'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

فلسفی نے 'اردو او سی آر پر تحقیق' کی ذیل میں اس موضوع کا آغاز کیا، ‏فروری 25, 2019

  1. شکیب

    شکیب محفلین

    مراسلے:
    1,792
    جھنڈا:
    India
    موڈ:
    Breezy
    فلسفی
    یہ او سی آر ہوتا کن مرحلوں میں ہے؟ مکمل سطر ایک ساتھ؟ حروف؟ یا ترسیمے؟

    پوچھنے کا مقصد یہ کہ کیا ہم ہر ترسیمے کی شناخت کے بعد کچھ کوڈ ڈال سکتے ہیں؟ اگر ہاں تو براہ راست الفاظ کو لغت کے مقابل چیک کرنے کے بعد write کیا جا سکتا ہے۔
     
    • پسندیدہ پسندیدہ × 1
  2. شکیب

    شکیب محفلین

    مراسلے:
    1,792
    جھنڈا:
    India
    موڈ:
    Breezy
    مناسب اور فیزبل الگوردم سوجھ جائے تو یوٹیلیٹی کوئی مسئلہ نہیں۔
     
    • متفق متفق × 1
  3. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    ٹیکسریٹ کی ہائی لیول اے پی آئی میں امیج فائل کو پروسیس کرنے کی سہولت ہے، اس میں پورا صفحہ بھی دے سکتے ہیں یا پری پروسیسنگ کے ذریعے سطروں کو علیحدہ کر کے ایک ایک سطر کا مواد بھی حاصل کیا جاسکتا ہے۔
     
  4. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    سطروں کو علیحدہ کرنے والا پروگرام علیحدہ سے لکھنا ہو گا وہ ٹیکسریٹ کی اے پی آئی کا حصہ نہیں ہے۔
     
  5. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    گٹ ہب پر "ایشو" بنا دیا ہے، اب دیکھتے ہیں کہ جھاڑ پڑتی ہے کہ نہیں۔ :D
     
    • پسندیدہ پسندیدہ × 1
  6. جاسم محمد

    جاسم محمد محفلین

    مراسلے:
    23,915
    یہ ٹیسٹ سیمپل آپ نے بہتر نتائج کیلئے ایسا بنایا ہے؟
    [​IMG]
     
  7. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    یہ اس کمانڈ کا نتیجہ ہے
    کوڈ:
    text2image --text "/traintext.txt" --outputbase "/traintext" --fontconfig_tmpdir "/fontconfig" --fonts_dir "/usr/share/fonts" --font "Jameel Noori Nastaleeq" --leading 32
     
  8. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    کسی کے پاس اگر یونیکوڈ میں اگر اردو کا مواد ، کتب وغیرہ ہیں تو وہ مہربانی کرکے شئیر کرے۔ ابھی تک میرے پاس جو مواد تھا اس سے تقریبا ایک لاکھ تیس ہزار سطریں بن سکیں ہیں۔ بہت سا مواد اسلامی کتب سے لیا گیا ہے جس میں عربی والا متن نکال دیا ہے۔ بہت سے سپیشل کریکٹرز، سپیسز وغیرہ کو علیحدہ کرنے کے بعد ابھی تک صرف ایک لاکھ تیس ہزار سطریں ہی بن سکیں ہیں۔ فائل یہاں موجود ہے۔
     
    • پسندیدہ پسندیدہ × 2
  9. دوست

    دوست محفلین

    مراسلے:
    13,075
    جھنڈا:
    Germany
    موڈ:
    Fine
    • پسندیدہ پسندیدہ × 2
    • زبردست زبردست × 2
  10. دوست

    دوست محفلین

    مراسلے:
    13,075
    جھنڈا:
    Germany
    موڈ:
    Fine
    جنگ کا ڈیٹا ابنِ سعید نے سکریپ کیا تھا 2012 میں شاید، وہ ڈراپ باکس پر شیئر کیا ہوا ہے میرے پاس۔ اس کی آئی ڈی ذاتی پیغام میں بھیجیں تو میں فولڈر شیئر کر دیتا ہوں۔
     
    • پسندیدہ پسندیدہ × 2
    • زبردست زبردست × 1
  11. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    بہت شکریہ میں سکرپٹ سے سطریں بنا کر تربیتی مواد بناتا ہوں۔

    ویسے ٹیسریکٹ کی ٹیم کی جانب سے گٹ ہپ والے ایشو پر مزید سوالات پوچھے گئے ہیں۔ دیکھتے ہیں کہ ان کی طرف سے بہتری کے لئے کوئی تجویز سامنے آتی ہے یا نہیں۔
     
    • پسندیدہ پسندیدہ × 2
    • معلوماتی معلوماتی × 1
  12. الف عین

    الف عین لائبریرین

    مراسلے:
    35,221
    جھنڈا:
    India
    موڈ:
    Psychedelic
    میری لائبریری کی کتب سے مواد حاصل کریں تو بہتر ہے، محفل اور جنگ سے جمع کردہ مواد میں پہلے ہی سے بے تحاشا اعلاط ہیں، ورڈ لسٹ بھی مجھے اپنی ہی پسند ہے کہ مقتدرہ کی فہرست میں بھی ایسے ہی Non-words شامل ہیں( اس کا پہلا لفظ ہی' آآکر' تھا۔)
     
    • پسندیدہ پسندیدہ × 6
  13. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    بہت شکریہ سر۔ اصل میں کچھ کتابیں آپ کے بلاگ سے بھی ڈاؤنلوڈ کیں تھی۔ کیا تمام مواد ٹیکسٹ فائل میں (چاہے علیحدہ علیحدہ ہو) ایک زپ فائل یا کچھ زپ فائلز میں مل سکتا ہے؟
     
    • پسندیدہ پسندیدہ × 1
  14. فرقان احمد

    فرقان احمد محفلین

    مراسلے:
    10,183
    ربط

    اس ویب سائیٹ پر کتب کو یونیکوڈ ورژن میں ڈاؤنلوڈ کیا جا سکتا ہے۔
     
  15. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    بہت شکریہ فرقان بھائی، پہلا ربط دیکھتا ہوں۔ دوسرا والا تو پہلے ہی کنگھال چکا ہو :)
    ویسے دوست بھائی والا ڈیٹا سکرپٹ پر لگایا ہوا ہے۔ ابھی تک ایک لاکھ پچاس ہزار سطریں بن گئیں ہیں۔ لیکن ان کو مزید ایک فلٹر سے گزارنا ہوگا۔ پھر فائنل مواد تیار کر کے آپ حضرات سے شئیر کروں گا۔
     
    • پسندیدہ پسندیدہ × 1
    • زبردست زبردست × 1
    • دوستانہ دوستانہ × 1
  16. فرقان احمد

    فرقان احمد محفلین

    مراسلے:
    10,183
    اس ربط کو بھی ملاحظہ کیجیے گا کیونکہ اردو ادب سے متعلقہ ویب سائٹس سے مواد لینے کی صورت میں اغلاط کا خدشہ کم سے کم ہو گا۔ اس صفحہ پر موجود روابط پر کلک کرنے پر آپ کو یونی کوڈ مواد دستیاب ہو گا۔
     
    • پسندیدہ پسندیدہ × 2
  17. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    بہت شکریہ فرقان بھائی۔
    اس میں ڈیٹا تو پی ڈی ایف میں ہے۔ سارا مواد ڈاؤنلوڈ اور پروسیس کرنے کے لیے علیحدہ سے جگاڑ لگانی پڑے گی۔ :p
    فی الحال تو میں ڈیٹا ٹیکسٹ فائل میں حاصل کرنے کے موڈ میں ہوں۔ کیونکہ سطریں بنانے والا سکرپٹ سادہ ٹیکسٹ فائلز کو پروسیس کرتا ہے۔ خیر مواد کافی جاندار لگا رہا ہے۔ اس کو بھی وقت نکال کر دیکھتا ہوں۔ ان شاءاللہ۔
     
    • پسندیدہ پسندیدہ × 1
    • زبردست زبردست × 1
  18. فرقان احمد

    فرقان احمد محفلین

    مراسلے:
    10,183
    دراصل، پی ڈی ایف کے ساتھ ساتھ انہوں نے یونیکوڈ میں بھی مواد دیا ہوا ہے تاہم سائیڈ بائی سائیڈ ۔۔۔! ان روابط پر کلک کر کے یہ مواد کاپی پیسٹ کرنا ہو گا۔ وقت تو لگے گا، محترم ۔۔۔! :)
     
    • پسندیدہ پسندیدہ × 1
  19. فرقان احمد

    فرقان احمد محفلین

    مراسلے:
    10,183
  20. فلسفی

    فلسفی محفلین

    مراسلے:
    2,584
    جھنڈا:
    Pakistan
    موڈ:
    Pensive
    اچھا ہے فرقان بھائی، یہ میں نے نوٹ نہیں کیا تھا۔ یونیکوڈ ڈیٹا سکرپٹ کے ذریعے آسانی سے نکل سکتا ہے۔ کرتا ہوں اس کا کچھ :)
     
    • پسندیدہ پسندیدہ × 2
    • زبردست زبردست × 1
    • معلوماتی معلوماتی × 1

اس صفحے کی تشہیر