اس فورم کا مقصد

نبیل نے 'اردو او سی آر پر تحقیق' کی ذیل میں اس موضوع کا آغاز کیا، ‏فروری 10, 2008

  1. نبیل

    نبیل محفلین

    مراسلے:
    16,748
    جھنڈا:
    Germany
    موڈ:
    Depressed
    السلام علیکم،

    اگرچہ اردو متن کی بصری شناخت (optical recognition) بہت پیچیدہ سبجیکٹ ہے اور ہم اس پر کسی قسم کا کوئی نتیجہ حاصل کرنے سے بہت دور ہیں، لیکن اس کے بارے میں سوالات پوسٹ کرنے کا سلسلہ جاری رہتا ہے۔ میں نے اس موضوع پر مراسلات کو اکٹھا کرنے کے لیے یہ زمرہ تشکیل دیا ہے تاکہ تمام تحقیق ایک ہی جگہ موجود رہے۔ مجھے اس موضوع پر جتنے تھریڈز ملیں گے، میں انہیں یہاں منتقل کر دوں گا۔ باقی منتظمین سے بھی اس جانب توجہ کرنے کی درخواست ہے۔ ہو سکتا ہے کہ مستقبل میں اس فیلڈ پر کام کرنے والے کسی محقق کی توجہ اس جانب مبذول ہو جائے اور یوں تحقیق کا سلسلہ کچھ آگے بڑھے۔

    والسلام
     
    • پسندیدہ پسندیدہ × 14
  2. مزمل اختر

    مزمل اختر محفلین

    مراسلے:
    109
    جھنڈا:
    India
    موڈ:
    Pensive
    ہاں اس چیز کی تو مجھے بھی شدید ضرورت ہے ۔ کیا اس پر اب تک کچھ کام نہیں ہوا
     
  3. فاخر رضا

    فاخر رضا محفلین

    مراسلے:
    3,151
    اب تو voice recognition پر کام ہورہا ہے بلکہ ہوچکا ہے
    یہ لڑی دس سال پرانی ہے
     
    • پسندیدہ پسندیدہ × 1
  4. عبید انصاری

    عبید انصاری محفلین

    مراسلے:
    2,681
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    گوگل ڈاکس بہت اچھا نتیجہ دے رہا ہے۔ صوتی کتابت اور بصری شناخت ہر دو میں۔
     
    • پسندیدہ پسندیدہ × 3
  5. نبیل

    نبیل محفلین

    مراسلے:
    16,748
    جھنڈا:
    Germany
    موڈ:
    Depressed
    بالا کا مراسلہ دس سال قبل ارسال کیا گیا تھا۔ اردو او سی آر کے میدان میں زیادہ پیشرفت نہیں ہوئی ہے لیکن گوگل کلاؤڈ او سی آر اے پی آئی کے استعمال کے ذریعے اچھے نتائج حاصل کیے جا سکتے ہیں۔ مجھے موقع ملا تو میں گوگل او سی آر اے پی آئی کے استعمال سے متعلق ایک ٹیوٹوریل لکھوں گا۔ ویب براؤزر کے ذریعے اس اے پی آئی کے استعمال کا تجربہ اس ربط پر کیا جا سکتا ہے۔ علاوہ ازیں گوگل ڈاکس کے ذریعے بھی تصویر سے اردو متن اخذ کیا جا سکتا ہے۔ تفصیل اس ربط پر دیکھی جا سکتی ہے۔
     
    • پسندیدہ پسندیدہ × 2
    • دوستانہ دوستانہ × 1
  6. عبید انصاری

    عبید انصاری محفلین

    مراسلے:
    2,681
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    نبیل بھائی گوگل کلاؤڈ کے بارے ضرور ٹیوٹوریل دیجیے گا۔ کیا اس کے نتائج گوگل ڈاکس سے بہتر ہیں؟ نیز زیادہ سے زیادہ کتنے صفحات پر مشتمل کتاب سے متن اخذ کیا جاسکتا ہے؟
     
  7. مزمل اختر

    مزمل اختر محفلین

    مراسلے:
    109
    جھنڈا:
    India
    موڈ:
    Pensive
    جزاک اللہ خیرا
     
  8. نبیل

    نبیل محفلین

    مراسلے:
    16,748
    جھنڈا:
    Germany
    موڈ:
    Depressed
    میرا قیاس ہے کہ گوگل ڈاکس پس منظر میں کلاؤڈ اے پی آئی کا ہی استعمال کر رہا ہے، اس لیے نتائج تو ایک ہی جیسے ہوں گے۔گوگل ڈاکس کا استعمال مفت ہے، لیکن یہ معلوم نہیں کہ اس میں ڈاکومنٹ کے سائز پر کیا لمٹ ہے۔ میں نے کلاؤڈ اے پی کی محدود ٹیسٹنگ ہی کی ہے اور ابھی تک کے نتائج کے مطابق تصویری متن میں اگر نوری نستعلیق فونٹ کا استعمال کیا گیا ہو تو کافی اچھے نتائج ملتے ہیں۔ فی الحال میرے پاس اعدادوشمار موجود نہیں ہیں کہ ایرر ریٹ کیا ہے۔ لیکن میں نے ٹیسٹنگ کے لیے جن تصاویر کا استعمال کیا تھا وہ عام طور پر دنیا نیوز کی سائٹ پر شائع کردہ کالم تھے۔ بہتر طور پر ٹیسٹ کرنے کے لیے علیحدہ سے کتاب کے صفحات کو سکین کرکے ان تصاویر سے اردو متن اخذ کرکے دیکھنا ہوگا۔ میں نے آرکائیو ڈاٹ آرگ سائٹ پر موجود پرانی اردو کتب سے اردو متن اخذ کرنے کے تجربات بھی کیے تھے جن کے نتائج اتنے اچھے نہیں تھے۔ بہتر نتائج کے لیے کچھ پری پراسیسنگ کی ضرورت ہوگی جس میں صفحات کی تصاویر کی الائنمنٹ کو درست کرنا اور ان کے کلر کنٹراسٹ کو بہتر بنانا شامل ہوگا۔ کلاؤڈ اے پی آئی اور گوگل ڈاکس کے استعمال میں فرق یہ ہے کہ کلاؤڈ اے پی آئی کے استعمال کے لیے کلاؤڈ اکاؤنٹ کی ضرورت ہوتی ہے، اور اکاؤنٹ بنانے کے لیے کارڈ کی ضرورت ہوتی ہے۔ ایک حد تک استعمال تک کلاؤڈ اے پی آئی کا استعمال مفت ہے اور اس کے بعد اس کے استعمال پر کچھ قیمت کا اطلاق ہوتا ہے۔ گوگل کلاؤڈ اکاؤنٹ بنانے پر گوگل کی جانب سے تین سو ڈالر کا کریڈٹ ملتا ہے جسے ایک سال کی مدت تک خرچ کیا جا سکتا ہے۔
     
    • پسندیدہ پسندیدہ × 1
    • معلوماتی معلوماتی × 1
  9. عبید انصاری

    عبید انصاری محفلین

    مراسلے:
    2,681
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    شکریہ نبیل بھائی۔ آپ نے کافی حد تک تعارف کروادیا۔ مزید تفصیلی ٹیوٹوریل اور وسیع تر ٹیسٹنگ کے نتائج کا انتظار رہے گا۔
     
  10. فاخر رضا

    فاخر رضا محفلین

    مراسلے:
    3,151
    السلام علیکم نبیل بھائی
    ایک بات یہ بتا دیں کہ گوگل ڈاکس جیسے مختلف لہجے میں کہی گئی بات لکھ لیتا ہے ویسے ہاتھ سے لکھی تحریر کو کیوں متن میں تبدیل نہیں کرپاتا
     
  11. نبیل

    نبیل محفلین

    مراسلے:
    16,748
    جھنڈا:
    Germany
    موڈ:
    Depressed
    سپیچ ریکگنیشن اور ہینڈ رائٹنگ ریکگنیشن مختلف پرابلمز ہیں۔ کیا آپ نے ہاتھ کی لکھائی کو او سی آر کرنے کی کبھی کوشش کی ہے؟ اردو کے لیے شاید ابھی کام نہ کرتی ہو لیکن میرا قیاس ہے کہ انگریزی اور دوسری رومن زبانوں میں ہینڈ رائٹنگ کے لیے بھی او سی آر بخوبی کام کرتا ہے۔ ذاتی طور میں نے اس کا کبھی تجربہ نہیں کیا ہے۔
     

اس صفحے کی تشہیر