اس فورم کا مقصد

نبیل

تکنیکی معاون
السلام علیکم،

اگرچہ اردو متن کی بصری شناخت (optical recognition) بہت پیچیدہ سبجیکٹ ہے اور ہم اس پر کسی قسم کا کوئی نتیجہ حاصل کرنے سے بہت دور ہیں، لیکن اس کے بارے میں سوالات پوسٹ کرنے کا سلسلہ جاری رہتا ہے۔ میں نے اس موضوع پر مراسلات کو اکٹھا کرنے کے لیے یہ زمرہ تشکیل دیا ہے تاکہ تمام تحقیق ایک ہی جگہ موجود رہے۔ مجھے اس موضوع پر جتنے تھریڈز ملیں گے، میں انہیں یہاں منتقل کر دوں گا۔ باقی منتظمین سے بھی اس جانب توجہ کرنے کی درخواست ہے۔ ہو سکتا ہے کہ مستقبل میں اس فیلڈ پر کام کرنے والے کسی محقق کی توجہ اس جانب مبذول ہو جائے اور یوں تحقیق کا سلسلہ کچھ آگے بڑھے۔

والسلام
 

نبیل

تکنیکی معاون
بالا کا مراسلہ دس سال قبل ارسال کیا گیا تھا۔ اردو او سی آر کے میدان میں زیادہ پیشرفت نہیں ہوئی ہے لیکن گوگل کلاؤڈ او سی آر اے پی آئی کے استعمال کے ذریعے اچھے نتائج حاصل کیے جا سکتے ہیں۔ مجھے موقع ملا تو میں گوگل او سی آر اے پی آئی کے استعمال سے متعلق ایک ٹیوٹوریل لکھوں گا۔ ویب براؤزر کے ذریعے اس اے پی آئی کے استعمال کا تجربہ اس ربط پر کیا جا سکتا ہے۔ علاوہ ازیں گوگل ڈاکس کے ذریعے بھی تصویر سے اردو متن اخذ کیا جا سکتا ہے۔ تفصیل اس ربط پر دیکھی جا سکتی ہے۔
 
بالا کا مراسلہ دس سال قبل ارسال کیا گیا تھا۔ اردو او سی آر کے میدان میں زیادہ پیشرفت نہیں ہوئی ہے لیکن گوگل کلاؤڈ او سی آر اے پی آئی کے استعمال کے ذریعے اچھے نتائج حاصل کیے جا سکتے ہیں۔ مجھے موقع ملا تو میں گوگل او سی آر اے پی آئی کے استعمال سے متعلق ایک ٹیوٹوریل لکھوں گا۔ ویب براؤزر کے ذریعے اس اے پی آئی کے استعمال کا تجربہ اس ربط پر کیا جا سکتا ہے۔ علاوہ ازیں گوگل ڈاکس کے ذریعے بھی تصویر سے اردو متن اخذ کیا جا سکتا ہے۔ تفصیل اس ربط پر دیکھی جا سکتی ہے۔
نبیل بھائی گوگل کلاؤڈ کے بارے ضرور ٹیوٹوریل دیجیے گا۔ کیا اس کے نتائج گوگل ڈاکس سے بہتر ہیں؟ نیز زیادہ سے زیادہ کتنے صفحات پر مشتمل کتاب سے متن اخذ کیا جاسکتا ہے؟
 

مزمل اختر

محفلین
بالا کا مراسلہ دس سال قبل ارسال کیا گیا تھا۔ اردو او سی آر کے میدان میں زیادہ پیشرفت نہیں ہوئی ہے لیکن گوگل کلاؤڈ او سی آر اے پی آئی کے استعمال کے ذریعے اچھے نتائج حاصل کیے جا سکتے ہیں۔ مجھے موقع ملا تو میں گوگل او سی آر اے پی آئی کے استعمال سے متعلق ایک ٹیوٹوریل لکھوں گا۔ ویب براؤزر کے ذریعے اس اے پی آئی کے استعمال کا تجربہ اس ربط پر کیا جا سکتا ہے۔ علاوہ ازیں گوگل ڈاکس کے ذریعے بھی تصویر سے اردو متن اخذ کیا جا سکتا ہے۔ تفصیل اس ربط پر دیکھی جا سکتی ہے۔
جزاک اللہ خیرا
 

نبیل

تکنیکی معاون
نبیل بھائی گوگل کلاؤڈ کے بارے ضرور ٹیوٹوریل دیجیے گا۔ کیا اس کے نتائج گوگل ڈاکس سے بہتر ہیں؟ نیز زیادہ سے زیادہ کتنے صفحات پر مشتمل کتاب سے متن اخذ کیا جاسکتا ہے؟

میرا قیاس ہے کہ گوگل ڈاکس پس منظر میں کلاؤڈ اے پی آئی کا ہی استعمال کر رہا ہے، اس لیے نتائج تو ایک ہی جیسے ہوں گے۔گوگل ڈاکس کا استعمال مفت ہے، لیکن یہ معلوم نہیں کہ اس میں ڈاکومنٹ کے سائز پر کیا لمٹ ہے۔ میں نے کلاؤڈ اے پی کی محدود ٹیسٹنگ ہی کی ہے اور ابھی تک کے نتائج کے مطابق تصویری متن میں اگر نوری نستعلیق فونٹ کا استعمال کیا گیا ہو تو کافی اچھے نتائج ملتے ہیں۔ فی الحال میرے پاس اعدادوشمار موجود نہیں ہیں کہ ایرر ریٹ کیا ہے۔ لیکن میں نے ٹیسٹنگ کے لیے جن تصاویر کا استعمال کیا تھا وہ عام طور پر دنیا نیوز کی سائٹ پر شائع کردہ کالم تھے۔ بہتر طور پر ٹیسٹ کرنے کے لیے علیحدہ سے کتاب کے صفحات کو سکین کرکے ان تصاویر سے اردو متن اخذ کرکے دیکھنا ہوگا۔ میں نے آرکائیو ڈاٹ آرگ سائٹ پر موجود پرانی اردو کتب سے اردو متن اخذ کرنے کے تجربات بھی کیے تھے جن کے نتائج اتنے اچھے نہیں تھے۔ بہتر نتائج کے لیے کچھ پری پراسیسنگ کی ضرورت ہوگی جس میں صفحات کی تصاویر کی الائنمنٹ کو درست کرنا اور ان کے کلر کنٹراسٹ کو بہتر بنانا شامل ہوگا۔ کلاؤڈ اے پی آئی اور گوگل ڈاکس کے استعمال میں فرق یہ ہے کہ کلاؤڈ اے پی آئی کے استعمال کے لیے کلاؤڈ اکاؤنٹ کی ضرورت ہوتی ہے، اور اکاؤنٹ بنانے کے لیے کارڈ کی ضرورت ہوتی ہے۔ ایک حد تک استعمال تک کلاؤڈ اے پی آئی کا استعمال مفت ہے اور اس کے بعد اس کے استعمال پر کچھ قیمت کا اطلاق ہوتا ہے۔ گوگل کلاؤڈ اکاؤنٹ بنانے پر گوگل کی جانب سے تین سو ڈالر کا کریڈٹ ملتا ہے جسے ایک سال کی مدت تک خرچ کیا جا سکتا ہے۔
 
میرا قیاس ہے کہ گوگل ڈاکس پس منظر میں کلاؤڈ اے پی آئی کا ہی استعمال کر رہا ہے، اس لیے نتائج تو ایک ہی جیسے ہوں گے۔گوگل ڈاکس کا استعمال مفت ہے، لیکن یہ معلوم نہیں کہ اس میں ڈاکومنٹ کے سائز پر کیا لمٹ ہے۔ میں نے کلاؤڈ اے پی کی محدود ٹیسٹنگ ہی کی ہے اور ابھی تک کے نتائج کے مطابق تصویری متن میں اگر نوری نستعلیق فونٹ کا استعمال کیا گیا ہو تو کافی اچھے نتائج ملتے ہیں۔ فی الحال میرے پاس اعدادوشمار موجود نہیں ہیں کہ ایرر ریٹ کیا ہے۔ لیکن میں نے ٹیسٹنگ کے لیے جن تصاویر کا استعمال کیا تھا وہ عام طور پر دنیا نیوز کی سائٹ پر شائع کردہ کالم تھے۔ بہتر طور پر ٹیسٹ کرنے کے لیے علیحدہ سے کتاب کے صفحات کو سکین کرکے ان تصاویر سے اردو متن اخذ کرکے دیکھنا ہوگا۔ میں نے آرکائیو ڈاٹ آرگ سائٹ پر موجود پرانی اردو کتب سے اردو متن اخذ کرنے کے تجربات بھی کیے تھے جن کے نتائج اتنے اچھے نہیں تھے۔ بہتر نتائج کے لیے کچھ پری پراسیسنگ کی ضرورت ہوگی جس میں صفحات کی تصاویر کی الائنمنٹ کو درست کرنا اور ان کے کلر کنٹراسٹ کو بہتر بنانا شامل ہوگا۔ کلاؤڈ اے پی آئی اور گوگل ڈاکس کے استعمال میں فرق یہ ہے کہ کلاؤڈ اے پی آئی کے استعمال کے لیے کلاؤڈ اکاؤنٹ کی ضرورت ہوتی ہے، اور اکاؤنٹ بنانے کے لیے کارڈ کی ضرورت ہوتی ہے۔ ایک حد تک استعمال تک کلاؤڈ اے پی آئی کا استعمال مفت ہے اور اس کے بعد اس کے استعمال پر کچھ قیمت کا اطلاق ہوتا ہے۔ گوگل کلاؤڈ اکاؤنٹ بنانے پر گوگل کی جانب سے تین سو ڈالر کا کریڈٹ ملتا ہے جسے ایک سال کی مدت تک خرچ کیا جا سکتا ہے۔
شکریہ نبیل بھائی۔ آپ نے کافی حد تک تعارف کروادیا۔ مزید تفصیلی ٹیوٹوریل اور وسیع تر ٹیسٹنگ کے نتائج کا انتظار رہے گا۔
 

فاخر رضا

محفلین
السلام علیکم نبیل بھائی
ایک بات یہ بتا دیں کہ گوگل ڈاکس جیسے مختلف لہجے میں کہی گئی بات لکھ لیتا ہے ویسے ہاتھ سے لکھی تحریر کو کیوں متن میں تبدیل نہیں کرپاتا
 

نبیل

تکنیکی معاون
السلام علیکم نبیل بھائی
ایک بات یہ بتا دیں کہ گوگل ڈاکس جیسے مختلف لہجے میں کہی گئی بات لکھ لیتا ہے ویسے ہاتھ سے لکھی تحریر کو کیوں متن میں تبدیل نہیں کرپاتا

سپیچ ریکگنیشن اور ہینڈ رائٹنگ ریکگنیشن مختلف پرابلمز ہیں۔ کیا آپ نے ہاتھ کی لکھائی کو او سی آر کرنے کی کبھی کوشش کی ہے؟ اردو کے لیے شاید ابھی کام نہ کرتی ہو لیکن میرا قیاس ہے کہ انگریزی اور دوسری رومن زبانوں میں ہینڈ رائٹنگ کے لیے بھی او سی آر بخوبی کام کرتا ہے۔ ذاتی طور میں نے اس کا کبھی تجربہ نہیں کیا ہے۔
 
Top