نستعلیق حرف شناس (OCR) ڈیسک ٹاپ ورژن ریلیز کر دیا گیا

اے خان

محفلین

فاتح

لائبریرین
یہ اتنے زیادہ پیسے نہیں ہیں۔
یہاں مسئلہ پیسوں کی زیادتی یا کمی کا نہیں تھا بلکہ یہ تھا کہ کیا اس سافٹ ویئر کو صرف سپورٹ کی غرض سے 15 ہزار روپے میں خریدنا چاہیے یا نہیں۔ کیونکہ سکین شدہ صفحات پر تو نتائج صفر ہیں اس لیے اسے خریدنا صرف اس ادارے کی مالی "سپورٹ" کرنا ہی ہو گا۔
 

زیک

مسافر
یہاں مسئلہ پیسوں کی زیادتی یا کمی کا نہیں تھا بلکہ یہ تھا کہ کیا اس سافٹ ویئر کو صرف سپورٹ کی غرض سے 15 ہزار روپے میں خریدنا چاہیے یا نہیں۔ کیونکہ سکین شدہ صفحات پر تو نتائج صفر ہیں اس لیے اسے خریدنا صرف اس ادارے کی مالی "سپورٹ" کرنا ہی ہو گا۔
سافٹویر صحیح کام نہ کرتی ہو تو سو روپے میں بھی خریدنا بیکار۔
 

فاتح

لائبریرین
سافٹویر صحیح کام نہ کرتی ہو تو سو روپے میں بھی خریدنا بیکار۔
بجا ارشاد۔ :)
میں نے بھی یہی لکھا تھا کہ
کیونکہ اگر نتائج واقعی اچھے ہوں تو جتنا مواد تصویری شکل میں ہے اسے یونیکوڈ میں تبدیل کرنے کے لیے 15 ہزار بہت بڑی رقم نہیں لیکن اگر نتیجہ ہی اطمینان بخش نہیں تو 15 سو روپے بھی زیادہ ہیں۔
 

ابو ہاشم

محفلین
یہ او سی آر صرف ایسی تصاویر سے ٹیکسٹ نکال سکتا ہے جو پہلے کمپیوٹر پر جمیل نوری نستعلیق یا کسی دوسرے نستعلیق فونٹ میں ٹائپ کر کے محفوظ کی گئی ہوں اور پھر انہیں تصویری شکل دے دی گئی ہو۔ اور یہ کام ایسا نہیں کہ اس کے لیے 15 ہزار روپے خرچ کر کے یہ سافٹ ویئر خریدا جائے۔
بہت سارا مواد ان پیج کے ذریعے تصویری شکل میں پیدا کیا گیا ہے اسے یونیکوڈ میں بدلنے کے لیے تو یہ سافٹ ویئر کار آمد ہو گا
 

فاتح

لائبریرین
بہت سارا مواد ان پیج کے ذریعے تصویری شکل میں پیدا کیا گیا ہے اسے یونیکوڈ میں بدلنے کے لیے تو یہ سافٹ ویئر کار آمد ہو گا
بات تو وہی رہی کہ
یہ او سی آر صرف ایسی تصاویر سے ٹیکسٹ نکال سکتا ہے جو پہلے کمپیوٹر پر جمیل نوری نستعلیق یا کسی دوسرے نستعلیق فونٹ میں ٹائپ کر کے محفوظ کی گئی ہوں اور پھر انہیں تصویری شکل دے دی گئی ہو۔ اور یہ کام ایسا نہیں کہ اس کے لیے 15 ہزار روپے خرچ کر کے یہ سافٹ ویئر خریدا جائے۔
خواہ مائکرو سافٹ ورڈ میں لکھ کر تصویری شکل دی گئی ہو یا ان پیج میں۔ کیونکہ اگر تو صرف ان پیج میں لکھا گیا مواد ہے جس کی ان پیج فائل دستیاب ہے تب تو بے شمار ٹولز ہیں جو آسانی سے یونیکوڈ متن میں تبدیل کر دیتے ہیں۔
اور صرف ان پیج یا ورڈ پراسیسر میں لکھ کر تصویری شکل میں ڈھالے گئے مواد کو او سی آر کے ذریعے یونیکوڈ میں تبدیل کرنے کا بزنس کیس یا تجارتی فائدے کا دائرہ کار بہت وسیع نہیں۔ بالفاظ دیگر ایسے کتنے لوگ ہوں گے صرف ان ییج سے تصویری شکل میں ڈھالے گئے مواد کو یونیکوڈ میں تبدیل کرنے کے لیے 15,000 روپے میں یہ سافٹویئر خریدنا چاہیں گے؟
 

الف عین

لائبریرین
بات تو وہی رہی کہ

خواہ مائکرو سافٹ ورڈ میں لکھ کر تصویری شکل دی گئی ہو یا ان پیج میں۔ کیونکہ اگر تو صرف ان پیج میں لکھا گیا مواد ہے جس کی ان پیج فائل دستیاب ہے تب تو بے شمار ٹولز ہیں جو آسانی سے یونیکوڈ متن میں تبدیل کر دیتے ہیں۔
اور صرف ان پیج یا ورڈ پراسیسر میں لکھ کر تصویری شکل میں ڈھالے گئے مواد کو او سی آر کے ذریعے یونیکوڈ میں تبدیل کرنے کا بزنس کیس یا تجارتی فائدے کا دائرہ کار بہت وسیع نہیں۔ بالفاظ دیگر ایسے کتنے لوگ ہوں گے صرف ان ییج سے تصویری شکل میں ڈھالے گئے مواد کو یونیکوڈ میں تبدیل کرنے کے لیے 15,000 روپے میں یہ سافٹویئر خریدنا چاہیں گے؟
لیکن سوال تب اٹھتا ہے کہ ان پیج فائل بآسانی دستیاب کس طرح ہو؟۔ یہاں تو اردو کی ویب سائٹس خود ہی غائب ہوتی رہتی ہیں، اور اکثر یہ معلوم ہی نہیں ہوتا کہ ہمارے پاس جو تصویری فائل ہے، وہ کس ان پیج فائل سے بنی ہے!
کچھ لوگ اس طرح کاپی رائٹ والی کتابوں کا متن بھی حاصل کرنے کی کوشش کر سکتے ہیں۔ ان لوگوں کو شاید یہ رقم زیادہ بڑی نہ لگے، اگر ان کا مقصد کمرشیل ہو۔

یہ سافٹ وئر مارچ میں ریلیز ہو چکا تھا، لیکن اب تک کسی کو پتہ نہیں چلا!!!!
 

سید ذیشان

محفلین
عارف صاحب تو جانے کب نتائج سے آگاہ کریں۔۔۔ ہم نے خود ہی تجربہ کر لیا۔۔۔ اور نتائج حاضر ہیں۔
پہلا ٹیسٹ:
مائکرو سافٹ ورڈ میں جمیل نوری نستعلیق میں ٹیکسٹ لکھ کے اس کی پی ڈی ایف بنائی اور اس پی ڈی ایف کو فوٹو شاپ میں 300 پکسل پر انچ پر امپورٹ کروایا اور اس سے تصویر بنا کر ڈیمو میں اپلوڈ کی۔ اس کا نتیجہ بہت اچھا رہا۔ او سی آر نے تقریباً تمام الفاظ کو درست پہچان کر تحریری متن دے دیا۔

دوسرا ٹیسٹ:
آرکائیو ڈاٹ آرگ سے فرہنگ آصفیہ کا ایک صفحہ ڈاؤن لوڈ کر کے ڈیمو پر اپلوڈ کیا لیکن اس پر بھی 300 ڈی پی آئی نہ ہونے کا مسئلہ آ گیا۔ ا سکے بعد اس تصویر کی فوٹو شاپ میں ریزولیوشن 300 پکسل پر انچ کی اور دوبارہ اپلوڈ کی تو اس پورے صفحے کا متن او سی آر نے صرف یہ دیا:
کوڈ:
۞‌بہ
۞۞۞۞۞‌سے ۞ 9۞‌ھ و مل
یعنی نتیجہ صفر

میری رائے میں اردو او سی آر کا سب سے بہتر استعمال تو یہی ہو سکتا ہے کہ سکین شدہ کتابوں کا متن حاصل کیا جا سکے جو کہ فی الحال اس او سی آر کے ذریعے نا ممکن ہے۔ اگر یہ استعمال ممکن ہو تو میں 15 ہزار میں یہ او سی آر خریدنے کو تیار ہوں۔
لیکن یہ او سی آر صرف ایسی تصاویر سے ٹیکسٹ نکال سکتا ہے جو پہلے کمپیوٹر پر جمیل نوری نستعلیق یا کسی دوسرے نستعلیق فونٹ میں ٹائپ کر کے محفوظ کی گئی ہوں اور پھر انہیں تصویری شکل دے دی گئی ہو۔ اور یہ کام ایسا نہیں کہ اس کے لیے 15 ہزار روپے خرچ کر کے یہ سافٹ ویئر خریدا جائے۔
ہاں، اس سافٹ ویئر کو ایک اچھے اردو او سی آر کی جانب ایک پیش رفت کے طور پر ضرور لیا جانا چاہیے۔

صفحہ 300 ڈی پی آئی پر ہی سکین کرنا چاہیے۔

اگر سکین کم ریزولوشن پر کیا ہو اور صرف اس کا ڈی پی آئی بڑھا دیا جائے تو شائد یہ درست کام نہ کر پائے۔
 

سید ذیشان

محفلین
بات تو وہی رہی کہ

خواہ مائکرو سافٹ ورڈ میں لکھ کر تصویری شکل دی گئی ہو یا ان پیج میں۔ کیونکہ اگر تو صرف ان پیج میں لکھا گیا مواد ہے جس کی ان پیج فائل دستیاب ہے تب تو بے شمار ٹولز ہیں جو آسانی سے یونیکوڈ متن میں تبدیل کر دیتے ہیں۔
اور صرف ان پیج یا ورڈ پراسیسر میں لکھ کر تصویری شکل میں ڈھالے گئے مواد کو او سی آر کے ذریعے یونیکوڈ میں تبدیل کرنے کا بزنس کیس یا تجارتی فائدے کا دائرہ کار بہت وسیع نہیں۔ بالفاظ دیگر ایسے کتنے لوگ ہوں گے صرف ان ییج سے تصویری شکل میں ڈھالے گئے مواد کو یونیکوڈ میں تبدیل کرنے کے لیے 15,000 روپے میں یہ سافٹویئر خریدنا چاہیں گے؟

بہت ساری کتب اور اخبارات کے لئے انپیج ہی استعمال ہوتا ہے۔ تو اگر ایسی کتب اور اخبارات کا سکین کرکے ان کو کنورٹ کیا جا سکے تب بھی یہ کسی حد تک کارآمد ہے۔ آپ کی بات درست ہے کہ جب تک ہاتھ کی لکھی ہوئی نستعلیق کو کنورٹ نہ کر سکے تب تک یہ مکمل طور پر کارآمد سافٹوئیر نہیں ہے۔ لیکن اس کے لئے دو کروڑ سے کہیں زیادہ رقم درکار ہو گی :)
 

دوست

محفلین
"اصلی" سکین شدہ تصویر جو 300 ڈی پی آئی پر ہو، وہی استعمال ہو تو نتیجہ دے گا ورنہ نہیں۔ ڈاکٹر سرمد سے پوچھا تھا، یہی جواب ملا تھا۔ اس لیے سافٹویئر کو گیڑا (پنجابی والا) دینے کی بجائے کوئی کتاب سکین کر کے آزمائیں۔ اگر یہ نوری نستعلیق پر بھی کام کر جاتا ہے تو بھی کافی کام کی چیز ہے۔
 
Top