یونی کوڈ او سی آر پروگرام

قیصرانی

لائبریرین
دوستو میرے ذہن “شریف“ میں ایک خیال آیا ہے۔ وہ کچھ ایسے ہے کہ کیا کوئی دوست ایسا کام کر سکتا ہے جس کے نتیجے میں ہمیں یو نیکوڈ کے لیے، یا کم از کم اردو کے لیے ایک OCR پروگرام مل سکے؟ اگر یہ ممکن نہ ہو تو کوئی دوست کسی فارسی یا عربی کے او سی آر پروگرام کا بتا سکیں۔ اس سے ہماری لائبریری کا کام بہت آسان ہو جائے گا۔ صرف پروف ریڈنگ کی حد تک، باقی کا کام بچ جائے گا۔
آپ دوست کیا کہتے ہیں اس بابت؟
قیصرانی
 
عربی کے او سی آر پروگرام میں نے دیکھے تو ہیں نیٹ پر مگر وہ اتنے مہنگے ہیں کہ الاماں الحفیظ ۔

اردو کے لیے بھی او سی آر پروگرام لکھے جاتے رہے ہیں ، UET کے چند طلبا نے چند سال پہلے اس میں انعام بھی جیتا تھا مگر کبھی اسے اوپن نہیں کیا نہ کہیں سے ملا مجھے۔ اس کے علاوہ FAST کی چند طالبات نے پچھلے سال OCR پروگرام لکھ کر انعام حاصل کیا مگر انہوں نے بھی وہی کیا جو ان سے پچھلوں نے کیا۔ پاکستان جا کر یا وہاں سے ان دو انسٹیٹوٹ سے پتہ کیا جاسکتا ہے کہ ان طلبا نے آگے کیا کیا ان پروگراموں کا۔
 

الف عین

لائبریرین
طلباء میں ایسی تجارتی ذہنیت (مائکروسافٹی) پر افسوس ہوتا ہے۔ یا ممکن ہے کہ ان لوگوں نے اپنی ڈگری کی تکمیل کے لئے ایسے پروجیکٹ لئے ہوں اور ڈگری ملنے کے بعد بھول گئے اور محض اپنے کارنامے پر خوش ہوتے رہے۔ کاش کالجوں میں آزاد ماخذ کی ذہنیت کا بول بالا ہو سکے تو کچھ بات بنے۔
 

قیصرانی

لائبریرین
محترمانٍ محفل۔ میری عرض کا یہ مقصد ہے کہ اگر عربی، فارسی یا پشتو (جی ہاں پشتو کے بھی او سی آر موجود ہیں)‌ مل جائیں تو ہمارا کام بہت آسان ہو جائے گا۔ ہر فقرے میں بہت کم الفاظ ایسے ملتے ہیں جو کہ عربی، فارسی یا پشتو کے حروف تہجی سے فرق ہوں۔
جو دوست یہ او سی آر استعمال کریں گے، تھوڑی بہت اصلاح تو وہ بھی کر سکتے ہیں۔ باقی کا کام پروف ریڈنگ والی ٹیم کر لے گی۔
کم از کم کوشش کرنے میں تو کوئی حرج نہیں ہے۔اگر تکا چل گیا تو اس سے ہمارا ایک سال کا کام ایک ماہ سے بھی کم مدت میں ہو جائے گا اور کتب کی بجائے لائبریریاں برقیانے کی طرف جا سکتے ہیں۔
قیصرانی
 

دوست

محفلین
قیصرانی یہ او سی آر اردو یونیکوڈ ویلیوز نہیں دیں گے۔۔جس کی وجہ سے متن دکھانے میں مسئلہ ہوگا۔۔۔اگر کوئی اوپن سورس مل جائے تو کیا ہی کہنے۔۔۔اس میں اردو کی سپورٹ شامل کی جاسکتی ہے۔
 

قیصرانی

لائبریرین
آپ نے درست کہا۔ لیکن میرا خیال ہے کہ اوپن سورس مل بھی جائے تو اس میں یونی کوڈ کی سپورٹ ہو، دائیں سے بائیں زبانوں کو بھی پہچانتا ہو اور اس میں‌ کرسو یعنی حروف کو ملا کر الفاظ جو بنائے جائیں، کو پہچاننے کی صلاحیت بھی ہو تو پھر کچھ شاید کوئی کر سکے :(
 

دوست

محفلین
اور یہ ہونا ابھی شاید ممکن نہیں۔ میرے حساب سے انگریزی کے اوپن سورس او سی آر بھی بڑی قابل رحم حالت کردیتے ہیں تصویر کو ٹیکسٹ میں بدلتے ہوئے۔ ان کی شرح اغلاط پچاس فیصد سے تو کیا ہی کم ہے۔۔۔
 
Top