"اردو نستعلیق حرف شناس" -- ایک نیا اردو او سی آر نظام

سید ذیشان

محفلین
کیا اسکین کردہ صفحہ ضروری ہے؟ میں نے ایک پی ڈی ایف کتاب سے جو نستعلیق فونٹ میں ہے ایک صفحہ الگ کرکے اس کو پینٹ برش میں لے جاکر جے پیگ فارمیٹ میں سیو کیا۔ لیکن اپ لوڈ کرتے ہوئے ایرر آیا کہ صفحہ کی ڈی پی آئی 300 نہیں ہے دوبارہ اسکین کریں۔ اس فائل کی ڈی پی آئی کسی طرح سیٹ کرسکتا ہوں؟

فوٹو شاپ میں تبدیل کی جا سکتی ہے۔
 

آصف اثر

معطل
کیا اسکین کردہ صفحہ ضروری ہے؟ میں نے ایک پی ڈی ایف کتاب سے جو نستعلیق فونٹ میں ہے ایک صفحہ الگ کرکے اس کو پینٹ برش میں لے جاکر جے پیگ فارمیٹ میں سیو کیا۔ لیکن اپ لوڈ کرتے ہوئے ایرر آیا کہ صفحہ کی ڈی پی آئی 300 نہیں ہے دوبارہ اسکین کریں۔ اس فائل کی ڈی پی آئی کسی طرح سیٹ کرسکتا ہوں؟
پینٹ برش کا تو مجھے معلوم نہیں البتہ فوٹوشاپ میں ڈی پی آئی 300 سیٹ کرنے کے لیے Image> Image size اب یہاں ریزولوشن کے سامنے Pixel/Inch 300 رکھ کر محفوظ کرلیں۔ ان شاء اللہ مسئلہ حل ہوجائے گا۔
 

رانا

محفلین
اور فوٹو شاپ میرے پاس ہے بھی نہیں اور آتا بھی نہیں مجھے۔ لہذا میری تو چھٹی ہوئی۔:)
 

رانا

محفلین
ہاں اس سائٹ سے کام ہوگیا۔ لیکن اب جو رزلٹ آیا وہ تو بہت ہی خراب ہے۔ یوں سمجھ لیں کہ سو میں پانچ نمبر ہی دوں گا میں اسکو۔ لیکن اوپر آصف صاحب نے جو رزلٹ شئیر کیا ہے وہ تو بہت بہتر ہے۔ اسکا مطلب میری بنائی گئی فائل میں ہی کوئی مسئلہ ہوگا۔
 

آصف اثر

معطل
ہاں اس سائٹ سے کام ہوگیا۔ لیکن اب جو رزلٹ آیا وہ تو بہت ہی خراب ہے۔ یوں سمجھ لیں کہ سو میں پانچ نمبر ہی دوں گا میں اسکو۔ لیکن اوپر آصف صاحب نے جو رزلٹ شئیر کیا ہے وہ تو بہت بہتر ہے۔ اسکا مطلب میری بنائی گئی فائل میں ہی کوئی مسئلہ ہوگا۔
کیا آپ یہی تصویر یہاں اپلوڈ کرسکتے ہیں؟ یا کوئی ربط ہو۔۔۔ تاکہ معلوم ہوسکے کہ مسئلہ تصویر میں ہے یا او سی آر میں۔
 

سید ذیشان

محفلین
ہاں اس سائٹ سے کام ہوگیا۔ لیکن اب جو رزلٹ آیا وہ تو بہت ہی خراب ہے۔ یوں سمجھ لیں کہ سو میں پانچ نمبر ہی دوں گا میں اسکو۔ لیکن اوپر آصف صاحب نے جو رزلٹ شئیر کیا ہے وہ تو بہت بہتر ہے۔ اسکا مطلب میری بنائی گئی فائل میں ہی کوئی مسئلہ ہوگا۔

300 ڈاٹ پر انچ ریزولوشن میں سکین کرنے میں اور 72 ڈاٹ پر انچ ریزولوشن سے ارٹیفیشلی 300 بنانے میں زمین آسمان کا فرق ہے۔بہتر یہی ہے کہ سکینر سے 300 ڈی پی آئی پر سکین کیا جائے۔
 

رانا

محفلین
کیا آپ یہی تصویر یہاں اپلوڈ کرسکتے ہیں؟ یا کوئی ربط ہو۔۔۔ تاکہ معلوم ہوسکے کہ مسئلہ تصویر میں ہے یا او سی آر میں۔
ذیشان بھائی ٹھیک کہہ رہے ہیں۔ آپ کا رزلٹ دیکھتے ہوئے مجھے یہی خیال آرہا تھا۔ بہرحال آپ کے رزلٹ کو دیکھتے ہوئے ایک بات کا تو اندازہ ہوا کہ کام بہت سنجیدگی سے ہورہا ہے جو بہت خوش آئند بات ہے۔
 
کل ٹوئٹر کے ذریعے یہ خبر ملی کہ یونیورسٹی آف انجینیئرنگ اینڈ ٹیکنالوجی لاہور کے اداروں، الخوارزمی انسٹیٹوٹ آف کمپیوٹر سائنس اور مرکزِ تحقیقاتِ لسانیات، نے اردو او سی آر کے لیے ایک نیا نظام، "اردو نستعلیق حرف شناس"، کا تجرباتی ورژن ریلیز کیا ہے۔ اس کی ویب سائٹ کے مطابق "اُردو نستعلیق حرف شناس (آپٹیکل کیریکٹر ریکگنائزر) ایک ایسا خودکار نظام ہے جو سکین کردہ صفحے سے متن اخذ کرتا ہے تاکہ اس میں ردّو بدل کیا جا سکے۔"

اس پروجیکٹ کی ویب سائٹ پر سسٹم کا ڈیمو بھی موجود ہے۔ میرے پاس کوئی سکین شدہ صفحہ تو تھا نہیں، اس لیے ویب سائٹ پر موجود مثالی صفحات میں سے ایک پر تجربہ کر کے دیکھا: نتائج مِلے جُلے ہی ہیں، لیکن ایک ابتدائی، تجرباتی ورژن کے لیے اتنا بھی بہت ہے۔ اگر آپ کے پاس سکین شدہ متن ہو، یا اگر کسی کتاب کا کوئی صفحہ سکین کر سکیں، تو اس سسٹم کو آزمانا ایک دلچسپ مشق ہو سکتی ہے۔

یہیں محفل پر کچھ عرصہ قبل ڈی-اے-ستی صاحب نے اپنا پی-ایچ-ڈی تھیسس شیئر کیا تھا جو اردو او سی آر کی تحقیق ہی پر مبنی تھا؛ یقیناً وہ اس نظام پر زیادہ بہتر روشنی ڈال سکیں گے۔ اچھی بات یہ ہے کہ پاکستانی یونیورسٹیز کے محققین اب اردو او سی آر کے لئے سنجیدگی سے کوششیں کر رہے ہیں، جو ایک قابلِ ستائش امر ہے۔
 
"محمد امین صد , یق
مجھے پہلی بار چونکہ اس محفل کے فورم میں شرکت کا شرف حاصل ہورہاہے چنانچہ سب سے پہلے میں آپ سب دوستوں کو اسقدر معلومات افزا مراسلات ارسال کرنے پر مبارکباداورخراج تحسین پیش کرتاہوں۔اب اس اردو او سی آر کی بابت عرض ہے کہ جی ہاں یہ میرا آزمایا ہو اہے اور میں نے اس کو اپنے اسکین کئے ہوئے صفحات پر آزمایا ہے اور رزلٹ کم وبیش 70 یا 80 فیصد آیا ہے جو کہ بطور تجرباتی ورژن ایک اچھی اور قابل قدر کاوش ہے ۔چنانچہ اردو کے متوالوں کو بجاطور پر ان کی بھرپور حوصلہ افزائی کرنی چاہئے تاہم دو روز سے یہ ویب سائٹ خدا جانے کیوں بند ہے حالانکہ ایسے کارآمد ویب سائٹ کوہرگز بند نہیں ہونا چاہیے کیونکہ مستقبل قریب میں اردو اوسی آر کے حوالے سے اس سے بہت سی توقعات اور امیدیں پوری ہوجائیں گی۔
 
رزلٹ 80 فیصد تک ہے۔
لیکن ایک بات سمجھ نہیں آئی کہ ہر دفعہ اسکین کرنے میں متن میں فرق دے رہا ہے۔
جی ہاں انیس صاحب ،مگر یہ فرق اکادکا الفاظ میں ہوتا ہے ،ایک اور اصلاح یہ کی گئی ہے کہ قبل ازیں حاصل شدہ متن میں چند ایک سطریں بوجوہ حذف ہوجاتی تھیں مگر حالیہ تازہ کاری میں اس کمزوری یا خامی کا بھی تدارک کیاگیاہےچنانچہ قوی امید ہے کہ آنیوالے دنوں میں یہ اوسی آر بجاطورپراس حوالے سے اپنا کام بطریق احسن سرانجام دیگی۔
 

arifkarim

معطل
کیا اسکین کردہ صفحہ ضروری ہے؟ میں نے ایک پی ڈی ایف کتاب سے جو نستعلیق فونٹ میں ہے ایک صفحہ الگ کرکے اس کو پینٹ برش میں لے جاکر جے پیگ فارمیٹ میں سیو کیا۔ لیکن اپ لوڈ کرتے ہوئے ایرر آیا کہ صفحہ کی ڈی پی آئی 300 نہیں ہے دوبارہ اسکین کریں۔ اس فائل کی ڈی پی آئی کسی طرح سیٹ کرسکتا ہوں؟

آپ اڈوبی ایکروبیٹ پرو میں پی ڈی ایف کھول کرے یہ کام کر سکتے ہیں:
b332.gif

b331.gif
 
مدیر کی آخری تدوین:

اوشو

لائبریرین
پتا نہیں کس طرح کی 300 DPI چاہیے اسے :(
کئی طرح سے کوشش کر چکا ہوں لیکن سائیٹ فائل قبولنے سے انکاری ہے:(
 
آپ اڈوبی ایکروبیٹ پرو میں پی ڈی ایف کھول کرے یہ کام کر سکتے ہیں:
محترم احباب محفل
السلام وعلیکم
انٹرنیٹ گردی کے دوران او سی آر کی ایک ویب سائٹ ہاتھ لگی جس میں ' ہندی ' اوسی آرکی سہولت مہیا ہے ۔اس ویب سائٹ کو آزمانے کے لئے جو بھی ہندی مواد میرے ہاتھ لگا ،میں نے اوسی میں اس کو آزمایا اور نتائج دلخوش کن سے بہرہ مند ہوا،تاہم یہ خواہش ہمہ وقت کچوکے دیتی کہ کیا ہی اچھا ہو اگر ' اردو 'اوسی آر بھی شامل ہو۔ حال ہی میں دوبارہ اس ویب سائٹ پر جانے کا اتفاق ہوا تو اس میں اوسی آر کے لئے دستیاب زبانوں میں ' اردو ' کوبھی موجود دیکھا۔مگر جب اردو اسکین کئے ہوئے صفحات اوسی آر کیے تو نتائج انتہائی غیر تسلی بخش پائے۔
ویب سائٹ کا ربط
https://www.newocr.com/
 

arifkarim

معطل
محترم احباب محفل
السلام وعلیکم
انٹرنیٹ گردی کے دوران او سی آر کی ایک ویب سائٹ ہاتھ لگی جس میں ' ہندی ' اوسی آرکی سہولت مہیا ہے ۔اس ویب سائٹ کو آزمانے کے لئے جو بھی ہندی مواد میرے ہاتھ لگا ،میں نے اوسی میں اس کو آزمایا اور نتائج دلخوش کن سے بہرہ مند ہوا،تاہم یہ خواہش ہمہ وقت کچوکے دیتی کہ کیا ہی اچھا ہو اگر ' اردو 'اوسی آر بھی شامل ہو۔ حال ہی میں دوبارہ اس ویب سائٹ پر جانے کا اتفاق ہوا تو اس میں اوسی آر کے لئے دستیاب زبانوں میں ' اردو ' کوبھی موجود دیکھا۔مگر جب اردو اسکین کئے ہوئے صفحات اوسی آر کیے تو نتائج انتہائی غیر تسلی بخش پائے۔
ویب سائٹ کا ربط
https://www.newocr.com/
اردو رسم الخط ہندی خط دیوناگری سے کہیں زیادہ پیچیدہ ہے
 
Top