نستعلیق, او سی آر , کیلئے ایک آئیڈٰیا!

arifkarim

معطل
کل مجھے ایک فلم کے سبٹائیٹلز جو کہ تصویری شکل میں تھے، تحریری صورت میں پیش کرنی ضرورت پیش آئی۔ نیٹ گردی کے دوران ایک چھوٹا سا ٹول ملا : Vobresync
یہ ٹول کسی بھی ڈی وی ڈی کے سبٹائیٹلز کو نہایت آسانی کیساتھ یونیکوڈ میں پیش کر دیتا ہے۔
اسکا او سی آر نہایت آسان ہے۔۔۔۔ یہ آٹو میٹک حروف کے درمیان فاصلہ ڈھونڈتا ہے اور پھر اسکا یونیکوڈ متبادل لکھنے کو کہتا ہے۔ انگریزی کے تقریبا 50 الفابیٹس ٹائپ کرنے کے بعد یہ اس قابل ہو گیا کہ مستقبل میں اگر کوئی بھی پکچر جس میں مطلوبہ فانٹ کی تحریر ہوگی، یہ اسے ڈیٹکٹ کرکے یونیکوڈ میں کر دے گا :)

اس پروگرام کی ایک خوبی یہ ہے کہ یہ او سی آر ڈیٹا ایک فائل میں محفوظ کر سکتا ہے، جسکی بعد میں تدوین بھی ممکن ہے۔ نیز اگر کوئی حرف مکمل ڈیٹکٹ نہ ہو رہا ہو، تو ایک کلک پر اسکا سرچنگ ریجن بڑھایا جا سکتا ہے۔

اس حوالے سے مجھے یہ خیال آیاکہ اگر اس پروگرام کی لاجک پر ایک پروگرام لکھا جائے جو نوری نستعلیق ترسیمہ جات کو ڈیٹکٹ کرکے ہم سے اسکا یونیکوڈ پوچھے اور پھر اسکو ٹائپ کرنے بعد اپنی ڈیٹا بیس میں محفوز کر لے۔ تو مجھےامید ہے کہ اردو او سی آر کی راہ ہموار ہو سکے گی۔ نوری نستعلیق لگیچرز میں یہ مسئلہ ہے کہ اس میں کرننگ بہت زبردست ہوتی ہے، اور لفظ پر لفظ چڑھا ہوتا ہے۔ جبکہ لاطینی حروف ایک لائن میں ساتھ ساتھ ہونے کے سبب زیادہ آسانی سے ڈیٹیکٹ ہو جاتے ہیں۔

اسوقت شاید صرف ابن سعید ہی اردو او سی آر پر کام کر رہے ہیں۔میں نےایک بار پڑھا تھا کہ محسن حجازی بھائی نے مقتدرہ میں اردو او سی آر کیلئے ایک انجن بنایا تھا۔ کیا اس پراجیکٹ کا اسٹیٹس معلوم ہو سکتا ہے؟

خیر پروگرامر حضرت Vobresync کو یہاں سے اتار سکتے ہیں:
http://www.videohelp.com/download/VobSub_2.23.exe

یہ پروگرام اس بنڈل کے اندر ہی موجود ہے۔ اسکو چیک کرنے لئے آپکو کسی بھی فلم کی ایک سب ٹائیٹل فائل درکار ہوگی، مثال کے طور انڈین فلم "ہیروز" کے پہلے حصے کی سبٹائیٹل فائل یہاں سے اتار سکتے ہیں:

http://www.fileden.com/files/2008/5/23/1926615/CD1.rar
 
Top