یونیکوڈ اردو سے رومن اردو میں تبدیلی کی ضرورت!

اس پراجیکٹ پر کام کے لیے اردو سپیچ پراسیسنگ فورم ٹھیک رہے گی۔ میں بھی اس کام کے لیے حاضر رہوں گا۔ جہاں تک طریقہ کار کا تعلق ہے تو میرے خیال میں انٹرانس جیسے ٹول کا استعمال مناسب ثابت ہو سکتا ہے۔ سب سے پہلے اردو الفاظ کی فہرست حاصل کرنے کی کوشش کرو۔

اعجاز اختر والی فائل حاصل کرتا ہوں اور پھر ساتھ میں اردو سپیچ پراسیسنگ فورم میں ایک دھاگہ کھولتا ہوں۔
 

hackerspk

محفلین
رومن اردو میں تبدیلی کے لیا سب سے اچھا طریقہ کار تو الفاظ کو الفاظ سے بدلنا ہے نہ کہ حرف کو حرف سے۔ مثلا
اللہ = Allah

اس طرح کی ایک بڑی ڈکشنری تیار ہو۔ پھر کام نہایت اچھا ہو سکتا ہے۔ میرے پاس ایک ڈکشنری موجود بھی تھی جو کچھ عرصہ پہلے میں نے فورم پر شئیر کی تھی۔
 
میں اس خیال سے متفق ہوں hackerspk , میں نے آج سارا دن مختلف کوڈ کی کوششوں پر لگائے جس میں حرف بہ حرف transliteration کی گئی تھی مختلف انڈین زبانوں کے لیے مگر وہی مسئلہ کہ حرف بہ حرف کافی مشکل اور دقت طلب ہے ۔ تمام انڈین زبانوں والے کوڈ میں اردو غیر حاضر تھی جبکہ ملیالم ، کناڈا وغیرہ کافی دیکھنے کو ملی (پائتھون کوڈ میں)۔

میں اب لفظ کی تبدیلی پر ہی کام کر رہا ہوں اور اسی سلسلے میں اعجاز صاحب نے اپنی فائل کا بتایا ہے اور کیا تمہارے سافٹ ویئر "ابجد" میں urduwordlist والی فائل ہی وہ فہرست ہے جو دیکھی بھالی ہے ؟
 

نبیل

تکنیکی معاون
رومن اردو میں تبدیلی کے لیا سب سے اچھا طریقہ کار تو الفاظ کو الفاظ سے بدلنا ہے نہ کہ حرف کو حرف سے۔ مثلا
اللہ = Allah

اس طرح کی ایک بڑی ڈکشنری تیار ہو۔ پھر کام نہایت اچھا ہو سکتا ہے۔ میرے پاس ایک ڈکشنری موجود بھی تھی جو کچھ عرصہ پہلے میں نے فورم پر شئیر کی تھی۔

درست فرمایا۔ حرف بحرف بدلنے کا کام تو کسی خودکار سکرپٹ کے ذریعے بھی ممکن تھا۔ اصل کام صوتی متبادل معلوم کرنا ہے جس کا کوئی سادہ الگورتھم موجود نہیں ہے۔
 

نبیل

تکنیکی معاون
کام کے آغاز کے لیے ایک آئیڈیا یہ بھی ہو سکتا ہے کہ پہلے کرلپ کی 5000 الفاظ کی فہرست کے لیے رومن متبادل تیار کیے جائیں۔ اس طرح کم از کم زیادہ استعمال ہونے والے الفاظ کی ایک معقول تعداد کے رومن متبادل دستیاب ہو جائیں گے۔ جہاں تک مجھے یاد پڑتا ہے ابن سعید نے ایک مرتبہ ذکر کیا تھا کہ انہوں نے اسی فہرست کو گوگل سکرپٹ کنورٹر کے ذریعے رومن میں کنورٹ بھی کیا تھا۔ وہی بتا سکتے ہیں کہ آیا یہ تبدیل شدہ فہرست ان کے پاس موجود ہے یا نہیں۔
 
اس میں صرف اردو الفاظ کی فہرست ہے ان کے رومن دستیاب نہیں۔ ایک اور فائل ہے جس میں اردو کے ساتھ رومن کی بھی ایک بڑی ڈکشنری موجود ہے۔
http://www.scribd.com/doc/14203656/English-to-Urdu-and-Roman-Urdu-Dictionary

زبردست ، گو کہ ابن سعید نے اپنے طور پر اردو الفاظ کی ایک فہرست کو رومن میں تبدیل کرنے کا کوئی اطلاقیہ لکھا ہے ۔ میں نے بھی آج سارا دن بیٹھ کر یہی کوشش کی ہے اور ایک چھوٹا سا پروگرام لکھا ہے جو کہ بہت خام ہے جو ایک فائل کی مدد سے ڈکشنری کو بھرنے کے بعد اسی ڈکشنری کو استعمال کرکے کسی رومن تحریر کو لے کر لفظ بہ لفظ اردو میں کنورٹ کر رہا ہے۔ میں ابھی وہ پائتھون والے تھریڈ میں پوسٹ کرتا ہوں تاکہ پائتھون میں دلچسپی رکھنے والے حضرات اس میں بہتری لا سکیں اور مشق بھی ہو سکے۔
 

hackerspk

محفلین
میرا خیال ہے چند سو الفاظ کے لیے میں اسے ڈاٹ نیٹ میں بنا سکتا ہوں۔ اگر کہیں تو کوشش کروں؟
 

نبیل

تکنیکی معاون
میں ایک مرتبہ اس پراجیکٹ کے مقاصد کی جانب توجہ مبذول کروانا چاہوں گا۔ ہمارا مقصد اردو سے رومن ڈکشنری کا حصول ہے ناکہ کسی ایسی سروس کی تشکیل جس کے ذریعے اس قسم کی کنورژن کی جا سکے۔ البتہ ایسی ڈکشنری کو بنانے کے لیے جو مشترکہ کاوش درکار ہے اس کی کوآرڈینیشن کے لیے کوئی ویب بیسڈ ٹول جیسے کہ انٹرانس وغیرہ کا استعمال کیا جا سکتا ہے۔ جہاں تک اردو الفاظ کی فہرست کا تعلق ہے تو میں نے اسی بارے میں اوپر دریافت کیا ہے کہ کیا ہمیں زیادہ استعمال ہونے والے الفاظ پر پہلے کام نہیں کر لینا چاہیے؟ اس طرح زیادہ استعمال ہونے والے تقریبا 5000 الفاظ کی اردو ٹو رومن ڈکشنری تیار ہو جائے گی جس کی بدولت سپی ریکگنیشن کے تجربات ممکن ہو سکیں گے۔
 

hackerspk

محفلین
میری مراد ڈکشنری کے الفاظ سے نہیں ہے بلکہ ان الفاظ سے ہے جو یوزر کنورٹ کرنے کے لیے دے گا۔ میں فی الحال ساٹھ ہزار الفاظ کی ڈکشنری سے تقریبا 400 کے قریب الفاظ 10 سیکنڈ میں کنورٹ کروا سکتا ہوں۔
 
میری مراد ڈکشنری کے الفاظ سے نہیں ہے بلکہ ان الفاظ سے ہے جو یوزر کنورٹ کرنے کے لیے دے گا۔ میں فی الحال ساٹھ ہزار الفاظ کی ڈکشنری سے تقریبا 400 کے قریب الفاظ 10 سیکنڈ میں کنورٹ کروا سکتا ہوں۔

ٹھیک ہے اس کے لیے تجربات پر کام شروع کیا جا سکتا ہے کیونکہ اگلے ہفتہ سے الفاظ کی فہرست پر کام کے آغاز کا قوی امکان ہے۔
 
Top