گوگل ٹرانسلٹریشن کے ذریعے رومن اردو سے تحریری اردو میں تبدیلی

نبیل

تکنیکی معاون
السلام علیکم،

کچھ روز قبل فاتح نے گوگل ٹرانسلٹریشن اے پی آئی کے ذریعے رومن اردو کی یونیکوڈ اردو میں کنورژن کے امکان کی جانب اشارہ کیا تھا۔ میں نے اس سلسلے میں کچھ تجربات کیے ہیں اور زیر نظر پوسٹ میں انہی تجربات کے نتائج کے بارے میں معلومات فراہم کر رہا ہوں۔

اگرچہ انٹرنیٹ پر تحریری اردو کا استعمال روز افزوں ترقی کر رہا ہے لیکن ابھی بھی انٹرنیٹ پر اردو کا بیشتر مواد تصویری اور رومن اردو کی صورت میں موجود ہے جو کہ گزشتہ ڈیڑھ عشرے سے زائد عرصے سے جمع ہو رہا ہے۔ آج بھی آپریٹنگ سسٹمز اور اپلیکیشن سوفٹویر میں یونیکوڈ کی مکمل سپورٹ کے باوجود انٹرنیٹ پر صارفین کی ایک بڑی تعداد رومن اردو کا استعما‌ل کرتی ہے۔ گوگل کی جانب سے ٹرانسلٹریشن کنٹرول اور ٹرانسلٹریشن اے پی آئی مہیا کیے جانے کے بعد صارفین کے لیے ٹائپ کرتے وقت رومن اردو کو تحریری اردو میں تبدیل کرنا ممکن ہو گیا ہے۔ لیکن ٹرانسلٹریشن کنٹرول کے استعمال میں ایک دشواری یہ پیش آتی ہے کہ اس میں پہلے سے موجود رومن اردو مواد کو کاپی پیسٹ کرکے تحریری اردو میں تبدیل نہیں کیا جا سکتا۔ صرف براہ راست ٹائپ کردہ مواد کو ہی تحریری اردو میں کنورٹ کرنا ممکن ہے۔ گوگل ٹرانسلٹریشن اے پی آئی میں کچھ لو لیول فنکشن بھی شامل ہیں جن کے ذریعے پہلے سے موجود رومن اردو مواد کو تحریری اردو میں تبدیل کرنے کی صورت پیدا ہو جاتی ہے، اگرچہ فی الوقت اس لو لیول اے پی آئی کا اس مقصد کے لیے استعمال بھی محدود پیمانے پر ممکن ہے۔ زیر نظر تحریر میں میں رومن اردو کو تحریری اردو میں کنورٹ کرنے کے لیے گوگل کی لو لیو ٹرانسلٹریشن کے استعمال کے بارے میں کچھ تجربات کے نتائج کے بارے میں معلومات فراہم کر رہا ہوں۔

گوگل کی لو لیول ٹرانسلٹریشن اے پی آئی کے استعمال سے مجھے یہ معلوم ہوا ہے کہ اس کے ذریعے فی الحال کئی الفاظ کی لسٹ کی اکٹھی ٹرانسلٹریشن کرنا ممکن نہیں ہے بلکہ ہر لفظ کو علیحدہ علیحدہ ٹرانسلٹریٹ کرنا پڑتا ہے۔ اس کے باعث کسی تحریر کو رومن اردو سے تحریری اردو میں کنورٹ کرنے کے لیے درکار وقت اس متن کی لمبائی کے راست متناسب ہوگا۔ ایک اور مسئلہ میرے مشاہدے میں آیا ہے کہ گوگل کی لو لیو ٹرانسلٹریشن اے پی آئی اے سنکرونس (asynchronous) ہے اور اس کا عمل مختلف براؤزر میں مختلف ہوتا ہے۔ انٹرنیٹ ایکسپلورر میں یہ پرابلم پیش آتی ہے کہ تبدیل شدہ تحریری اردو متن میں الفاظ کی ترتیب اکثر رومن اردو والے متن کی ترتیب سے مختلف ہوتی ہے۔ اس کے باعث اس کنورژن کی افادیت ختم ہوجاتی ہے۔ میں نے اسے فائر فاکس پر بھی ٹیسٹ کیا ہے اور اس پر یہ درست کام کرتی نظر آ رہی ہے۔ فی الحال میں نے مزید براؤزرز پر اسے ٹیسٹ نہیں کیا ہے۔ میرا قیاس ہے کہ گوگل کروم پر بھی یہ ٹھیک کام کرے گا۔

میں نے گوگل کی لو لیول ٹرانسلٹریشن اے پی آئی کے ذریعے رومن اردو سے تحریری اردو میں تبدیلی کے لیے ایک ابتدائی پروٹوٹائپ تیار کیا ہے۔ جیسا کہ ذیل کی تصویر میں دکھایا گیا ہے، اوپر والے ٹیکسٹ ایریا میں رومن اردو والا متن کاپی پیسٹ کرنے کے بعد Transliterate بٹن پر کلک کرنے سے نیچے والے ٹیکسٹ ایریا میں تبدیل شدہ تحریری اردو متن ظاہر ہو جائے گا۔ نیچے والے ٹیکسٹ ایریا میں اردو ویب پیڈ ایڈیٹر فراہم کیا گیا ہے جس کے ذریعے کنورٹ کردہ متن میں ضرورت تصحیح کرنے میں سہولت ہو جاتی ہے۔ یہ ڈیمو اس ربط پر موجود ہے۔

transliterate2.gif

ذیل کی تصویر میں بھی اوپر والی مثال کی طرح رومن اردو کو تحریری اردو میں کنورژن دکھائی گئی ہے۔ فرق صرف اتنا ہے کہ اس مثال میں زیریں ٹیکسٹ ایریا میں اردو ویب پیڈ کی بجائے گوگل کا ٹرانسلٹریشن کنٹرول فراہم کیا گیا ہے۔ اس کا مقصد بھی تبدیل شدہ متن میں ضروری تصحیح کی سہولت فراہم کرنا ہے۔ یہ ڈیمو اس ربط پر موجود ہے۔

transliterate1.gif

ذیل کی تصویر میں اسی ٹرانسلٹریشن پروٹوٹائپ کا انٹرنیٹ ایکسپلورر میں استعمال دکھایا گیا ہے۔ جیسا کہ تصویر سے ظاہر ہے، انٹرنیٹ ایکسپلورر میں الفاظ کی ترتیب گڑبڑ ہو رہی ہے۔

transliterate_ie.gif

رومن اردو سے تحریری اردو میں تبدیلی کے تجربات کے لیے متن ان بے شمار رومن اردو فورمز اور ویب سائٹس سے حاصل کیا جا سکتا ہے جو کافی عرصے سے انٹرنیٹ پر موجود ہیں۔ چونکہ رومن اردو لکھنے کا کبھی کوئی باقاعدہ معیار موجود نہیں رہا ہے، اس لیے مختلف رومن اردو تحاریر کو اس طریقے سے تحریری اردو میں کنورٹ کرنے سے مختلف نتائج حاصل ہوں گے۔

اس مضمون میں پیش کردہ پروٹوٹائپ کا کوڈ ڈاؤنلوڈ کریں

میں امید کرتا ہوں کہ آپ رومن اردو سے تحریری اردو میں کنورژن کے ان ابتدائی پروٹوٹائپس کے استعمال کو مفید پائیں گے۔ مستقبل میں اگر گوگل کی جانب سے اس کی ٹرانسلٹریشن اے پی آئی کو بہتر اور استعمال میں آسان بنایا جاتا ہے تو رومن اردو سے تحریری اردو میں تبدیلی کا عمل بھی بہتر نتائج فراہم کر سکے گا۔‌
 

Attachments

  • roman2urdu.zip
    36.3 KB · مناظر: 129

نبیل

تکنیکی معاون
یہاں میں سب دوستوں کو دعوت دیتا ہوں کہ وہ نیٹ سے رومن اردو متون کو بالا میں پیش کردہ طریقے کے ذریعے تحریری اردو میں کنورٹ کرکے یہاں اپنے نتائج پیش کریں۔ اکثر اوقات یہ نتائج آپ کی توقعات کے برعکس نکلیں گے۔ مثال کے طور پر London کو ٹرانسلٹریٹ کرنے پر یہ لونڈوں بن جاتا ہے۔ :laughing:
 

نبیل

تکنیکی معاون
ذیل کا متن ہلا گلا فورم سے اٹھایا گیا ہے:

[ENG]
Kitny dhoom dhaam se manaya jata he 14 August ka din, agar me ghalat na kahoon tau shaid Eid k din se bhi ziada Ronaq lagi hoti he. Hamar Jashan-e-Azadi manany ka tareeqa bhi duniya me sab se anookha he. Hum har wo kaam kar ke jashan manatay aur khushi mahsoos karty hain, jis se doosro ko takleef ho jis se doosro ko bechainy ho, jis se doosry ko chirchira uthain. Maslan motor bike bina silencer chalna, one wheel show. Racing oonchi awaz me music wagher waghera. Wo mulak jahan bijli ki kami he aur 14-16 se ghatny ki load shedding ho rahi ho jahan ki awam bijli naam ko taras ho rahi, jahan ki economy bijli k hatho khatam hoti ja rahi ho. Waha Jashn-e-Azadi pe aisy noora barsa jaisy hum Bijli khud kafeel ho chuky. Jaisy iss rang – o – k seelab me beh kar sab badal jayee ga.​
[/ENG]

اسے ٹرانسلٹریٹ کرنے پر ذیل کا متن حاصل ہوتا ہے:

کتنے دھوم دھام سے منایا جاتا ہے ١٤ اگست کا دِن اگر مے غلط نہ کہوں تو شائد عید ک دیں سے بھی زیادہ رونق لگی ہوتی ہے ہمار ظَثہَنےاذَدِ منانے کا طریقہ بھی دنیا مے سب سے انوکھا ہے ہم ہر وو کام کر کے جشن مناتے اور خوشی محسوس کرتے ہَِن جس سے دوسرو کو تکلیف ہو جس سے دوسرو کو بچیننے ہو جس سے دوسرے کو چڑچڑا ُطَِن مسلان موٹر بکے بنا سیلنکر چَلنَ انے وہیل ثہوی رکنگ اونچی آواز مے مسک وغیر یَغےڑَ وو ملک جہاں بجلی کی کمی ہے اور ١٤١٦ سے گھٹنے کی لوڈ شیدڈنگ ہو رہی ہو جہاں کی اوم بجلی نام کو ترس ہو ڑَہِ جہاں کی اونومنے بجلی ک ہاتھو ختم ہوتی جا رہی ہو وہا ظَثہنےاذَدِ پی ایسے نورا برسا جیسے ہم بجلی خود کفیل ہو چُکی جیسے اسس رنگ و ک سیلاب مے بہ کر سب بدل جیے گَ
 
اصل میں گوگل کا اردو ٹرانسلٹریشن انجن ابھی سیکھ رہا ہے۔ اسے میچیور ہونے میں وقت لگے گا۔ جس دن اس ٹرانسلٹریشن کے نتائج زیادہ عمدگی سے آنے لگے اس دن گوگل اپنا ٹرانسلٹریشن چیٹ باٹ بھی اردو کے لئے جاری کر دے گا جیسا کہ اس نے ہندی اور چند ایک اور ہندوستانی زبانوں کے لئے کیا ہے۔
 

فاتح

لائبریرین
filhaqeeqat mujhay alfaaz nahi mil rahay ke kis tarah aap ka shukriya adaa karoon
aap nay meri khwahish ko pa ba zanjeer e haqeeqat kar diya
فلحقیقت مجھے الفاظ نہیں مل رہے کے کس طرح آپ کا شکریہ ادا کروں
آپ نے میری خواہش کو پا با زنجیر ا حقیقت کر دیا

Haj ka sawaab nazr kiya hay nabeel ki
حج کا صواب نظر کیا ہے نبیل کی
 

نبیل

تکنیکی معاون
bradram fateh , aap ko khush dekh main bhi aabdeedah ho gaya hooN . kiya khabar ham kabhi London main milain

برادرم فتح آپ کو خوش دیکھ میں بھی آبدیدہ ہو گیا ہوں کیا خبر ہم کبھی لونڈوں میں ملیں
 

نبیل

تکنیکی معاون
اصل میں گوگل کا اردو ٹرانسلٹریشن انجن ابھی سیکھ رہا ہے۔ اسے میچیور ہونے میں وقت لگے گا۔ جس دن اس ٹرانسلٹریشن کے نتائج زیادہ عمدگی سے آنے لگے اس دن گوگل اپنا ٹرانسلٹریشن چیٹ باٹ بھی اردو کے لئے جاری کر دے گا جیسا کہ اس نے ہندی اور چند ایک اور ہندوستانی زبانوں کے لئے کیا ہے۔



ibne saeed ye to bohot achi baat ho gi , agar google transliteration ki Zahanat main ijafa ho jata hai to is say conversion ki quality behtar ho jaiy gi

ابنے سید یہ تو بوہوت اچھی بات ہو گی اگر گوگل ٹرانسلٹریشن کی ذہانت میں اضافہ ہو جاتا ہے تو اس سے کونورسیوں کی قولیتنے بہتر ہو جیسے گی
 

ذیشان حیدر

محفلین
بہت اچھی پیش رفت ہے اللہ تعالیٰ‌ آپ کو جزائے خیر عطا فرمائیں ۔ اللہ آپ کو دین اسلام اور اردو کی خدمت میں ترقی عطا فرمائے(آمین)
 

شاہ حسین

محفلین
ماشاء اللہ جناب نبیل صاحب نہایت عمدہ کاوش ہے ۔

ایک خیال تھا ذہن میں آیا یقینا یہ پہلو آپ کی نظر سے پوشیدہ نہ ہو گا گو کہ مجھے نی پروگرامنگ نہ اس کے اسرار و رموز کی کچھ سمجھ ہے اگر کچھ جاہلانہ قسم کا لگے تو پیشگی معزرت ۔

میں نے مختلف سائٹس سے (رومن میں) اس پروگرام میں‌پیسٹ کیا کچھ درست نتائج کے ساتھ کافی اغلاط شامل تھیں ۔ جس طرح ہم لیگجز بیس فونٹ میں مختلف اشکال کو ڈالتے ہیں اسی تھیوری کو مدنظر رکھ کر رومن اردو میں‌جو مستعمل ترین اسپیلنگ ہو اس سے نتیجہ اخذ کیا جائے تو کافی حد تک درست نتائج سامنے آسکتے ہیں ۔
مگر ایک خرابی سامنے اور اس صورت میں آسکتی ہے کہ اس ایپلیکیشن کا سائز بڑا ہو جائے گا ۔
 

ابوشامل

محفلین
نتائج اس لیے سو فیصد ملنے کا امکان نہیں کہ رومن لکھنے کا کوئی معیار نہیں ہے آپ چاہیں تو بہت کو buhat لکھیں یا bohot یا صرف boht یہ سراسر آپ کی مرضی پر منحصر ہے۔
نبیل بھائی کی کوشش بہت اعلی لگتی ہے۔ ابھی چیک کر کے مزید کوئی رائے دے پاؤں گا۔
 

فاتح

لائبریرین
bradram fateh , aap ko khush dekh main bhi aabdeedah ho gaya hooN . kiya khabar ham kabhi London main milain

برادرم فتح آپ کو خوش دیکھ میں بھی آبدیدہ ہو گیا ہوں کیا خبر ہم کبھی لونڈوں میں ملیں
hahahahaha
ہاہاہاہاہا
jis tarah sookhay huway phool kitaabon mein milein
جس طرح سوکھے ہوئے پھول کتابوں میں ملیں

میں نے اب تک یہی دیکھا ہے کہ گوگل انگریزی کے الفاظ کو اردو میں ٹرانسلیٹریٹ نہیں کرتا مثلاً سپیس بار، ڈیٹا بیس، لنڈن وغیرہ
اس کا ڈیٹا بیس جس قدر وسیع ہو گا اور جس قدر صارفین اسے استعمال کریں گے اسی قدر الفاظ کے مختلف النوع رومن ہجے گوگل سمجھنے لگے گا۔
بہرحال صمیمِ قلب سے ایک مرتبہ پھر آپ کا شکریہ:)
 

نبیل

تکنیکی معاون
ماشاء اللہ جناب نبیل صاحب نہایت عمدہ کاوش ہے ۔

ایک خیال تھا ذہن میں آیا یقینا یہ پہلو آپ کی نظر سے پوشیدہ نہ ہو گا گو کہ مجھے نی پروگرامنگ نہ اس کے اسرار و رموز کی کچھ سمجھ ہے اگر کچھ جاہلانہ قسم کا لگے تو پیشگی معزرت ۔

میں نے مختلف سائٹس سے (رومن میں) اس پروگرام میں‌پیسٹ کیا کچھ درست نتائج کے ساتھ کافی اغلاط شامل تھیں ۔ جس طرح ہم لیگجز بیس فونٹ میں مختلف اشکال کو ڈالتے ہیں اسی تھیوری کو مدنظر رکھ کر رومن اردو میں‌جو مستعمل ترین اسپیلنگ ہو اس سے نتیجہ اخذ کیا جائے تو کافی حد تک درست نتائج سامنے آسکتے ہیں ۔
مگر ایک خرابی سامنے اور اس صورت میں آسکتی ہے کہ اس ایپلیکیشن کا سائز بڑا ہو جائے گا ۔

نتائج اس لیے سو فیصد ملنے کا امکان نہیں کہ رومن لکھنے کا کوئی معیار نہیں ہے آپ چاہیں تو بہت کو buhat لکھیں یا bohot یا صرف boht یہ سراسر آپ کی مرضی پر منحصر ہے۔
نبیل بھائی کی کوشش بہت اعلی لگتی ہے۔ ابھی چیک کر کے مزید کوئی رائے دے پاؤں گا۔

جیسا کہ میں نے اپنی پہلی پوسٹ میں عرض کیا ہے، تبدیل کردہ متن کی درستگی کا انحصار گوگل کے ٹرانسلٹریشن سسٹم کی ذہانت پر ہے۔ ابن سعید نے بھی بتایا ہے کہ یہ سسٹم ابھی بہتر بنایا جا رہا ہے۔ اگر گوگل کی جانب سے اس کے ٹرانسلٹریشن سسٹم کی ذہانت میں مسلسل اضافہ کیا جاتا رہا تو رومن سے تحریری اردو میں تبدیلی کے نتائج بھی بہتر ہوتے جائیں گے۔
 

نبیل

تکنیکی معاون
مشہور پاکستانی صحافی ابراہیم ساجد ملک کے بلاگ پر تبصرہ خانے میں رومن اردو مبدل کی سہولت کس طرح آئی؟ ذرا ملاحظہ کیجیے
اس بلاگ پر بھی گوگل ٹرانسلٹریشن بک مارکلٹ استعمال ہو رہا ہے۔ میرا ارادہ ہے کہ ورڈپریس کے لیے علیحدہ سے اردو ٹرانسلٹریشن پلگ ان تیار کروں۔
 

پردیسی

محفلین
نبیل بھائی آداب
آج آپ کی اس کاوش پر نگاہ پڑی تو بتا نہیں سکتا کہ کتنی خوشی ہو رہی ہے۔آپ کے اردو ایڈیٹر اور دیگر کاوشوں نے انٹرنیٹ کی دنیا میں تحریری اردو کو فروغ دینے میں جو کردار ادا کیا ہے اس کی مثال ملنی مشکل ہے۔اور یہ آپ کی کاوش میرے خیال میں ایک تہلکہ مچا دینے والی ہے۔لوگوں کو شاید ابھی اس کی افادیت کا اندازہ نہ ہو مگر دیکھئے گا کہ آپ کی اس کاوش سے تحریری اردو کا مستقبل بہت زیادہ تابناک ہو گا۔گوگل سے مواد کو کنورٹ کرنے سے اتنی جلدی تحریری اردو میں ترقی ہونا مشکل ہوتا مگر اب مجھے تحریری اردو کا مستقبل زیادہ تابناک نظر آ رہا ہے۔کیونکہ رومن اردو اب بھی انٹرنیٹ اردو میں ساتھ پرسنٹ کے قریب استمال ہو رہی ہے۔مجھے امید ہے کہ آپ کی یہ کاوش کل کو آپکی بہترین کاوشوں میں شمار کی جائے گی
 

نبیل

تکنیکی معاون
السلام علیکم پردیسی بھائی،
مجھے بھی آپ کو اتنے عرصے بعد یہاں دیکھ کر بہت خوشی ہو رہی ہے۔ آپ جیسے مہربان دوستوں کی حوصلہ افزائی ہی ہمارے لیے آگے بڑھنے کی مہمیز ثابت ہوتی ہے۔

میں نے یہاں جو کوڈ اور ڈیمو فراہم کیا ہے، یہ صرف ایک پروٹوٹائپ ہے۔ اس کی وجہ یہ ہے کہ ابھی گوگل کی ٹرانسلٹریشن اے پی آئی اور خاص طور پر اردو ٹرانسلٹریشن ابھی زیادہ میچیور نہیں ہوئے ہیں۔ لیکن یہ بات پھر بھی اطمینان بخش ہے کہ اب گوگل جیسی بڑی کمپنیوں نے اردو پر بھی توجہ دینا شروع کر دیا ہے۔ میں امید کرتا ہوں کہ آئندہ کچھ عرصے میں نہ صرف گوگل کی ٹرانسلٹریشن اے پی آئی میں بہتری آئے گی، بلکہ اس کی ڈیٹابیس بھی خاطر خواہ حد تک بڑھ جائے گی۔ اس کے بعد یقیناً اس سسٹم کی افادیت میں کئی گنا اضافہ ہو جائے گا۔
 

پردیسی

محفلین
بہت شکریہ نبیل بھائی
اصل میں وقت ہی نہیں ملتا جب سے نیوز میں پڑے ہیں سب ڈویلپنگ وغیرہ کے کام چوپٹ ہو گئے ہیں۔۔بس یوں جانئے کہ روزی روٹی کے چکر میں پڑے ہیں۔
جی ہاں آپ کی بجا کہ یہ پروٹوٹائپ ہے اور اس میں گوگل ٹرانسلٹریشن اے پی آئی استمال کی گئی ہے مگر میں پھر کہوں گا کہ آپ کی یہ کاوش لاجواب ہے۔اس کی افادیت کا اندازہ سب کو جلد ہو جائے گا
 
نبیل بھائی اس کی بینچ مارکنگ کے لئے کچھ سیمپل ڈاٹا جمع کرلیتے ہیں۔ اور ہر ہفتے دو ہفتے میں اسی سیمپل ڈاٹا کو اس ٹرانسلٹریشن کے مرحلے سے گزار کر دیکھتے ہیں کیا بہتری آتی ہے وقت کے ساتھ ساتھ۔
 
Top