اردوسے رومن اردو ٹرانسلٹریشن پر کام

فاتح

لائبریرین
آپ کی اطلاع کے لیے عرض ہے کہ دنیا کی ہر زبان کی آوازوں کو آئی پی اے کے الفا بٹ میں لکھا جا سکتا ہے۔ اس کا مقصد ہی یہ تھا کہ املاء سے بے نیاز ہو کر صوتیات کے ماہرین صرف آوازوں، ان کے مخارج، ان کے طریقہ ادائیگی وغیرہ پر توجہ مرکوز کر سکیں۔ اگر ایسا نہیں ہے تو یہ اپنا مقصدہ ہی کھو دیتا ہے۔ عربی، پنجابی، اردو، فارسی سب کی آوازیں اس میں بیان کی جا سکتے ہیں۔ عربی ق، خ، ط، ت وغیرہ سب کے لیے اس میں الگ سے علامات موجود ہیں۔ کھ، گھ، چھ وغیرہ کو ظاہر کرنے کا بھی ایک خاص طریقہ ہے۔ آپ آئی پی اے پر مزید مطالعہ کریں اور پھر بتائیں کہ کونسی زبان کی آوازیں اس میں نہیں لکھی جا سکتیں۔ دعویٰ آپ نے کیا ہے ثبوت بھی دیں۔
لیجیے آپ ہی کے محبوب ادارے سی ایل اے کا حوالہ بطور ثبوت :)
چلیے اب آپ بطور ماہرِ لسانیات میری مزید اطلاع کے لیے مجھے ذیل کے حروف کے لیے "الگ الگ" آئی پی اے کے متبادل بتا دیجیے تا کہ مجھ جاہل کے علم میں اضافہ ہو سکے:
ا :؟
ع: ؟
دو مثالیں آسف اور عاصف آئی پی اے میں لکھ دیجیے

ت: ؟
ط: ؟
دو مثالیں تا اور طا آئی پی اے میں لکھ دیجیے

ث: ؟
س: ؟
ص: ؟
تین مثالیں ثمر، سمر اور صمر آئی پی اے میں لکھ دیجیے

ز: ؟
ذ: ؟
ض: ؟
ظ: ؟
اپنی مرضی سے چاروں کی کوئی مثالیں بھی لکھنا مت بھولیے گا۔ :)
 
آخری تدوین:
کونسی زبان کی آوازیں اس میں نہیں لکھی جا سکتیں
آئی پی اے کے حوالے سے ہماری معلومات بے حد محدود ہے، البتہ ہم نے پہلی دفعہ اس بابت سن 2008 میں سنا تھا جب ہم سری نگر یونیورسٹی کشمیر میں لوکل لینگوئج کمپیوٹنگ پر ورکشاپ میں بطور پریزینٹر گئے ہوئے تھے۔ وہاں اردو ڈیپارٹمنٹ کے ہیڈ نے بتایا کہ کشمیری زبان کے کم از کم دو حروف علت ایسے ہیں جن کا تلفظ اس وقت تک آئی پی اے کی مدد سے ممکن نہ تھا، اب کا کچھ کہہ نہیں سکتے۔ :) :) :)
 

arifkarim

معطل
اس موضوع پر تحقیق کے دوران جو مسائل نظر آئے ہیں ان میں رومن حروف کی تعداد کا اردو حروف سے کہیں کم ہونا سب سے زیادہ واضح ہے۔ میں نے مختلف ٹرانسلٹریشن اسکرپٹس کا مطالعہ کیا ہے اور سبھی میں انگریزی الفابیٹس کو استعمال کر لینے کے بعد مشینی انداز میں باقی اردو حروف ڈیفائن کرنے کی کوشش کی جاتی ہے جو کہ متن پڑھتے وقت عام صارف کیلئے مشکلات کا باعث بنتی ہے۔ اس ضمن میں اگر ہم ترکی زبان کی رومنائزیشن کا جائزہ لیں تو معلوم ہوگا کہ یہ کام اتنا سادہ اور آسان نہیں جتنا ہم سمجھ رہے ہیں ۔
https://en.wikipedia.org/wiki/Turkish_alphabet#History
ترکی زبان بھی قریباً ایک ہزار سال تک عربی رسم الخط میں لکھی جاتی تھی ۔ پھر خلافت عثمانیہ کے زوال کے بعد مصطفیٰ کمال اتاترک نے اسے لاطینی حروف میں کنورٹ کر دیا جو آج تک جمہوریہ ترکی میں مستعمل ہے۔ ہم اردو دانوں کو بھی کچھ اسی قسم کے اسٹینڈرڈ کی ضرورت ہوگی۔
 
آخری تدوین:

arifkarim

معطل
فاتح اب کیا کہتے ہیں؟
brierley14jss_Page_21.jpg
 
مدیر کی آخری تدوین:

دوست

محفلین
کم تحقیق شدہ زبانوں جیسے کشمیری کے حوالے سے ایسا کہنا جائز ہو سکتا ہے کہ چند ایک آوازیں ابھی آئی پی اے میں شامل نہیں۔ لیکن عربی کی این ایل پی اور معیار بندی پر بہت زیادہ کام ہو چکا ہے۔ عربی عرب استعمار کی زبان رہ چکی ہے اس لیے اس کے حوالے سے ایسا امکان موجود نہیں ہے۔ یہی صورتحال فارسی کی ہے۔ اردو ہندی کی آوازیں تو سنسکرت اور عربی/فارسی سے مستعار ہیں چنانچہ وہ بھی سب کی سب اس میں شامل ہیں۔ یہی حال پنجابی کا ہے بھی۔ سندھی، سرائیکی، بلوچی۔ ہاں بہت کم بولی جانے والی زبانوں جیسے شنا، بلتی، واخی کے لیے یہ بات کہی جا سکتی ہے، لیکن یہ بھی یاد رہے کہ ایسی زبانوں پر مغربی ماہرینِ لسانیات کی خصوصی نظرِ کرم ہوتی ہے۔ ان کی دستاویز بندی اور مطالعہ پر پچھلے برسوں میں بے بہا کام ہوا ہے اور ہو رہا ہے۔ کشمیر اور گلگت بلتستان جیسے لسانی طور پر زرخیز علاقے ہمیشہ ہی سماجی لسانیات کے ماہرین کو کشش کرتے ہیں۔
 

فاتح

لائبریرین
فاتح بے چارے نے کیا کہنا ہے۔۔۔ یہ ایک تحقیقی مقالہ (ریسرچ پیپر) ہے اور اگر آئی پی اے میں یہ حروف سٹینڈرڈ کے طور پر شامل ہوتے تو اس مصنف (آتھر) کو تحقیقی مقالہ لکھ کر اس جانب توجہ دلانے اور اپنی جانب سے تجاویز پیش کرنے کی کیا ضرورت تھی؟
لیکن اگر یہ سٹینڈرڈ ہے تو نہ صرف میرے علم میں اضافہ ہے بلکہ خوش کن بات ہے
 
مدیر کی آخری تدوین:

نبیل

تکنیکی معاون
ایک مرتبہ میری تمام دوستوں سے گزارش ہے کہ اردو سے رومن متبادل حاصل کرنے میں تعاون کریں۔ میری کوشش ہوگی کہ اس لغت کے لیے کم از کم ایک لاکھ اندراجات حاصل کیے جا سکیں۔
 

تجمل حسین

محفلین
ایک مرتبہ میری تمام دوستوں سے گزارش ہے کہ اردو سے رومن متبادل حاصل کرنے میں تعاون کریں۔ میری کوشش ہوگی کہ اس لغت کے لیے کم از کم ایک لاکھ اندراجات حاصل کیے جا سکیں۔
نبیل بھائی اس سلسلے میں کیا ایسا نہیں ہوسکتا کہ اردو ویب پر ہی ایک الگ سیکشن بنادیا جائے۔ جہاں مختلف پیراگراف دیئے جائیں اور کوئی بھی انہیں رومن اردو میں تبدیل کرسکے۔ کیونکہ خود سے پیراگراف ڈھونڈنے اور پھر رومن اردو میں کنورٹ کرکے یہاں پوسٹ کرنے کے عمل بہت سارے لوگ تھوڑے سست ہوجاتے ہیں۔ اگر مختلف پیراگراف سامنے ہوں تو ان میں سے اپنی مرضی کا پیرا منتخب کرکے اسے رومن اردو میں تبدیل کرنا آسان ہوگا۔ اس بات تعین بھی کیا جاسکتا ہے کہ ایک پیراگراف زیادہ سے زیادہ کتنی تعداد میں رومن اردو میں تبدیل کیا جائے۔
اگر ایسا ہوسکے تو میرے خیال میں اردو سے رومن اردو میں تبدیلی کا کام تیزی سے ہوجائے گا۔ :)
 
ایک طریقہ کار یہ بھی ہو سکتا ہے کہ کوئی ایسی ضخیم کتاب منتخب کر لی جائے، جو زیادہ سے زیادہ الفاظ کا احاطہ کرتی ہو۔ اور اس کو رومن میں لکھا جائے۔
لیکن جتنے زیادہ لوگ اس کام میں شامل ہوں گے، اتنے ہی زیادہ متفرق تلفظ سامنے آ جائیں گے۔
 

فاتح

لائبریرین
ایک مرتبہ میری تمام دوستوں سے گزارش ہے کہ اردو سے رومن متبادل حاصل کرنے میں تعاون کریں۔ میری کوشش ہوگی کہ اس لغت کے لیے کم از کم ایک لاکھ اندراجات حاصل کیے جا سکیں۔
کرلپ کی اردو لغت کا ڈیٹا تو موجود ہی ہے اور اس میں یوں تو سوا لاکھ سے زائد الفاظ کا اندراج ہے لیکن اب تک 82000 سے زائد الفاظ کے معنی اور مصوتوں کے ساتھ درج کیے جا چکے ہیں۔ ابن سعید بھائی سے گفتگو کے دوران یہ نکتہ سامنے آیا کہ اس ڈیٹا بیس میں سے اگر مصوتے نکال لیے جائیں تو کل مصوتوں کی تعداد چند ہزار سے تجاوز نہیں کرے گی جنہیں رومن میں ڈھالنا کسی قدر مشینی اور کسی قدر مینوئل انداز سے کرنا بہت زیادہ دشوار نہ ہو گا اور اس کے بعد مکمل مشینی طریق سے ان رومن فونیمز کو الفاظ کی فہرست سے میپ کرنا بھی زیادہ مشکل نہیں۔ یوں ہمارے پاس 82000 سے زائد الفاظ کا رومن ڈیٹا آ جائے گا۔
 

نبیل

تکنیکی معاون
کرلپ کی اردو لغت کا ڈیٹا تو موجود ہی ہے اور اس میں یوں تو سوا لاکھ سے زائد الفاظ کا اندراج ہے لیکن اب تک 82000 سے زائد الفاظ کے معنی اور مصوتوں کے ساتھ درج کیے جا چکے ہیں۔ ابن سعید بھائی سے گفتگو کے دوران یہ نکتہ سامنے آیا کہ اس ڈیٹا بیس میں سے اگر مصوتے نکال لیے جائیں تو کل مصوتوں کی تعداد چند ہزار سے تجاوز نہیں کرے گی جنہیں رومن میں ڈھالنا کسی قدر مشینی اور کسی قدر مینوئل انداز سے کرنا بہت زیادہ دشوار نہ ہو گا اور اس کے بعد مکمل مشینی طریق سے ان رومن فونیمز کو الفاظ کی فہرست سے میپ کرنا بھی زیادہ مشکل نہیں۔ یوں ہمارے پاس 82000 سے زائد الفاظ کا رومن ڈیٹا آ جائے گا۔

بہت خوب، میں منتظر رہوں گا۔ یہ ڈیٹا دستیاب ہو جائے تو یقیناً اچھی پیشرفت کی جا سکے گی۔
 

تجمل حسین

محفلین
ایک طریقہ کار یہ بھی ہو سکتا ہے کہ کوئی ایسی ضخیم کتاب منتخب کر لی جائے، جو زیادہ سے زیادہ الفاظ کا احاطہ کرتی ہو۔ اور اس کو رومن میں لکھا جائے۔
لیکن جتنے زیادہ لوگ اس کام میں شامل ہوں گے، اتنے ہی زیادہ متفرق تلفظ سامنے آ جائیں گے۔
اردو محفل سے زیادہ ضخیم کتاب کونسی ہوگی :)
 

نبیل

تکنیکی معاون
کئی سال قبل گوگل ٹرانسلٹریشن اے پی آئی دستیاب تھی جس کو استعمال کرکے رومن اردو کو یونیکوڈ اردو میں تبدیل کرنے کا طریقہ نکالا تھا۔ بدقسمتی سے یہ اے پی آئی اب دستیاب نہیں ہے، اس لیے اب یہ طریقہ قابل استعمال نہیں رہا ہے۔ لیکن میرے ذہن میں اس کا متبادل ایک طریقہ ہے۔ اس کے ذریعے قریبا اسی طرح گوگل ٹرانسلٹریشن کے ذریعے رومن اردو سے تحریری اردو میں تبدیلی کی جا سکے گی۔ یہ طریقہ غلطیوں سے پاک تو نہیں ہوگالیکن اس سے پھر بھی وقت کی کافی بچت ہو گی۔
 
کئی سال قبل گوگل ٹرانسلٹریشن اے پی آئی دستیاب تھی جس کو استعمال کرکے رومن اردو کو یونیکوڈ اردو میں تبدیل کرنے کا طریقہ نکالا تھا۔ بدقسمتی سے یہ اے پی آئی اب دستیاب نہیں ہے، اس لیے اب یہ طریقہ قابل استعمال نہیں رہا ہے۔ لیکن میرے ذہن میں اس کا متبادل ایک طریقہ ہے۔ اس کے ذریعے قریبا اسی طرح گوگل ٹرانسلٹریشن کے ذریعے رومن اردو سے تحریری اردو میں تبدیلی کی جا سکے گی۔ یہ طریقہ غلطیوں سے پاک تو نہیں ہوگالیکن اس سے پھر بھی وقت کی کافی بچت ہو گی۔
نبیل بھائی ،اردو اسپیچ ریکگنیشن کے لئے ڈریگن نیچرلی اسپیکنگ کو استعمال کرنے کے طریقے وضع کرنے کی آپ کی مستعدانہ کاوشیں بجا طور پر لائق ستائش ہیں ،اور میں احباب محفلین کو یہ باور کرانا چاہتا ہوں کہ جانفشانی،مستقل مزاجی اور خلوص کے ساتھ کی جانے والی یہ کوششیں قطعی رائیگاں نہیں جائیں گی۔میں یہ بات اس قدر وثوق کیساتھ اس بناء پر کررہاہوں کہ کچھ عرصہ قبل میں بذات خوداس کا قریب قریب کامیاب تجربہ کرچکا ہوں ،اور اس بات کا ذکر میں شائد پہلے بھی کرچکا ہوں۔یہیں 'اردو محفل' ہی سے میں نے ایک اردو ورڈ لسٹ ڈاؤنلوڈ کی تھی جو شائد محترم'الف عین'صاحب کی فراہم کردہ تھی۔اس لسٹ میں تقریبا" ایک لاکھ الفاظ تھے(تاہم آجکل یہ نادر لسٹ کم ازکم میرے پاس تو ڈاؤنلوڈ نہیں ہو پارہی ہے۔۔ربط کلک کرنے کے بعدہر بار ایک بے مقصد ایڈورٹائزنگ ویب سائٹ میرا منہ چڑارہی ہوتی ہے!) اور میرا طریقہءواردات یہ ہوتا کہ میں نے اس ورڈلسٹ جوں کا توں ڈریگن نیچرلی کے ووکیبلری ایڈیٹر میں ایڈ کردیا،جہاں پر لسٹ میں موجود سارے اردو کے الفاظ 'رٹن فارم' کے خانے یا سیکشن میں آن دستیاب ہوگئے۔(واضح ہو کہ اس لسٹ میں انگریزی متبادل ندارد ہیں)۔پھر میں روز محنت شاقہ سے ڈیڑھ دو سو الفاظ کے رومن اردو 'اسپوکن فارم' کے سیکشن میں مینولی ٹائپ کرتا اور پھر ان سب تاحال تیار شدہ ذخیرہء الفاظ کو سلیکٹ کرکے ان کو ٹرین کرتا اور اس دوران ونڈوز ساؤنڈ ریکارڈر کو بھی آن کردیتااور جب سارے الفاظ کی ٹریننگ مکمل ہوجاتی تو اسی وقت میرے پاس ایک ساؤنڈ فائل بھی ریکارڈڈ صورت میں دستیاب ہوتی۔اب ڈریگن نیچرلی میں ایک فنکشن ہے 'ٹرانسکرپشن' کا۔میں اپنی ریکارڈڈ ساؤنڈ فائل کو اس فنکشن میں براؤز کرکے ٹرانسکرائب کو کلک کرتا اور ڈریگن نیچرلی نہایت برق رفتاری کے ساتھ میرے کئی منٹوں کے دورانئے میں بولے گئے ڈیڑھ دو سو الفاظ کو نوٹ پیڈ (جسے میں ہمیشہ ترجیح دیتا تھا) پر چند سیکنڈوں میں ٹائپ کردیتا تھا،اور الگ الگ الفاط پر مشتمل یہ عبارت کم وبیش پانچ یا چھ سطروں سے شائد ہی کبھی کم رہی ہو!۔۔۔مراسلہ کچھ زیادہ ہی طوالت اختیار کرگیا چنانچہ آگے کے کے تجربات،جو خاصے امیدافزاء ہیں،کسی اور مراسلے رقم کروں گا ۔انشاءاللہ۔اللہ آپ سب کو ہمیشہ خوش رکھے۔آمین
 
آخری تدوین:
Top