اردو ٹیکسٹ ٹو سپیچ پر تجربات

نبیل

تکنیکی معاون
گوگل کلاؤڈ اے پی آئی کی بدولت اردو او سی آر اور اردو سپیچ ریکگنیشن کسی حد تک ممکن ہو گئی ہے، اور ان میں وقت کے ساتھ ساتھ بتدریج بہتری بھی نظر آتی ہے۔ لیکن ابھی تک اردو سپیچ سنتھسز (Urdu Speech Synthesis) یعنی متن سے آواز کی تشکیل کی کمی کی وجہ سے تشنگی محسوس ہوتی ہے۔ گوگل، ایمیزون اور مائیکروسوفٹ تینوں ہی ٹیکسٹ ٹو سپیچ اے پی آئی فراہم کرتے ہیں لیکن ہمیشہ کی طرح اردو کی سپورٹ مسنگ ہے۔ محفل فورم کے پلیٹ فارم پر ہمارا بیشتر وقت اسی تحقیق میں گزرتا رہا کہ مختلف سوفٹویر اور آپریٹنگ سسٹمز میں کسی طرح اردو کی سپورٹ کا بندوبست کیا جا سکے۔ میں ہر کچھ عرصے کے بعد گوگل ٹیکسٹ ٹو سپیچ اے پی آئی کی اپڈیٹ دیکھتا رہتا ہوں اور ہر مرتبہ جان کر شدید مایوسی ہوتی ہے کہ دنیا کی ہر زبان کی سپورٹ موجود ہے سوائے اردو کے۔ اردو کے ساتھ یہ سلوک اس لیے بھی حیران کن معلوم ہوتا ہے کہ اعدادوشمار کی رو سے اردو دنیا کی بڑی زبانوں میں شامل ہے، اور اس کے مقابلے میں دو یا تین ملین آبادی کی زبان کی کہیں بہتر سوفٹویر سپورٹ پائی جاتی ہے۔

گوگل ٹیکسٹ ٹو سپیچ اے پی آئی میں ہندی کی سپورٹ دیکھ کر خیال آیا کہ اسے ہی اردو ٹیکسٹ ٹو سپیچ کنورژن کے لیے استعمال کرکے دیکھا جائے۔ اس سے پہلے بھی کچھ ویب سائٹس پر ہندی سپیچ ریکگنیشن کو اردو کے لیے استعمال کرنے کا کافی حد تک کامیاب تجربہ کیا جا چکا ہے۔ فی الوقت تو ان معاملات میں اردو کی سپورٹ کا راستہ ہندی سے ہی ہو کر جاتا ہے۔ لیکن یہ تجربہ کرنےکے لیے پہلا مرحلہ اردو متن کو ہندی متن میں کنورٹ کرنے کا ہے۔ اردو متن کو گوگل ٹرانسلیٹ سے ہندی میں ترجمہ کریں تو ظاہر ہے کہ یہ ٹرانسلٹریشن (Transliteration) نہیں بلکہ ٹرانسلیشن ہوتی ہے۔ اسی لیے میں نے آج جب اردو ٹو ہندی ٹرانسلٹریشن کے بارے میں دریافت کیا تو محمد اسلم نے یہ ربط فراہم کیا۔

مذکورہ بالا ربط سے مزید تجربات کا راستہ ہموار ہو گیا ہے۔ اس ربط پر گوگل ٹیکسٹ ٹو سپیچ اے پی آئی کو ٹیسٹ کیا جا سکتا ہے۔ پہلے اوپر فراہم کیے گئے ربط پر جا کر اپنے مرضی کے اردو متن کو ہندی میں ٹرانسلٹریٹ کریں اور پھر ذیل کی تصویر کے مطابق گوگل ٹیکسٹ ٹو سپیچ اے پی آئی کے پیچ پر جا کر اسے آواز میں تبدیل کرکے دیکھیں۔




ابتدائی تجربات میں مجھے نتائج ٹھیک معلوم ہوئے ہیں۔ لہجے میں یقینی طور پر ہندی ٹچ ہے لیکن اکثر الفاظ کی ادائیگی درست ہے۔ فی الحال اسے ایک تجربہ ہی سمجھا جا سکتا ہے۔ بڑے سکیل پر استعمال کے لیے اس کا استعمال غالبا مناسب نہیں رہے گا۔ اس کے لیے براہ راست اے پی آئی میں اردو کی سپورٹ کا انتظار ہی کرنا پڑے گا۔
 

رانا

محفلین
اتفاق سے کوئی دو ہفتے پہلے اسی معاملے پر کسی وجہ سے توجہ مبذول ہوئی تو سرچ کرنے پر ایک دو نتائج اردو ٹیکسٹ ٹو اسپیچ کے ملے تھے۔ جن میں سے ایک تو سی ایل ای کا تھا بہت پرانا لیکن لنکس کی وجہ سے چیک نہیں کیا جاسکا۔ لیکن سرچ کرنے پر جو اس سمیت دیگر نتائج آئے تھے ان سے ایک شک سا ہوا تھا کہ غالبا ان کی پرفارمنس عمدہ نہ رہی ہوگی جو ان پر وقت کی گرد چڑھتی جارہی ہے۔
ابتدائی تجربات میں مجھے نتائج ٹھیک معلوم ہوئے ہیں۔ لہجے میں یقینی طور پر ہندی ٹچ ہے لیکن اکثر الفاظ کی ادائیگی درست ہے۔
میں تو تجربہ نہیں کرسکا کیونکہ کریڈٹ کارڈ وغیرہ کی معلومات مانگ رہا تھا جو آج تک رکھا ہی نہیں۔ لیکن آپ نے جو تجربہ کیا ہے اس میں ادائیگی کے دوران الفاظ کا اتار چڑھاؤ کیسا ہے؟ یہ اس لئے پوچھا کہ مجھے جب خیال آیا کہ آیا یہ خود سے بنایا جاسکتا ہے یا نہیں۔ تو سادہ طریق یہی سوچا تھا کہ اردو کے ایک لاکھ الفاظ کو مستند لہجے میں وائس کے ساتھ ڈیٹابیس میں محفوظ کرلیا جائے تو ابتدائی سافٹوئیر کے لئے باقی کا کام آسان ہے۔ پھر اس میں وقت کے ساتھ ساتھ الگورتھم بہتر کرکے ایک جیسے املا لیکن مختلف تلفظ والے الفاظ کے قوانین بھی شامل کئے جاسکتے ہیں۔ لیکن جو مسئلہ مجھے شروع سے ہی کھٹک رہا تھا وہ یہ کہ الفاظ کے اتار چڑھاؤ کو کیسے بہتر کیا جائے گا کیونکہ ہر لفظ کی ادائیگی اور اس کے زیروبم کا تعلق تو جملے میں اس کے مقام سے ہے۔
 

یاقوت

محفلین
مجھے جہاں کہیں ضرورت محسوس ہوتی ہے تو میں ایزی ٹرانسلیٹر استعمال کرتا ہوں۔جو دنیا کی ایک سو چار زبانوں کو سپورٹ کرتا ہے اور انسٹھ زبانوں کو ٹیکسٹ ٹو سپیچ کی سہولت بھی دیتا ہے جسمیں اردو بھی شامل ہے۔مجھے تو گوگل کی نسبت اسکا ترجمہ زیادہ صحت مند لگا اور ٹیکسٹ ٹو سپیچ کا انجن بھی کافی طاقتور ہے ۔@رانا صاحب نے جس بات کی نشاندہی کی ہے اسکی کمی واقعتاََ اس میں بھی ہے آواز میں منتقل کرتے کرتے انجن الفاظ کی شکل کہیں کہیں بگاڑ دیتا ہے۔لیکن پھر بھی مجھے تو بہت مناسب لگا۔اسمیں پنجابی اور سندھی کی سپورٹ بھی شامل ہے۔

trance.jpg

جن زبانوں کےساتھ سپیکر کا آئیکون ہے ان زبانوںمیں ٹیکسٹ ٹو سپیچ کی سہولت ہے۔ایک اور بات آپ ٹیکسٹ ٹو سپیچ کو ایم پی تھری میں محفوظ کر سکتے ہیں اور ترجمے کو ٹیکسٹ اور ڈوک فائلز میں براہ راست محفوظ کرسکتےہیں۔
 

رانا

محفلین
گوگل ٹیکسٹ ٹو سپیچ اے پی آئی میں ہندی کی سپورٹ دیکھ کر خیال آیا کہ اسے ہی اردو ٹیکسٹ ٹو سپیچ کنورژن کے لیے استعمال کرکے دیکھا جائے۔
ابتدائی تجربات میں مجھے نتائج ٹھیک معلوم ہوئے ہیں۔ لہجے میں یقینی طور پر ہندی ٹچ ہے لیکن اکثر الفاظ کی ادائیگی درست ہے۔ فی الحال اسے ایک تجربہ ہی سمجھا جا سکتا ہے۔ بڑے سکیل پر استعمال کے لیے اس کا استعمال غالبا مناسب نہیں رہے گا۔ اس کے لیے براہ راست اے پی آئی میں اردو کی سپورٹ کا انتظار ہی کرنا پڑے گا۔
اگر گوگل نے ہندی کی سپورٹ دے دی ہے تو پھر قوی امید ہے کہ اردو کی سپورٹ بھی جلد یا بدیر شامل کردی جائے گی۔ ایسی صورت میں انتظار ہی ایک بہترین آپشن ہے کیونکہ انتظار کرنے سے بہرحال ایک اچھی چیز ہاتھ آجائے گی کہ گوگل عموما جس کام میں ہاتھ ڈالتا ہے اس میں ہم سے بہتر پرفارمنس دیتا ہے۔:) کم از کم اردو کے حوالے سے تو یہی دیکھنے کو ملا ہے جیسے اردو او سی آر۔
 

محمد اسلم

محفلین
اینڈرائڈ پر تو اردو ٹیکسٹ ٹو اسپیچ آفلائن بھی آ گیا ہے....
اور ہم ڈیسک-ٹاپ اور موبائل دونوں پر نو،انس کے معتقد ٹھہرے. سو ہندی کی نیل میاں کی آواز سے مستفید ہوتے تھے.. .. ہندی الفاظ کے اردو متبادل ڈال کر. . . اور یہ جگاڑ تو جب سے ہندی کی آواز آئی تب سے کر رہے ہیں.
 

محمد اسلم

محفلین
لیکن جو مسئلہ مجھے شروع سے ہی کھٹک رہا تھا وہ یہ کہ الفاظ کے اتار چڑھاؤ کو کیسے بہتر کیا جائے گا
اس سلسلے میں ناچیز بھی کافی سرگرداں ہوا کرتا ہے. . ایک ویڈیو دیکھی تھی کبھی... جس میں ایک آئیڈیا دیا گیا تھا کہ کنہی دو الفاظ کے تلفظ کو یعنی تمام ممکن جوڑوں کے تلفظ کو ایک ڈیٹا بیس میں ڈھال لیا جائے . . باقی تو انٹرفیس وغیرہ کا رہ جاتا ہے. کام
 

رانا

محفلین
اس سلسلے میں ناچیز بھی کافی سرگرداں ہوا کرتا ہے. . ایک ویڈیو دیکھی تھی کبھی... جس میں ایک آئیڈیا دیا گیا تھا کہ کنہی دو الفاظ کے تلفظ کو یعنی تمام ممکن جوڑوں کے تلفظ کو ایک ڈیٹا بیس میں ڈھال لیا جائے . . باقی تو انٹرفیس وغیرہ کا رہ جاتا ہے. کام
یہ مسئلہ اس صورت میں زیادہ اور واضح ہوگا جب اس الگورتھم پر سافٹویئر بنانے کی کوشش کی جائے جس کا میں نے ذکر کیا ہے۔ لیکن یہ بہرحال اہک جٹ قسم کا طریقہ ہے جو کچھ نہ ہونے سے کچھ ہونا بہتر ہے کے مصداق تو قابلِ قبول ہوسکتا تھا لیکن اب جب کہ علم ہے کہ گوگل ہندی ٹیکسٹ ٹو اسپیچ پر کافی کامیابی حاصل کر چکا ہے تو اس صورت میں اردو کی بھی قوی امید ہے۔ اور گوگل کے الگورتھمز میں اس مسئلے پر قابو پانا بہرحال اسان ہے کیونکہ ان الگورتھمز کی خاص بات مسلسل سیکھتے رہنا ہے نا کہ ڈیٹابیس کے پریڈیفائنڈ پئیرز کا محتاج ہونا۔
 
آخری تدوین:

محمد اسلم

محفلین
یہ مسئلہ اس صورت میں زیادہ اور واضح ہوگا جب اس الگورتھم پر سافٹویئر بنانے کی کوشش کی جائے جس کا میں نے ذکر کیا ہے
کون سا الگورتھم؟
اور سافٹویئر بنانے کی کوشش تو پروگرامرز حضرات ہی کر سکتے ہیں.... ہمارے جیسوں کے لیے کیا حکم؟
 

رانا

محفلین
الگورتھم:
پیچیدگیوں میں پڑے بغیر سادہ الفاظ میں بیان کیا جائے تو کچھ یوں ہوگا کہ
اردود الفاظ کی وائس ریکارڈنگ مینول طریقے سے ڈیٹا بیس میں ڈالی جائے۔ یعنی ایک فیلڈ میں لفظ اور دوسری میں وائس بائنری ڈیٹا۔
پھر تحریر کے ایک ایک لفظ کو ڈیٹابیس میں سرچ کرکے متعلقہ آوازوں کی ایک زنجیر بنائی جائے۔
اور اس زنجیر کو آڈیو پلے کردیا جائے۔

فائدہ:
اس طریقے کا سب سے بڑا فائدہ یہ ہے کہ سافٹوئیر اپنے ڈیٹابیس سے باہر کچھ سوچ کر آزادئی رائے اور آزادئی اظہار جیسے افعال قبیح کا مرتکب ہونے سے بچا رہے گا۔ اور کفریہ الفاظ اور فرنگی لغات کی ادائیگی کرکے ہمارے کانوں کو گناہ گار نہ کرسکے گا۔ جو ہم چاہیں گے وہی بولے گا اور علم کے چشمے بہائے گا۔:)

نقصان؛
اوپر درج کئے گئے فائدے کو پڑھنے سے پہلے دل و دماغ میں ٹارچ کی روشنی ڈال کر اسے روشن کرلیں تو نقصان نظر آ جائے گا۔:)
 
Top