اردو ٹیکسٹ ٹو سپیچ پر تجربات

نبیل نے 'اردو سپیچ پراسیسنگ' کی ذیل میں اس موضوع کا آغاز کیا، ‏جولائی 22, 2020

  1. نبیل

    نبیل محفلین

    مراسلے:
    16,749
    جھنڈا:
    Germany
    موڈ:
    Depressed
    گوگل کلاؤڈ اے پی آئی کی بدولت اردو او سی آر اور اردو سپیچ ریکگنیشن کسی حد تک ممکن ہو گئی ہے، اور ان میں وقت کے ساتھ ساتھ بتدریج بہتری بھی نظر آتی ہے۔ لیکن ابھی تک اردو سپیچ سنتھسز (Urdu Speech Synthesis) یعنی متن سے آواز کی تشکیل کی کمی کی وجہ سے تشنگی محسوس ہوتی ہے۔ گوگل، ایمیزون اور مائیکروسوفٹ تینوں ہی ٹیکسٹ ٹو سپیچ اے پی آئی فراہم کرتے ہیں لیکن ہمیشہ کی طرح اردو کی سپورٹ مسنگ ہے۔ محفل فورم کے پلیٹ فارم پر ہمارا بیشتر وقت اسی تحقیق میں گزرتا رہا کہ مختلف سوفٹویر اور آپریٹنگ سسٹمز میں کسی طرح اردو کی سپورٹ کا بندوبست کیا جا سکے۔ میں ہر کچھ عرصے کے بعد گوگل ٹیکسٹ ٹو سپیچ اے پی آئی کی اپڈیٹ دیکھتا رہتا ہوں اور ہر مرتبہ جان کر شدید مایوسی ہوتی ہے کہ دنیا کی ہر زبان کی سپورٹ موجود ہے سوائے اردو کے۔ اردو کے ساتھ یہ سلوک اس لیے بھی حیران کن معلوم ہوتا ہے کہ اعدادوشمار کی رو سے اردو دنیا کی بڑی زبانوں میں شامل ہے، اور اس کے مقابلے میں دو یا تین ملین آبادی کی زبان کی کہیں بہتر سوفٹویر سپورٹ پائی جاتی ہے۔

    گوگل ٹیکسٹ ٹو سپیچ اے پی آئی میں ہندی کی سپورٹ دیکھ کر خیال آیا کہ اسے ہی اردو ٹیکسٹ ٹو سپیچ کنورژن کے لیے استعمال کرکے دیکھا جائے۔ اس سے پہلے بھی کچھ ویب سائٹس پر ہندی سپیچ ریکگنیشن کو اردو کے لیے استعمال کرنے کا کافی حد تک کامیاب تجربہ کیا جا چکا ہے۔ فی الوقت تو ان معاملات میں اردو کی سپورٹ کا راستہ ہندی سے ہی ہو کر جاتا ہے۔ لیکن یہ تجربہ کرنےکے لیے پہلا مرحلہ اردو متن کو ہندی متن میں کنورٹ کرنے کا ہے۔ اردو متن کو گوگل ٹرانسلیٹ سے ہندی میں ترجمہ کریں تو ظاہر ہے کہ یہ ٹرانسلٹریشن (Transliteration) نہیں بلکہ ٹرانسلیشن ہوتی ہے۔ اسی لیے میں نے آج جب اردو ٹو ہندی ٹرانسلٹریشن کے بارے میں دریافت کیا تو محمد اسلم نے یہ ربط فراہم کیا۔

    مذکورہ بالا ربط سے مزید تجربات کا راستہ ہموار ہو گیا ہے۔ اس ربط پر گوگل ٹیکسٹ ٹو سپیچ اے پی آئی کو ٹیسٹ کیا جا سکتا ہے۔ پہلے اوپر فراہم کیے گئے ربط پر جا کر اپنے مرضی کے اردو متن کو ہندی میں ٹرانسلٹریٹ کریں اور پھر ذیل کی تصویر کے مطابق گوگل ٹیکسٹ ٹو سپیچ اے پی آئی کے پیچ پر جا کر اسے آواز میں تبدیل کرکے دیکھیں۔


    [​IMG]

    ابتدائی تجربات میں مجھے نتائج ٹھیک معلوم ہوئے ہیں۔ لہجے میں یقینی طور پر ہندی ٹچ ہے لیکن اکثر الفاظ کی ادائیگی درست ہے۔ فی الحال اسے ایک تجربہ ہی سمجھا جا سکتا ہے۔ بڑے سکیل پر استعمال کے لیے اس کا استعمال غالبا مناسب نہیں رہے گا۔ اس کے لیے براہ راست اے پی آئی میں اردو کی سپورٹ کا انتظار ہی کرنا پڑے گا۔
     
    • زبردست زبردست × 4
    • پسندیدہ پسندیدہ × 3
  2. محمّد احسن سمیع :راحل:

    محمّد احسن سمیع :راحل: محفلین

    مراسلے:
    1,035
    جھنڈا:
    Pakistan
    موڈ:
    Confused
    .
     
    آخری تدوین: ‏جولائی 22, 2020
  3. رانا

    رانا محفلین

    مراسلے:
    2,832
    جھنڈا:
    Pakistan
    موڈ:
    Cheerful
    اتفاق سے کوئی دو ہفتے پہلے اسی معاملے پر کسی وجہ سے توجہ مبذول ہوئی تو سرچ کرنے پر ایک دو نتائج اردو ٹیکسٹ ٹو اسپیچ کے ملے تھے۔ جن میں سے ایک تو سی ایل ای کا تھا بہت پرانا لیکن لنکس کی وجہ سے چیک نہیں کیا جاسکا۔ لیکن سرچ کرنے پر جو اس سمیت دیگر نتائج آئے تھے ان سے ایک شک سا ہوا تھا کہ غالبا ان کی پرفارمنس عمدہ نہ رہی ہوگی جو ان پر وقت کی گرد چڑھتی جارہی ہے۔
    میں تو تجربہ نہیں کرسکا کیونکہ کریڈٹ کارڈ وغیرہ کی معلومات مانگ رہا تھا جو آج تک رکھا ہی نہیں۔ لیکن آپ نے جو تجربہ کیا ہے اس میں ادائیگی کے دوران الفاظ کا اتار چڑھاؤ کیسا ہے؟ یہ اس لئے پوچھا کہ مجھے جب خیال آیا کہ آیا یہ خود سے بنایا جاسکتا ہے یا نہیں۔ تو سادہ طریق یہی سوچا تھا کہ اردو کے ایک لاکھ الفاظ کو مستند لہجے میں وائس کے ساتھ ڈیٹابیس میں محفوظ کرلیا جائے تو ابتدائی سافٹوئیر کے لئے باقی کا کام آسان ہے۔ پھر اس میں وقت کے ساتھ ساتھ الگورتھم بہتر کرکے ایک جیسے املا لیکن مختلف تلفظ والے الفاظ کے قوانین بھی شامل کئے جاسکتے ہیں۔ لیکن جو مسئلہ مجھے شروع سے ہی کھٹک رہا تھا وہ یہ کہ الفاظ کے اتار چڑھاؤ کو کیسے بہتر کیا جائے گا کیونکہ ہر لفظ کی ادائیگی اور اس کے زیروبم کا تعلق تو جملے میں اس کے مقام سے ہے۔
     
    • پسندیدہ پسندیدہ × 2
  4. یاقوت

    یاقوت محفلین

    مراسلے:
    550
    موڈ:
    Breezy
    مجھے جہاں کہیں ضرورت محسوس ہوتی ہے تو میں ایزی ٹرانسلیٹر استعمال کرتا ہوں۔جو دنیا کی ایک سو چار زبانوں کو سپورٹ کرتا ہے اور انسٹھ زبانوں کو ٹیکسٹ ٹو سپیچ کی سہولت بھی دیتا ہے جسمیں اردو بھی شامل ہے۔مجھے تو گوگل کی نسبت اسکا ترجمہ زیادہ صحت مند لگا اور ٹیکسٹ ٹو سپیچ کا انجن بھی کافی طاقتور ہے ۔@رانا صاحب نے جس بات کی نشاندہی کی ہے اسکی کمی واقعتاََ اس میں بھی ہے آواز میں منتقل کرتے کرتے انجن الفاظ کی شکل کہیں کہیں بگاڑ دیتا ہے۔لیکن پھر بھی مجھے تو بہت مناسب لگا۔اسمیں پنجابی اور سندھی کی سپورٹ بھی شامل ہے۔

    [​IMG]

    جن زبانوں کےساتھ سپیکر کا آئیکون ہے ان زبانوںمیں ٹیکسٹ ٹو سپیچ کی سہولت ہے۔ایک اور بات آپ ٹیکسٹ ٹو سپیچ کو ایم پی تھری میں محفوظ کر سکتے ہیں اور ترجمے کو ٹیکسٹ اور ڈوک فائلز میں براہ راست محفوظ کرسکتےہیں۔
     
    • معلوماتی معلوماتی × 7
  5. رانا

    رانا محفلین

    مراسلے:
    2,832
    جھنڈا:
    Pakistan
    موڈ:
    Cheerful
    اگر گوگل نے ہندی کی سپورٹ دے دی ہے تو پھر قوی امید ہے کہ اردو کی سپورٹ بھی جلد یا بدیر شامل کردی جائے گی۔ ایسی صورت میں انتظار ہی ایک بہترین آپشن ہے کیونکہ انتظار کرنے سے بہرحال ایک اچھی چیز ہاتھ آجائے گی کہ گوگل عموما جس کام میں ہاتھ ڈالتا ہے اس میں ہم سے بہتر پرفارمنس دیتا ہے۔:) کم از کم اردو کے حوالے سے تو یہی دیکھنے کو ملا ہے جیسے اردو او سی آر۔
     
    • پسندیدہ پسندیدہ × 1
  6. محمد اسلم

    محمد اسلم محفلین

    مراسلے:
    697
    جھنڈا:
    India
    موڈ:
    Sleepy
    اینڈرائڈ پر تو اردو ٹیکسٹ ٹو اسپیچ آفلائن بھی آ گیا ہے....
    اور ہم ڈیسک-ٹاپ اور موبائل دونوں پر نو،انس کے معتقد ٹھہرے. سو ہندی کی نیل میاں کی آواز سے مستفید ہوتے تھے.. .. ہندی الفاظ کے اردو متبادل ڈال کر. . . اور یہ جگاڑ تو جب سے ہندی کی آواز آئی تب سے کر رہے ہیں.
     
    • معلوماتی معلوماتی × 2
  7. محمد اسلم

    محمد اسلم محفلین

    مراسلے:
    697
    جھنڈا:
    India
    موڈ:
    Sleepy
    ایک جیسے حروف والے الفاظ میں ذرا گڑبڑ ہوجاتی ہے جن کا تلفظ الگ ہوتا ہے
     
    • پسندیدہ پسندیدہ × 1
  8. محمد اسلم

    محمد اسلم محفلین

    مراسلے:
    697
    جھنڈا:
    India
    موڈ:
    Sleepy
    اس سلسلے میں ناچیز بھی کافی سرگرداں ہوا کرتا ہے. . ایک ویڈیو دیکھی تھی کبھی... جس میں ایک آئیڈیا دیا گیا تھا کہ کنہی دو الفاظ کے تلفظ کو یعنی تمام ممکن جوڑوں کے تلفظ کو ایک ڈیٹا بیس میں ڈھال لیا جائے . . باقی تو انٹرفیس وغیرہ کا رہ جاتا ہے. کام
     
    • پسندیدہ پسندیدہ × 2
  9. رانا

    رانا محفلین

    مراسلے:
    2,832
    جھنڈا:
    Pakistan
    موڈ:
    Cheerful
    یہ مسئلہ اس صورت میں زیادہ اور واضح ہوگا جب اس الگورتھم پر سافٹویئر بنانے کی کوشش کی جائے جس کا میں نے ذکر کیا ہے۔ لیکن یہ بہرحال اہک جٹ قسم کا طریقہ ہے جو کچھ نہ ہونے سے کچھ ہونا بہتر ہے کے مصداق تو قابلِ قبول ہوسکتا تھا لیکن اب جب کہ علم ہے کہ گوگل ہندی ٹیکسٹ ٹو اسپیچ پر کافی کامیابی حاصل کر چکا ہے تو اس صورت میں اردو کی بھی قوی امید ہے۔ اور گوگل کے الگورتھمز میں اس مسئلے پر قابو پانا بہرحال اسان ہے کیونکہ ان الگورتھمز کی خاص بات مسلسل سیکھتے رہنا ہے نا کہ ڈیٹابیس کے پریڈیفائنڈ پئیرز کا محتاج ہونا۔
     
    آخری تدوین: ‏جولائی 24, 2020
    • متفق متفق × 1
  10. محمد اسلم

    محمد اسلم محفلین

    مراسلے:
    697
    جھنڈا:
    India
    موڈ:
    Sleepy
    کون سا الگورتھم؟
    اور سافٹویئر بنانے کی کوشش تو پروگرامرز حضرات ہی کر سکتے ہیں.... ہمارے جیسوں کے لیے کیا حکم؟
     
  11. رانا

    رانا محفلین

    مراسلے:
    2,832
    جھنڈا:
    Pakistan
    موڈ:
    Cheerful
    الگورتھم:
    پیچیدگیوں میں پڑے بغیر سادہ الفاظ میں بیان کیا جائے تو کچھ یوں ہوگا کہ
    اردود الفاظ کی وائس ریکارڈنگ مینول طریقے سے ڈیٹا بیس میں ڈالی جائے۔ یعنی ایک فیلڈ میں لفظ اور دوسری میں وائس بائنری ڈیٹا۔
    پھر تحریر کے ایک ایک لفظ کو ڈیٹابیس میں سرچ کرکے متعلقہ آوازوں کی ایک زنجیر بنائی جائے۔
    اور اس زنجیر کو آڈیو پلے کردیا جائے۔

    فائدہ:
    اس طریقے کا سب سے بڑا فائدہ یہ ہے کہ سافٹوئیر اپنے ڈیٹابیس سے باہر کچھ سوچ کر آزادئی رائے اور آزادئی اظہار جیسے افعال قبیح کا مرتکب ہونے سے بچا رہے گا۔ اور کفریہ الفاظ اور فرنگی لغات کی ادائیگی کرکے ہمارے کانوں کو گناہ گار نہ کرسکے گا۔ جو ہم چاہیں گے وہی بولے گا اور علم کے چشمے بہائے گا۔:)

    نقصان؛
    اوپر درج کئے گئے فائدے کو پڑھنے سے پہلے دل و دماغ میں ٹارچ کی روشنی ڈال کر اسے روشن کرلیں تو نقصان نظر آ جائے گا۔:)
     
    • پر مزاح پر مزاح × 2
  12. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,365
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    جس کو اردو الفاظ کی آوازوں کا ذخیرہ چاہیے وہ ذاتی پیغام میں رابطہ کر سکتا ہے۔
     
    • پسندیدہ پسندیدہ × 2
  13. نبیل

    نبیل محفلین

    مراسلے:
    16,749
    جھنڈا:
    Germany
    موڈ:
    Depressed
    ایسی کیا رازداری ہے؟ کیا کاپی رائٹ کا مسئلہ ہے؟
     
    • پسندیدہ پسندیدہ × 1
    • متفق متفق × 1

اس صفحے کی تشہیر