السلام علیکم،

پہلی بار تو میں نے اپنی آواز میں اردو ڈیجیٹل لائبریری سے ایک کتاب آڈیو میں ریکارڈ کی تھی
آڈیو کتاب : انجو منجو۔ میرا پہلا تجربہ

اس بار میں نے اپنی آواز کے بجائے ٹیکسٹ تو اسپیچ کی سہولت سے استفادہ کیا۔ مجھے قوی امید ہے کہ بہت سے سقم ہیں اور بہت بہتری لائی جا سکتی ہے لیکن پہلی کوشش کے طور پر میرا خیال ہے آپ ضرور سراہیں گے۔ :)

لیجیئے جی حاضُر ہے اردو لائبریری کی ایک اور کتاب "زندہ درخت" آڈیو میں۔

کوڈ:
https://soundcloud.com/amjad-miandad/zinda-darakht-urdu-story
 
شمشاد , قیصرانی ,@ ابن سعید , مقدس , عائشہ عزیز , نیلم , غدیر زھرا , نیرنگ خیال , سید زبیر , زبیر مرزا, سید ذیشان , سید شہزاد ناصر , بھلکڑ , محمد احمد , محمدعلم اللہ اصلاحی , ماہی احمد , arifkarim@ , حاتم راجپوت , عمر سیف , نایاب , فلک شیر ، ملائکہ

کوئی ٹیگ سے رہ گیا ہو تو معذرت اور اگر کوئی اور کسی رہ جانے والے کو ٹیگ کر دے تو شکریہ مہربانی
 

arifkarim

معطل
کونسا انجن استعمال ہوا ہے؟ٹیکسٹ ٹو اسپیچ ممکن ہو سکتا ہے تو اسپیچ ٹو ٹیکسٹ زیادہ مشکل نہیں ہونا چاہئے۔
 
کون سا انجن استعمال کیا ہے؟ کافی سے زیادہ بہتری کی گنجائش ہے۔ :)

کونسا انجن استعمال ہوا ہے؟ٹیکسٹ ٹو اسپیچ ممکن ہو سکتا ہے تو اسپیچ ٹو ٹیکسٹ زیادہ مشکل نہیں ہونا چاہئے۔
گوگل :lol:

دراصل میں نے کافی سارے سوفٹ وئیر ٹرائے کر کے دیکھے لیکن سب سے بہتر گوگل کو پایا۔

ابھی کچھ انجنز کو ٹرائے کر رہا ہوں اور کچھ کو لینکس پہ ٹرائے کروں گا۔
 

سید ذیشان

محفلین
گوگل :lol:

دراصل میں نے کافی سارے سوفٹ وئیر ٹرائے کر کے دیکھے لیکن سب سے بہتر گوگل کو پایا۔

ابھی کچھ انجنز کو ٹرائے کر رہا ہوں اور کچھ کو لینکس پہ ٹرائے کروں گا۔

اپنی آواز میں ہی ریکارڈ کرتے تو شائد ہم پورا سن بھی لیتے :)
 
اپنی آواز میں ہی ریکارڈ کرتے تو شائد ہم پورا سن بھی لیتے :)
دراصل یہاں پہلے سے یہ بات چل رہی تھی کہ ٹیکسٹ ٹو اسپیچ کو اردو کے لیے کس طرح بہتر طریقے سے استعمال کیا جا سکے تاکہ اردو کی کتابوں کی آڈیو آسانی سے بنائی جا سکے۔ تو یہ کاوش اس سلسلے کی ایک کڑی تھی۔ کیوں کہ اردو کی سپورٹ کافی محدود ہے اور اس کے علاوہ بھی ٹیکسٹ ٹو اسپیچ کی ساؤنڈز بھی کافی آرٹیفیشل واقع ہوئی ہیں۔
 
ابن سعید بھائی NVDA اسکرین ریڈر میں میں نے دیکھا کہ اردو ٹیکسٹ کی پہچان یا ریکگنیشن بھی ہے باقیوں میں ٹرائے کرتا ہوں میں۔ لیکن یہ جرک اور روبوٹک آواز سے پیچھا چھڑانا مشکل ہو رہا ہے۔
 

نبیل

تکنیکی معاون
یہ آج پہلی مرتبہ میری نظر سے گزرا ہے۔ میری نظر میں تو یہ بہت اہم پیشرفت ہے۔ مائیکروسوفٹ کی ٹیکسٹ ٹو سپیچ اے پی آئی کی نسبت بدجہا بہتر رزلٹ ہے۔ اس پر کام ضرور آگے بڑھانا چاہیے۔
 
ابن سعید ، امجد میانداد ، کیا یہ ممکن ہے کہ ایک ڈکشنری کے الفاظ کی آڈیو فائلز حاصل کر لی جائیں اور بعد میں انہی کو بنیاد بنا کر ٹیکسٹ ٹو سپیچ سسٹم وضع کر لیا جائے؟
کل زکریا بھائی سے اسپیچ سنتھسس اور ٹیکسٹ ٹو اسپیچ کے موضوعات پر کافی گفتگو رہی۔ یہ الگ بات ہے کہ انھوں نے لکھنوی لہجے کو لے کر دل شکن بات کی۔ خیر مذاق بر طرف، ہم نے مل کر ایک طریقہ کار کا تعین کیا ہے۔ :) :) :)
 
آخری تدوین:

زیک

تکنیکی معاون
گوگل :lol:

دراصل میں نے کافی سارے سوفٹ وئیر ٹرائے کر کے دیکھے لیکن سب سے بہتر گوگل کو پایا۔

ابھی کچھ انجنز کو ٹرائے کر رہا ہوں اور کچھ کو لینکس پہ ٹرائے کروں گا۔
گوگل ٹی ٹی ایس آن لائن بھی دستیاب ہے یا صرف اینڈرائڈ پر ہے؟
 

زیک

تکنیکی معاون
السلام علیکم،

پہلی بار تو میں نے اپنی آواز میں اردو ڈیجیٹل لائبریری سے ایک کتاب آڈیو میں ریکارڈ کی تھی
آڈیو کتاب : انجو منجو۔ میرا پہلا تجربہ

اس بار میں نے اپنی آواز کے بجائے ٹیکسٹ تو اسپیچ کی سہولت سے استفادہ کیا۔ مجھے قوی امید ہے کہ بہت سے سقم ہیں اور بہت بہتری لائی جا سکتی ہے لیکن پہلی کوشش کے طور پر میرا خیال ہے آپ ضرور سراہیں گے۔ :)

لیجیئے جی حاضُر ہے اردو لائبریری کی ایک اور کتاب "زندہ درخت" آڈیو میں۔

کوڈ:
https://soundcloud.com/amjad-miandad/zinda-darakht-urdu-story
روبوٹک آواز کا تو کچھ نہیں ہو سکتا مگر اگر ٹیکسٹ ٹو سپیچ سسٹم کو اردو اہل زبان سے ٹرین کیا جائے تو اس کا اردو بولنے کا انداز کافی بہتر ہو سکتا ہے۔
 
اس طریقہ کار سے ہمیں کب تک آگاہی ہو سکتی ہے؟
سارا قصہ یوں تمام ہوا تھا کہ ہندی میں اسپیچ ٹو ٹیکسٹ میں جو کام ہوا ہے اس سے استفادہ کیا جائے کیونکہ زیادہ تر الفاظ کو فقط اردو رسم الخظ میں لکھنے کی تبدیلی کرنی ہوگی۔ دوم یہ کہ اردو مواد سے کارپس بنا کر (جو کہ شاکر بھائی نے بنا بھی رکھا ہے، اس کی توسیع کی جا سکتی ہے) اس میں سے سب سے زیادہ مستعمل الفاظ کی فہرست کو پانچ پانچ الفاظ کے سیٹ کی شکل میں لوگوں کو ریکارڈ کرنے کو کہا جائے۔ یہ ریکارڈنگ آف لائن بھی ہو سکتی ہے یا پھر براؤزر میں ایچ ٹی ایم ایل فائیو کی نئی اے پی آئی کو استعمال کر کے مائکرو فون سے ڈیٹا حاصل کر کے سرور پر اپلوڈ کرائی جا سکتی ہے۔ پھر ان الفاظ کی سیگمنٹیشن کر کے انھیں اکوسٹک ماڈل بلڈ کرنے میں استعمال کیا جا سکے گا، نیز اوپن سورس اکوسٹک رپوزیٹری میں بھی محفوظ کیا جا سکے گا۔ یہ تو قصہ ہوا اسپیچ ٹو ٹیکسٹ کا، جو کہ ٹیکسٹ ٹو اسپیچ سے کہیں زیادہ مشکل عمل ہے۔ بہر کیف اس ڈیٹا میں سے کسی اچھے تلفظ و لب و لہجے کا منتخب کر کے اس کی مد سے ٹیکسٹ ٹو اسپیچ پر تجربات کیے جا سکتے ہیں۔ اولاً ایک ایک لفظ علیحدہ علیحدہ بولے جائیں گے لیکن ان میں تسلسل لانے پر کافی ریسرچ موجود ہے جس سے استفادہ کیا جا سکتا ہے۔ شاید کرلپ نے بھی اس حوالے سے کچھ کام کیا تھا، اللہ جانے ان کا اکوسٹک ڈیٹا رفاہ عامہ کے لیے دستیاب ہے یا نہیں۔ :) :) :)
 
Top