اردو وائس ریکوگنیشن پراجیکٹ

وائس ریکوگنیشن کو بہتر بنانے کے لیے موزیلا نے ایک پراجیکٹ شروع کیا ہے ۔ جہاں کوئی بھی اپنی زبان کے لیے پراجیکٹ شروع کر سکتا ہے۔ ابھی کچھ لمحہ قبل مجھے اس کی جانکاری ملی اور اکاؤنٹ بنانے کے بعد اپنی زبان اردو تلاش کیا، لیکن اب تک اس پر کام کا آغاز نہیں ہوا۔ میں نے اردو زبان کو شامل کرنے کی درخواست دے دی ہے۔
اس کام کا پہلا مرحلہ اردو جملوں کا انتخاب ہے۔ اس کے لیے مختلف پبلک ڈومین سے جملے کاپی پیسٹ کرنا ہے، جنہیں پڑھ کر آواز ریکارڈ کی جائے گی۔ جس کا آغاز میں نے ’’اللہ کے نام سے شروع جو بڑا مہربان نہایت رحم والا ہے‘‘ اور ’’نبی رحمت حضرت محمد مصطفیٰ صلی اللہ علیہ وسلم پر ہزاروں درود و سلام‘‘ جملے سے کر دیا ہے۔

آپ حضرات سے بھی گزارش ہے کہ اس کار خیر میں حصے لیں اور اردو کی ترقی و ترویج کے لیے مزید قدم آگے بڑھائیں۔

اکاؤنٹ بنانے کے لیے اس لنک پر جائیں: Common Voice by Mozilla

یہاں آپ اردو لکھ کر تلاش کریں اور Get Involved پر کلک کر دیں۔

مقامیانے کے اصول اور اہم باتیں یہاں ملاحظہ فرمائیں : Common Voice by Mozilla

جملوں کو جمع کرنے کے کام میں شامل ہونے کے لیے اس لنک پر جائیں : Common Voice Sentence Collector

طمیم جاسم محمد الف عین نیرنگ خیال دوست ابن سعید
 
جملے کو جمع کرنے کے تعلق سے چند ضروری ہدایات:

Login
You can login by entering any available username and choosing a password, that will automatically create an account for you. Once logged in you can select your languages from the profile section.

Add new sentences
All sentences you submit must be under Public Domain (CC-0) license.
Numbers. There should be no digits in the source text because they can cause problems when read aloud. The way a number is read depends on context and might introduce confusion in the dataset. For example, the number “2409” could be accurately read as both “twenty-four zero nine” and “two thousand four hundred nine”.
Abbreviations and Acronyms. Abbreviations and acronyms like “USA” or “ICE” should be avoided in the source text because they may be read in a way that does not coincide with their spelling. Additionally, there may be multiple accurate readings for a single abbreviation. For example, the acronym “ICE” could be pronounced “I-C-E” or as a single word.
Punctuation. Special symbols and punctuation should only be included when absolutely necessary. For example, an apostrophe is included in English words like “don’t” and “we’re” and should be included in the source text, but it’s unlikely you’ll ever need a special symbol like “@” or “#.”
Foreign letters. Letters must be valid in the language being spoken. For example, “ж” is a letter in the Russian alphabet but is never used in English and so should never appear in any English source text.
Length. Sentences must be 14 words or less.
We prefer natural/conversational sentences. While phonetic diversity and different words in sentences is important, we are trying to make recording sentences as much fun as possible. Therefore it would be great if you could try to keep your sentences as natural/engaging as possible.​
 

دوست

محفلین
میرا خیال ہے پرانی شاعری ساری پبلک ڈومین میں ہے۔ مزید کے لیے اردو ویب لائبریری کی کتب منتخب کی جا سکتی ہیں۔
 

دوست

محفلین
جملے بنانے پڑیں گے، ادب سے کاپی پیسٹ نہیں ہو گی۔ 14 الفاظ سے کم کا جملہ اب کہاں سے ڈھونڈا جائے۔
 
میرا خیال ہے پرانی شاعری ساری پبلک ڈومین میں ہے۔ مزید کے لیے اردو ویب لائبریری کی کتب منتخب کی جا سکتی ہیں۔
شاعری کے لیے کس پبلک ڈومین کا رخ کروں؟ اگر کچھ لنک یہاں درج کردیں تو کام شروع کردوں۔

14 الفاظ سے کم کا جملہ اب کہاں سے ڈھونڈا جائے۔
میں نے اردو محفل کے ہی مختلف مضامین سے کاپی پیسٹ کیا ہے۔
 
آخری تدوین:

دوست

محفلین
دستاویزات کے مطابق جملے مکالماتی بھی ہونے چاہئیں۔
اور ایسی صورت میں صرف 5000 جملے، بہت کم ہیں۔
 
14 الفاظ سے کم کا جملہ اب کہاں سے ڈھونڈا جائے۔
گِٹ ہب میں پُل ریکویسٹ دیکھیں
BEzjUR0.png


اگر اردو کے لیے الفاظ کی تعداد میں اضافہ کی ضرورت ہے تو ہم بھی پُل ریکویسٹ بھیج سکتے ہیں۔

یہاں بھی دیکھیں
 
آخری تدوین:
صرف 5000 جملے، بہت کم ہیں
غالباً یہ تعداد کسی پروجیکٹ کا وائس ریکارڈنگ پروسیس کو آغاز کرنے کے لیے ہو۔ انگریزی کے اب تک تیرہ ہزار ایک سو تین وائس کلپ سنے جا چکے ہیں اور چھ ہزار نو سو سینتالیس جملے ریکارڈ کیے جانے ہیں۔
 
جو کوڈنگ کے ماہرین ہیں ان سے گزارش ہے کہ گٹ ہب میں اردو وائس ریکوگنیشن کے لیے جملے میں ۱۴ الفاظ کی حد کو بڑھا کر ۲۵ الفاظ کرنے کا پُل ریکویسٹ بھیجیں۔ میں نے اپنے طور پر کوشش کی تھی لیکن ایرر آ رہا ہے۔

پُل ریکویسٹ لنک: Update index.js by abusarimhindi · Pull Request #289 · Common-Voice/sentence-collector

Create ur.js by abusarimhindi · Pull Request #287 · Common-Voice/sentence-collector
 
جو کوڈنگ کے ماہرین ہیں ان سے گزارش ہے کہ گٹ ہب میں اردو وائس ریکوگنیشن کے لیے جملے میں ۱۴ الفاظ کی حد کو بڑھا کر ۲۵ الفاظ کرنے کا پُل ریکویسٹ بھیجیں۔ میں نے اپنے طور پر کوشش کی تھی لیکن ایرر آ رہا ہے۔

پُل ریکویسٹ لنک: Update index.js by abusarimhindi · Pull Request #289 · Common-Voice/sentence-collector

Create ur.js by abusarimhindi · Pull Request #287 · Common-Voice/sentence-collector

Michael Kohler said on GitHub: If anyone speaking Urdu could help review this PR here, it would be greatly appreciated :) Create ur.js by abusarimhindi · Pull Request #287 · Common-Voice/sentence-collector
 

دوست

محفلین
یہاں ایک دھاگہ بنائیں، اور اس میں جملے تخلیق کریں۔ روزمرہ بول چال کے جملے۔ 5000 ہو جائیں تو وہاں ڈال دیں۔
میری جانب سے روزانہ کم از کم ایک جملہ لکھنے کی پیشکش ہے۔
 

الف نظامی

لائبریرین
  1. ہم آپ کو صمیم قلب سے خوش آمدید کہتے ہیں
  2. یہاں طبی سہولیات بہت مہنگی ہیں
  3. جھوٹ کے پاؤں نہیں ہوتے
  4. ہم آہ بھی کرتے ہیں تو ہو جاتے ہیں بدنام
  5. وہ قتل بھی کرتے ہیں تو چرچا نہیں ہو تا
  6. آپ سے مل کر بہت خوشی ہوئی
  7. اللہ تعالی آپ کو صحت ِکاملہ عطا فرمائے
  8. سائنس کائنات اور انسان کے درمیان رابطے کا علم ہے
  9. خوشونت سنگھ نے علامہ اقبال کے کلام کا انگریزی ترجمہ کیا ہے
  10. فلاحی ریاست کی اولین ترجیح شہریوں کی فلاح و بہبود ہوتی ہے
  11. سیاست اور معیشت ایک دوسرے سے جڑے ہوئے ہیں
  12. وزیر اعظم نے ورلڈ اکنامک فورم پہ اپنی قادرالکلامی کی دھوم مچا دی
  13. بالائی سطح پر پاکستان میں کرپشن کا خاتمہ ہو چکا ہے
  14. انسان زندگی میں بہت سے لوگوں سے سیکھتا ہے
  15. امن و امان کی صورتِ حال کا معاشی ترقی سے براہ راست تعلق ہے
  16. سائنسی اسلوب میں زمانے کے ساتھ ساتھ ترقی ہوتی رہی ہے
  17. غیر یقینی صورتحال میں ملکی ترقی ممکن نہیں
  18. کہاں گئے شبِ فرقت کے جاگنے والے
نیلے رنگ میں لکھے جملے شامل ہوچکے ہیں
 
آخری تدوین:

الف نظامی

لائبریرین
یہاں ایک دھاگہ بنائیں، اور اس میں جملے تخلیق کریں۔ روزمرہ بول چال کے جملے۔ 5000 ہو جائیں تو وہاں ڈال دیں۔
میری جانب سے روزانہ کم از کم ایک جملہ لکھنے کی پیشکش ہے۔
روزانہ کم از کم دس جملوں کا اہتمام تو ہونا چاہیے
 
واہ ماشاء اللہ !! یہاں تو معاملہ گرم ہے ، اتنے سارے افراد کام کو آگے بڑھانے کے لیے آ گئے، دل خوش ہو گیا۔
میں الف عین صاحب کا مشکور ہوں گِٹ ہب میں ریوو کرنے کے لیے ۔ اگر مزید لوگ بھی اپنا تبصرہ پیش کردیں تو۔ ہمارے لیے کام مزید آسان ہو جائے گا۔
میں بہت مشکور ہوں محمد شاکر عزیز صاحب کا بھی۔

موزیلا کی جانب سے ٹیلی گرام پر Mozillians نامی ایک گروپ بھی تشکیل دی گئی ہےجس میں اب تک ۹۷۶ افراد شامل ہیں، اس کام کے تعلق سے ہم اگر اس میں شامل رہیں گے تو مزید رہنمائی مل سکتی ہے۔
 

دوست

محفلین
یہاں پر جملے ٹائپ یا کاپی پیسٹ کرتے جائیں۔ بہتر ہے کہ نوٹ پیڈ سے پیسٹ کریں تاکہ دیگر فارمیٹنگ کام خراب نہ کرے۔
دیکھتے ہیں کتنے دن میں پانچ ہزار جملے مکمل ہوتے ہیں۔
اس میں انگریزی اور نمبر نہیں ہونے چاہئیں۔
 
Top