اردو وائس ریکوگنیشن پراجیکٹ

سرفراز احمد نے 'ڈیویلپمنٹ' کی ذیل میں اس موضوع کا آغاز کیا، ‏جنوری 13, 2020

  1. سرفراز احمد

    سرفراز احمد محفلین

    مراسلے:
    83
    جھنڈا:
    India
    موڈ:
    Cold
    وائس ریکوگنیشن کو بہتر بنانے کے لیے موزیلا نے ایک پراجیکٹ شروع کیا ہے ۔ جہاں کوئی بھی اپنی زبان کے لیے پراجیکٹ شروع کر سکتا ہے۔ ابھی کچھ لمحہ قبل مجھے اس کی جانکاری ملی اور اکاؤنٹ بنانے کے بعد اپنی زبان اردو تلاش کیا، لیکن اب تک اس پر کام کا آغاز نہیں ہوا۔ میں نے اردو زبان کو شامل کرنے کی درخواست دے دی ہے۔
    اس کام کا پہلا مرحلہ اردو جملوں کا انتخاب ہے۔ اس کے لیے مختلف پبلک ڈومین سے جملے کاپی پیسٹ کرنا ہے، جنہیں پڑھ کر آواز ریکارڈ کی جائے گی۔ جس کا آغاز میں نے ’’اللہ کے نام سے شروع جو بڑا مہربان نہایت رحم والا ہے‘‘ اور ’’نبی رحمت حضرت محمد مصطفیٰ صلی اللہ علیہ وسلم پر ہزاروں درود و سلام‘‘ جملے سے کر دیا ہے۔

    آپ حضرات سے بھی گزارش ہے کہ اس کار خیر میں حصے لیں اور اردو کی ترقی و ترویج کے لیے مزید قدم آگے بڑھائیں۔

    اکاؤنٹ بنانے کے لیے اس لنک پر جائیں: Common Voice by Mozilla

    یہاں آپ اردو لکھ کر تلاش کریں اور Get Involved پر کلک کر دیں۔

    مقامیانے کے اصول اور اہم باتیں یہاں ملاحظہ فرمائیں : Common Voice by Mozilla

    جملوں کو جمع کرنے کے کام میں شامل ہونے کے لیے اس لنک پر جائیں : Common Voice Sentence Collector

    طمیم جاسم محمد الف عین نیرنگ خیال دوست ابن سعید
     
    • زبردست زبردست × 5
    • پسندیدہ پسندیدہ × 4
  2. سرفراز احمد

    سرفراز احمد محفلین

    مراسلے:
    83
    جھنڈا:
    India
    موڈ:
    Cold
    جملے کو جمع کرنے کے تعلق سے چند ضروری ہدایات:

    Login
    You can login by entering any available username and choosing a password, that will automatically create an account for you. Once logged in you can select your languages from the profile section.

    Add new sentences
    All sentences you submit must be under Public Domain (CC-0) license.
    Numbers. There should be no digits in the source text because they can cause problems when read aloud. The way a number is read depends on context and might introduce confusion in the dataset. For example, the number “2409” could be accurately read as both “twenty-four zero nine” and “two thousand four hundred nine”.
    Abbreviations and Acronyms. Abbreviations and acronyms like “USA” or “ICE” should be avoided in the source text because they may be read in a way that does not coincide with their spelling. Additionally, there may be multiple accurate readings for a single abbreviation. For example, the acronym “ICE” could be pronounced “I-C-E” or as a single word.
    Punctuation. Special symbols and punctuation should only be included when absolutely necessary. For example, an apostrophe is included in English words like “don’t” and “we’re” and should be included in the source text, but it’s unlikely you’ll ever need a special symbol like “@” or “#.”
    Foreign letters. Letters must be valid in the language being spoken. For example, “ж” is a letter in the Russian alphabet but is never used in English and so should never appear in any English source text.
    Length. Sentences must be 14 words or less.
    We prefer natural/conversational sentences. While phonetic diversity and different words in sentences is important, we are trying to make recording sentences as much fun as possible. Therefore it would be great if you could try to keep your sentences as natural/engaging as possible.​
     
    • پسندیدہ پسندیدہ × 3
  3. دوست

    دوست محفلین

    مراسلے:
    13,007
    جھنڈا:
    Germany
    موڈ:
    Fine
    میرا خیال ہے پرانی شاعری ساری پبلک ڈومین میں ہے۔ مزید کے لیے اردو ویب لائبریری کی کتب منتخب کی جا سکتی ہیں۔
     
    • پسندیدہ پسندیدہ × 3
  4. دوست

    دوست محفلین

    مراسلے:
    13,007
    جھنڈا:
    Germany
    موڈ:
    Fine
    جملے بنانے پڑیں گے، ادب سے کاپی پیسٹ نہیں ہو گی۔ 14 الفاظ سے کم کا جملہ اب کہاں سے ڈھونڈا جائے۔
     
    • پسندیدہ پسندیدہ × 1
    • معلوماتی معلوماتی × 1
  5. سرفراز احمد

    سرفراز احمد محفلین

    مراسلے:
    83
    جھنڈا:
    India
    موڈ:
    Cold
    شاعری کے لیے کس پبلک ڈومین کا رخ کروں؟ اگر کچھ لنک یہاں درج کردیں تو کام شروع کردوں۔

    میں نے اردو محفل کے ہی مختلف مضامین سے کاپی پیسٹ کیا ہے۔
     
    آخری تدوین: ‏جنوری 14, 2020 6:41 شام
    • معلوماتی معلوماتی × 1
  6. دوست

    دوست محفلین

    مراسلے:
    13,007
    جھنڈا:
    Germany
    موڈ:
    Fine
    دستاویزات کے مطابق جملے مکالماتی بھی ہونے چاہئیں۔
    اور ایسی صورت میں صرف 5000 جملے، بہت کم ہیں۔
     
    • متفق متفق × 2
  7. سرفراز احمد

    سرفراز احمد محفلین

    مراسلے:
    83
    جھنڈا:
    India
    موڈ:
    Cold
    گِٹ ہب میں پُل ریکویسٹ دیکھیں
    [​IMG]

    اگر اردو کے لیے الفاظ کی تعداد میں اضافہ کی ضرورت ہے تو ہم بھی پُل ریکویسٹ بھیج سکتے ہیں۔

    یہاں بھی دیکھیں
     
    آخری تدوین: ‏جنوری 14, 2020 9:39 شام
    • معلوماتی معلوماتی × 1
  8. سرفراز احمد

    سرفراز احمد محفلین

    مراسلے:
    83
    جھنڈا:
    India
    موڈ:
    Cold
    غالباً یہ تعداد کسی پروجیکٹ کا وائس ریکارڈنگ پروسیس کو آغاز کرنے کے لیے ہو۔ انگریزی کے اب تک تیرہ ہزار ایک سو تین وائس کلپ سنے جا چکے ہیں اور چھ ہزار نو سو سینتالیس جملے ریکارڈ کیے جانے ہیں۔
     
    • معلوماتی معلوماتی × 1
  9. سرفراز احمد

    سرفراز احمد محفلین

    مراسلے:
    83
    جھنڈا:
    India
    موڈ:
    Cold
    جو کوڈنگ کے ماہرین ہیں ان سے گزارش ہے کہ گٹ ہب میں اردو وائس ریکوگنیشن کے لیے جملے میں ۱۴ الفاظ کی حد کو بڑھا کر ۲۵ الفاظ کرنے کا پُل ریکویسٹ بھیجیں۔ میں نے اپنے طور پر کوشش کی تھی لیکن ایرر آ رہا ہے۔

    پُل ریکویسٹ لنک: Update index.js by abusarimhindi · Pull Request #289 · Common-Voice/sentence-collector

    Create ur.js by abusarimhindi · Pull Request #287 · Common-Voice/sentence-collector
     

اس صفحے کی تشہیر