نتائج تلاش

  1. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    میں کل سے کچھ مزید تحقیق کر رہا ہوں ٹریننگ ڈیٹا بنانے کے حوالے سے۔ ایک تو ٹریننگ ڈیٹا موجود ہے یہاں، جیسا کہ اوپر بھی دو ایک مرتبہ اس کا ذکر کیا گیا لیکن تب میری ستر سی سی کھوپڑی میں یہ بات نہیں آ رہی تھی۔ ٹریننگ ٹیکسٹ اور ورڈ لسٹ میں تقریباً ایک لاکھ الفاظ موجود نہیں ہیں۔ پھر بھی ٹریننگ ٹیکسٹ...
  2. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    سطری فائل اور اضافی الفاظ جو نہیں مل سکے یہاں سے حاصل کیے جا سکتے ہیں۔ کل سطور 223,397 جن میں کہیں کہیں مسائل بھی نظر آئیں گے، یہ میری دانست میں بہترین دستیاب حل تھا۔ لائن جنریٹر پروگرام کو اپڈیٹ کر دیا ہے، اب پیرالل لوپنگ سے گھنٹوں کا کام منٹوں میں ہو جاتا ہے۔ شرط یہ ہے کہ پہلے سب سے چھوٹی...
  3. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اگر فونٹس سے مصنوعی امیجز تیار کرنا ہیں تو یہی طریقہ ہے۔ ورنہ اصلی والے صفحات یعنی سکینز استعمال کیے جائیں۔ یہ بھی دھیان رہے کہ اردو جیسی زبانوں کے پیچیدہ رسم الخط کی وجہ سے ٹریننگ کرواتے ہوئے 10000 پھیروں کی بجائے بیس ہزار پھیروں تک کے مشورے بھی دیے گئے ہیں۔ مزید براں ڈیٹا جتنا مرضی ہو اس بات...
  4. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اردو کے زیادہ فریکوئنسی والے الفاظ ان سطور میں موجود سیاق و سباق کی وجہ سے بار بار دوہرائے جائیں گے۔ دراصل صرف چند سو الفاظ ہی بہت زیادہ فریکوئنسی کے حامل الفاظ ہوتے ہیں، اس کے بعد الفاظ کی فریکوئنسی گرتی چلی جاتی ہے اور بڑے سے بڑے ڈیٹا سیٹ میں بھی آپ کو دسیوں ہزار ایسے الفاظ ملتے ہیں جن کی...
  5. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    میرا مقصد اس سلسلے صرف اتنا تھا کہ ایک ایسی ٹریننگ ڈیٹا فائل تیار ہوجائے جس میں اردو کے زیادہ سے زیادہ دستیاب اور درست کردہ الفاظ اپنے سیاق و سباق سمیت موجود ہوں۔ اس لئے میں نے ترسیموں اور سپیل چیکر سے حاصل کردہ الفاظ، اور اردو کی بورڈ سے تقریباً تمام علامات، اعراب وغیرہ کو یکجا کر کے کئی برسوں...
  6. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    وہی نیم حکیم، پہلی مرتبہ یہ کام کیا ہے۔ 12 برس ہو گئے سی شارپ میں کوڈنگ کرتے، کوڈنگ کیا کرتے بس ترلے کرتے۔ اب چیک کریں۔ اردو ورڈ لسٹ کا لنک بدل دیا ہے۔
  7. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    تب تک یہ انجوائے کریں۔
  8. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    منفرد الفاظ ہیں جو لگیچرز اور ہن سپیل کی ڈکشنری والی لسٹ سے اٹھائے ہیں۔ یہ لسٹ آٹھ برس قبل کرلپ کی سپیل چیکر لسٹ اور اسی ٹیکسٹ آرکائیو سے حاصل کردہ منفرد الفاظ کو ملا کر بنائی گئی تھی۔ پروف ریڈنگ کر کے مہمل بے کار املا کی غلطیاں نکالی گئی تھیں۔ سطور نکالنے کے پروگرام اور ورڈ لسٹ یہاں موجود ہیں۔
  9. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    ہمارا تو نیم حکیم خطرہ جان والا کام ہے۔ پہلے پروگرام مٹا مٹا کر لکھتے رہے اب اس کے مکمل چلنے کا انتظار ہے۔ ابھی ستاون ہزار الفاظ باقی ہیں۔ وہی نیم حکیم سادہ کام کرنے کی بجائے اوکھا کام کیا ہے، تین کروڑ الفاظ پر سے سوا لاکھ الفاظ لوپ، اگے تسیں سمجھدار او۔ میں کسی دیوار میں ٹکر بھی نہیں مار سکتا...
  10. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اور اس کے بعد کل سے واپس پرانی تنخواہ پر کام پر واپسی۔ اس کی ٹریننگ دیکھتے ہیں پھر وقت ملنے پر۔
  11. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    7 گھنٹے کم و بیش کی ڈونکی، اردو میں جسے گدھا اور پنجابی میں کھوتا کہتے ہیں، محنت سے ایک فرینکسٹائن پروگرام لکھا، مٹا مٹا کر لکھا۔ اور اب تقریباً ایک لاکھ تیس ہزار الفاظ کی فہرست سے ہر لفظ کے لیے 21 الفاظ کے تین ٹکڑے بن رہے ہیں۔ کُل قریباً 4 لاکھ سطریں۔ نہ ملنے والے لگیچر حروف آخر پر ویسے ہی شامل...
  12. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    آج ٹریننگ ٹیکسٹ بن جائے گی، زیادہ سے زیادہ ممکن سطروں کے ساتھ۔ منفرد الفاظ جمع لگیچرز دونوں کو کام میں لا کر سطور جنریٹ ہو جائیں گی، ابھی تجربات جاری ہیں۔
  13. دوست

    ایڈیٹر اردو ایڈیٹر بکمارکلٹ

    آپ کے پاس اردو کی بورڈ نہیں ہے؟
  14. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    میرا آج کا دن کچھ احباب کے لیے پراٹھے بنانے اور پھر سونے میں گزرا ہے۔ کل پہلے متن فائل اپلوڈ کروں جس میں سب علامات ہوں، پھر یونی کریسٹ فائل پر کچھ دیکھتا ہوں۔ کچھ تجربات مزید ہونے کے بعد اندازہ ہو گا کہ مکمل الفاظ بہتر ہیں یا لگیچرز۔ جمیل نوری نستعلیق 3 والی لگیچرز لسٹ کہاں ہے بھلا؟ ٹیکسٹ فائل۔
  15. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اس طریقے میں تو صرف ٹیکسٹ فائل دیں گے باقی سارا کام تو ٹیس ٹرین نے کرنا ہے، امیج ٹو ٹیکسٹ استعمال کر کے۔
  16. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    unicharset ضروری ہے، یہ انگریزی اور عربی کے لیے تو ہے، اردو کے لیے نہیں ہے۔ صبح اس پر بات کرتے ہیں۔ بنیادی طور پر ٹیسرکٹ تین کی باکس فائلوں سے یہ بنے گی (ٹولز بھی تین کے ساتھ ہی آتے ہیں اسے بھی انسٹال کرنا ہو گا)۔ لیکن ڈیٹا میں سارے کیریکٹرز بشمول اردو ہندسے اعراب، مذہبی علامات، رموزِ اوقاف سب...
  17. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    اسے کمپائل کیا جائے، تب ٹریننگ ٹولز بھی انسٹال ہوتے ہیں۔ آفیشل پتہ نہیں کیا چول ہے۔ سمجھ ہی نہیں آتی۔
  18. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    مرنا یہ ہے کہ میری قبل از مسیح کی کھوپڑی میں اس کا ورک فلو نہیں آ رہا۔ مثالیں بھی نہیں ہیں ٹیوٹوریل میں۔ او سی آر ڈی والا آسان لگا تھا ٹریننگ ڈیٹا کی مثال دیکھ کر۔ بنیادی طور پر جرمن زبان کے لیے ہے اس پراجیکٹ کی فنڈنگ ایجنسی جرمن ہے۔
  19. دوست

    'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

    پھر ٹیکسٹ فائل جو اس طریقے میں بن رہی ہے وہ سٹرنگ کو الٹ کر لکھی جائے؟ کیریکٹر لیول پر یا لفظ کے لیول پر۔
Top