'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

فلسفی

محفلین
وہی ہوا جس کا ڈر تھا۔ کرننگ کی وجہ سے باکس فائل درست نہیں بن رہی اور نتائج متوقع آ رہے ہیں
ویسے آپ ٹف فائل اور باکس فائل کو کسی بھی باکس فائل ایڈیٹر میں کھولیں تو بظاہر سب کچھ درست ہی لگتا ہے۔

uc
 
یہ تو لگیچرز کی وجہ سے مزید گڑبڑ ہو گئی۔۔۔ہو سکے تو ایک تجربہ کسی کریکٹر فونٹ مثلاََ مہر نستعلیق ویب یا جمیل خوشخطی کی مدد سے بھی کر لیں ، شایدکچھ حد تک کام چل جائے کیونکہ ٹریننگ میں کافی فائلیں استعمال ہوں گی اور اتنی زیادہ فائلوں کے باکسز خود بنانا بہت محنت طلب ہو گا۔
 

فلسفی

محفلین
یہ تو لگیچرز کی وجہ سے مزید گڑبڑ ہو گئی۔۔۔ہو سکے تو ایک تجربہ کسی کریکٹر فونٹ مثلاََ مہر نستعلیق ویب یا جمیل خوشخطی کی مدد سے بھی کر لیں ، شایدکچھ حد تک کام چل جائے کیونکہ ٹریننگ میں کافی فائلیں استعمال ہوں گی اور اتنی زیادہ فائلوں کے باکسز خود بنانا بہت محنت طلب ہو گا۔
جو حکم، بھائی۔
جاسم بھائی ان فونٹس کے لنکس دیجیو۔
 
جمیل خوشخطی
دونوں مرتبہ اردو کی سابقہ نسخ والے تربیتی مواد (best) کو بنیاد بنا کر کی ہے۔
پھر شاید اسی وجہ سے لگیچرز کی ٹریننگ میں مسئلہ ہو کہ لگیچرز پہلی دفعہ استعمال ہوئے اور کریکٹرز کی بیس پہ تو سابقہ نسخ فونٹس والی ٹریننگ بھی موجود تھی تو اسی میں بہتری آئی۔۔۔
 

فلسفی

محفلین
جمیل خوشخطی

پھر شاید اسی وجہ سے لگیچرز کی ٹریننگ میں مسئلہ ہو کہ لگیچرز پہلی دفعہ استعمال ہوئے اور کریکٹرز کی بیس پہ تو سابقہ نسخ فونٹس والی ٹریننگ بھی موجود تھی تو اسی میں بہتری آئی۔۔۔
آپ کا مطلب ہے کہ تربیت کرواتے ہوئے موجودہ تربیتی مواد کے بجائے ابتدا سے تربیتی مواد بنا کر دیکھوں؟ مجھے یاد پڑتا ہے ایسا کرنے کی کوشش کی تھی کچھ مسئلہ آیا تھا۔ کہتے ہیں تو دوبارہ جمیل نستعلیق سے کوشش کرکے دیکھوں؟
 
آخری تدوین:
آپ کو مطلب ہے کہ تربیت کرواتے ہوئے موجودہ تربیتی مواد کے بجائے ابتدا سے تربیتی مواد بنا کر دیکھوں؟ مجھے یاد پڑتا ہے ایسا کرنے کی کوشش کی تھی کچھ مسئلہ آیا تھا۔ کہتے ہیں تو دوبارہ جمیل نستعلیق سے کوشش کرکے دیکھوں؟
جی اس بات کا امکان ہے کہ چونکہ سابقہ تمام ٹریننگ کریکٹر کی بیس پہ ہے تو آپ نے کریکٹر کی بیس پہ باکس فائل بنائی تو انہیں کریکٹرز کی لرننگ بہتر ہوئی جبکہ لگیچرز کی ٹریننگ چونکہ پہلی دفعہ ہوئی کہ سابقہ ٹریننگ میں لگیچرز موجود نہیں تھے اس لیے لگیچرز کی اتنی بہتر لرننگ نہیں ہوئی۔ یہ بھی ممکن ہے کہ پروگرام میں ہی لگیچرز کی وجہ سے کوئی مسئلہ ہو مگر اس کا امکان کم ہے کیونکہ انگریزی اور دوسری زبانوں میں بھی بعض جگہ لگیچر استعمال ہوتے ہیں۔
 

جاسم محمد

محفلین
آپ کا مطلب ہے کہ تربیت کرواتے ہوئے موجودہ تربیتی مواد کے بجائے ابتدا سے تربیتی مواد بنا کر دیکھوں؟ مجھے یاد پڑتا ہے ایسا کرنے کی کوشش کی تھی کچھ مسئلہ آیا تھا۔ کہتے ہیں تو دوبارہ جمیل نستعلیق سے کوشش کرکے دیکھوں؟
یہ تجربہ بھی کر کے دیکھ لیں۔ ویسے مجھے بہت عجیب سا لگا کہ درست باکس فائل کے ساتھ اتنا غلط نتیجہ کیسے آرہا ہے۔ حالانکہ آپکے ابتدائی ٹیسٹس میں درست تھا
 

فلسفی

محفلین
مہر نستعلیق والے فونٹ پر image2text یہ ایرر دے رہا ہے۔
کوڈ:
Stripped 10 unrenderable words
اس وجہ سے ٹف اور باکس فائل دونوں کی خالی ہیں۔
جمیل خوشخطی والے فونٹ سے باکس فائل تو حرف بہ حرف بنی ہے۔ لیکن ٹف اور باکس فائل میں یہ گڑبڑ ہے۔

uc


میں جمیل نوری والے فونٹ سے موجودہ تربیتی مواد کے بغیر تربیت کروا کے دیکھتا ہوں پہلے۔
 
آخری تدوین:

فلسفی

محفلین
اردو او سی آر کا بنیادی فوکس تو یہی خط ہے۔ اگر تجربہ کامیاب رہا تو دیگر خطوط تک سکیل ایبل کیا جا سکتا ہے
میرے خیال میں پہلے بھی یہ تجربہ کیا تھا لیکن شاید دائیں سے بائیں والی باکس فائل کے ساتھ اس میں ایرر ریٹ بہت زیادہ تھا اور نتیجہ بیکار۔ خیر اب دوبارہ ٹریننگ پر لگایا ہے دیکھتے ہیں۔
 
جمیل خوشخطی والے فونٹ سے باکس فائل تو حرف بہ حرف بنی ہے۔ لیکن ٹف اور باکس فائل یہ گڑبڑ ہے۔
یہ تو فونٹ میں غلطی ہے آن لائن پری ویو میں بھی آہنی لکھنے پر ایسا ہی نظر آتا ہے۔
اللہ کرےسکریچ سے ٹریننگ میں آپ کو کامیابی نصیب ہو۔ اگر جمیل نوری نستعلیق کے لگیچرز پر ہی کامیابی حاصل ہو جائے تونوے فیصد سے زائد اردو پرنٹڈ ٹیکسٹ پر تو کام کرے گا ہی۔
 

فلسفی

محفلین
لیجیے نتائج ۔۔۔ تربیتی مواد والی فائل فقط 3.8 ایم بی کی ہے۔

کوڈ:
کوٹھی ے ہنی گیٹ کھکیمں ادردرھتے
کوٹھی ے ہنی گیٹ کیککیکھکیمں ادردرھتے
کوٹھی ے ہنندرکھتے

ایک وارننگ جاوا اے پی آئی استعمال کرتے ہوئے تقریبا سب ہی تربیتی مواد میں دکھا رہا ہے۔ جس کی فی الحال سمجھ نہیں آئی۔

کوڈ:
Failed to load any lstm-specific dictionaries for lang urd!!
 

جاسم محمد

محفلین
تازہ ترین تجربہ تربیتی مواد کے لیے استعمال کی گئی فائل، اس سے جو تربیتی مواد بنایا گیا اس کے ذریعے اس تصویر کو ٹیسٹ کیا۔

نتیجہ
فلسفی کہیں ایسا تو نہیں یہ او سی آر انجن نسخ خط کیلئے اوپٹیمائز کیا گیا ہے۔ جبکہ نستعلیق میں ایسا نہ ہونے کے باعث اچھا نتیجہ نہیں مل رہا؟
 
لیجیے نتائج ۔۔۔ تربیتی مواد والی فائل فقط 3.8 ایم بی کی ہے۔
ابتدائی نتائج کے لحاظ سے دیکھا جائے تو کافی امید افزا نتائج ہیں۔۔۔ تاہم کچھ مسائل ہیں جن کو مزید ٹریننگ سے پہلے دیکھا جانا ضروری ہے: مثال کے طور پر باکس فائل میں اسپیس کے مقام اور تعداد میں غلطی۔۔۔۔
اس کے علاوہ جمیل نوری نستعلیق کے نسخہ دوم میں کچھ لگیچرز میں غلطیاں بھی تھیں جن کو بعد میں درست کیا گیا تھا۔
 
Top