'ٹیزرکٹ' کے سا تھ آف لائن اردو او سی آر

فلسفی

محفلین
فلسفی یہ مسئلہ تو آنا ہی تھا :)
اوپر پیش کردہ نمونوں کے مطابق ٹیزریکٹ انجن نستعلیق اسپیس پڑھنے سے قاصر ہے۔ کیونکہ نستعلیق خط میں اسپیس نسخ خط کی طرح عمودی نہیں ترچھی ہوتی ہے :
Kerningex.png

یہ مسئلہ کیسے حل ہوگا وہ آپ ماہرین بہتر بتا سکتے ہیں۔ لیکن آپ کیلئے نوری نستعلیق فانٹ بغیر کرننگ والایہاں اپلوڈ کر دیتا ہوں ۔ اس فانٹ میں اسپیسنگ والا مسئلہ نہیں آئے گا :)
JNN3_Nokern_shipped.7z
نہیں یار اس کا نتیجہ تو بہت خراب ہے

کوڈ:
حیف راسےاننام باتقوںکاتزیکرتےہوئےکہتے ہیںک۔یسبپواس لیےہورہاسکمم
نےاحتقیاکرنابنکردیاہے۔شایدحنیف اگھرسہیں نکلتےورنوہدیکھتےکیکسطرح آج کینوجوان
امریبکی بکروںاورچکن ریسٹورنٹ کےسا سحنکڑےہوکرلگوںکتلقینکررہے تقھکرہم دیی رولی پنےہ
دییمرغ اورروٹیکھائیں گے۔ہم نووبنلیںپیں گےاورنوہمرغیاںکھائیں گےن۔حیف راسےجی!
آپکومعلوم ہےاننمامنوجان سیسچیوں کےساتکیا ہوا تیسرےذنحکتیکارندس؟ ےنہیںاٹاکر
گاڑیوں میںڈالکرشہرسےباہرھوڑآ ئے۔ !ف
 

جاسم محمد

محفلین
نہیں یار اس کا نتیجہ تو بہت خراب ہے
پہلے اس بغیر کرننگ والے فانٹ سے ایک نمونہ بنا کر ٹرین کروائیں۔ اور پھر اسی نمونے کو او سی آر سے پڑھنے کی کوشش کریں۔ نسخ فانٹ جیسا رزلٹ آنا چاہئے۔ اگر یہ نہیں ہو رہا تو گڑبڑ کہیں اور ہے۔ اس مسئلہ کو درست کئےبغیر کام آگے نہیں بڑھا جا سکتا۔
ٹیزریکٹ انجن کو کم از کم نسخ جیسی عمودی اسپیس تو پڑھنی چاہیے۔
 

عباس اعوان

محفلین
پہلے اس بغیر کرننگ والے فانٹ سے ایک نمونہ بنا کر ٹرین کروائیں۔ اور پھر اسی نمونے کو او سی آر سے پڑھنے کی کوشش کریں۔ نسخ فانٹ جیسا رزلٹ آنا چاہئے۔ اگر یہ نہیں ہو رہا تو گڑبڑ کہیں اور ہے۔ اس مسئلہ کو درست کئےبغیر کام آگے نہیں بڑھا جا سکتا۔
ٹیزریکٹ انجن کو کم از کم نسخ جیسی عمودی اسپیس تو پڑھنی چاہیے۔
متفق
 

عباس اعوان

محفلین
میرے خیال میں نمونے کے طور پر بھی جو ٹریننگ ڈیٹا مہیا کیا جا رہا ہے، وہ بہت ہی کم ہے۔
نیورل نیٹورک میں ٹریننگ کے دوران ہمیں فالس کیسز(False cases) سے بھی ٹریننگ کرنی ہوتی ہے۔صرف ٹرو کیسز(True cases) سے بہترین رزلٹ نہیں آئے گا۔
 

فلسفی

محفلین
پہلے اس بغیر کرننگ والے فانٹ سے ایک نمونہ بنا کر ٹرین کروائیں۔ اور پھر اسی نمونے کو او سی آر سے پڑھنے کی کوشش کریں۔ نسخ فانٹ جیسا رزلٹ آنا چاہئے۔ اگر یہ نہیں ہو رہا تو گڑبڑ کہیں اور ہے۔ اس مسئلہ کو درست کئےبغیر کام آگے نہیں بڑھا جا سکتا۔
ٹیزریکٹ انجن کو کم از کم نسخ جیسی عمودی اسپیس تو پڑھنی چاہیے۔


یہ لیجیے جناب
بغیر کرننگ والا فونٹ 14 سائز (تربیت بغیر کرننگ والے فانٹ سے ہی کروائی ہے)
uc

کوڈ:
حال اچا بتانے پر آدمی کو تھوڑا بہت سکون مل جاتا
کرننگ والا فونٹ 14 سائز (تربیت بغیر کرننگ والے فانٹ سے ہی کروائی ہے)
کوڈ:
حالاچمابتانرآدیکوتھوڑابہت سنکون مل جاتا


میرے خیال میں نمونے کے طور پر بھی جو ٹریننگ ڈیٹا مہیا کیا جا رہا ہے، وہ بہت ہی کم ہے۔
نیورل نیٹورک میں ٹریننگ کے دوران ہمیں فالس کیسز(False cases) سے بھی ٹریننگ کرنی ہوتی ہے۔صرف ٹرو کیسز(True cases) سے بہترین رزلٹ نہیں آئے گا۔
میرا بھی یہی خیال ہے۔ ابھی میں نے ایک لاکھ سطروں سے تربیت کروائی ہے۔ مزید مواد اکھٹا کرنے کی کوشش کرتا ہوں۔ ٹیسریکٹ میں تربیت کے لیے درست اور غلط تربیتی مواد کے لیے کوئِ علیحدہ سے آپشن نہیں۔ میرا خیال ہے کہ اگر ایسا ضروری ہے تو انجن اس کو خود ہی تیار کرتا ہوگا۔ اگر آپ کے پاس ٹیسریکٹ کے حوالے سے کوئی لنک ہے تو ضرور شئیر کیجیے۔
 

عباس اعوان

محفلین
یہ لیجیے جناب
بغیر کرننگ والا فونٹ 14 سائز (تربیت بغیر کرننگ والے فانٹ سے ہی کروائی ہے)
uc

کوڈ:
حال اچا بتانے پر آدمی کو تھوڑا بہت سکون مل جاتا
کرننگ والا فونٹ 14 سائز (تربیت بغیر کرننگ والے فانٹ سے ہی کروائی ہے)
کوڈ:
حالاچمابتانرآدیکوتھوڑابہت سنکون مل جاتا
بہت بہتر رزلٹ ہے۔زبردست
میرا بھی یہی خیال ہے۔ ابھی میں نے ایک لاکھ سطروں سے تربیت کروائی ہے۔ مزید مواد اکھٹا کرنے کی کوشش کرتا ہوں۔۔
زبردست،بہت عمدہ
ٹیسریکٹ میں تربیت کے لیے درست اور غلط تربیتی مواد کے لیے کوئِ علیحدہ سے آپشن نہیں۔ میرا خیال ہے کہ اگر ایسا ضروری ہے تو انجن اس کو خود ہی تیار کرتا ہوگا۔ اگر آپ کے پاس ٹیسریکٹ کے حوالے سے کوئی لنک ہے تو ضرور شئیر کیجیے۔
میں نے ایک جنرل نوٹ لکھا تھا، ٹیزرکٹ کے حوالے سے ریسرچ کرنی پڑے گی۔
 

فلسفی

محفلین
زبردست۔ یعنی مسئلہ بالآخر ڈائگنوز ہو چکا ہے۔ اللہ تعالی آپ کو جزا دے۔ آمین
یہ خدشہ آپ پہلے ظاہر کر چکے تھے اب پروگرام سے بھی تصدیق ہوگئی۔ میں مزید تربیتی مواد بنانے کی کوشش کرتا ہوں پھر کرننگ والے فانٹ پر ہی مزید تجربات کریں گے۔
 

جاسم محمد

محفلین
میں مزید تربیتی مواد بنانے کی کوشش کرتا ہوں پھر کرننگ والے فانٹ پر ہی مزید تجربات کریں گے۔
کیا مزید تربیتی مواد بنا دینے سے نستعلیق اسپیسنگ کا مسئلہ حل ہو جائے گا؟ میرے خیال میں ایسا نہیں ہے۔
ٹیزریکٹ کی آفیشل ٹیم سے رابطہ کر کے ان کے او سی آر انجن میں معمول کی عمودی اسپیسنگ سے ہٹ کر ترچھی اسپیسنگ کی سپورٹ ڈلوانی پڑے گی۔ عین ممکن ہے اس میں یہ سپورٹ پہلےسے موجود ہو لیکن پروگرام کے ٹریننگ اور ریڈنگ ماڈلز میں اسے بائی ڈیفالٹ ایکٹیویٹ نہ کیا گیا ہو۔ یہ معلومات ان کی ٹیم سے بات کر کے ہی حاصل ہو سکتی ہیں۔
 

فلسفی

محفلین
کیا مزید تربیتی مواد بنا دینے سے نستعلیق اسپیسنگ کا مسئلہ حل ہو جائے گا؟ میرے خیال میں ایسا نہیں ہے۔
ٹیزریکٹ کی آفیشل ٹیم سے رابطہ کر کے ان کے او سی آر انجن میں معمول کی عمودی اسپیسنگ سے ہٹ کر ترچھی اسپیسنگ کی سپورٹ ڈلوانی پڑے گی۔ عین ممکن ہے اس میں یہ سپورٹ پہلےسے موجود ہو لیکن پروگرام کے ٹریننگ اور ریڈنگ ماڈلز میں اسے بائی ڈیفالٹ ایکٹیویٹ نہ کیا گیا ہو۔ یہ معلومات ان کی ٹیم سے بات کر کے ہی حاصل ہو سکتی ہیں۔
یہ بھی کر کے دیکھ لیتے ہیں لیکن عام طور پر اوپن سورس پراجیکٹ کے بارے میں ای میل پر جواب نہیں ملتا، اس کے لیے فورم پر تھریڈ بنانا پڑے گا۔ میں سوال تیار کر کے تھریڈ اوپن کرتا ہوں پھر دیکھتے ہیں۔

مزید مواد ہر صورت میں چاہیئے ہو گا، چاہے سپیس کا مسئلہ مکمل حل ہو یا نہیں کیونکہ بہت سے الفاظ گڑ بڑ ہوجاتے ہیں مثلا "ہے" اکثر "ے" بن جاتا ہے۔ اسی طرح کچھ دوسرے الفاظ اور یہ زیادہ سے زیادہ مواد کی صورت میں بہتر ہوگا۔
 

جاسم محمد

محفلین
یہ بھی کر کے دیکھ لیتے ہیں لیکن عام طور پر اوپن سورس پراجیکٹ کے بارے میں ای میل پر جواب نہیں ملتا، اس کے لیے فورم پر تھریڈ بنانا پڑے گا۔ میں سوال تیار کر کے تھریڈ اوپن کرتا ہوں پھر دیکھتے ہیں۔
میں نے خصوصی طور پر ای میل کا ذکر نہیں کیا۔ ٹیزریکٹ کی آفیشل یا نان آفیشل ٹیم سے رابطے کا جو بھی طریقہ ہو اسے اپنایا جائے۔
میرے خیال میں اس مسئلہ کا مستقل حل نستعلیق کی ترچھی اسپیسنگ ٹیزریکٹ انجن میں ڈیٹیکٹ کروانے کے بعد نکل آئے گا۔ اس کے علاوہ کوئی جگاڑ جیسے باکس فائلز کے ساتھ چھیڑ چھاڑ شاید آگے چل کر کوئی خاص فائدہ نہ دے۔
 

فلسفی

محفلین
ویسے تو آپ لوگ اب تک یہ پڑھ چکے ہوں گے۔ پھر بھی پوسٹ کر رہا ہوں، تاکہ اگر نظر سے نہ گزرا ہو تو دیکھ لیں۔ :)
بہت شکریہ تابش بھائی، یہ پیپر معلوماتی ہے اور ٹیکسریٹ 3 کے بارے میں ہے۔ ٹیسریکٹ 4 کا طریقہ کار مختلف ہے لیکن میرا خیال ہے کہ انہوں نے ٹیسریکٹ 4 میں بھی بنیادی حروف کی شکلوں (بغیر اعراب اور نقاط کے) کے مطابق تربیت کروائی ہوگی (یہ میرا اندازہ ہی ہے) ۔ جیسا اس پیپر میں لکھا ہے۔ انہوں نے ٹیسریکٹ کے انجن میں کچھ تبدیلی کی بات بھی کی ہے، اللہ جانے وہ کیا تبدیلی ہے (ممکن ہے وہ سپیس سے متعلق ہو جس کا ذکر جاسم کر رہے ہیں)
 

شکیب

محفلین
بہت شکریہ تابش بھائی، یہ پیپر معلوماتی ہے اور ٹیکسریٹ 3 کے بارے میں ہے۔ ٹیسریکٹ 4 کا طریقہ کار مختلف ہے لیکن میرا خیال ہے کہ انہوں نے ٹیسریکٹ 4 میں بھی بنیادی حروف کی شکلوں (بغیر اعراب اور نقاط کے) کے مطابق تربیت کروائی ہوگی (یہ میرا اندازہ ہی ہے) ۔ جیسا اس پیپر میں لکھا ہے۔ انہوں نے ٹیسریکٹ کے انجن میں کچھ تبدیلی کی بات بھی کی ہے، اللہ جانے وہ کیا تبدیلی ہے (ممکن ہے وہ سپیس سے متعلق ہو جس کا ذکر جاسم کر رہے ہیں)
CLE والوں سے اس تبدیلی کے متعلق پوچھا جائے تو؟ اس کا امکان تو کم ہی ہے کہ وہ تبدیل شدہ ورژن یا فقط متعلقہ کوڈ ہی کو شیئر کر دیں، لیکن کرننگ کے متعلق کوئی قابلِ عمل ٹپ ضرور مل جائے گی۔
 

شکیب

محفلین
یہ لیجیے جناب
بغیر کرننگ والا فونٹ 14 سائز (تربیت بغیر کرننگ والے فانٹ سے ہی کروائی ہے)
uc

کوڈ:
حال اچا بتانے پر آدمی کو تھوڑا بہت سکون مل جاتا
کرننگ والا فونٹ 14 سائز (تربیت بغیر کرننگ والے فانٹ سے ہی کروائی ہے)
کوڈ:
حالاچمابتانرآدیکوتھوڑابہت سنکون مل جاتا



میرا بھی یہی خیال ہے۔ ابھی میں نے ایک لاکھ سطروں سے تربیت کروائی ہے۔ مزید مواد اکھٹا کرنے کی کوشش کرتا ہوں۔ ٹیسریکٹ میں تربیت کے لیے درست اور غلط تربیتی مواد کے لیے کوئِ علیحدہ سے آپشن نہیں۔ میرا خیال ہے کہ اگر ایسا ضروری ہے تو انجن اس کو خود ہی تیار کرتا ہوگا۔ اگر آپ کے پاس ٹیسریکٹ کے حوالے سے کوئی لنک ہے تو ضرور شئیر کیجیے۔
بغیر کرننگ کے تو زبردست رزلٹ ہے۔ آپ نے ٹریننگ ڈیٹا کتنا استعمال کیا ہے؟
گوگل ڈرائیو سے تصاویر کیسے شامل کر رہے ہیں؟ Google Drive Direct Link Generator کے ذریعے ممکن ہے؟
 

فلسفی

محفلین
CLE والوں سے اس تبدیلی کے متعلق پوچھا جائے تو؟ اس کا امکان تو کم ہی ہے کہ وہ تبدیل شدہ ورژن یا فقط متعلقہ کوڈ ہی کو شیئر کر دیں، لیکن کرننگ کے متعلق کوئی قابلِ عمل ٹپ ضرور مل جائے گی۔

جی شکیب بھائی اس کے لیے کوشش کررہا ہوں۔ ایک دو دوستوں سے کہا ہے کہ کوئی ریفرنس نکال کر اگر کچھ معلومات حاصل ہوسکیں تو مددگار ثابت ہوں گی۔

بغیر کرننگ کے تو زبردست رزلٹ ہے۔ آپ نے ٹریننگ ڈیٹا کتنا استعمال کیا ہے؟
گوگل ڈرائیو سے تصاویر کیسے شامل کر رہے ہیں؟ Google Drive Direct Link Generator کے ذریعے ممکن ہے؟
کرننگ کے ساتھ بھی اب تک کے حساب سے نتیجہ کافی بہتر ہے۔ ابھی تک ایک لاکھ سطروں سے (جن کی لمبائی زیادہ سے زیادہ 50 سے 70 کریکٹرز بشمول سپیس کے ہے) تربیت کروائی ہے۔ مزید مواد اکھٹا کرنے کی کوشش کرتا ہوں۔ مواد اکھٹا کر کے آپ حضرات سے شئیر کروں گا تاکہ مواد کی کوالٹی کو بھی پرکھا جاسکے۔ ممکن ہے مواد کی کوالٹی بہتر کرنے سے نتائج پر بھی فرق پڑے۔ میں نے ویسے مواد مختلف یونیکوڈ کتابوں سے حاصل کیا ہے۔

گوگل ڈرائیو سے شئیر والا لنک حاصل کر کے اس کو ایک ٹیب میں کھولتا ہوں پھر اس پر ڈاؤنلوڈ کے بٹن پر کلک کرتا ہوں تو نیا ٹیب کھلتا ہے، اس میں جو لنک ہوتا ہے اس کو یہاں داخل کرتا ہوں۔
 
آخری تدوین:
Top