علوی فونٹ میں الفاظ بہت د ور دورچلے جاتی ہیں

ہادی

محفلین
السلام علیکم میں نے ایک او سی آر سافٹ وئیر کی مدد سے تصویر سے متن نکالا ہے جو یونی کوڈ میں ہے۔
Arial Font میں وہ ٹھیک دکھائی دیتا ہےلیکن جب علوی فونٹ کیا جا ئےتو الفاظ بہت دور دور ہو جاتے ہیں ۔ یہ کیسے ٹھیک ہوں گے۔نیچے تصویر میں دیکھیں
capturedza4.jpg

captured1ep0.jpg
 

arifkarim

معطل
السلام علیکم میں نے ایک او سی آر سافٹ وئیر کی مدد سے تصویر سے متن نکالا ہے جو یونی کوڈ میں ہے۔
Arial Font میں وہ ٹھیک دکھائی دیتا ہےلیکن جب علوی فونٹ کیا جا ئےتو الفاظ بہت دور دور ہو جاتے ہیں ۔ یہ کیسے ٹھیک ہوں گے۔نیچے تصویر میں دیکھیں
capturedza4.jpg

captured1ep0.jpg

بھائی جان یہ کونسا او سی آر سافت وئیر ہے؟
 

باسم

محفلین
بھائی اس او سی آر سے ایک مکمل صفحہ کے متن کا نتیجہ تو دکھائیں
نوٹ پیڈ میں ایسا کرکے دیکھیں
 

اسد

محفلین
تصویر سے تو ظاہر ہوتا ہے کہ او سی آر نے حروف کو انکے بیس کوڈ (U+0600 سے U+06FF)کے بجائے پریزنٹیشن فورمز کے کوڈز میں تبدیل کیا ہے، جو شاید نستعلیق فونٹس میں شامل نہیں ہوتے۔ اس کا حل شاید یہ بھی ہو سکتا ہے کہ کسی سکرپٹ یا یوٹیلٹی (یا Find and Replace) کے ذریعے ٹیکسٹ کے حروف کو ان کے بیس کوڈ میں تبدیل کر دیا جائے۔ یعنی ب کے لئے ‭U+FE8F; U+FE90; U+FE91; U+FE92;‬ کی جگہ صرف U+0628 استعمال کیا جائے۔ پھر تمام فونٹس، بشمول نستعلیق، اسے درست ظاہر کریں گے۔
 

باسم

محفلین
بہت شکریہ یہ کون سا او سی آر ہے ؟
اور میں یہ کہنا چاہ رہا تھا کہ نوٹ پیڈ میں فونٹ بدل کر دیکھیں کیا وہاں بھی ایسا ہوتا ہے۔
 

ہادی

محفلین
بہت شکریہ یہ کون سا او سی آر ہے ؟
اور میں یہ کہنا چاہ رہا تھا کہ نوٹ پیڈ میں فونٹ بدل کر دیکھیں کیا وہاں بھی ایسا ہوتا ہے۔
باسم بھائی میں تو ابھی کمپیوٹنگ میں مبتدی ہوں معلوم نہیں کہ یہ سافٹ وئیر او سی آر کے زمرے میں بھی آتا ہے یا نہیں
نام ہے PDF2TXT v3.2 ۔
اور فونٹ کونسا بدل کر دیکھوں
 

ہادی

محفلین
تصویر سے تو ظاہر ہوتا ہے کہ او سی آر نے حروف کو انکے بیس کوڈ (u+0600 سے U+06ff)کے بجائے پریزنٹیشن فورمز کے کوڈز میں تبدیل کیا ہے، جو شاید نستعلیق فونٹس میں شامل نہیں ہوتے۔ اس کا حل شاید یہ بھی ہو سکتا ہے کہ کسی سکرپٹ یا یوٹیلٹی (یا Find And Replace) کے ذریعے ٹیکسٹ کے حروف کو ان کے بیس کوڈ میں تبدیل کر دیا جائے۔ یعنی ب کے لئے ‭u+fe8f; U+fe90; U+fe91; U+fe92;‬ کی جگہ صرف U+0628 استعمال کیا جائے۔ پھر تمام فونٹس، بشمول نستعلیق، اسے درست ظاہر کریں گے۔
اسد بھائی تھوڑی و ضاحت کریں کہ کس طرح ان کو ٹھیک کروں آسان طریقے سے یہ طریقہ سمجھ نہیں آیا ؟
 

اسد

محفلین
پہلی بات تو یہ کہ PDF2TXT v3.2 سوفٹویئر او سی آر نہیں ہے۔ بلکہ پی ڈی ایف میں موجود ٹیکسٹ کو ٹیکسٹ فائل میں ایکسٹریکٹ کرتا ہے۔ اگر اردو پی ڈی ایف صرف امیجز سے بنائی گئی ہو تو یہ سوفٹویئر کچھ نہیں کر سکتا۔
اسد بھائی تھوڑی و ضاحت کریں کہ کس طرح ان کو ٹھیک کروں آسان طریقے سے یہ طریقہ سمجھ نہیں آیا ؟

یہ سمجھیں کہ جب ہم لکھتے ہیں: "حیوانوں کی"؛ تو اس طرح: "ح ی و ا ن و ں ک ی" اور فائل میں اسی طرح محفوظ ہونا چاہئیے، سکرین پر دکھاتے ہوئے یا پرنٹ کرتے ہوئے حروف کی درست شکل استعمال ہوتی ہے۔ یعنی ان حروف کا بیس کوڈ ہیکس میں 0600 سے 06FF تک ہو نا چاہئیے۔ لیکن آپ کی فائل میں یہ کچھ اس طرح محفوظ ہے: "ﺣ ﻴ ﻮ ا ﻧ ﻮ ں ﻛ ﻰ"۔ یعنی حروف کی ابتدائی، درمیانی اور آخری حالتوں کے کوڈ (الف اور نون غنہ اپنی بیس حالت میں ہیں اس لئے نظر آ رہے ہیں)، یہ کوڈ نستعلیق فونٹس میں نہیں ہوتے۔ اگر کوئی پروگرام ایسا نہیں ہے جو اسے درست کر سکے تو ٹیکسٹ ایڈیٹر یا ورڈپروسیسر میں فائنڈ/ریپلیس استعمال کریں۔ :( یا اگر پروگرامنگ آتی ہے تو ایک یوٹیلٹی لکھیں جو یہ کام کر دے۔

ویسے، نسخ میں رہنے دیں، کیا مسئلہ ہے؟
 
Top