ان پیج ٹو یونی کوڈ کنورٹر کی اصلاح کریں

نبیل

تکنیکی معاون
آفس ۲۰۰۷ کا ڈیفالٹ فارمیٹ xml کو اسپورٹ کرتا ہے۔
http://en.wikipedia.org/wiki/office_open_xml

اور مجھےیقین ہے کہ آپ جیسے ماہر پروگرامرز xml کیساتھ روزانہ گلی ڈنڈا کھیلتے ہیں! :grin:
اگر کسی طرح انپیج کی مکمل فائل کو xml میں کنورٹ کر لیا جائے تو اسکو ایم ایس ورڈ کی docx میں کرنا زیادہ مشکل نہیں ہوگا۔ بہر حال، پہلی توجہ سادہ کنورٹر کو دینی چاہئے!

مجھے اوپن آفس نہیں بلکہ ان پیج کی فائل فارمیٹ کے بارے میں معلومات درکار ہیں۔
 

نبیل

تکنیکی معاون
نبیل کیا آپ ان پیج کی فائل کا کنورٹر بنانا چاہتے ہیں (inp.) یا اس سے ایکسپورٹ کردہ ٹیکسٹ کا؟

شارق، میں تو inp فائل کے لیے ہی کنورٹر لکھنا چاہتا ہوں۔ آپ کا کنورٹر inp فائل سے کچھ ٹیکسٹ جنریٹ تو کرتا ہے۔
 

نبیل

تکنیکی معاون
میرے پاس ان پیج کا جو بھی ورژن ہے، اس سے کوئی ٹیکسٹ ایکسپورٹ نہیں ہوتا ہے۔
 
نبیل میرے خیال میں آپ اگر inp فائل کا کنورٹر لکھ سکیں تو وہ حالیہ مبدل سے کہیں زیادہ فائدہ مند ہوگا کیوں کہ اس طرح ان پیج کے سافٹ ویئر کی کمپیوٹر پر موجودگی غیر ضروری ہوجائے گی۔

میں نے ٹیکسٹ کنورٹر کو ریورس انجینئرنگ کے قاعدے کی مدد سے بنایا تھا۔ میں ایک کیریکٹر کو ایکسپورٹ کرتا تھا، پھر فائل میں ایکسپورٹ شدہ کیریکٹر کو hex میں پڑھتا تھا اور اس سے یونی کوڈ کا ایک جدول بنا لیا تھا۔ سورس کوڈ سے آپ اس کو سمجھ جائیں گے۔
 

نعیم سعید

محفلین
شارق بھائی!
میرے خیال سے (ٹیب کا ہضم ہوجانا) یہ مسئلہ کنورٹر ہی کا ہے کیونکہ ان پیج سے ایکسپوٹ کردہ ٹیکسٹ فائل میں ٹیب موجود ہوتا ہے۔ بلکہ ایک نیا تجربہ کرنے سے پتہ چلا کہ کنورٹ کردہ ’’ٹیکسٹ‘‘ فائل میں تو ٹیب آجاتا ہے۔ ’’ایچ ٹی ایم ایل‘‘ فائل میں نہیں آتا۔ اس تو بظاہر ایسا ہی معلوم ہوتا ہے کہ مسئلہ کنورٹر ہی میں ہے۔

ان پیج پر ٹائپ شدہ کچھ ٹیکسٹ فائلیں یہ لیں:
http://dl.getdropbox.com/u/2483063/Inpage 2.4 Data Files.rar

نبیل بھائی!
ان پیج سے ٹیکسٹ فائل بنانے کے لیے ضروری ہے کہ آپ پہلے لکھے گئے ٹیکسٹ کو سلیکٹ کر لیں، پھر ایکسپورٹ کے ذریعے ٹیکسٹ فائل بنائیں، ان شاء اللہ بن جائے گی۔
نوٹ: ’’ایکسپورٹ پیج‘‘ کا آپشن استعمال نہ کریں بلکہ اس کے اوپر موجود صرف ’’ایکسپورٹ‘‘ کے ذریعے بنائیں۔
 

الف عین

لائبریرین
اوہو، واقعی یہی مسئلہ ہو سکتا ہے نبیل کے ساتھ، میں سمجھا تھا کہ ممکن ہے ڈیمو میں ایسی کوئی بات ہو۔ اس کا ذکر تو کیا تھا میں نے جو الگ الگ ٹیکسٹ باکس کا متن اکسپورٹ کرنے کے سلسلے میں۔
اس سے ثابت ہوا کہ ان پیج نہ استعمال کرنے والوں میں بھی میں نبیل سے کم از کم بہتر ہوں!!!!
 

الف عین

لائبریرین
نبیل کو یہ شارٹ کٹ بھی بتا دوں کہ ٹیکسٹ سلیکٹ کر کے کنٹرول آلٹ وائی دبائیں۔ ان پیج میں سیو کا آپشن آ جائے تو سیو کر لیں۔ کچھ نام دے کر۔ دل چسپ بات یہ ہے کہ یہ ٹیکسٹ فائل بھی آسانی سے پہچاننے میں آتی ہے کہ اس کے نام میں ایکسٹینشن بڑے حروف میں ہوتا ہے TXT, لیکن یہ اس وقت نظر آ سکتا ہے جب آپ کا فولڈر آپشن Show extension of known file type ہو۔
 

نبیل

تکنیکی معاون
نبیل بھائی!
ان پیج سے ٹیکسٹ فائل بنانے کے لیے ضروری ہے کہ آپ پہلے لکھے گئے ٹیکسٹ کو سلیکٹ کر لیں، پھر ایکسپورٹ کے ذریعے ٹیکسٹ فائل بنائیں، ان شاء اللہ بن جائے گی۔
نوٹ: ’’ایکسپورٹ پیج‘‘ کا آپشن استعمال نہ کریں بلکہ اس کے اوپر موجود صرف ’’ایکسپورٹ‘‘ کے ذریعے بنائیں۔

شکریہ نعیم، اب کچھ سمجھ لگی ہے۔ میں دیکھتا ہوں کہ براہ راست inp فائل سے کنورژن کو کیسے ہینڈل کیا جا سکتا ہے۔ شارق نے ریورس انجینیرنگ کا ذکر کیا ہے۔ میرے خیال میں یہ کافی پیچیدہ اور محنت طلب طریقہ ہے۔ لیکن اگر ان پیج کی فائل کی فارمیٹ کہیں دستیاب نہ ہو تو اس کے علاوہ کوئی چارہ بھی نہیں رہے گا۔
 

الف عین

لائبریرین
شکریہ نبیل۔۔ مجھے سب سے زیادہ خوشی ہوگی اگر ایسا کنورٹر بن جائے۔ تاکہ ان پیج سسٹم میں ہی نہ رہے جو مجبوراً رکھنا پڑتا ہے محض کنورژن کے لئے۔
 

arifkarim

معطل
پاک ڈیٹا والوں نے جو کنورٹر بنایا تھا، اسمیں سیدھا "inp" فائل دیکر کنورژن ہو جاتی تھی۔ اگر انکے کنورٹر کو ریورس انجنیئر کیا جا سکے تو عین ممکن ہے انپیج کے ڈیفالٹ فارمیٹ تک رسائی ممکن ہوگی، کیونکہ موجودہ حل جو کہ ٹیکسٹ ایکسپورٹ کرنے کی صورت میں موجود ہے۔ انتہائی غیر پروفیشنل ہے!
 

نبیل

تکنیکی معاون
کسی فائل فارمیٹ کو ریورس انجینیر کرنا پہلے ہی کافی مشکل کام ہے، اور کسی پروگرام کو ریورس انجینیر کرنا اس سے بھی زیادہ مشکل ہے۔
 

نبیل

تکنیکی معاون
میں یہاں صرف یہ اطلاع دینا چاہ رہا تھا کہ میں نے فی الحال شارق کے ان پیج ٹو یونیکوڈ کنورٹر کو ہی سی شارپ پر پورٹ کرنے کا آغاز کیا ہے۔ یہ ان پیج کی ایکسپورٹ کردہ فائل کو ہی یونیکوڈ میں کنورٹ کرے گا۔ میرے خیال میں پہلے سٹیپ کے طور پر اس کنورٹر کو سی شارپ پر پورٹ کرنا ہی درست رہے گا۔ ایک مرتبہ یہ ٹھیک کام کرنے لگ جاتا ہے تو اس کے بعد براہ راست inp فائلوں کو کنورٹ کرنے اور ان پیج ڈاکومنٹس سے دوسرے فارمیٹنگ آپشنز پڑھنے کے بارے میں تحقیق کی جا سکے گی۔ میں کوشش کروں گا کہ جلد ہی اس کام کے ابتدائی نتائج یہاں فراہم کر دوں۔ مجھے اس کام میں شارق اور باقی دوستوں کی رہنمائی کی ضرورت رہے گی۔
 
میں یہاں کنورٹر کا نیا ورژن لاد رہا ہوں۔ اس میں ریپلیسمنٹ فائل کو یونی کوڈ کر دیا گیا ہے، اس لیے اب کوئی بھی اس کو کھول کر بآسانی تبدیل کرسکتا ہے اور اپنے پسند کی تبدیلیوں کا اضافہ کرسکتا ہے۔ امید ہے کچھ عرصے میں ایک ایسی replacement.txt فائل وجود میں آجائے گی جو ان پیج کنورژن کے بیشتر مسائل کو قابو میں کر لے گی انشا اللہ۔

http://www.filesavr.com/inpage2uniweb094
http://www.filesavr.com/inpage2unisrc094
 
جیسا کہ اعجاز صاحب نے اس دھاگے کی ابتداء میں لکھا ہے کہ شارق صاحب کا ’’ان پیج ٹو یونی کوڈ کنورٹر‘‘ سب سے اچھا ثابت ہوا ہے، اور مجھے بھی ان کی اس رائے سے مکمل اتفاق ہے کہ واقعی شارق صاحب کا کنورٹر سب سے اچھا ہے۔ اس لئے میں ان پیج کا ڈیٹا یونی کوڈ میں تبدیل کرنے کے لئے شارق صاحب کے کنورٹر کو ہی ہمیشہ استعمال کرتا ہوں۔ اس دوران کچھ مسائل کا سامنا بھی ہوا جو کہ دیگر کنورٹرز کے مقابلے میں بہت کم ہیں۔
الحمد للہ اپنی مصروفیت کے باوجود شارق صاحب نے اس دھاگے میں شریک ہوکر کریکشن سے متعلق تو کافی راہنمائی کر دی ہے۔ شارق صاحب اگر کچھ وقت اور دے کر اِن درج ذیل مسائل کو بھی حل کر دیں تو ان شاء اللہ ڈیٹا کنورٹنگ میں بھی مزید آسانیاں پیدا ہو جائیں گی۔

کنورٹنگ کے دوران آنے والے مسائل کی تفصیل:
(1) ’’ئ‘‘ اور ’’ء‘‘:
بہت سی جگہوں پر’’ء‘‘ چاہئے ہوتا ہے مگر اس کی جگہ ’’ئ‘‘ کنورٹ ہوتا ہے۔ خصوصاً عربی عبارات میں جن پر اعراب بھی لگے ہوئے ہوں۔

(2)’’ٹیب‘‘:
اس کو تو کنورٹر سرے سے غائب ہی کر دیتا ہے۔ یوں لگتا ہے جیسے ان پیج کی فائل میں ’’ٹیب‘‘ لگا ہوا ہی نہ ہو۔

(3)’’؍‘‘:
اس کی جگہ دوسری علامت ’’!‘‘ تبدیل ہو جاتی ہے۔

(4)’’…‘‘:
اس کی جگہ دوسری علامت ’’۔‘‘ (اردو کا ڈیش) تبدیل ہو جاتی ہے۔ اور وہ بھی تین بار لگی ہوتی ہے۔

(5) (’’‘‘): (انورٹڈ کوماز)
زیادہ تر یہ الٹ بنتے ہیں۔ یعنی ابتداء والے آخر میں اور آخر والے ابتدا میں لگ جاتے ہیں۔ انہیں ورڈ میں سرچ کر کے درست کرنا بھی محال ہے۔ کیونکہ سرچنگ میں دونوں ایک سے لگتے ہیں۔

(6) ’’علامت تطویل‘‘:
اس کی جگہ علامت ’’۔‘‘ (اردو کا ڈیش) تبدیل ہو جاتی ہے۔ مزید ڈیش کے بعد اسپیس بھی لگ جاتا ہے۔
نوٹ: نستعلیق فونٹس میں لکھتے وقت تو بیشک یہ علامت استعمال نہیں ہوتی خواہ ’’ان پیج‘‘ ہو یا ’’ورڈ‘‘ مگر عربی عبارات میں اس کی ضرورت پڑتی ہے۔ اس لئے اس کا درست ہونا بھی ضروری ہے۔

(7) ’’-‘‘: (یہ علامت ان پیج میں Alt+2 پر ہے۔)
اس کی جگہ بھی علامت ’’۔‘‘ (اردو کا ڈیش) تبدیل ہو جاتی ہے۔

( 8 ) ’’ٹیبل‘‘:
ٹیبل میں بنے ہر باکس کی عبارت کو نیا پیرا بن جاتا ہے۔

(9) ان پیچ میں Alt سے آنے والی علامات:
کنورٹ ہونے کی بجائے اکثر کی جگہ مختلف ٹیکسٹ لکھا آجاتا ہے تفصیل درج ذیل ہے:
Alt+1 والی علامت کی جگہ ٹیکسٹ [L:4 R:228]
Alt+3 والی علامت کی جگہ ٹیکسٹ [L:4 R:235]
Alt+4 والی علامت کی جگہ ٹیکسٹ [L:4 R:239]
Alt+5 والی علامت کی جگہ ٹیکسٹ [L:4 R:236]
Alt+6 والی علامت کی جگہ ٹیکسٹ [L:4 R:222]
Alt+> والی علامت کی جگہ ٹیکسٹ [L:4 R:58]
Alt+< والی علامت کی جگہ ٹیکسٹ [L:4 R:59]

(10) ’’/‘‘ کے ساتھ گنتی کا استعمال: (یہ علامت ان پیج میں Alt+8 پر ہے۔)
اس علامت کے ساتھ اگر گنتی لکھی جائے تو اس کو الٹ کر دیتا ہے اس طرح:
ان پیج میں: (بخاری شریف: ۳۴۵/۷)
یونی کوڈ میں: (بخاری شریف: ۷/۳۴۵)

(11) پیرا گراف کے اختتام پر ’’گنتی‘‘:
جب کسی پیرا گراف کا اختتام گنتی پر ہو رہا ہو تو اس گنتی سے پہلے ہی پیرا بریک ہوجاتا ہے اور گنتی اگلے پیرے کی ابتداء میں چلی جاتی ہے۔ اور اگر کسی فائل کے آخری پیرے میں اسی صورت میں گنتی آجائے تو اُسے یعنی گنتی کو’’ٹیب‘‘ کی طرح سرے سے غائب کردیتا ہے۔

(12) Text File:
تھوڑی بڑی فائل (تقریباً ۳۰۰ صفحات یا اس سے زائد) ہونے کی صورت میں HTML فائل تو بنا دیتا ہے مگر ’’ٹیکسٹ فائل‘‘ نہیں بن پاتی کنورٹر ہینگ ہو جاتا ہے۔

جی شارق بھائی فہرست کہیں زیادہ طویل تو نہیں ہوگئی، ان شاء اللہ مجھے امید ہے آپ آسانی سے ان مسائل کا حل نکال لیں گے۔
دیگر ساتھی جنہیں ان پیج سے ٹیکسٹ کنورٹ کرنے کی ضرورت پڑتی ہے وہ بھی اگر اپنے تجربات کو یہاں شیئر کر لیں تو اور بھی اچھا تاکہ زیادہ سے زیادہ مسائل کا حل نکالا جاسکے۔


نعیم صاحب کنورٹر کے مسائل کی طرف توجہ دلانے کا شکریہ۔ میں نے حتی المقدور ان کو صحیح کرنے کی کوشش کی ہے۔ کچھ جگہوں پر میں ان پیج کا مطلوبہ کیریکٹر تلاش کرنے میں ناکام رہا ہوں سو اس کے لیے آپ سے مدد کی درخواست ہے۔ نیا ورژن ضرور چیک کریے گا ، آپ کے سوالات کا جواب حاضر ہے:

کنورٹنگ کے دوران آنے والے مسائل کی تفصیل:
(1) ’’ئ‘‘ اور ’’ء‘‘:
بہت سی جگہوں پر’’ء‘‘ چاہئے ہوتا ہے مگر اس کی جگہ ’’ئ‘‘ کنورٹ ہوتا ہے۔ خصوصاً عربی عبارات میں جن پر اعراب بھی لگے ہوئے ہوں۔

(2)’’ٹیب‘‘:
اس کو تو کنورٹر سرے سے غائب ہی کر دیتا ہے۔ یوں لگتا ہے جیسے ان پیج کی فائل میں ’’ٹیب‘‘ لگا ہوا ہی نہ ہو۔

جناب ایچ ٹی ایم ایل میں ٹیب کیریکٹر نہیں ہوتا۔ یہ کیا جا سکتا ہے کہ ایچ ٹی ایم ایل فائل میں اسے تین سپیس سے تبدیل کیا جائے۔

(3)’’؍‘‘:
اس کی جگہ دوسری علامت ’’!‘‘ تبدیل ہو جاتی ہے۔

اس علامت کے ساتھ ان پیج کا ایک دستاویز مہیا کیجیے

(4)’’…‘‘:
اس کی جگہ دوسری علامت ’’۔‘‘ (اردو کا ڈیش) تبدیل ہو جاتی ہے۔ اور وہ بھی تین بار لگی ہوتی ہے۔

اس علامت کے ساتھ ان پیج کا ایک دستاویز مہیا کیجیے

(5) (’’‘‘): (انورٹڈ کوماز)
زیادہ تر یہ الٹ بنتے ہیں۔ یعنی ابتداء والے آخر میں اور آخر والے ابتدا میں لگ جاتے ہیں۔ انہیں ورڈ میں سرچ کر کے درست کرنا بھی محال ہے۔ کیونکہ سرچنگ میں دونوں ایک سے لگتے ہیں۔

اس علامت کے ساتھ ان پیج کا ایک دستاویز مہیا کیجیے

(6) ’’علامت تطویل‘‘:
اس کی جگہ علامت ’’۔‘‘ (اردو کا ڈیش) تبدیل ہو جاتی ہے۔ مزید ڈیش کے بعد اسپیس بھی لگ جاتا ہے۔
نوٹ: نستعلیق فونٹس میں لکھتے وقت تو بیشک یہ علامت استعمال نہیں ہوتی خواہ ’’ان پیج‘‘ ہو یا ’’ورڈ‘‘ مگر عربی عبارات میں اس کی ضرورت پڑتی ہے۔ اس لئے اس کا درست ہونا بھی ضروری ہے۔

اس علامت کے ساتھ ان پیج کا ایک دستاویز مہیا کیجیے

(7) ’’-‘‘: (یہ علامت ان پیج میں Alt+2 پر ہے۔)
اس کی جگہ بھی علامت ’’۔‘‘ (اردو کا ڈیش) تبدیل ہو جاتی ہے۔

اس کی یونی کوڈ میں صحیح علامت کیا ہوگی؟

( 8 ) ’’ٹیبل‘‘:
ٹیبل میں بنے ہر باکس کی عبارت کو نیا پیرا بن جاتا ہے۔

(9) ان پیچ میں Alt سے آنے والی علامات:
کنورٹ ہونے کی بجائے اکثر کی جگہ مختلف ٹیکسٹ لکھا آجاتا ہے تفصیل درج ذیل ہے:
Alt+1 والی علامت کی جگہ ٹیکسٹ [L:4 R:228]
Alt+3 والی علامت کی جگہ ٹیکسٹ [L:4 R:235]
Alt+4 والی علامت کی جگہ ٹیکسٹ [L:4 R:239]
Alt+5 والی علامت کی جگہ ٹیکسٹ [L:4 R:236]
Alt+6 والی علامت کی جگہ ٹیکسٹ [L:4 R:222]
Alt+> والی علامت کی جگہ ٹیکسٹ [L:4 R:58]
Alt+< والی علامت کی جگہ ٹیکسٹ [L:4 R:59]

جناب کچھ علامات یونی کوڈ میں مل جاتی ہیں جو کنورٹر تبدیل کر دیتا ہے۔ کچھ علامات نہیں مل رہیں اس لیے ان کو ایسے ہی چھوڑ دیا ہے۔

(10) ’’/‘‘ کے ساتھ گنتی کا استعمال: (یہ علامت ان پیج میں Alt+8 پر ہے۔)
اس علامت کے ساتھ اگر گنتی لکھی جائے تو اس کو الٹ کر دیتا ہے اس طرح:
ان پیج میں: (بخاری شریف: ۳۴۵/۷)
یونی کوڈ میں: (بخاری شریف: ۷/۳۴۵)

نئے ورژن میں صحیح کر دیا گیا ہے

(11) پیرا گراف کے اختتام پر ’’گنتی‘‘:
جب کسی پیرا گراف کا اختتام گنتی پر ہو رہا ہو تو اس گنتی سے پہلے ہی پیرا بریک ہوجاتا ہے اور گنتی اگلے پیرے کی ابتداء میں چلی جاتی ہے۔ اور اگر کسی فائل کے آخری پیرے میں اسی صورت میں گنتی آجائے تو اُسے یعنی گنتی کو’’ٹیب‘‘ کی طرح سرے سے غائب کردیتا ہے۔

نئے ورژن میں صحیح کر دیا گیا ہے


(12) Text File:
تھوڑی بڑی فائل (تقریباً ۳۰۰ صفحات یا اس سے زائد) ہونے کی صورت میں HTML فائل تو بنا دیتا ہے مگر ’’ٹیکسٹ فائل‘‘ نہیں بن پاتی کنورٹر ہینگ ہو جاتا ہے۔

یہ مسئلہ ہنوز توجہ طلب ہے۔
 

الف عین

لائبریرین
نعیم بھی اس کا تفصیل سے جائزہ لیں۔ میں نے بھی لینا شروع کر دیا ہے۔ بعد میں نتائج سے آگاہ کروں گا۔
شکریہ شارق۔
 

الف عین

لائبریرین
نہیں شارق، اس ورژن میں تو ’ں‘ والی اغلاط قائم رہتی ہیں، رپلیس مینٹ ٹیکسٹ والی فائل کے با وجود۔ اور وہ ’ڑ‘ کے پہلے جو مزید سپیس آتی تھی، اس کو رپلیسمینٹ میں دینے کے باوجود یہ کام نہیں کرتا۔ لگتا ہے کہ رپلیس مینٹ ٹیکسٹ کام ہی نہیں‌کرتی، حالانکہ آئ این آئ فائل میں اس کی قدر ’1‘ ہے۔
 

نعیم سعید

محفلین
شارق بھائی!
جزاک اللہ۔
نیا ورجن چیک کیا ہے، الحمد للہ کچھ مسائل کا حل مل گیا، اور چند ایک ابھی باقی ہیں، قوی امید ہے کہ بہت جلد ان کا مناسب حل بھی نکل ہی جائے گا۔
’’ان پیج‘‘ کے جن کریکٹرز کو آپ تلاش نہیں کر پائے اس کے لئے میں نے ذیل میں ’’ان پیج‘‘ 2.4 کی ایک فائل رکھی ہے، امید ہے اس کی مدد سے آپ کریکٹر بھی تلاش کر سکیں گے اور ان مسائل کو بھی سمجھ جائیں گے جو ابھی باقی رہ گئے ہیں۔
http://dl.getdropbox.com/u/2483063/Inpage Sample File for Shariq Bhai.rar

اعجاز صاحب!
جی ابھی پہلی فرصت میں تفصیل جائزہ لیتا ہوں۔
کیا آپ نے اپنی ’’رپلیسمنٹ فائل‘‘ کو یونی کوڈ میں تبدیل کر لیا ہے؟ اگر نہیں کیا تو ضرور کر لیں جب ہی یہ کام کرے گی۔
 
Top