دو سمتی متن اور یونیکوڈ کنٹرول حروف

الف نظامی

لائبریرین
تعارف
عربی رسم الخط کی پیچیدگی کا ایک سبب دو سمتی لے آوٹ ہے۔ لفط دائیں سے بائیں لکھے جاتے ہیں جبکہ لاطینی حروف اور ہندسے بائیں سے دائیں۔ متن کی مناسب سمت برقرار رکھنے کے لیے مائیکروسافٹ “یونیکوڈ دوسمتی الگورتھم“ کا استمعال کرتا ہے ۔یہ الگورتھم حروف کی خصوصیات کی بنیاد پر خودبخود یہ کام کرتا ہے اور اس کے علاوہ ہم یونیکوڈ کنٹرول حروف سے متنی سمت متعین کرسکتے ہیں۔

اس مضمون میں دوسمتی متن کی مناسب سمت متعین کرنے کے لیے کنٹرول حروف کے استمعال کا مظاہرہ کیا گیا ہے۔
مسئلہ:
عربی اور دوسرے دو سمتی متن میں بسا اوقات دوسمتی الگورتھم کے ذریعے مناسب سمت متعین نہیں ہوسکتی ۔ اس مسئلہ کے حل کے لیے سمتی کنٹرول حروف کا سیٹ بنایا گیا ہے جس کی وجہ سے دوسمتی متن کی سمت درست کی جاسکتی ہے۔
مثالیں
235_1_5.jpg
خطوط وحدانی کی سمت صحیح نہیں۔
235_2_4.jpg
وقفہ (فل سٹاپ) کو شروع میں ہونا چاہیے
کنٹرول حروف
RLM
مطلب : دائیں سے بائیں کی علامت
استمعال : متن کو عربی / اردو کی سمت دینا (دائیں سے بائیں)
یونیکوڈ قدر : 200F (اساس سولہ کے عددی نظام میں )

LRM
مطلب : بائیں سے دائیں کی علامت
استمعال : متن کو لاطینی سمت دینا (بائیں سے دائیں)
یونیکوڈ قدر : 200E(اساس سولہ کے عددی نظام میں )

RLE
LRE

RLO
مطلب: صرف دائیں سے بائیں
استمعال: متنی سمت کو بغیر کسی لحاظ کے دائیں سے بائیں کرنے کے لیے استمعال ہوتا ہے۔ تمام متن (خواہ وہ لاطینی ہو یا عربی/ اردو ) دائیں سے بائیں ہوجاتا ہے ۔
یونیکوڈ قدر :202E (اساس سولہ کے عددی نظام میں )

LRO
مطلب : صرف بائیں سے دائیں
استمعال: متنی سمت کو بغیر کسی لحاظ کے بائیں سے دائیں کرنے کے لیے استمعال ہوتا ہے۔ تمام متن (خواہ وہ لاطینی ہو یا عربی/ اردو ) بائیں سے دائیں ہوجاتا ہے ۔
یونیکوڈ قدر : 202D (اساس سولہ کے عددی نظام میں )

PDF
مطلب : پرانی سمت بحال کرو
استمعال :آخری مرتبہ LRE, RLE, RLO, LRO میں سے کسی ایک کے استمعال سے پہلے والی متنی سمت بحال کردیتا ہے۔
یونیکوڈ قدر : 202C (اساس سولہ کے عددی نظام میں )

ZWJ
مطلب : صفری وقفہ جوڑ کر
استمعال: اس کنٹرول حرف سے پہلے والا اور بعد والا حرف ایک دوسرے سے جڑ جاتا ہے (اگر ممکن ہو)
یونیکوڈ قدر: 200D (اساس سولہ کے عددی نظام میں )

ZWNJ
مطلب : صفری وقفہ بغیر جوڑے
استمعال:استمعال: اس کنٹرول حرف سے پہلے والا اور بعد والا حرف ایک دوسرے سے نہیں جڑ تا۔
یونیکوڈ قدر: 200C (اساس سولہ کے عددی نظام میں )

نوٹ: یہ کنٹرول حروف صرف متنی دکھاوے کو متاثر کرتے ہیں، متن کے تقابل ، تلاش یا متنی عددی تجزیہ پر اثر انداز نہیں ہوتے۔

مثالیں
نوٹ پیڈ میں جاکر متنی خانہ میں دائیں کلک کریں یہاں سے آپ یونیکوڈ کنٹرول حروف کا استمعال کرسکتے ہیں
235_ctrls_1.gif

RLM
صورتحال:
ابراہیم ایک انگریزی مسل پر کام کررہا ہے جس میں عربی حروف کا استمعال ہوا ہے، اسے متن میں خطوط وحدانی کے استمعال میں مسئلہ درپیش ہے۔
235_eg06_1.gif

اس مسئلہ کو حل کرنے کے لیے اس نے اختتامی خط وحدانی سے پہلے RLM کنٹرول حرف کا اضافہ کیا، جس سے متن کی صحیح سمت متعین ہوگئی۔
235_eg07_1.gif

LRM
صورتحال : اسلم ایک عربی مسل پر کام کررہا ہے جس میں انگریزی حروف بھی شامل ہیں۔ اسے انگریزی متن سے پہلے ڈاٹ موجود ہونے کی وجہ سے دکھاوٹ میں مسئلہ ہے۔
235_eg08_1.gif

اس مسئلہ کو حل کرنے کے لیے اس نے ڈاٹ سے پہلے LRM کنٹرول حرف کا اضافہ کردیا جس سے متن کی صحیح سمت متعین ہوگئی۔
235_eg09_1.gif

جاری ہے۔۔۔۔
۔۔۔۔



روابط
یہ مضمون یہاں سے ترجمہ شدہ ہے
یونیکوڈ
 

الف عین

لائبریرین
جزاک اللہ نعیم۔ اچھا ٹیوٹوریل دے رہے ہو۔ خود میں اکثر کنفیوز ہو جاتا ہوں اور ان کنٹرول حروف کا استعمال ٹال جاتا ہوں۔
 

ہمسفر

محفلین
جزاک اللہ
بہت ہی معلومات بھرا دھاگہ
اللہ آپ کو خوش رکھے دوسرے حصے کا انتظار ہے
 
سبحان اللہ عزوجل
واقع اس سے بہت الجھن کم ہوگئی ہے ۔
اور کہی کیوں جائے یہی اسی محفل میں جب انگریزی لکھنی پڑ جائے اور پیچ میں کوئی " . " یا پھر "/ or < . >" آجائے تو کام بڑا خراب ہوجاتا ہے ۔ اب اس کا بھی حل نکل آیا۔
بہت بہت شکریہ
والسلام علیکم ورحمۃ اللہ وبارکۃ۔
والصلوۃ والسلام علیک یارسول اللہ
 
Top