اردو جملے اور انفارمیشن انٹراپی

الف نظامی

لائبریرین
مندرجہ ذیل جملوں میں اردو کے تمام حروف تہجی موجود ہیں اور یہ جملے اس تھریڈ سے جمع کیے گئے ہیں۔
  • آج صبح کے آغاز پر مختلف قومی ٹیلی ویژنوں کے ذریعے بلاگستان کی تشہیر کے باعث چند بڑے مضبوط لکھاری ڈرتے نظر آئے
  • اِن پیج اُردو سافٹ ویئر چلانا بڑی محنت، خلوص، عرق ریزی، ژرف نگہی، طبعی شغف، مثالی ڈسپلن اور ذوقِ نظر کا متقاضی ہے
  • اگر آپ ضابطۂِ زورو ثبات پر عمل کریں گے تو ذِلّت سے بچ جائیں گے۔ خوشی، ظفر، قوّتِ ژال اور ڈٹ کر لڑنے کا حوصلہ و غیرت پیدا ہوگی
  • آج صبح کے آغاز پر مختلف ٹیلی ویژنوں کے ذریعے مضبوط قانون کی تشہیر کے باعث چند بڑے لوگ ڈر سے بھاگتے نظر آئے
  • آج صبح مختلف ٹیلی ویژنوں پر زبان کا ذکر سنتے ہی مضبوط لوگ ڈرے بغیر بڑھ چڑھ کر اردو نستعلیق کی مثال پیش کرتے نظر آئے
  • ر‌ضائی کو غلط اوڑھے بیٹھی ژوب کی قرہ العین اور عظمٰی کے پاس گھر کے ذخیرہ سے آناً فاناً ڈش میں ثابت جو، صراحی میں چائے اور پلیٹ میں زردہ آیا
  • آج صبح کے آغاز پر مختلف ٹیلی ویژنوں کے ذریعے پاک اردو انسٹالر کی تشہیر کے باعث لوگ ڈرنا چھوڑ کرقواعد و ضوابط سے لکھتے نظر آئے
  • ایک ٹیلے پر واقع مزار خواجہ فرید الدین گنج شکر کے احاطہ ء صحن میں ذرا سی ژالہ باری چاندی کے ڈھیروں کی مثل بڑے غضب کا نظارہ دیتی ہے
ان جملوں کی رینکنگ کی جائے تو کس جملے کو ترجیح دی جا سکتی ہے۔ انفارمیشن انٹراپی کے حوالے سے کچھ کام کر رہا تھا کہ خیال آیا کہ اردو کے جملوں کی انفارمیشن انٹراپی معلوم کی جائے تو جن جملوں کی انفارمیشن انٹراپی زیادہ ہوگی وہ زیادہ جامع ہوں گے۔ یعنی ان میں کم حروف میں زیادہ بات کی گئی ہوگی۔
اب معلوم نہیں یہ بات کس حد تک درست ہے ، بہرحال نتائج آپ کے سامنے پیش کرتا ہوں۔


آج صبح کے آغاز پر مختلف قومی ٹیلی ویژنوں کے ذریعے بلاگستان کی تشہیر کے باعث چند بڑے مضبوط لکھاری ڈرتے نظر آئے
4.61
اِن پیج اُردو سافٹ ویئر چلانا بڑی محنت، خلوص، عرق ریزی، ژرف نگہی، طبعی شغف، مثالی ڈسپلن اور ذوقِ نظر کا متقاضی ہے
4.61
اگر آپ ضابطۂِ زورو ثبات پر عمل کریں گے تو ذِلّت سے بچ جائیں گے۔ خوشی، ظفر، قوّتِ ژال اور ڈٹ کر لڑنے کا حوصلہ و غیرت پیدا ہوگی
4.60
آج صبح کے آغاز پر مختلف ٹیلی ویژنوں کے ذریعے مضبوط قانون کی تشہیر کے باعث چند بڑے لوگ ڈر سے بھاگتے نظر آئے
4.59
آج صبح مختلف ٹیلی ویژنوں پر زبان کا ذکر سنتے ہی مضبوط لوگ ڈرے بغیر بڑھ چڑھ کر اردو نستعلیق کی مثال پیش کرتے نظر آئے
4.58
ر‌ضائی کو غلط اوڑھے بیٹھی ژوب کی قرہ العین اور عظمٰی کے پاس گھر کے ذخیرہ سے آناً فاناً ڈش میں ثابت جو، صراحی میں چائے اور پلیٹ میں زردہ آیا
4.56
آج صبح کے آغاز پر مختلف ٹیلی ویژنوں کے ذریعے پاک اردو انسٹالر کی تشہیر کے باعث لوگ ڈرنا چھوڑ کرقواعد و ضوابط سے لکھتے نظر آئے
4.55
ایک ٹیلے پر واقع مزار خواجہ فرید الدین گنج شکر کے احاطہ ء صحن میں ذرا سی ژالہ باری چاندی کے ڈھیروں کی مثل بڑے غضب کا نظارہ دیتی ہے
4.39

انفارمیشن انٹراپی کےحوالے سے پہلے دو جملے زیادہ انفارمیشن انٹراپی کے حامل ہیں لہذا یہ جملے زیادہ جامع ہیں۔
انفارمیشن انٹراپی کو اردو نثر کو کلاسیفائی کرنے کے لیے بھی استعمال کیا جاسکتا ہے اور اس حوالے سے سادہ اور پیچیدہ نثر پر تجربات کیے جا سکتے ہیں۔
انفارمیشن انٹراپی اس ویب سائٹ سے معلوم کی گئی ہے
 
آخری تدوین:

محمد سعد

محفلین
ظاہراً تو یہ خیال درست نہیں معلوم ہوتا کہ حروف تہجی کے تعدد کی بنیاد پر کیلکولیٹ کی گئی شینن اینٹروپی، جملے کی "جامعیت" کا قابل اعتبار پیمانہ ہو گی۔ کیا یہ نتیجہ کسی ریسرچ لٹریچر کی بنیاد پر اخذ کیا گیا ہے؟
 

زیک

تقریباً غائب
انفارمیشن انٹراپی کےحوالے سے پہلے دو جملے زیادہ انفارمیشن انٹراپی کے حامل ہیں لہذا یہ جملے زیادہ جامع ہیں۔
انفارمیشن انٹراپی کو اردو نثر کو کلاسیفائی کرنے کے لیے بھی استعمال کیا جاسکتا ہے اور اس حوالے سے سادہ اور پیچیدہ نثر پر تجربات کیے جا سکتے ہیں۔
یہ بڑے دعوے ہیں اور انہیں مان لینے کی کوئی وجہ نظر نہیں آتی
 

الف نظامی

لائبریرین
یہ تو محض متن میں حروف کی فریکونسی کے ذریعہ اینٹراپی کیلکولیٹ کرتا ہے جو زیادہ فائدہ مند نظر نہیں آتا
آپ کے خیال میں حروف کے فریکونسی کے علاوہ کوئی اور طریقہ موجود ہے جس سےمتن کی اینٹراپی کو کیلکولیٹ کیا جا سکتا ہو؟
 

الف نظامی

لائبریرین
ظاہراً تو یہ خیال درست نہیں معلوم ہوتا کہ حروف تہجی کے تعدد کی بنیاد پر کیلکولیٹ کی گئی شینن اینٹروپی، جملے کی "جامعیت" کا قابل اعتبار پیمانہ ہو گی۔ کیا یہ نتیجہ کسی ریسرچ لٹریچر کی بنیاد پر اخذ کیا گیا ہے؟
شاید اس اصطلاح کو جامعیت نہیں کہنا چاہیے بلکہ کوئی ایسی اصطلاح استعمال کرنی چاہیے تھی جس کا تعلق جملے میں ایک حرف کے ایک سے زیادہ بار آنے کے کم یا زیادہ امکان سے تعلق ہو۔ اگر انٹراپی زیادہ ہے تو جملے میں کسی ایک حرف کے دھرائے جانے کا امکان کم ہوگا اور اگر کم ہے تو جملے میں کسی ایک حرف کے دھرائے جانے کا امکان زیادہ ہوگا۔
 

محمد سعد

محفلین
آپ کے خیال میں حروف کے فریکونسی کے علاوہ کوئی اور طریقہ موجود ہے جس سےمتن کی اینٹراپی کو کیلکولیٹ کیا جا سکتا ہو؟
آپ کے ذہن میں اینٹروپی کی تعریف کیا چل رہی ہے؟
شینن اینٹروپی کا زیادہ تعلق پیغام کی سٹوریج اور ترسیل کے لیے درکار کیپسٹی سے ہوتا ہے۔ نیچرل لینگویج کے متن میں سے کسی قسم کے معانی کشید کرنے کے لیے یہ کام کا پیمانہ نہیں۔
 

الف نظامی

لائبریرین
جس جملے میں حروف کی تکرار ہو ، اس کی انٹراپی کم ہوگی
مثلا مندرجہ ذیل جملہ دیکھیے
کفاک ربک کم یکفیک واکفۃ کف کفکافھا ککمین کان منک لک تکر کرا ککر الکر فی کبد تبکی مشکشکۃ کلکلک لککا کفاک ما بی کفاف الکاف کربتہ یا کوکبا کان یحکی کوکب الفلکا
اس کی انٹراپی
3.32
ہے
 

محمد سعد

محفلین
جس جملے میں حروف کی تکرار ہو ، اس کی انٹراپی کم ہوگی
مثلا مندرجہ ذیل جملہ دیکھیے
کفاک ربک کم یکفیک واکفۃ کف کفکافھا ککمین کان منک لک تکر کرا ککر الکر فی کبد تبکی مشکشکۃ کلکلک لککا کفاک ما بی کفاف الکاف کربتہ یا کوکبا کان یحکی کوکب الفلکا
اس کی انٹراپی
3.32
ہے
اس تعریف کی رو سے تو ہم نیچرل لینگویج سے کوئی معانی کشید کرنے میں اس کا استعمال نہیں کر سکتے۔
ہاں اگر ڈیجیٹل کمیونیکیشن یا ڈیٹا سٹوریج کا نظام ترتیب دینا ہو تو وہاں اس کا استعمال ہو گا۔
 

الف نظامی

لائبریرین
اس تعریف کی رو سے تو ہم نیچرل لینگویج سے کوئی معانی کشید کرنے میں اس کا استعمال نہیں کر سکتے۔
ہاں اگر ڈیجیٹل کمیونیکیشن یا ڈیٹا سٹوریج کا نظام ترتیب دینا ہو تو وہاں اس کا استعمال ہو گا۔
کیا فرق پڑتا ہے۔ آپ درست ہیں۔
 

الف نظامی

لائبریرین
اس حوالے سے بنیادی بات یہ ہے کہ جس متن میں پیٹرن نہ ہو یا لفظوں کی تکرار نہ ہو تو اس کی کمپریشن ممکن نہیں ہوتی یہی وجہ ہے کہ کہا جاتا ہے رینڈم سٹرنگ کمپریس نہیں ہوتی اور اس کی انٹراپی زیادہ ہوتی ہے جب کہ کسی متن کی انٹراپی کم ہو تو اس میں حرف و الفاظ کی تکرار پائی جاتی ہےاور ایسے متن کے کمپریس ہونے کی شرح زیادہ ہوتی ہے۔
اب اسی حوالے سے جن جملوں میں حروف کی تکرار کم ہوتی ہے ان کی انٹراپی زیادہ ہوتی ہے۔ لہذا ہم اگر کسی کارپس سے ایسے جملوں کو علیحدہ کرنا چاہیں جن میں حروف کی تکرار کم ہو تو انٹراپی کی مدد سے یہ کام ممکن ہوتا ہے۔
رینڈم نیس ، انٹراپی اور کمپریشن کے باہمی تعلق کے حوالے سے یہ تھریڈ دیکھیے۔
 

زیک

تقریباً غائب
نیچرل لینگویج پراسسنگ میں میکسیمم اینٹراپی ماڈلز کا استعمال کافی پرانا ہے لیکن آپ کچھ زیادہ ہی سادہ کام کر رہے ہیں
 

الف نظامی

لائبریرین
نیچرل لینگویج پراسسنگ میں میکسیمم اینٹراپی ماڈلز کا استعمال کافی پرانا ہے لیکن آپ کچھ زیادہ ہی سادہ کام کر رہے ہیں
چوں کہ ایک کام کو کرنے کے کئی طریقے ہو سکتے ہیں۔ رول بیسڈ سسٹم یا ماڈلزکے ذریعے مسئلے کا حل دونوں طریقوں سے کام کیا جا سکتا ہے۔ بہرحال YET ANOTHER SOLUTION
 

محمد سعد

محفلین
اس حوالے سے بنیادی بات یہ ہے کہ جس متن میں پیٹرن نہ ہو یا لفظوں کی تکرار نہ ہو تو اس کی کمپریشن ممکن نہیں ہوتی یہی وجہ ہے کہ کہا جاتا ہے رینڈم سٹرنگ کمپریس نہیں ہوتی اور اس کی انٹراپی زیادہ ہوتی ہے جب کہ کسی متن کی انٹراپی کم ہو تو اس میں حرف و الفاظ کی تکرار پائی جاتی ہےاور ایسے متن کے کمپریس ہونے کی شرح زیادہ ہوتی ہے۔
اب اسی حوالے سے جن جملوں میں حروف کی تکرار کم ہوتی ہے ان کی انٹراپی زیادہ ہوتی ہے۔ لہذا ہم اگر کسی کارپس سے ایسے جملوں کو علیحدہ کرنا چاہیں جن میں حروف کی تکرار کم ہو تو انٹراپی کی مدد سے یہ کام ممکن ہوتا ہے۔
رینڈم نیس ، انٹراپی اور کمپریشن کے باہمی تعلق کے حوالے سے یہ تھریڈ دیکھیے۔
ایسے الفاظ یا جملوں کو الگ کر کے ہم ان کا استعمال کیا کریں گے؟ کیا شینن اینٹروپی ہمیں حروف یا الفاظ کی تکرار کے علاوہ بھی کچھ بتا سکتی ہے؟
 

الف نظامی

لائبریرین
شعر میں عیبِ تنافر معلوم کرنے کے لیے بھی انفارمیشن انٹراپی کا استعمال کیا جا سکتا ہے۔ مصرع میں باہم متصل ہر دو الفاظ کی انٹراپی معلوم کی جائے اور جن دو الفاظ کی انفارمیشن انٹراپی زیادہ ہو ان میں عیب تنافر ہو سکتا ہے۔@سید ذیشان
 
Top