برائے ملاحظہ:
ابھی تک جتنا کام ہوا ہے اس کی فائل منسلک کر رہا ہوں
کثیر الاستعمال الفاظ کی فہرست ورژن 0.1
کارپس فائل ۱۹۸ ایم بی
متعلقہ:
کثیر الاستعمال الفاظ کی فہرست بنانے کا طریقہ کار
کثیر الاستعمال الفاظ کی اس فہرست کو بنانے کا مقصد یہ ہے کہ ہم 3000 کثیر الاستعمال الفاظ کی ایک ای بک مرتب کر لیں جو اردو سیکھنے کے لیے معاون ہو۔
اس بات کا خیال The Longman Communication 3000 دیکھ کر آیا۔
جی ضرور۔ یہ بہت اعلی کام ہے اور سپیل چیک کے لیے از حد مفید ہے۔
کل اس کو ڈاون لوڈ کیا تو ایم پی ۳ کی ایکسٹینشن کے ساتھ ڈاون لوڈ ہوئی لیکن جب نوٹ پیڈ میں اوپن کیا تو فہرست نظر آئی۔
سلیقہ یہ ہے کہ جزو اور کُل دونوں کو مد نظر رکھ کر تجزیہ کیا جائے اس حوالے سے فرقان احمد کا یہ اقتباس ملاحظہ کیجیے:
ہم اگر کسی ایک معاملے میں ہی تفکر کریں گے یا کُل کے کسی ایک جزو پر ہی غور کریں گے تو ہمارے سامنے مکمل اوورویو نہ آ سکے گا اور ہم جزو کو کُل پر منطبق کر کے یک رخی سوچ اپنا لیں گے...
شہر کتاب خوار
اب کی مرتبہ دمشق میں ایسا قحط پڑا کہ لوگ شعر کہنا بھول گئے۔ درختوں کی چھال اور پودوں کی جڑیں تک لوگ کھا گئے۔ باغوں سے گُل اور گُلوں سے بُلبل غائب ہوئے۔ لوگوں نے ہریالی کھائی ، پھر خاک پھانکنے لگے اور آخر حرام کھانے کی نوبت آگئی۔ جب اس طور بھوک آدمی کو کھانے لگی تو ایک شاعر نے اپنا...
مندرجہ ذیل صورت میں کیا طریقہ اپنایا جائے؟
جہاں ﷺ کسی لفظ کے ساتھ آ رہا ہے اس کو دو علیحدہ لفظ بنا کر اندراج کر دیا جائے ۔
مثلا :
ﷺاخلاق 1
کو
ﷺ 1
اخلاق 1
سے تبدیل کر دیا جائے؟
ﷺ
1717
ﷺاخلاق
1
ﷺالبقرۃ
1
ﷺاور
3
ﷺایکم
1
ﷺبس
1
ﷺتمہارا
1
ﷺسے
9
ﷺقال
1
ﷺقالوالذی
1...
ابھی جو کارپس استعمال کیا گیا ہے اس میں آپ کی لائبریری والی کتابوں کا متن شامل ہے جومحمد شاکر عزیز اور محب علوی نے مرتب کیا تھا۔
کارپس میں الفاظ کی تعداد:
صفائی سے قبل 26686084
صفائی کے بعد 26598152
دو کروڑ پینسٹھ لاکھ اٹھانوے ہزار ایک سو باون الفاظ
کثیر الاستعمال الفاظ کے استخراج کے لیے اردو جملوں کا ذخیرہ استعمال کیا گیا جو دو طرح کے متون کا مجموعہ ہے ادبی اور سیاسی ۔
ادبی متن الف عین صاحب کی مرتب کردہ کتب سے لیا گیا ہے اور محمد وارث صاحب کے بلاگ کا متن بھی اس میں شامل ہے۔
سیاسی متن مختلف کالم نگاروں کے کالموں سے لیا گیا ہے۔
متن کے اس...
متن میں مندرجہ ذیل کنٹرول کیریکٹرز بھی موجود ہیں، ان کا کیا کرنا چاہیے؟
ZWNJ zero width non joiner
PDF pop directional formatting
LRM left to right mark
ZWNBSP Zero Width No-Break Space
RLO start of right to left over-ride
RLE
الف عین سعادت زیک محب علوی دوست
لفظ اللہ کے متعدد اندراج دیکھ کر معلوم ہوا کہ متن میں متعدد جگہ پر لفظ اللہ کو ایک لگیچر کی صورت میں لکھا گیا ہے یعنی ﷲ جس کی یونیکود ویلیو FDF2 ہے اور اور کہیں کیریکٹرز کی صورت میں لہذا فائنڈ اینڈ ری پلیس سے اس کو بھی یکساں کرنے کے لیے لفظ اللہ سے تبدیل کیا گیا
ٹھیک ہے سر۔ فہرست کی صفائی کر رہا ہوں۔
اس میں عربی کے حروف بھی شامل ہیں ان کو بھی فہرست سے نکال رہا ہوں
یؤْتکم
2
یؤْتوْن
6
یؤْتون
1
یؤْتی
2
یؤْتیْ
3
یؤْتیہ
2
یؤْذن
1
یؤْذی
1
یؤْذیک
3
یؤْذین
1
یؤْفکون
2
یؤْفکون
1
یؤْقنوْن
1
یؤْلوْن
1
یؤْلون
3
یؤْمروْن
1
یؤْمن
7...
کارپس کا تجزیہ کرنے کے بعد ایک خام فہرست حاصل ہوئی جو دو کالمز پر مشتمل ہے پہلا کالم لفظ اور دوسرا اس کی تعداد بتاتا ہے۔
یہ سب ایک ہی لفظ ہیں لیکن کسی کے ساتھ تخلص کی علامت اور کسی کے ساتھ ! سٹار کا نشان یا ؟ ، - ۔ موجود تھے جنہیں فہرست سے فانڈ اینڈ ریپلیس کرنے سے اس طرح کی صورت حال پیدا ہوئی۔...