کثیر الاستعمال الفاظ کی فہرست بمعہ معیاری تلفظ

الف نظامی

لائبریرین
میری فہرست، جسے میں کارپس نہیں کہتا، کرلپ کے کارپس سے درست کردہ اور ورڈ میں لغت کے طور پر استعمال شدہ ہونے کے بعد. اضافہ شدہ ہے، اور جس میں روز بروز اضافہ ہوتا رہتا ہے، ہے۔ خود میری پرانی برقی کتابوں میں بے شمار اغلاط تھیں کہ اس زمانے ورڈ میں سپیل چیک ممکن نہ تھا۔ میری فہرست استعمال کر کے دیکھیں
الف نظامی
جی ضرور۔ یہ بہت اعلی کام ہے اور سپیل چیک کے لیے از حد مفید ہے۔
کل اس کو ڈاون لوڈ کیا تو ایم پی ۳ کی ایکسٹینشن کے ساتھ ڈاون لوڈ ہوئی لیکن جب نوٹ پیڈ میں اوپن کیا تو فہرست نظر آئی۔
 

ابو ہاشم

محفلین
بہت اچھی کوشش ہے۔ البتہ اس کے کارپس کا سائز بہت چھوٹا اور خاص نوعیت کا یعنی زیادہ مذہبی مواد والا لگ رہا ہے۔ ہو سکے تو ہر طرح کی تحریریں کارپس میں شامل کی جائیں
 

الف نظامی

لائبریرین
بہت اچھی کوشش ہے۔ البتہ اس کے کارپس کا سائز بہت چھوٹا اور خاص نوعیت کا یعنی زیادہ مذہبی مواد والا لگ رہا ہے۔ ہو سکے تو ہر طرح کی تحریریں کارپس میں شامل کی جائیں
بہت شکریہ ابو ہاشم
آپ کی تجویز اچھی ہے۔
اس فہرست کو مکمل کرنے کے بعد مزید متن حاصل کر کے اس کو بھی پراسیس کیا جائے گا۔
 

الف نظامی

لائبریرین
اس حوالے سے اپنی رائے دیجیے کہ مندرجہ ذیل اندراجات / ریکارڈ / انٹریز کو کیسے دیکھا جائے؟ یہ بنیادی طور پر اردو میں موجود عربی متن سے اخذ شدہ مرکب الفاظ ہیں
کیا انہیں ڈیلیٹ کر دیا جائے؟
دو الفاظ میں تقسیم کر کے ہر حرف کا علیحدہ اندراج کیا جائے؟
پہلا لفظ اردو میں ابو بمعنی والد سمجھ کر رکھ لیا جائے اور دوسرے لفظ کو ڈیلیٹ کر دیا جائے؟

ابوالاشعث​
3​
ابوالانبیاء​
3​
ابوالبرکات​
3​
ابوالحسین​
3​
ابوالضحی​
3​
ابوالفرج​
3​
ابوالمظفر​
3​
ابوالنصر​
3​
ابوالوفا​
3​
ابوتمیمہ​
3​
ابوحامد​
3​
ابوحسن​
3​
ابودہم​
3​
ابوسبرہ​
3​
ابوسعیدخدری​
3​
ابوشامل​
3​
ابوظہبی​
3​
ابوعفک​
3​
ابوعیسی​
3​
ابوغرہ​
3​
ابوقبیس​
3​
ابوقیس​
3​
ابونائلہ​
3​
 

ابو ہاشم

محفلین
پہلا لفظ اردو میں ابو بمعنی والد سمجھ کر رکھ لیا جائے اور دوسرے لفظ کو ڈیلیٹ کر دیا جائے
یہی مناسب معلوم ہوتا ہے ۔ البتہ ابو کا مطلب 'والا' بھی درج کیا جائے مرکب میں پہلا لفظ ہونے کی صورت میں ۔
مزید یہ کہ دیے گئے مرکبات میں سے ابو ظہبی اور ابو قبیس جغرافیائی نام ہیں اور ابو الانبیاء لقب۔ وسیع تر لغت بنانے کی صورت میں ان کا اندراج بنتا ہے باقی تمام دیے گئے اندراجات حذف کیے جا سکتے ہیں
 

الف نظامی

لائبریرین
یہی مناسب معلوم ہوتا ہے ۔ البتہ ابو کا مطلب 'والا' بھی درج کیا جائے مرکب میں پہلا لفظ ہونے کی صورت میں ۔
مزید یہ کہ دیے گئے مرکبات میں سے ابو ظہبی اور ابو قبیس جغرافیائی نام ہیں اور ابو الانبیاء لقب۔ وسیع تر لغت بنانے کی صورت میں ان کا اندراج بنتا ہے باقی تمام دیے گئے اندراجات حذف کیے جا سکتے ہیں
بہت شکریہ ابو ہاشم صاحب
 

ابو ہاشم

محفلین
یہی مناسب معلوم ہوتا ہے ۔ البتہ ابو کا مطلب 'والا' بھی درج کیا جائے مرکب میں پہلا لفظ ہونے کی صورت میں ۔
مزید یہ کہ دیے گئے مرکبات میں سے ابو ظہبی اور ابو قبیس جغرافیائی نام ہیں اور ابو الانبیاء لقب۔ وسیع تر لغت بنانے کی صورت میں ان کا اندراج بنتا ہے باقی تمام دیے گئے اندراجات حذف کیے جا سکتے ہیں
اوہ معذرت
میں کارپس کی بنیاد پر لغت بارے سوچ رہا تھا اسی سوچ میں آپ کا مراسلہ پڑھا اور اس پر اپنی رائے دے دی ۔ یہ بھول گیا کہ یہ کام صرف کثیر الاستعمال الفاظ کے بارے میں ہے نہ کہ لغت بارے ۔
کثیر الاستعمال الفاظ کی فہرست کے لیے تو آپ کی دی گئی فہرست میں سے صرف ابو کا لفظ رکھا جائے گا باپ کے معنے میں۔ باقی تمام اندراجات حذف کر دیے جائیں گے
بہرحال اس کام کے بعد کارپس کی بنیاد پر وسیع تر اردو لغت کے بارے میں بھی غور کیجیے گا
 

الف نظامی

لائبریرین
200 یا اس سے زیادہ بار کارپس میں دہرائے جانے والے الفاظ کی فہرست:
کثیر الاستعمال الفاظ کی فہرست ورژن 0.1
الفاظ کی تعداد: 7122​
 
آخری تدوین:

الف نظامی

لائبریرین
فائل موبائل پر کھل نہیں رہی ۔ اس فائل میں الفاظ کی کیا تعداد ہے ؟
یہ ایکسل فائل ہے۔ آپ کے پاس ایکسل فائل دیکھنے کے لیے متعلقہ ایپ نہیں ہوگی۔

اس فائل میں وہ الفاظ شامل ہیں جو کم از کم 200 بار کارپس میں پائے گئے۔
الفاظ کی تعداد:
7122
 

ظہیراحمدظہیر

لائبریرین
محترم الف نظامی صاحب یہ آپ اچھا کام کررہے ہیں ۔ میں لانگ مین کمیونیکیشن 3000 سےواقف ہوں اور خود چاہتا تھا کہ کبھی وقت ملے تو اس طرح کی ایک فہرستِ الفاظ مرتب کروں ۔ ویسے یہ الگ بات ہے کہ میں اس فہرست کی افادیت کے بارے میں کلی طور پر مطمئن نہیں ہوں ۔ وجہ یہ کہ فہرست بنانا اور چیز ہے اور اس کو عملی طور پرتعلیمی اداروں میں رائج کرنا اور بات ہے جو موجودہ حالات میں بوجوہ ناممکنات میں سے نظر آتی ہے ۔ بہرحال ، یہ کام اہم ہے اور ہونا چاہیئے۔ لانگ مین کے 3000 الفاظ انگریزی تحریروں میں مستعمل الفاظ کے 85 فیصد کا احاطہ کرتے ہیں ۔( اس کے علاوہ ایک اور فہرست 300 الفاظ کی بھی بنائی گئی ہے جو تقریباً 65 فیصد الفاظ کی نمائندگی کرتی ہے ۔ انگریزی سکھانے کے لیے اس مختصر فہرست کا استعمال زیادہ مؤثر ثابت ہوا ہے بالخصوص غیر انگریزی دانوں کے لیے۔)
جیسا کہ آپ نے پہلے ہی نشاندہی کردی ہے کہ الفاظ ڈھونڈنا اور ان کی درجہ بندی کرنا نسبتاً آسان کام ہے ، اصل کام ایک بہت بڑے ڈیٹا بیس یا ذخیرۂ عبارات کی فراہمی ہے۔ اگر یہ ذخیرہ مقدار میں چھوٹا یا مضامین کے اعتبار سے محدود ہو تو اس سے اخذ کردہ فہرستِ الفاظ جانب دارانہ یا غیر متوازن ہوگی۔اور اس فہرست کے مستند ہونے میں کلام رہے گا اور اس کی ترویج میں رکاوٹ ثابت ہوگا۔ چنانچہ پہلا کام یہی ہے کہ کم از کم دس سے بیس کروڑ الفاظ پر مشتمل مواد مہیا کیا جائے ۔ میں سمجھتا ہوں کہ اس مواد کی فراہمی میں زیادہ تر اخبارات و رسائل(ڈائجسٹ وغیرہ) ، ناول ، افسانے ، سیاسی و سماجی تحریریں ، نصابی کتب سے کام لینا چاہیئے۔ مذہبی کتب عموماً ثقیل عربی الفاظ اور مذہبی اصطلاحات سے پر ہوتی ہیں جن کا استعمال اتنا زیادہ نہیں ۔ مذہبی مواد کے لیے مختلف مدارس کی سوال جواب والی ویبگاہیں دیکھنا زیادہ مناسب ہوگا کہ جہاں عوام اپنے مسائل بھیج کر فتویٰ یا جواب طلب کرتے ہیں۔ میں کوشش کروں گا کہ جتنا یونیکوڈ مواد میرے پاس موجود ہے اسے آپ تک پہنچا سکوں ۔ ان شاء اللہ۔
 

الف نظامی

لائبریرین
جیسا کہ آپ نے پہلے ہی نشاندہی کردی ہے کہ الفاظ ڈھونڈنا اور ان کی درجہ بندی کرنا نسبتاً آسان کام ہے ، اصل کام ایک بہت بڑے ڈیٹا بیس یا ذخیرۂ عبارات کی فراہمی ہے۔ اگر یہ ذخیرہ مقدار میں چھوٹا یا مضامین کے اعتبار سے محدود ہو تو اس سے اخذ کردہ فہرستِ الفاظ جانب دارانہ یا غیر متوازن ہوگی۔اور اس فہرست کے مستند ہونے میں کلام رہے گا اور اس کی ترویج میں رکاوٹ ثابت ہوگا۔ چنانچہ پہلا کام یہی ہے کہ کم از کم دس سے بیس کروڑ الفاظ پر مشتمل مواد مہیا کیا جائے ۔
بہت شکریہ ظہیر احمد ظہیر صاحب۔
فی الوقت جو ذخیرہ متن یا کارپس استعمال کیا گیا ہے اس میں دو کروڑ پینسٹھ لاکھ اٹھانوے ہزار ایک سو باون الفاظ موجود ہیں جن کی مدد سے یہ فہرست مرتب کی گئی ہے۔ یہ بنیادی طور پر محترم الف عین صاحب کی جمع کردہ کتب کے متن پر مشتمل ہے۔

آپ کی بات درست ہے کہ مزید متن کی ضرورت ہے ان شاء اللہ اگلے ورژنز کے لیے مزید متن شامل کیا جائے گا۔

اس کے علاوہ اگر آپ فہرست کو ملاحظہ کریں تو اس میں ثقیل عربی الفاظ اور مذہبی اصطلاحات نہیں ہیں کیوں کہ انہیں نکال دیا گیا ہے۔ پھر بھی کچھ الفاظ آپ کی نظر سے گزریں تو مطلع کر دیجیے تا کہ اگلے ورژن میں ان الفاظ کو نکال دیا جائے۔

اس سے قبل اس طرح کی ایک فہرست سینٹڑ فار لینگوئج انجینئرنگ کی طرف سے مرتب کی گئی تھی جو ایک کروڑ نوے لاکھ الفاظ پر مبنی کارپس سے اخذ کی گئی تھی۔
 
آخری تدوین:

ظہیراحمدظہیر

لائبریرین
بہت شکریہ ظہیر احمد ظہیر صاحب۔
فی الوقت جو ذخیرہ متن یا کارپس استعمال کیا گیا ہے اس میں دو کروڑ پینسٹھ لاکھ اٹھانوے ہزار ایک سو باون الفاظ موجود ہیں جن کی مدد سے یہ فہرست مرتب کی گئی ہے۔ یہ بنیادی طور پر محترم الف عین صاحب کی جمع کردہ کتب کے متن پر مشتمل ہے۔

آپ کی بات درست ہے کہ مزید متن کی ضرورت ہے ان شاء اللہ اگلے ورژنز کے لیے مزید متن شامل کیا جائے گا۔

اس کے علاوہ اگر آپ فہرست کو ملاحظہ کریں تو اس میں ثقیل عربی الفاظ اور مذہبی اصطلاحات نہیں ہیں کیوں کہ انہیں نکال دیا گیا ہے۔ پھر کچھ الفاظ آپ کی نظر سے گزریں تو مطلع کر دیجیے تا کہ اگلے ورژن میں ان الفاظ کو نکال دیا جائے۔

اس سے قبل اس طرح کی ایک فہرست سینٹڑ فار لینگوئج انجینئرنگ کی طرف سے مرتب کی گئی تھی جو ایک کروڑ نوے لاکھ الفاظ پر مبنی کارپس سے اخذ کی گئی تھی۔
یہ ذخیرۂ الفاظ تو بہت ہی مختصر ہے اور اس سے اخذ کردہ فہرست مروجہ زبان کی درست نمائندگی نہیں کرے گی۔ لانگ مین کی تیاری میں تو اس سے کئی گنا زیادہ مواد استعمال ہوا تھا ۔
دوسری بات یہ کہ فہرست میں کسی لفظ کو رکھنا یا نکالنا شخصی فیصلہ نہیں ہونا چاہیئے۔ اس کا انحصار صرف اور صرف لفظ کی اپنی فریکوئنسی یا تعددِ استعمال پر ہونا چاہیئے ورنہ تو فہرست بنانے کا مقصد ہی فوت ہوجائے گا۔ مقصد کوئی ایک فہرست بنانا نہیں ہے بلکہ نمائندہ فہرست بنانا ہے جو اردو تحریروں میں مستعمل کم از کم پچھتر اسی فیصد لفظیات کی نمائندگی کرے۔
 

الف نظامی

لائبریرین
یہ ذخیرۂ الفاظ تو بہت ہی مختصر ہے اور اس سے اخذ کردہ فہرست مروجہ زبان کی درست نمائندگی نہیں کرے گی۔ لانگ مین کی تیاری میں تو اس سے کئی گنا زیادہ مواد استعمال ہوا تھا ۔
دوسری بات یہ کہ فہرست میں کسی لفظ کو رکھنا یا نکالنا شخصی فیصلہ نہیں ہونا چاہیئے۔ اس کا انحصار صرف اور صرف لفظ کی اپنی فریکوئنسی یا تعددِ استعمال پر ہونا چاہیئے ورنہ تو فہرست بنانے کا مقصد ہی فوت ہوجائے گا۔ مقصد کوئی ایک فہرست بنانا نہیں ہے بلکہ نمائندہ فہرست بنانا ہے جو اردو تحریروں میں مستعمل کم از کم پچھتر اسی فیصد لفظیات کی نمائندگی کرے۔
جی درست ہے۔
جہاں تک ذخیرہ الفاظ کم ہونے کی بات ہے تو اطمینان رکھیے اگلے ورژن میں بڑا کارپس استعمال کیا جائے گا۔
 

ظہیراحمدظہیر

لائبریرین
نکالے جانے والے الفاظ میں کسی لفظ کا تعدد 50 سے زیادہ نہیں ہے۔ اور فہرست میں وہ لفظ شامل ہے جو کارپس میں کم از کم 200 بار آیا ہو۔

جہاں تک ذخیرہ الفاظ کم ہونے کی بات ہے تو اطمینان رکھیے اگلے ورژن بڑا کارپس استعمال کیا جائے گا۔
میرا خیال ہے کہ شماریات کا مسئلہ بعد کا مسئلہ ہے اور اتنا آسان نہیں جتنا نظر آتا ہے ۔ پہلا مسئلہ تو ذخیرۂ عبارات کو وسیع کرنے کا ہے۔
کسی بھی مستعمل لفظ کی سادہ تعداد کی بنیاد پر اس کی شمولیت یا عدم شمولیت کا فیصلہ ٹھیک نہیں ہوگا۔ مثلاً کسی ایک خاص موضوع پر لکھی گئی تحریر میں کچھ مخصوص الفاظ بار بار آسکتے ہیں اوریوں ان کی سادہ تعداد زیادہ ہوسکتی ہے ۔ لیکن اگرکچھ شماریاتی فارمولے استعمال کیے جائیں تو شاید زیادہ نمائندہ فہرست بن سکے۔ مثلاً ایک ہزار افسانوں ، ناولوں ، مضامین وغیرہ میں سے ہر آرٹیکل میں کوئی لفظ کتنی بار آیا اور پھر اس کی فیصد نکال لی جائے ۔ وغیرہ
اس بارے میں کسی ماہرِ شماریات کی مشاورت سے ایک لائحہ عمل بنایا جاسکتا ہے۔
 

الف نظامی

لائبریرین
میرا خیال ہے کہ شماریات کا مسئلہ بعد کا مسئلہ ہے اور اتنا آسان نہیں جتنا نظر آتا ہے ۔ پہلا مسئلہ تو ذخیرۂ عبارات کو وسیع کرنے کا ہے۔
کسی بھی مستعمل لفظ کی سادہ تعداد کی بنیاد پر اس کی شمولیت یا عدم شمولیت کا فیصلہ ٹھیک نہیں ہوگا۔ مثلاً کسی ایک خاص موضوع پر لکھی گئی تحریر میں کچھ مخصوص الفاظ بار بار آسکتے ہیں اوریوں ان کی سادہ تعداد زیادہ ہوسکتی ہے ۔ لیکن اگرکچھ شماریاتی فارمولے استعمال کیے جائیں تو شاید زیادہ نمائندہ فہرست بن سکے۔ مثلاً ایک ہزار افسانوں ، ناولوں ، مضامین وغیرہ میں سے ہر آرٹیکل میں کوئی لفظ کتنی بار آیا اور پھر اس کی فیصد نکال لی جائے ۔ وغیرہ
اس بارے میں کسی ماہرِ شماریات کی مشاورت سے ایک لائحہ عمل بنایا جاسکتا ہے۔
کسی لفظ کی عدم شمولیت ان دو اصولوں کو مد نظر رکھ کر کی گئی ہے:
لفظ کی کارپس میں تعداد پچاس سے کم ہو
لفظ عربی الاصل ، فارسی الاصل یا انگریزی الاصل ہو

آپ سے ذاتی پیغام یا مکالمہ ممکن نہیں ہو پا رہا معلوم نہیں کہ کیا تکینیکی وجہ ہو سکتی ہے
ْ
 
Top