تحریر سے مصنف کی شناخت : تحقیقی بحث

الف نظامی

لائبریرین

الف نظامی

لائبریرین

For the author identification system a corpus has been developed in which there
are texts from different newspapers. The subjects of these texts range from current​
events to medical and political issues.​
--​
After we had established the corpus, we studied style markers(اسلوبی خصوصیات)
We used 35 style markers which are shown in Table 1. These 35 style markers have been processed​
for every article of each author​
smq8o3.png
 

الف نظامی

لائبریرین
اُسلوب سے مراد کسی ادیب یا شاعر کا وہ طریقہ ء ادائے مطلب یا خیالات و جذبات کے اظہار و بیان کا وہ ڈھنگ ہے جو اس خاص صنف کی ادبی روایت میں مصنف کی اپنی انفرادیت (انفرادی خصوصیات) کے شمول سے وجود میں آتا ہے اور چونکہ مصنف کی انفرادیت کی تشکیل میں اس کا علم ، کردار ، تجربہ ، مشاہدہ ، افتاد طبع ، فلسفہء حیات ، اور طرزِ فکر و احساس جیسے عوامل مل کر حصہ لیتے ہیں۔ اس لیے اُسلوب کو مصنف کی شخصیت کا پرتو اور اس کی ذات کی کلید سمجھا جاتا ہے۔
"کشاف تنقیدی اصطلاحات"
مرتبہ :- ابوالاعجاز حفیظ صدیقی
مقتدرہ قومی زبان ، اسلام آباد
 

سعادت

تکنیکی معاون
2007ء سے PAN کے نام سے ایک ورکشاپ ہر سال منعقد ہوتی ہے، جس میں سوفٹویئر کی مدد سے خود کار طور پر تحاریر میں سرقے (plagiarism) کی پہچان، تحریر سے مصنف کی شناخت، اور تحریر سے مصنف کے کوائف کی پروفائلنگ کے موضوعات پر مقابلے کروائے جاتے ہیں۔ اگلے سال یہ مقابلہ (مصنف کی شناخت سمیت) سپین میں منعقد ہو رہا ہے۔

میں نے زیادہ تفصیل سے تو ایکسپلور نہیں کیا، لیکن تحریر سے مصنف کی شناخت کے حوالے سے آپ پچھلے برسوں میں منعقد کیے گئے PAN مقابلوں کی اینٹریز اور ورکشاپ میں شامل کی-نوٹس، مقالہ جات اور پریزنٹیشنز ملاحظہ کر سکتے ہیں۔ :)
 
اس سب کی حقیقت اپنی جگہ لیکن بعض اوقات قریبی رشتہ دار ، دوستوں اور ساتھیوں میں ایک دوسرے کے کام کی انتہائی شباہت بھی ممکن ہے ۔ ایسے دل چسپ اتفاقات کا مجھے بھی مشاہدہ ہوا ہے ۔ ایک مشہور کپل میاں بیوی کے بارے میں اڑائی جاتی تھی کہ ان میں سے کسی ایک کا کام دونوں کے نام سے چھپتا ہے لیکن میں نے ہمیشہ محسوس کیا کہ ان کا فی البدیہہ بات کرنے کا انداز اتنا آئڈنٹیکل ہے کہ حد نہیں ۔ اس لیے عین ممکن ہے کہ وہ نادانستہ ایک دوسرے کے رنگ میں لکھتے ہوں ۔
 
یہ تھریڈ ایک کمپیوٹری مسئلے پر غور کرنے کے لیے شروع کیا گیا ہے۔ امید ہے کہ الگورتھم تخلیق کار اس تحقیق میں حصہ لیں گے۔
مسئلہ : ہر شخص کے لکھنے کا انداز مختلف ہوتا ہے ۔۔۔ ایسا الگورتھم / نظام وضع کرنا جو کسی شخص کی مختلف تحاریر ( کالم ، فورم ، بلاگ پوسٹ ) کا تجزیہ کر نے کے بعد کسی دئیے گئے متن کے بارے میں یہ فیصلہ کر سکے کہ آیا وہ اس شخص کا لکھا ہوا ہے یا نہیں؟

کیا اردو متن کے لیے ایسا الگورتھم / نظام وضع کرنا ممکن ہے اور اس حوالے سے تحریر میں کون کون سی اسلوبی خصوصیات کا جائزہ لینا ہوگا؟
ماہرین اسلوب و لسانیات و کمپیوٹر متوجہ ہوں۔

مفید روابط برائے مطالعہ:






الف نظامی ، تم لگتا ہے بیٹھ کر ایسے ہی مسائل سوچتے رہتے ہو ۔ ویسے غائب کہاں ہو۔

میں نے ایک کتاب تھوڑی سی شروع کی تھی اس علم Graphology پر مگر جس دوست کی طرف سے مطالبہ آیا تھا اس سے بات چیت نہ ہونے کی وجہ سے دلچسپی ماند پڑ گئی ۔ اب لگتا ہے کہ پھر سے اسے دیکھنا ہوگا ۔

معذرت ، میں لکھے ہوئے حروف کی مدد سے شخصیت کے کردار کا اندازہ لگانے والے علم سمجھ بیٹھا تھا۔
 

قیصرانی

لائبریرین
میرا خیال ہے یہ ممکن نہیں۔ بات ہار ماننے یا نہ ماننے کی نہیں۔ چند حقائق پیش کرتا ہوں۔
۱۔ اسلوب صرف لفظیات کا نام نہیں ہے۔ اور پھر یہ بھی ضروری نہیں کہ میں ہمیشہ سو پچاس بڑے (نمایاں) لفظوں کا سیٹ ہی استعمال کروں۔ اور یہ بھی ضروری نہیں کہ الفاظ کا وہ سیٹ کوئی دوسرا استعمال نہیں کرے گا۔ جملے کی ساخت اور معنی آفرینی میں بہت سارے احباب کا انداز مماثل ہو سکتا ہے۔
۲۔ ایک ہی لکھاری کے بیس پچیس مضامین یا تحریر کے دیگر نمونوں کو دیکھ کر، ایک دی گئی تحریر کے بارے میں ہم زیادہ سے زیادہ یہ اندازہ لگا سکتے ہیں، کہ یہ انداز فلاں شخص کا سا ہے۔ کوئی فیصلہ صادر کرنا، انسانوں کے لئے بھی مشکل ہے کہاں بے چاری مشین!۔ ایسی تجزیہ کاری میں خود تجزیہ کرنے والے کا علم، اس کی اپج اور قوتِ تجزیہ، میلان اور نہ جانے کون کون سے انسانی عوامل کار فرما ہوتے ہیں۔ اور انسان پھر بھی ٹھوکر کھا سکتا ہے یعنی لکھاری کا درست تعین نہیں کر پاتا۔
۳۔
گلوں میں رنگ بھرے بادِ نوبہار چلے
چلے بھی آؤ کہ گلشن کا کار و بار چلے
قفس اداس ہے یارو صبا سے کچھ تو کہو
کہیں تو بہرِ خدا آج ذِکرِ یار چلے
مقام فیضٓ کوئی راہ میں جچا ہی نہیں
جو کوئے یار سے نکلے تو سوئے دار چلے
یہاں فیض نمایان طور پر دکھائی دے رہا ہے، مگر اس چیز کی کیا ضمانت ہے کہ کوئی اور شخص یہی تراکیب اور الفاظ استعمال نہیں کرے گا؟۔ مجھے یقین ہے کہ یہی تراکیب اور الفاظ فیض سے پہلے بھی مستعمل رہے ہیں۔ گل، رنگ، رنگ بھرنا، بادِ نوبہار، نوبہار، بہار، گلشن، کاروبار، بہرِ خدا، ذکر، یار، مقام، کوئے یار، سوئے دار میں سے کوئی بھی اردو کے لئے نیا نہیں۔ جن احباب کا شعر سے واسطہ ہے وہ بآسانی پہچان لیتے ہیں کہ یہ فیض کا کلام ہے۔ سب بجا، تاہم اس شناخت میں کچھ حصہ اس غزل کی شہرت کا بھی ہے۔ مشینی تجزیہ نگاری میں یہ سارا پس منظر اور پیش منظر نہ تو محفوظ کیا جا سکتا ہے اور نہ ہی کوئی قطعی فیصلہ ممکن ہے۔
۴۔ اقبال کی شاعری کے مختلف ادوار بنائیے تو کھُلتا ہے کہ ان کی لفظیات بھی تبدیل ہوئیں اور اسلوب کے دیگر عناصر بھی۔ غالب نے شروع شروع میں مشکل پسندی سے کام لیا، اور وقت کے ساتھ ساتھ سلاست کی طرف مائل ہوتے گئے۔ ان دونوں بزرگوں کی اپنی اپنی نثر اور شاعری کے اسالیب مختلف ہیں۔ اقبال کے ہاں موضوع بدلتا ہے تو ساری لفظیات بدل جاتی ہے اور یہ صرف اقبال پر موقوف نہیں۔

بہر حال، کر دیکھئے!۔
میرا مشورہ ہے کہ محدود پیمانے پر چند لکھاریوں سے اگر یہ شروع کیا جائے تو آہستہ آہستہ ترقی پا کر آگے جا سکتا ہے۔ اردو کالم نگاروں کے حوالے سے اس کی چند مثالیں پیش خدمت ہیں

مولانا ہارون الرشید جو قبل از مسیح کے ایک مشہور کالم نگار ہیں، وہ اپنے ہر مضمون میں ہی کپتان یعنی عمران خان کو گھسیڑتے ہیں۔ یعنی کپتان ان کا کی ورڈ ہے۔ دوسرا وہ Active کی بجائے Passive یعنی براہ راست کی بجائے بالواسطہ فقرے لکھتے ہیں
مولانا حامد میر مدظلہ علیہ نے اسامہ بن لادن کو ہمیشہ شیخ اسامہ کہہ کر پکارا ہے جو یونیک ہے
یاسر پیرزادہ اور آفتاب اقبال نے لفظ "واہیات" کثرت سے استعمال کیا ہے
قاضی حسین احمد صاحب قال اللہ اور قال الرسول کا بہت استعمال کرتے ہیں۔ پشاور، جماعت اسلامی، جہاد بھی ان کے کی ورڈ ہیں جو کمبی نیشن کے ساتھ ان کی شناخت ہیں
ٹیکسٹائل سے متعلقہ مسائل وغیرہ کی نشاندہی کے لئے چند ایک ہی لکھاری ہیں جو لکھتے رہتے ہیں

میرا مشورہ ہے کہ ابتداء میں چند ایک لکھاریوں کو شارٹ لسٹ کر کے اس پر کام کیا جائے۔ جب ان کی پہچان کا عمل کامیابی سے ہمکنار ہونے لگے گا تو بہت سارے نئے نکات سامنے آئیں گے جو مزید آگے چل کر دیگر لکھاریوں پر بھی لاگو ہو جائیں گے۔ اس طرح مسلسل بہتری کا عمل چلتا رہے گا اور کی ورڈ یا کی ورڈز (یعنی ایک لکھاری کی پہچان میں دو یا تین کی ورڈز کا مجموعہ بھی ہو سکتا ہے) جمع ہوتے جائیں گے اور بہتری کا اندازہ ہوتا جائے گا
 

قیصرانی

لائبریرین
اس سب کی حقیقت اپنی جگہ لیکن بعض اوقات قریبی رشتہ دار ، دوستوں اور ساتھیوں میں ایک دوسرے کے کام کی انتہائی شباہت بھی ممکن ہے ۔ ایسے دل چسپ اتفاقات کا مجھے بھی مشاہدہ ہوا ہے ۔ ایک مشہور کپل میاں بیوی کے بارے میں اڑائی جاتی تھی کہ ان میں سے کسی ایک کا کام دونوں کے نام سے چھپتا ہے لیکن میں نے ہمیشہ محسوس کیا کہ ان کا فی البدیہہ بات کرنے کا انداز اتنا آئڈنٹیکل ہے کہ حد نہیں ۔ اس لیے عین ممکن ہے کہ وہ نادانستہ ایک دوسرے کے رنگ میں لکھتے ہوں ۔
آپ اشفاق احمد اور بانو قدسیہ کی بات تو نہیں کر رہیں؟
 
نہیں ، نام ذکر نہیں کرنا چاہتی جبھی نہیں لکھے ۔ ویسے وہ دونوں رائٹر بھی ہیں اور سپیکرز بھی ۔
بانو قدسیہ کا انداز مجھے اشفاق احمد سے مختلف لگتا ہے ۔
 

قیصرانی

لائبریرین
نہیں ، نام ذکر نہیں کرنا چاہتی جبھی نہیں لکھے ۔ ویسے وہ دونوں رائٹر بھی ہیں اور سپیکرز بھی ۔
بانو قدسیہ کا انداز مجھے اشفاق احمد سے مختلف لگتا ہے ۔
پھر آپ نے جس کپل کا تذکرہ کیا تھا، اس کا نام بھی شئیر کر دیں
 
الف نظامی ، تم لگتا ہے بیٹھ کر ایسے ہی مسائل سوچتے رہتے ہو ۔ ویسے غائب کہاں ہو۔

میں نے ایک کتاب تھوڑی سی شروع کی تھی اس علم Graphology پر مگر جس دوست کی طرف سے مطالبہ آیا تھا اس سے بات چیت نہ ہونے کی وجہ سے دلچسپی ماند پڑ گئی ۔ اب لگتا ہے کہ پھر سے اسے دیکھنا ہوگا ۔

معذرت ، میں لکھے ہوئے حروف کی مدد سے شخصیت کے کردار کا اندازہ لگانے والے علم سمجھ بیٹھا تھا۔

اردو گرافولوجی کی کتاب یا انگریزی کی ؟
 
پھر آپ نے جس کپل کا تذکرہ کیا تھا، اس کا نام بھی شئیر کر دیں
ان کے علاوہ ایک اور کپل کا ذکر کر لیتے ہیں : مولانا ابوالکلام آزاد کے والد اور والدہ ، ان کی والدہ بالکل اپنے شوہر کی ہم اسلوب اور ہم خط تھیں ۔ لیکن وہ باقاعدہ مصنف نہیں تھیں کہہ سکتے ہیں وہ اپنے شوہر کی کاپی کرتی تھیں ۔
 
مولانا ہارون الرشید جو قبل از مسیح کے ایک مشہور کالم نگار ہیں، وہ اپنے ہر مضمون میں ہی کپتان یعنی عمران خان کو گھسیڑتے ہیں۔ یعنی کپتان ان کا کی ورڈ ہے۔ دوسرا وہ Active کی بجائے Passive یعنی براہ راست کی بجائے بالواسطہ فقرے لکھتے ہیں​
۔۔۔۔۔۔۔ ان کے بارے میں تو مجھے زیادہ علم نہیں، میں کالم بہت کم پڑھتا ہوں۔
مولانا حامد میر مدظلہ علیہ نے اسامہ بن لادن کو ہمیشہ شیخ اسامہ کہہ کر پکارا ہے جو یونیک ہے​
۔۔۔۔۔۔۔ اسامہ بن لادن کو بہت وسیع حلقے میں ’’شیخ اسامہ‘‘ کہا جاتا رہا ہے، بلکہ آج کہا جاتا ہے۔ یہ صرف حامد میر پر موقوف نہیں ہے۔
یاسر پیرزادہ اور آفتاب اقبال نے لفظ "واہیات" کثرت سے استعمال کیا ہے​
۔۔۔۔۔۔۔ ان کے بارے میں تو مجھے زیادہ علم نہیں۔
قاضی حسین احمد صاحب قال اللہ اور قال الرسول کا بہت استعمال کرتے ہیں۔ پشاور، جماعت اسلامی، جہاد بھی ان کے کی ورڈ ہیں جو کمبی نیشن کے ساتھ ان کی شناخت ہیں​
۔۔۔۔۔۔۔ یہ قاضی حسین احمد کے ساتھ خاص نہیں ہے۔ قرآن و حدیث کی بات ہو تو یہ دونوں لفظ (
قال اللہ، قال الرسول)​
بہت معروف ہیں اور بہت سارے علماء حسبِ موقع ان کو ادا کرتے ہیں۔

ٹیکسٹائل سے متعلقہ مسائل وغیرہ کی نشاندہی کے لئے چند ایک ہی لکھاری ہیں جو لکھتے رہتے ہیں۔​
۔۔۔۔۔۔۔ صنعتی اور دیگر مسائل پر قلم اٹھانے والا ظاہر ہے متعلقہ ’’فیلڈ‘‘ کے مانوس الفاظ استعمال کرے گا۔ ایک خاص صنعت کے حوالے سے کچھ خاص ’’مانوس الفاظ‘‘ ہیں تو دوسری صنعت کے حوالے سے اس کے اپنے۔ کچھ لفظیات پورے صنعتی ماحول سے تعلق رکھتی ہیں۔ لکھاری اگر ایک ہی ہے تو بھی اس کی لفظیات ’’فیلڈ‘‘ کے مطابق ڈھل جائیں گی۔

دعاؤں میں یاد رکھئے گا۔
 

سید ذیشان

محفلین
جب باقی زبانوں میں 70 سے 95 فی صد کامیابی حاصل کر لی گئی ہے تو اردو میں بھی ایسا ہونا چاہیے۔ خاص طور پر یہ بات ذہن میں رکھنی چاہیے کہ اردو انگریزی کی طرح ہندی-یورپی نسل کی زبان ہے۔ تو جو الگورتھم انگریزی پر کارگر ہوگا وہ اردو پر کافی حد تک ٹھیک چلے گا۔
 
Top