اردو ویب پر کمپیوٹنگ دنیا میں گزشتہ دو چار سال میں ہوئی تبدیلیوں اور ترقی پر خاموشی کیوں؟

السلام علیکم،

اردو محفل جیسا کہ ہم سب ہی جانتے ہیں اردو لکھنا پڑھنا اور بولنا پسند کرنے والوں کی محفل ہے۔ اور یہاں پر بہت سے ایسے ذرخیز دماغ موجود ہیں جنہوں نے کمپیوٹنگ کی دنیا میں اردو کے لیے کافی کوششیں کی ہیں بہت سوں نے انفرادی طور پر اور بہت سوں نے اجتماعی طور پر۔ اور ایک ایک فرد کی کوشش گراں قدر اہمیت کی حامل ہے۔
لیکن میں محسوس کر رہا تھا کہ گزشتہ کچھ سالوں میں کمپیوٹنگ کی دنیا بالخصوص آرٹیفیشل اِنٹیلیجنس کے میدان میں جو بے پناہ اور تیز رفتار ترقی ہوئی ہے اور ان ٹیکنالوجیز کے استعمال سے مختلف شعبہ جات سے تعلق رکھنے والے لوگوں کی زندگیوں میں جو انقلاب آ رہا ہے اس پر ہمارے فورم پر لوگ خاموش ہیں بالکل خاموش۔
حالانکہ کئی لوگ ایسے ہیں جو خود براہِ راست شامل ہیں بہت سی ترقیاں اور تبدیلیاں برپا کرنے والی ٹیمز میں۔
بہت سے ایسے کام جو ہم یہاں کئی کئی دن اور مہینوں کی محنت سے کرتے رہے ہیں اب کچھ منٹس اور کچھ گھنٹوں کے کام میں تبدیل ہو کر رہ گئے ہیں۔ مثلاً کتب کی ڈیجیٹلائزیشن، نریشن، ٹرانسکرپشن۔ اور اردو کے موافق مواد کی تیاری وغیرہ۔
ملٹی میڈیا سے متعلق بہت پیش رفت ہوئی ہے جس میں مصنوعی ذہانت کا استعمال بہت بڑھا ہے اور لوگ یا تو مصنوعی ذہانت کے ماڈلز بنانے میں لگے ہیں یا ان میں بہتری لانے کی کوشش میں ہیں ، کچھ ان کو کسٹمائز کرنے میں یا انہیں ٹرین کرنے میں اور لوکلائز کرنے میں جُتے ہوئے ہیں۔ کیا ہم آئندہ بھی گزشتہ کی طرح پراڈکٹ مارکیٹ میں آ جانے کے بعد پائریٹِڈ ورژنز ڈھونڈنے میں لگے رہیں گے یا یہاں سیکھنے سکھانے کا ماحول بنا کر اگر خود اس قابل نہیں رہے تو اپنے بچوں کی تربیت کا خیال رکھتے ہوئے خود بھی اس میدان میں قدم رکھیں گے۔
Nvidia، ایڈوبی، مائکروسافٹ، گوگل کے بہت سے ایسے ماڈلز ان کے اپنے اور Github اور دوسرے پلیٹ فارمز پر تجربوں کے لیے دستیاب ہیں۔ ہم میں سے بہت سے لوگ تو انہی پلیٹ فارمز پر دستیاب ڈیموز تک کو استعمال کرنا نہیں جانتے۔ اور کچھ کے پر ان پروگرامز کو اپنے سسٹم پر تجربہ کرنے کی کوشش میں جل جاتے ہیں ۔
ہمارے بہت سے دوست جو ڈیولپمنٹ انوائرنمنٹ بنانے کے اور اِن ماڈلز کو استعمال کے قابل بنانے کے ماہر ہیں وہ اگر کوشش کریں تو مجھ جیسے بہت سے لوگ کوشش کر کے سیکھ سکتے ہیں اور اپنے آس پاس بچوں کو اس رستے پر رہنمائی کر سکتے ہیں۔ تاکہ ہم بھی ترقی میں حصہ ڈالنے والوں میں شامل ہو سکیں نہ کے چور رستے ڈھونڈنے والوں میں۔
اور کچھ دوست کوشش کر کے یہاں آن لائن دستیاب ایسے ٹُولز اینڈ ماڈیولز اور ماڈلز کو شئیر کرنے کا بھی اہتمام کریں تاکہ لوگ نا صرف انہیں استعمال کرنا سیکھ جائیں بلکہ ان کو اپنا کر ان میں بہتری کی کوشش بھی کرنے کے قابل ہو سکیں اور مزید نئے تجربے کر سکیں۔
شکریہ
نبیل ابن سعید سید ذیشان الف نظامی زیک
 

نبیل

تکنیکی معاون
یاد دہانی کا شکریہ امجد۔آپ نے جن لوگوں کو ٹیگ کیا ہے ان میں سے اکثر زندگی کی دوسری ترجیحات میں مصروف ہو چکے ہیں۔ اردو محفل پر اگرچہ گاہے گاہے ٹیکنالوجی کی کوئی خبر ملتی رہتی ہے لیکن زیادہ تر وہی پرانے شعروشاعری اور گپ شپ کے سلسلے ہی نظر آتے ہیں۔ اردو کمپیوٹنگ کی فیلڈ میں تحقیق کو آگے بڑھانانئی نسل کا کام ہے اور انہیں سامنے آنا چاہیے۔ مصنوعی ذہانت سے متلعق آپ کے نکات سے میں سو فیصد متفق ہوں۔ گزشتہ کئی برسوں سے میں فورم کی سالگرہ کے موقعے پر اپنی خصوصی تحریر میں اس کی نشاندہی بھی کرتا آیا ہوں۔ ذاتی طور پر مجھے ڈیپ لرننگ کی فیلڈ میں بہت دلچسپی ہے اور لیکن یہ میرے لیے بھی نئی فیلڈ ہے۔ ڈیپ لرننگ ماڈلز کو اردو کے لیے قابل استعمال بنانا عام سوفٹویر کی اردو لوکلائزیشن سے کافی مختلف اور دشوار کام ہے۔ جی پی ٹی 3 جیسے لینگویج ماڈلز کی ٹرینینگ پر ہی تیس ملین ڈالر کی لاگت آئی تھی۔ انٹرنیٹ سے اردو مواد کو سکریپ کرکے اس پر لینگویج ماڈل ٹرین کرنا تھیوری میں ممکن تو ہے لیکن عملی طور پر اتنا آسان نہیں ہے۔ یہ کام فی الحال بڑی ٹیکنالوجی کمپنیز کی دسترس میں ہی ہے۔ عام صارف بھی اگر گٹ ہب یا Hugging Face سے کوئی ماڈل ڈاؤنلوڈ کرکے تجربات کرنا چاہیں تو اس کے لیے ایک اچھا جی پی یو درکار ہوگا۔ گوگل کولیب پر مفت جی پی یو دستیاب ضرور ہوتا ہے لیکن اب گوگل اس فری آپشن کو بھی کم بتدریج گھٹا رہا ہے۔
جہاں تک محفل فورم پر اے آئی سے متعلق شراکت کا تعلق ہے تو میں شاید اس سلسلے میں کچھ مضامین پوسٹ کرنے کا ارادہ رکھتا ہوں۔ لیکن یہ بات ایک مرتبہ پھر دہرانا چاہتا ہوں کہ اب ہمیں ایک نئے کمیونٹی پلیٹ فارم کی ضرورت ہے جہاں مختلف موضوعات پر علیحدہ سے معلومات شئیر کی جا سکیں۔
 
بہت شکریہ نبیل۔
جس طرح ہم گرافکس، ویب، اور ملٹی میڈیا سے تعلق مواد ، ذرائع اور اپ ڈیٹس شئیر کر رہے ہوتے ہیں یا بات کر رہے ہوتے ہیں تو اسی طرح اگر ایسی اپ ڈیٹس یا کھوج، تجربے اور ہونے والی تبدیلیوں پر بھی بات ہوتی رہے تو میرا خیال ہے بہت سوں کے لیے ان کی فیلڈز میں کار آمد ہو سکتا ہے یہ سلسلہ۔
جیسے ٹیکسٹ تو اسپیچ اور اسپیچ تو ٹیکسٹ اب بہت بہترین ہو چکا ہے۔ آپ صرف اردو میں کتابیں پڑھیں سسٹم خود لکھ رہا ہوتا ہے، اور اس میں اب بہت زیادہ رکھ رکھاؤ اور مخصوص لہجوں یا کم رفتار کی بھی ضرورت نہیں رہی۔
اسی طرح اب آپ صرف تصویر کھینچ کر ہی اس میں موجود تحریر کو بطور تحریر کاپی ، ترجمہ، یا آڈیو میں تبدیل کر سکتے ہیں۔ یہاں تک کہ اب تو کمانڈ پرامپٹ کے ذریعے تصاویر اور ویڈیوز بھی بن رہی ہیں۔ اسی طرح بہت سی سروسز اردو تحریر کو اپنے اے آئی تھری ڈی ماڈلز کے ذریعے نریٹ کی ویڈیوز بنا رہے ہیں۔
بہت سے آرٹیفیشل انٹیلیجنس کے ماڈلز گرافکس کے ساتھ کام کر رہے ہیں جن میں سے کچھ آپ کی تحریر کے مطابق آپ کو گرافکس بنا کر دیتے ہیں۔ مثلاً میں اگر لکھوں (سرخ رنگ کے مینارِ پاکستان پر نیلا پرندہ اڑتا ہوا) تو وہ مجھے ایک فوٹو بنا کر دے دے گا جس میں تحریر کے عین مطابق ہو گا۔ اسی طرح کچھ ماڈلز پہ میں نے کسی دوست کی تصویر ڈال کر لکھا (a man with his girl friend) تو اے آئی نے اس دوست کے ساتھ اے آئی جنریٹڈ خاتون کھڑی کر دی ۔
کئی ماڈلز بلیک اینڈ وائٹ تصاویر کو حقیقی رنگوں میں تبدیل کر رہے ہیں، کئی ماڈل پرانی بلررڈ فوٹوز کو ایچ ڈی میں تبدیل کر رہے ہیں۔ فیس اسٹرکچر کو اے آئی سے ری کنسٹرکٹ کر کے۔
ایک دو ماڈلز میں نے دیکھے جن میں آپ مشہور ہئیر اسٹائلز کے نام لکھ دیں تو تصویر کا ہیر اسٹائل قطعی غیر محسوس طریقے سے تبدیل ہو جاتا ہے۔
اگر فی الحال کم سے کم ایک زمرہ ایسا بنا دیا جائے جہاں کمپیوٹنگ اور آٹومیشن کے دنیا میں ہونے والی پیش رفت اور نئی دریافتیں سب لوگ شئیر کر سکیں۔
نئے کمیونٹی پلیٹ فارم کے بارے میں بھی آپ کے ذہن میں کیا آئیڈیا ہے؟
 

شکیب

محفلین
یاد دہانی کا شکریہ امجد۔آپ نے جن لوگوں کو ٹیگ کیا ہے ان میں سے اکثر زندگی کی دوسری ترجیحات میں مصروف ہو چکے ہیں۔ اردو محفل پر اگرچہ گاہے گاہے ٹیکنالوجی کی کوئی خبر ملتی رہتی ہے لیکن زیادہ تر وہی پرانے شعروشاعری اور گپ شپ کے سلسلے ہی نظر آتے ہیں۔ اردو کمپیوٹنگ کی فیلڈ میں تحقیق کو آگے بڑھانانئی نسل کا کام ہے اور انہیں سامنے آنا چاہیے۔ مصنوعی ذہانت سے متلعق آپ کے نکات سے میں سو فیصد متفق ہوں۔ گزشتہ کئی برسوں سے میں فورم کی سالگرہ کے موقعے پر اپنی خصوصی تحریر میں اس کی نشاندہی بھی کرتا آیا ہوں۔ ذاتی طور پر مجھے ڈیپ لرننگ کی فیلڈ میں بہت دلچسپی ہے اور لیکن یہ میرے لیے بھی نئی فیلڈ ہے۔ ڈیپ لرننگ ماڈلز کو اردو کے لیے قابل استعمال بنانا عام سوفٹویر کی اردو لوکلائزیشن سے کافی مختلف اور دشوار کام ہے۔ جی پی ٹی 3 جیسے لینگویج ماڈلز کی ٹرینینگ پر ہی تیس ملین ڈالر کی لاگت آئی تھی۔ انٹرنیٹ سے اردو مواد کو سکریپ کرکے اس پر لینگویج ماڈل ٹرین کرنا تھیوری میں ممکن تو ہے لیکن عملی طور پر اتنا آسان نہیں ہے۔ یہ کام فی الحال بڑی ٹیکنالوجی کمپنیز کی دسترس میں ہی ہے۔ عام صارف بھی اگر گٹ ہب یا Hugging Face سے کوئی ماڈل ڈاؤنلوڈ کرکے تجربات کرنا چاہیں تو اس کے لیے ایک اچھا جی پی یو درکار ہوگا۔ گوگل کولیب پر مفت جی پی یو دستیاب ضرور ہوتا ہے لیکن اب گوگل اس فری آپشن کو بھی کم بتدریج گھٹا رہا ہے۔
جہاں تک محفل فورم پر اے آئی سے متعلق شراکت کا تعلق ہے تو میں شاید اس سلسلے میں کچھ مضامین پوسٹ کرنے کا ارادہ رکھتا ہوں۔ لیکن یہ بات ایک مرتبہ پھر دہرانا چاہتا ہوں کہ اب ہمیں ایک نئے کمیونٹی پلیٹ فارم کی ضرورت ہے جہاں مختلف موضوعات پر علیحدہ سے معلومات شئیر کی جا سکیں۔
آپ کی سالگرہ پر ہونے والی پوسٹ میں نئے پلیٹ فارم کی جو بات ہوئی تھی وہ خوش آئند تھی، اور اس سے کسی حد تک تکنیکی مواد سامنے آتا اور اردو کمپیوٹنگ پر مزید پیش رفت ضرور ہوتی۔

محفل پر اب تعمیری سرگرمیاں بہت کم بلکہ نہیں کے برابر ہو چلی ہیں۔
 

زیک

مسافر
گزشتہ کچھ سالوں میں کمپیوٹنگ کی دنیا بالخصوص آرٹیفیشل اِنٹیلیجنس کے میدان میں جو بے پناہ اور تیز رفتار ترقی ہوئی ہے اور ان ٹیکنالوجیز کے استعمال سے مختلف شعبہ جات سے تعلق رکھنے والے لوگوں کی زندگیوں میں جو انقلاب آ رہا ہے اس پر ہمارے فورم پر لوگ خاموش ہیں بالکل خاموش۔

محفل پر اب تعمیری سرگرمیاں بہت کم بلکہ نہیں کے برابر ہو چلی ہیں۔
حقیقت یہ ہے کہ اردو کو ٹیکنالوجی کی اس دنیا میں اب بر صغیر اور خصوصاً پاکستان کے لوگوں نے چلانا ہے۔ ہم جیسے بدیسیوں کا اردو سے تعلق نہ ہونے کے برابر رہ گیا ہے۔
 

نبیل

تکنیکی معاون
حقیقت یہ ہے کہ اردو کو ٹیکنالوجی کی اس دنیا میں اب بر صغیر اور خصوصاً پاکستان کے لوگوں نے چلانا ہے۔ ہم جیسے بدیسیوں کا اردو سے تعلق نہ ہونے کے برابر رہ گیا ہے۔

ہمارا اردو سے تعلق پہلے جیسا ہی ہے۔ اب ترجیحات قدرے تبدیل ہو گئی ہیں۔ آج کل لارج لینگویج ماڈلز پر کام ہو رہا ہے۔ اردو ایک بڑی زبان ہونے کے باوجود لو ریسورس لینگویج شمار ہوتی ہے۔ اردو کے لیے ایک فاؤندیشن ماڈل کی ضرورت ہے جسے مزید فائن ٹیون کیا جا سکے۔ لیکن بنیادی لینگویج ماڈل ٹرین کرنا نہایت مہنگا کام ہےاور صرف بڑی کمپنیاں ہی ایسا کر سکتی ہیں۔ حیران کن طور پر ابوظہبی میں عربی لینگویج ماڈل تیار کیا گیا ہے۔ ذیل کی خبر ملاحظہ کریں:

Abu Dhabi launches Jais: advanced AI language model for Arabic

اس سے امید کی جاسکتی ہے کہ اردو پر مبنی لینگویج ماڈل بھی کبھی ٹرین کیا جا سکے گا۔
 
حقیقت یہ ہے کہ اردو کو ٹیکنالوجی کی اس دنیا میں اب بر صغیر اور خصوصاً پاکستان کے لوگوں نے چلانا ہے۔ ہم جیسے بدیسیوں کا اردو سے تعلق نہ ہونے کے برابر رہ گیا ہے۔
جب تک آپ زندہ ہیں تب تک تو تعلق نہیں ٹوٹ سکتا
 

الف نظامی

لائبریرین
ہمارا اردو سے تعلق پہلے جیسا ہی ہے۔ اب ترجیحات قدرے تبدیل ہو گئی ہیں۔ آج کل لارج لینگویج ماڈلز پر کام ہو رہا ہے۔ اردو ایک بڑی زبان ہونے کے باوجود لو ریسورس لینگویج شمار ہوتی ہے۔ اردو کے لیے ایک فاؤندیشن ماڈل کی ضرورت ہے جسے مزید فائن ٹیون کیا جا سکے۔ لیکن بنیادی لینگویج ماڈل ٹرین کرنا نہایت مہنگا کام ہےاور صرف بڑی کمپنیاں ہی ایسا کر سکتی ہیں۔ حیران کن طور پر ابوظہبی میں عربی لینگویج ماڈل تیار کیا گیا ہے۔ ذیل کی خبر ملاحظہ کریں:

Abu Dhabi launches Jais: advanced AI language model for Arabic

اس سے امید کی جاسکتی ہے کہ اردو پر مبنی لینگویج ماڈل بھی کبھی ٹرین کیا جا سکے گا۔
اردو پر مبنی لینگوئج ماڈل ٹرین کرنے کے لیے مختلف کیٹیگریریز (ادب ، سیاست ، ماحولیات ، سائنس و ٹیکنالوجی وغیرہ)کے لحاظ سے ایک یا کثیر ڈیٹا سیٹس بنانا ضروری ہے یا متنوع موضوعات کا ایک ہی کارپس کافی ہوگا؟
 

نبیل

تکنیکی معاون
اردو پر مبنی لینگوئج ماڈل ٹرین کرنے کے لیے مختلف کیٹیگریریز (ادب ، سیاست ، ماحولیات ، سائنس و ٹیکنالوجی وغیرہ)کے لحاظ سے ایک یا کثیر ڈیٹا سیٹس بنانا ضروری ہے یا متنوع موضوعات کا ایک ہی کارپس کافی ہوگا؟
ٹریننگ ڈیٹا کی مقدار سے زیادہ معیار کی اہمیت ہے۔ نئی تحقیق کے مطابق اعلی معیار کے ڈیٹا پر قدرے چھوٹے سائز کے لینگویج ماڈل ٹرین کیے جا سکتے ہیں اور ان کی کارکردگی موجود لارج لینگویج ماڈلز کے مقابلے کی ہو سکتی ہے۔
ریفرینس:

Textbooks Are All You Need


ریسرچ کی ایک اور سمت موجودہ لارج لینگویج ماڈلز سے ڈیٹا جنریٹ کروانا یعنی synthetic ڈیٹا کااستعمال بھی ہے۔

ریفرینس:

TinyStories: How Small Can Language Models Be and Still Speak Coherent English?


بہرحال کسی بھی ماڈل ٹریننگ یا فائن ٹیوننگ سے قبل ایک معیاری اردو کارپس کی تیاری ضروری ہوگی، جوکہ بذات خود ایک بڑا پراجیکٹ ہوگا۔
 
امجد میانداد آپ کم از کم خبروں کی حد تک دھاگے بنانا شروع کریں اور مجھے بھی ٹیگ کر دیا کریں۔

کچھ پرانے دوستوں کو بیدار کرنے کی ضرورت ہے۔

محمد شعیب ویکیپیڈیا کے حوالے سے آپ باقاعدگی سے معلومات شیئر کیا کرتے تھے، اس سلسلے کو دوبارہ شروع کرنے کی ضرورت ہے۔
 

زیک

مسافر
جب تک آپ زندہ ہیں تب تک تو تعلق نہیں ٹوٹ سکتا
تعلق اب کچھ ایسا ہے کہ ایک دوست سے تیس سال بعد حال ہی میں ملاقات ہوئی۔ گفتگو آدھی اردو آدھی انگریزی میں ہوئی۔ سنجیدہ کام اردو میں کرنے کا نہ وقت ہے اور نہ ہی تحریک۔ موٹیویشن تک کا ترجمہ گوگل ٹرانسلیٹ سے تلاش کیا جس نے غلط بتایا
 
Top