ڈیٹا مائینگ

الف نظامی نے 'انفارمیشن ٹیکنالوجی کی دنیا' کی ذیل میں اس موضوع کا آغاز کیا، ‏اپریل 7, 2008

  1. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,403
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    data mining کیا چیز ہے؟
     
  2. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    الف نظامی بھائی آپ ان ٹرمنالوجیز کو گوگل کیوں نہیں کر لیا کرتے؟ وکیپیڈیا پر زیادہ بہتر وضاحت مل جائے گی۔

    خیر میں اپنا علم بگھارتا ہوں۔ :)

    مائننگ کا مطلب ہوتا ہے کان کنی کرنا۔ اس کا مقصد زمین کی مٹی کی تہوں کو کھود کر ان سے کام کی (قیمتی) چیزیں نکالنا۔ مثلاً سونا، چاندی، ہیرا وغیرہ۔ ذرا سے ہیرے کے لئے کس قدر کثیر مقدار میں مٹی کھودنی پڑتی ہے اس کا تو اندازہ کر ہی سکتے ہیں۔ یہ کام کتنا دقت طلب ہے یہ دھیان میں رکھیں تو ڈاٹا مائننگ سمجھنے میں آسانی ہوگی۔

    انٹرنیٹ جہاں معلومات کی یلغار ہے اس انبار کا ایک بڑا حصہ ایسا ہے جو کہ بے مصرف یا غیر موزوں ہے اور کسی خاص موقعے، موضوع اور شخص کے لئے کچھ خاص معلومات ہی کام کی ہوتی ہیں باقی کا سب کچھ کوڑا ہوتا ہے۔

    اس صورت حال میں ایسی تکنیک جو معلومات کے اس انبار سے کام کے پیٹرن نکال سکے اسی کا نام ڈاٹا مائننگ ہے۔

    اس کی کئی قسمیں ہیں۔

    - خرید و فروخت کی مائننگ
    - ویب مائننگ

    ویب مائننگ کی مزید اقسام ہیں۔

    - ویب لاگ یا یوزیج (استعمال) مائننگ
    - ویب کنٹینٹ (مواد) مائننگ

    اب فرداً فرداً ان کی وضاحت کرنے کی کوشش کرتا ہوں۔

    خرید و فروخت کی مائننگ: سپر اسٹورس میں ہر خرید و فروخت کا ٹرانزیکشنل ڈاٹا بیس میں ریکارڈ رکھا جاتا ہے۔ جس میں یہ لکھا جاتا ہے کہ کسی شخص نے کن کن چیزوں کی خریداری ایک ساتھ کی ہے اور کتنی مقدار میں۔ جب ایسی اطلاعات اربوں کی تعداد میں جمع ہو جاتی ہیں تو ان کی مائننگ سے کچھ چونکاؤ نتیجے برامد کئے جا سکتے ہیں۔ وہ اطلاعات کچھ اس قسم کی ہو سکتی ہیں کہ 60 فیصد حالات میں پایا گیا ہے ہیں جب بھی دودھ اور ڈائپر خریدا گیا تو بئیر بھی خریدا گیا۔ ایسے نتائج سپر اسٹورس میں سامان کو ترتیب دینے میں معاون ہوتے ہیں کہ کس چیز کو کس کے پاس رکھا جائے وغیرہ۔

    ویب لاگ یا یوزیج مائننگ: اس میں ویب یوزرس کی ویب استعمال کا ٹرینڈ دیکھا جاتا ہے کہ کون کون سی سائٹیں کس مقدار میں دیکھی جاتی ہیں۔ کس سائٹ کے ساتھ کس سائٹ کا اسوسئیشن کتنا ہے مطلب کہ کتنے ایسے صارف ہیں جو فلاں سائٹ کو دیکھتے ہیں تو فلاں کو بھی ضرور دیکھتے ہیں۔ یا فلا سائٹ کے فلا صفحے کے بعد صارفیں عموماً فلاں صفحے کو جاتے ہیں۔ یا فلاں صارف کھیل سے متعلق سائٹیں زیادہ دیکھتا ہے۔
    یہ معلومات سائٹوں کو کیٹیگرائز کرنے، سائٹوں کے صفحات کو ترتیب دینے ان میں مینو مرتب کرنے نیز ٹارگیٹڈ ایڈورٹائزنگ (معینہ اشتہار جس میں صارف کے مزاج کو سامنے رکھ کر اشتہار دیا جاتا ہے) اور اسپیم صفحات سے مقابلہ کرنے میں مفید ثابت ہوتے ہیں۔

    ویب کنٹینٹ مائننگ: اس تکنیک میں ویب ڈاکومینٹس کے مواد کو کھنگالا جاتا ہے اور اس سے کام کے پیٹرن نکالے جاتے ہیں۔ یہ سب سے زیادہ مستعمل (اور شاید مفید بھی) تکنیک ہے۔ اسے عموماً سرچ انجن استعمال میں لاتے ہیں۔ جن کی زندہ مثال گوگل، لائو، الٹا وسٹا وغیرہ ہیں جن کے چلتے آپ چند کیورڈ ڈال کر اپنی ضرورت کے حساب سے سائٹیں تلاش لیتے ہیں۔ نیز یہ مائننگ ٹارگیٹیڈ ایڈورٹائزنگ میں بھی استعمال کی جاتی ہے۔ جس میں سائٹ کے مواد کا تجزیہ کر کے اسی زمرے کے اشتہار ڈالے جاتے ہیں۔


    اوہو اتنا کچھ لکھ دیا یہ تو اچھا خاصہ مضمون بن گیا۔ بہر کیف امید ہے کہ مفید ثابت ہوگا۔
     
    • پسندیدہ پسندیدہ × 6
  3. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,403
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    بہت شکریہ ابن سعید ، ڈیٹا مائننگ کے ٹولز کون کون سے ہیں؟
     
  4. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    ڈاٹا مائننگ ابھی ریسرچ کا ٹوپک ہے۔ عموماً دستیاب ٹولس اور ایلگوریتھمس پروپرائٹی ہیں۔ اس کے باوجود اس لنک پر آپ کو دستیاب ٹولس کی قوت کا تقابلی جائزہ مل جائے گا۔
     
  5. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    پچھلے سیمیسٹر میں ڈاٹا مائنگ کے مضمون میں ایک ایلگوریتھم "پیج رینک ود ہب، اتھارٹی ویلیو" کا ڈیمونسٹریشن پروگرام ڈیویلپ کرنے کا اسئنمینٹ ملا تھا جسے میں نے جاوا اسکرپٹ کے ذریعہ کیا تھا۔ :) اور کلاس میں سب سے امتیازی نمبر حاصل کئے تھے۔ اس ایلگوریتھم میں میوچولی ری انفورسنگ (تائید باہمی) تکنیک کا ستعمال ہوتا ہے۔ شاید اس کا کوڈ میرے ہوم پیج پر دستیاب ہو پر میں وثوق سے نہی کہہ سکتا کیوں کہ عرصہ ہوا اسے اپڈیٹ نہیں کیا۔

    اس کے علاوہ ڈاٹا مائننگ کے ایپرائری ایلگوریتھم کو سریع کرنے کے لئے بھی کچھ آئیڈیاز ہیں میرے پاس جن پر کبھی فرصت ملی تو ٹیکنیکل پیپر لکھوں گا انشاء اللہ۔
     
    • پسندیدہ پسندیدہ × 2
  6. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,403
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    شکریہ ابن سعید . اس موضوع پر کوئی اچھی سے کتاب کا ربط بھی مل جائے تو کیا کہنے.
     
  7. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    اس ربط پر ڈاٹا مائننگ زمرے کی کم و بیش 50 کتابیں دستیاب ہیں۔ آپ اپنی ضرورت کے مطابق کچھ کا انتخاب کر لیں۔ ایک تو مجھے آپ کے مقصد کا علم نہیں ورنہ ممکن تھا کہ دو ایک کتابیں منتخب کرنے میں مدد دے سکتا۔ ویسے میں نے ان میں سے کوئی بھی کتاب نہیں پڑھی ہے۔

    واضح رہے کہ یہ ربط غیر قانونی طور پر کتابوں کا ذخیرہ کرنے والی سائٹ کا ہے۔ لہٰذا ناظمین محفل اصولوں کے خلاف ہونے کی صورت میں ربط محذوف کر سکتے ہیں۔
     
    • پسندیدہ پسندیدہ × 1
  8. دوست

    دوست محفلین

    مراسلے:
    13,076
    جھنڈا:
    Germany
    موڈ:
    Fine
    سبحان اللہ آپ کے اس غیر قانونی ربط نے میرا بھلا کردیا۔ مجھے سی شارپ پر کتب کی تلاش تھی اس سے امید ہے کافی مل جائیں‌گی۔ ;)
     
    • پسندیدہ پسندیدہ × 1
  9. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    یہ سچ ہے کہ یہاں تکنیکی کتابوں کا بہت بڑا ذخیرہ ہے۔ :) تقریباً سبھی نیک نام تکنیکی پبلشرس کی کتابیں یہاں دستیاب ہیں۔
     
    • پسندیدہ پسندیدہ × 1
  10. shine

    shine محفلین

    مراسلے:
    10
    text mining

    kaya ap text mining kay baray man jantay hien wo kaya hoti hai aur es kay tasks kaya kaya hien? for example classification of documents main kaisay text mining involve hoti hai?can u tell me something about this?thanks
     
  11. shine

    shine محفلین

    مراسلے:
    10
    text mining

    plz reply fast.thanks
     
  12. سیفی

    سیفی محفلین

    مراسلے:
    634
    یہ سائٹ کھلتے ہی یوزر نیم اور پاسورڈ مانگتی ہے۔ کیا یہ شرط ابھی لگی ہے یا اسکا یوزر نیم اور پاسورڈ کوئی ہے۔
     
  13. shine

    shine محفلین

    مراسلے:
    10
    text mining

    ٰplease thread to continue rakhien.and tell me about text mining
     
  14. دوست

    دوست محفلین

    مراسلے:
    13,076
    جھنڈا:
    Germany
    موڈ:
    Fine
    سیفی کبھی یہ کھل جاتی ہے اور کبھی مسئلہ کرتی ہے۔ میرے ساتھ بھی ایسے ہی ہوتا ہے۔ ابھی اس دھاگے پر اسی لیے آیا تھا کہ شاید اس ربط سے پہنچ سکوں۔ لیکن اس سے بھی وہی مسئلہ آرہا ہے۔
     
  15. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    میں نے وہ ربط درست کر دیا ہے اب انشاء اللہ یہ دقت نہیں آئے گی۔
     
  16. دوست

    دوست محفلین

    مراسلے:
    13,076
    جھنڈا:
    Germany
    موڈ:
    Fine
    بھائی اصلی ویب سائٹ کو بک مارک کیا ہوا ہے وہ بھی مسئلہ کرتی ہے۔ مجھے لگتا ہے ان کے سرور پر ہی کوئی مسئلہ ہے۔
     
  17. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    شاکر بھائی اس کا ڈومین ڈاٹ کام استعمال کیجئے ڈاٹ یو ایس نہیں۔
     

اس صفحے کی تشہیر