فرہنگ اصطلاحاتِ جامعہ عثمانیہ

اسد نے 'اردو لغت پراجیکٹ‌' کی ذیل میں اس موضوع کا آغاز کیا، ‏نومبر 28, 2008

  1. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    میں نے یہ فرہنگ سکین کرنا شروع کر دی ہے۔ ابھی صرف A کے صفحات سکین کیے ہیں۔ کچھ تجربے کرنے کے بعد، باقی بھی ہوتے رہیں گے۔ کیونکہ اردو کی پرنٹنگ کچھ اچھی نہیں ہے، اس لئے ایسا کرنا ضروری ہے تاکہ امیجز کا سائز کم سے کم ہو سکے۔

    چند صفحات کے انگلش متن کو OCR بھی کیا ہے۔ مزید کام کرنے سے پہلے میں جاننا چاہوں گا کہ انگلش متن کس فورمیٹ میں رکھا جائے۔ لغت کے کام میں ڈیٹا انٹری کے لئے جو اطلاقیے استعمال ہوئے ہیں انکے لئے کیا فورمیٹ ہونا چاہئیے؟

    [​IMG]

    کیا یہ سادہ ٹیکسٹ فورمیٹ ٹھیک رہے گا؟
    لنکس نیچے دیتا جاؤں گا۔
    [Table="head"]ابتدائی لفظ|فائل سائز|ابتدائی لفظ|فائل سائز
    B کی تمام فائلیں|1.8MB|B کی ٹیکسٹ فائل| 10.1KB
    C کی تمام فائلیں|5.5MB|C کی ٹیکسٹ فائل|29KB
    D کی تمام فائلیں|2.6MB|E کی تمام فائلیں|2.1MB
    F کی تمام فائلیں۔|1.6MB|G کی تمام فائلیں۔| 1.2MB
    H کی تمام فائلیں۔|1.6MB |I کی تمام فائلیں۔| 1.7MB
    J سے L کی تمام فائلیں۔| 2.1 MB|M کی تمام فائلیں۔| 2.5 MB
    N اور Oکے سکین امیج|2.1MB|P کے سکین امیج|4.1MB
    Q اور R کے سکین امیجز۔|1.9MB|T کے سکین امیجز۔|2.3MB
    U سے Z کے سکین امیجز۔|2.5MB|A کے سکین امیجز۔ |3.7MB
    S کے سکین امیجز۔ |4.4MB||
    [/table]
    اگر ڈائریکٹ ڈاؤنلوڈ لنک کام نہ کریں تو ای سنپ کے صفحے سے ڈاؤنلوڈ کریں۔
     
    • پسندیدہ پسندیدہ × 4
    • زبردست زبردست × 1
  2. نبیل

    نبیل محفلین

    مراسلے:
    16,624
    جھنڈا:
    Germany
    موڈ:
    Depressed
    شکریہ اسد، لغت کی ڈیٹا انٹری کے سلسلے میں الف نظامی آپ کی بہتر رہنمائی کر سکیں گے۔ ویسے آپ چاہیں تو comma sepaerated ٹیکسٹ فائل میں ڈیٹا محوظ کر سکتے ہیں۔
     
    • پسندیدہ پسندیدہ × 1
  3. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    فورمیٹ ایسا ہے کہ Csv فائل میں سیو کرنے کا کوئی فائدہ نظر نہیں آتا۔ سوائے ڈبل کوٹس لگانے کے اور کچھ نہیں ہوتا۔ میں سوچ رہا تھا کہ سبجیکٹس کے نام الگ ہو جاتے تو بہتر ہوتا، لیکن یہ کسی سکرپٹ کے ذریعے ہی ہو سکتا ہے۔
    اب میں صرف امیجز کا سائز کم کرنے پر توجہ دوں گا۔
     
    • پسندیدہ پسندیدہ × 1
  4. قیصرانی

    قیصرانی لائبریرین

    مراسلے:
    45,875
    جھنڈا:
    Finland
    موڈ:
    Festive
    فائلز کو آپ شاید او سی آر کے حوالے سے سکین کر رہے ہیں۔ اس وجہ سے اردو پڑھنے میں‌مشکل ہو رہی ہے۔ اگر اسے بلیک اینڈ وائٹ پر سکین کر یں تو شاید بہتر نتیجہ نکلے
     
    • پسندیدہ پسندیدہ × 1
  5. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    میں ‭ 300 Dpi‬بلیک اینڈ وہائٹ پر ہی سکین کر رہا ہوں۔ اوپر والا امیج ری‌سائزڈ ہے، اس لئے زیادہ برا ہو گیا ہے۔ اردو متن کہیں بہت گہرا ہے، کہیں درست اور کہیں مدہم۔ مختلف سیٹنگز چیک کروں گا، کیونکہ مقتدرہ کی زیادہ تر انگلش/اردو کتب کی پرنٹنگ ایسی ہی ہے۔ ایک ہی دفعہ بہتر حل تلاش کرنا مناسب ہے۔
     
    • پسندیدہ پسندیدہ × 1
  6. قیصرانی

    قیصرانی لائبریرین

    مراسلے:
    45,875
    جھنڈا:
    Finland
    موڈ:
    Festive
    ہممم۔ میرے ذاتی مشاہدے میں 150 ڈی پی آئی بھی بالکل ٹھیک کام کرتی ہے۔ فائل کے سائز کے ساتھ ساتھ کوالٹی کا بہتر کمبی نیشن بنتا ہے۔ تاہم میری رائے سے آپ کا یا کسی اور کا اتفاق کرنا ضروری نہیں
     
    • پسندیدہ پسندیدہ × 1
  7. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,145
    برادرم اسد آپ بس اس سکین کر دیں۔ او سی آر کا استعمال کر کے اسے متن میں تبدیل کرنا ایک مزید مصیبت ہے۔ کیو‫‫ں کہ اردو متن کے باعث سب کچھ خلط ملط ہو کر رہ جائے گا۔ میں ان شاء اللہ اس کو برقیانے کے لئے بہت جلد ایک عدد اطلاقیہ بنا دوں گا۔ اس کام کو اپنی ٹو ڈو فہرست میں ڈال لیتا ہوں۔
     
    • پسندیدہ پسندیدہ × 3
  8. مہوش علی

    مہوش علی لائبریرین

    مراسلے:
    3,003
    ابن سعید کی یہ بات بالکل درست ہے۔
    بہرحال، دوسری طرف یہ بھی بہت ضروری ہے کہ انگلش کا ٹیکسٹ ہمارے پاس یونیکوڈ میں میسر ہو تاکہ ٹائپنگ کرتے ہوئے صرف اردو ٹائپ کرنا پڑے۔

    "مجھے پہلے یہ بتائیں کہ جب اردو کے صفحات کو او سی آر سے گذارتے ہیں تو ٹیکسٹ کس شکل میں سامنے آتا ہے؟

    اگر تو اردو ہی کے الفاظ ٹوٹی پھوٹی شکل میں آتے ہیں تو پھر یہ کیا جا سکتا ہے کہ تمام امیجز کی ایک ٹیکسٹ فائل بنائی جائے، اور پھر فائینڈ اینڈ ریپلیس کے ذریعے "ا" "ب" "پ" ۔۔۔۔۔ تا "ے" تک کو ٹیکسٹ فائل سے حذف کر دیا جائے۔ اس طرح آخر میں جو ٹیکسٹ بچے گا وہ صرف انگلش ٹیکسٹ پر مشتمل ہو گا۔

    بہرحال، اگر اردو ٹیکسٹ کے الفاظ کسی اور ہی شکل میں نمودار ہوتے ہیں [یعنی الف بے تے کی شکل میں نہیں، تو پھر یہ طریقہ کار نہیں آزمایا جا سکتا]۔

    نیز میں دیکھ رہی ہوں کہ اس کتاب میں ٹیکسٹ نسخ فونٹ میں ہے۔ اسکے لیے عربی کے کسی او سی آر سے فائدہ اٹھانے کی کوشش کی جا سکتی ہے۔
     
    • پسندیدہ پسندیدہ × 1
  9. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,145
    اگر آپ بآسانی انگلش ٹیکسٹ کو علیحدہ کر پا رہے ہیں جیسا کہ آپ نے اور کوٹ کیا ہے تو ٹحیک ہےخواہ پلین ٹیکسٹ ہو خواہ ڈبل کوٹیڈ۔ اس کو با آسانی مائن کیا جا سکتا ہے۔ بس علیحدہ سطروں میں ہو۔ نیز یہ کہ موضوع کو بھی علیحدہ کیا جا سکے گا۔ آپ ایسے چند صفحات فراہم کر دیجئے گا تو میں کوشش کروں گا۔ اور نتائج سے آگاہ کروں گا۔
     
    • پسندیدہ پسندیدہ × 1
  10. مہوش علی

    مہوش علی لائبریرین

    مراسلے:
    3,003
    ویسے نظامی بھائی سے رابطہ کیا جائے تو وہ ہر صورت میں ایسا اطلاقیہ لکھ کر دے سکتے ہیں جو کہ کسی بھی ٹیکسٹ فائل سے صرف انگلش ٹیکسٹ کو الگ کر لے اور باقی کو حذف کر دے۔

    جہاں تک لائن کا تعلق ہے تو او سی آر میں ویسے ہیں لائنیں بنتی ہیں جیسا کہ کتاب کے سیکن میں ہوتی ہیں۔ ہو سکتا ہے کہ اس کا ہمیں فائدہ ہو جائے اور یوں ایک اصطلاح صرف ایک لائن میں ہی آ جائے۔ [بہرحال جن اصطلاحات کا مطلب کئی لائنوں پر محیط ہیں، ان میں پرابلم ہو سکتی ہے]۔ ۔۔۔۔۔ یعنی اسکا واحد حل شاید یہ ہی ہو کہ ہاتھ سے کام کرنا پڑے۔
     
    • پسندیدہ پسندیدہ × 1
  11. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    اوپر والا ٹیکسٹ او سی آر کی آؤٹ پٹ ہے۔ ابھی میں نے B کے صفحات مکمل کیے ہیں۔ 18 صفحات کی زپ فائل 1.8 Mb کی ہے۔ ہر صفحہ کی علیحدہ Png امیج اور پلین Txt فائل ہے۔ ایک Txt فائل میں تمام صفحات کا ٹیکسٹ اکٹھا بھی ہے۔
    او سی آر صرف انگلش کے لئے ہے۔ آؤٹ پٹ ایسی ہے۔ یہ B کا پہلے صفحہ ہے۔
    کوڈ:
    [LEFT]
    B
    Baalbec (hist)
    Babeuf (hist)
    Babylon (hist)
    Babylonia (hist)
    Babylonian (hist)
    Baccate   (-atus) (bot)
    Baccate Fruits (berries)    (bot)
    Baccetum   (bot)
    Bacchus   (hist)
    Bacchylides   (hist)
    Bacheterew (astron)
    Bacillary    (med)
    Bacillary Diseases (med)
    Bacillus (bot, Med)
    Bacillus Coli   (med)
    Bacillus Coli Infection (med)
    Back (anat)
    Backache   (pathol)
    Back Boy   (pubad)
    Back E.m.f. (phys)
    (chem)
    Back-ground (hist, Lit)
    (bot)
    Backing (tech)
    Back-loading    (econ)
    Back Pressure    (phys)
    Back Stay (tech)
    Back Surface (phys)
    Backward Action (chem)
    Backward Displacement    (pathol)
    Backward Reading Vernier (phsy, Tech)
    Back Water    (agric, Phys, Tech)
    Back Wounds(   (med)
    Bacteria    (bot, Chem, Med, Physiol)
    Bacteria Action (med)
    Bacterial Action   (chem, Physiol)
    Bacterial Diseases (med)
    Bacterial Fermentation (chem)
    Bactericidal Action    (chem, Physiol)
    Bactericidal Nature   (med)
    Bactericidal Power    (chem, Physiol)
    Bactericide   (chem)
    Bacteroid (bot)
    Bacteriological Examination (pathol)
    Bacteriolysins   (chem, Physiol)
    Bacterium Coli (med)
    Bactra (hist)
    Bactria (hist)
    Bactrian   (hist)
    Badajoz    (hist)
    Bad Conductor (phys)
    Badeley M.   (hist)
    Badious    (bot)
    Bag (agirc)
    Bagdad Boil     (med)
    Bag Of Membranes   Med)
    Bagration     (hist)
    Bailly   (hist)
    Bainbridge Reflex     (chem, Physiol)
    Balance    (econ, Pathol, Phys, Tech)
    Balance (libra)    (astorn)
    Balance Case    (phys)
    Balanced Action   (chem)
    Balance Of Acconnts(econ)
    Balance Of Debit And Credit (econ)
    Balance Of Import And Export (econ)
    Balance Of Trade (econ)
    Balance Point (phys)
    Balances (econ)
    Balance Sheet (econ)
    Balance Wheel (phys)
    Balancing Columns (phys)
    Balancing Rotating Weights (tech)‬[/LEFT]
     
  12. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    • پسندیدہ پسندیدہ × 3
  13. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    14,482
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    بہت خوب اسد!!!
    ابن سعید کے بنائے ہوئے اطلاقیے چاچو ٹائپنگ ہیلپر کے ذریعے اس کو برقیانہ کیسا ہوگا۔
    براہ کرم جو لوگ برقیانے کے کام میں شامل ہونا چاہتے ہوں وہ یہاں آمادگی ظاہر کردیں۔
     
    • پسندیدہ پسندیدہ × 1
  14. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    میں اس بارے میں کچھ کہہ نہیں سکتا کیونکہ میں نے یہ اطلاقیہ استعمال نہیں کیا، لیکن میرا خیال ہے کہ یہ صرف اردو کے لئے ہے۔ اس سے پہلے انگلش اردو لغت کے لئے کیا ہوا تھا؟

    لغت میں بہت سے مسائل ہوتے ہیں جو عام اردو کتابوں میں نہیں ہوتے اور انگلش اردو لغت میں ایک اضافی مسئلہ دو مختلف زبانوں کا ہوتا ہے۔ ایک LTR اور دوسری RTL۔ بہتر تو یہی ہو گا کہ کسی ڈیٹا بیس یا سپریڈشیٹ میں کام کیا جائے تاکہ اردو اور انگلش الفاظ علیحدہ فیلڈز یا سیلوں میں رہیں۔ کیونکہ انگلش الفاظ کی لسٹ موجود ہے اس لئے یہ مسئلہ نہیں ہونا چاہئیے۔ سپریڈشیٹ سب کے کمپیوٹرز پر ہو گی، چاہے M$ Excel ہو یا اوپن آفس Calc، یا کوئی اور۔ ایک کالم میں انگلش الفاظ ہوں گے، دوسرے میں اردو الفاظ ٹائپ کرنے ہوں گے۔ اس طرح ہم بہت سے مسائل سے بچ جائیں گے۔
     
  15. مہوش علی

    مہوش علی لائبریرین

    مراسلے:
    3,003
    السلام علیکم
    میں اس بات کے بہت حق میں ہوں کہ اسد نے جو ایک سافٹ ویئر بتایا تھا کہ جس میں پوری کمیونٹی مل کر کتابوں کو ٹائپ کرتی ہے اُسے استعمال کیا جائے۔

    بہرحال، جملہ کی پراگریس دیکھتے ہوئے لگتا ہے کہ کسی نئی چیز کو انٹروڈیوز کروانا خاصا مشکل ثابت ہو گا۔ اسد، آپ کو خود کچھ اراکین کی مدد سے پہلے قدم اس سمت میں اٹھانے ہوں گے۔

    اسد برادر،
    اگر وقتی طور پر میں آپکے اس پراجیکٹ کو جملہ پر شروع کروا دوں تو آپکو کوئی اعتراض تو نہیں؟
    ///////////////////////

    مختصر بات یہ کہ میں نے جملہ پر اس پراجیکٹ کو "فرہنگ اصطلاحات" کے نام سے بطور نمونہ بنایا ہے [جہاں سب مل کر کتاب کو ٹائپ کر سکتے ہیں اور سب پراگرس سب کی آنکھوں کے سامنے ہر وقت آنلائن رہے گی]

    نمونے کا لنک یہ ہے


    مختصر تعارف
    1۔ یہاں آپ کو A تا Z تمام ابواب نظر آ جائیں گے۔
    2۔ ہر باب کے نیچے ٹائپسٹ اور پروف ریڈر کے نام، اور ہر باب پر پراگرس رپورٹ بطور نمونہ دی گئی ہے۔
    3۔ ان تمام ابواب سے اوپر کتاب کے پروجیکٹ کا تعارف کروایا گیا ہے۔ [کتاب کا نام، مصنف، پروجیکٹ لیڈر، اراکین وغیرہ]۔
    4۔ نیز میں نے یہ کیا ہے کہ حروف تہجی کے اعتبار سے امیجز کے فولڈرز کو نیٹ پر منتقل کر دیا ہے۔ اب جو بھی رکن کسی "حرف" پر کام کرنا چاہتا ہے، اسکے پاس اس حرف کے تمام امیجز یہاں پر موجود ہوں گے۔

    کام کرنے کا طریقہ
    5۔ اراکین کے پاس ہر حرف کی ٹیکسٹ فائل ہے۔۔۔۔۔ اور ہر حرف کے امیجز کی فائل بھی۔
    وہ ٹائپنگ کا کام آنلائن ایڈیٹر میں بھی کر سکتے ہیں، اور آفلائن اپنے پسندیدہ ایڈیٹر میں بھی اور بعد میں سادگی سے اسے متعلقہ آنلائن باب میں پیسٹ کر کے Save کر دیں تاکہ چیزیں نیٹ پر شائع ہو جائیں۔

    [نوٹ: ابتدا میں آپ لوگ آفلائن اپنے پسندیدہ ایڈیٹر میں کام کریں۔ جلد ہی ہم نیا آنلائن ایڈیٹر متعارف کروائیں گے جو کہ بہت ہی تیز رفتار ہو گا [موجودہ ڈیفالٹ ایڈیٹر بہت ہی سست رفتار ہے]

    6۔ کام کرنے کا طریقہ بہت آسان ہے۔
    ۔ پہلے پروجیکٹ کتاب پر جائیں۔ [لنک میں نے اوپر دے دیا ہے]
    ۔ اراکین نے جس باب پر بھی کام کرنا ہے، اس پر کلک کر کے اس باب پر پہنچ جائیں۔
    لائبریری کے ہر رکن کو ہر باب کے اوپر یہ امیج نظر آئے گا [​IMG]
    بس بالکل سادگی سے اس امیج پر کلک کریں، اور آپکے ایڈیٹر میں یہ باب لوڈ ہو کر خود بخود آپکے سامنے آ جائے گا۔
    ۔ اس ایڈیٹر باکس میں ٹیکسٹ کو پیسٹ کر دیں، اور پھر اسے Save کا بٹن دبا کر نیٹ پر شائع کر دی۔ ختم شد۔
    ۔ نہیں ٹہریے۔۔۔۔ ہر باب کے اوپر ہر ٹائپسٹ اور پروف ریڈر کو اپنا نام لکھنا ہو گا اور پراگرس رپورٹ لکھنا ہو گی۔ ۔۔۔۔ اور اب کے واقعی ختم شد۔

    مجھے پتا ہے شروع میں ہر چیز ذرا مشکل نظر آتی ہے۔۔۔۔ مگر صرف ایک دو دفعہ کام کرنے کے بعد یہ گاجر کے حلوے کی طرح آسان چیز ثابت ہو گی۔

    والسلام۔
     
  16. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    14,482
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    اسد لغت کے ڈیٹا کے اندراج کے لیے ایکسل میں کام کیا گیا تھا جس کو بعد میں اکٹھا کرکے ایکس ایم ایل میں تبدیل کرلیا گیا۔
    اگر تو چاچو ٹائپنگ ہیلپر میں متن کو ایکس ایم ایل میں محفوظ کرنے کی آپشن ڈال دی جائے تو وہ زیادہ بہتر ہوگا کیونکہ بار بار تصویر سے دیکھنا نہیں پڑے گا کہ اس اطلاقیہ میں اوپر تصویر اور نیچے ٹیکسٹ باکس موجود ہے جس سے بڑی آسانی سے برقیانے کا کام ہوسکتا ہے۔
    ورنہ ایکسل تو ہے ہی۔
     
  17. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    ایک مثال (میں ایسے کام کرتا ہوں):
    [​IMG]
     
    • پسندیدہ پسندیدہ × 1
  18. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    14,482
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    اسد میرے خیال میں ایکسل مناسب رہے گا۔ ایک کالم میں انگریزی اور دوسرے میں اردو۔
     
  19. اسد

    اسد محفلین

    مراسلے:
    1,050
    موڈ:
    Busy
    مجھے اعتراض تو نہیں ہے، لیکن اس میں کاپی رائٹ کا تھوڑا سا مسئلہ ہے۔ میں ان لوگوں میں سے ہوں جو کاپی رائٹ کا خیال رکھتے ہیں۔ لیکن اس قسم کی علمی کتابوں، خصوصاً لغت، کے بارے میں کچھ نرم گوشہ رکھتا ہوں۔ سائٹ پر لغت کا مواد کتابی متن کی صورت میں رکھنا کچھ مناسب نہیں ہے۔ ہاں اس کا مواد کسی لغت اطلاقیہ میں استعمال ہو تو وہ اور بات ہے۔ ویسے تو یہ مقتدرہ نے شائع کی تھی، اسلئے جائز/حلال ہونی چاہئیے... مرتب: ڈاکٹر جمیل جالبی۔ سال اشاعت 1991

    باقی لوگوں کا کیا خیال ہے؟

    ایک سوال: کیا جملہ میں مواد ظاہر کرنے کے لئے ٹیبل دستیاب ہیں؟ یعنی ایک سیل میں اردو اور دوسرے میں انگلش۔
     
  20. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    14,482
    جھنڈا:
    Pakistan
    موڈ:
    Cool
    اسد فی الحال اس کو ایکسل میں ہی کرتے ہیں۔
    کتابی شکل کا فیصلہ بعد میں ہوتا رہے گا۔
     
    • پسندیدہ پسندیدہ × 1

اس صفحے کی تشہیر