Akkaas! The OCR

الف نظامی نے 'اردو او سی آر پر تحقیق' کی ذیل میں اس موضوع کا آغاز کیا، ‏دسمبر 15, 2008

  1. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,106
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    Its an OCR that recognizes Urdu text optically from an offline image in any format and generates an Urdu document file easily editable in any word processor including MS Word.
    It is generally based on the flexible Ligature Recognition Engine which can be used to develop any kind of customized text recognition software according to the specific needs of the client depending upon the font. It accepts input in the form of different image formats taken from an image capturing device like scanner. It extracts each ligature’s geometry from that input image and generates a polar map which is RTS invariant. This polar image is analyzed in the frequency domain. The Fourier coefficients are obtained from the so obtained frequencies. These coefficients are then used as features to recognize a specific ligature. Nastalique Font of Urdu is in progress and more than 1500 ligatures of different sizes have been tested using the technique with an accuracy of 92%.It is being developed as a Final Year Project and it is still in progress.


    بحوالہ
     
    • پسندیدہ پسندیدہ × 4
  2. arifkarim

    arifkarim معطل

    مراسلے:
    29,828
    جھنڈا:
    Norway
    موڈ:
    Happy
    شکریہ۔ ابن سعید کے کام آئے گا!
     
    • پسندیدہ پسندیدہ × 1
  3. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,106
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    Fourier coefficients are commonly used for shape description because they are invariant to scale, rotation and translation.
    کیا کوئی بتائے گا کہ یہ polar map کیا ہوتا ہے؟ اور RTS invariant کیا چیز ہے؟
     
    • پسندیدہ پسندیدہ × 1
  4. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    پولر سسٹم کو آرڈینیٹ‌ سسٹم کا وہ نظام ہوتا ہے جس میں X اور Y ایکسس کے بجائے ایک نقطہ سے دوری اور اس سے نکلی معین شعاع سے زاویوں کی مدد سے کسی نقطے کی نشاندہی کی جاتی ہے۔ اس نقطے کو اس کوآرڈینیٹ نظام کا پول کہتے ہیں۔

    اس نظام میں اگر کسی آبجیکٹ کا خاکہ بنایا جائے تو آبجیکٹ کے مختلف نقطوں کا ایڈریس قطب سے اس کی دوری اور بنیادی شعاع پر اس نقطے کے ذریعہ قطب سے بنے زاویے کا مرتب جوڑا ہوگا۔ ایسے خاکے گھماؤ سے آزاد اس طور ہوتے ہیں کہ کسی بھی حالت میں ہوں ان کے کنھیں بھی دو نقاط کی قطب سے دوری کا فرق اور کنھیں بھی دو نقاط کے ذریعہ قطب پر بنا زاویہ ہمیشہ غیر مبدل ہوگا۔ ایسے خاکے فنگر پرنٹ ریکگنیشن میں بھی انتہائی مدد گار ہوتے ہیں۔ کیوں کہ استعمال کرنے والا اسکینر پر اپنے انگلیوں کے نشان کسی بھی طرح چھوڑ سکتا ہے۔
     
    • پسندیدہ پسندیدہ × 4
  5. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,106
    جھنڈا:
    Pakistan
    موڈ:
    Amused
  6. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,106
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    RTS invariant
    یعنی rotation translation scale invariant
     
  7. الف نظامی

    الف نظامی لائبریرین

    مراسلے:
    16,106
    جھنڈا:
    Pakistan
    موڈ:
    Amused
    ابن سعید ، کیا یہاں تمام ترسیمہ جات کے فورییرر عددی سروں کے ڈیٹا بیس سے "سیگمنٹیڈ امیج کے فورئیرر عددی سر کا تقابل" کا الگورتھم لگتا ہے؟
     
  8. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    میں پچھلے پیغام میں مزید وضاحت کے لئے تبدیلی کر رہا تھا پر اس میں اسکیل انویرینس کی بات رہ گئی۔ اگر زاویے کو دیکھا جائے تو یہ از خود اسکیل انویرینٹ ہوتا ہے جب کہ قطب سے دوری اسکیل انویرینٹ نہیں ہوتی۔ پر عموماً‌ ایسے کاموں کے لئے ہمیں‌ صرف نقاط کے زاویوں کا مجموعہ ہی کافی ہوتا ہے۔

    اور ہاں میرا مطالعہ اس سمت زیادہ تو نہیں پر آثار یہی ہیں کہ ترسیموں کی پہچان کے لئے فورئر کا ہی سہارا لیا جاتا ہوگا۔
     
    • پسندیدہ پسندیدہ × 1
  9. arifkarim

    arifkarim معطل

    مراسلے:
    29,828
    جھنڈا:
    Norway
    موڈ:
    Happy
    کیا اسکام کیلئے نوری نستعلیق کے تمام ترسیمہ جات کی گلفس امیجز درکار ہوں گیں؟
     
  10. ابن سعید

    ابن سعید خادم

    مراسلے:
    60,165
    جی ہاں عارف بھائی ویکٹر امیجز۔
     
  11. نبیل

    نبیل محفلین

    مراسلے:
    16,743
    جھنڈا:
    Germany
    موڈ:
    Depressed
    میں ایک پروگرام کو فائنل کر رہا ہوں جس کے ذریعے کسی بھی فونٹ کے تمام گلفس کو بطور جف امیج ایکسپورٹ کیا جا سکے گا۔ لیکن ان کو ویکٹر امیج میں علیحدہ سے ٹریس کرنے کی ضرورت پیش آئے گی۔ ویسے ٹروٹائپ فونٹس کے گلفس کے curve ڈیٹا کو پڑھنا اور ان پوائنٹس کو فائل میں لکھنا بھی ممکن ہے۔ ضرورت پڑنے پر اس کے لیے بھی ٹول لکھا جا سکتا ہے۔
     
    • پسندیدہ پسندیدہ × 3
  12. arifkarim

    arifkarim معطل

    مراسلے:
    29,828
    جھنڈا:
    Norway
    موڈ:
    Happy
    شکریہ نبیل بھائی، میرا اشارع اسی طرف تھا ;)
     
  13. علوی امجد

    علوی امجد محفلین

    مراسلے:
    300
    جھنڈا:
    Pakistan
    موڈ:
    Brooding

    مجھے اس میں کوئی ڈاؤن لوڈ لنک نظر نہیں آیا۔
    کیایہ سافٹ وئیرکہیں سے ڈاؤن لوڈ ہوسکتا ہے یا صرف تعارف ہی ہے؟
     
  14. عمران القادری

    عمران القادری محفلین

    مراسلے:
    725
    علوی بھائی یہ صرف ایک تعارف ہے۔ اس میں ڈاؤن لوڈ لنک موجود نہیں‌ہے۔
     

اس صفحے کی تشہیر