Verwenden von Tesseract für die Handschrifterkennung

Lesezeit: 2 Minuten

Ich habe mich nur gefragt, wie genau Tesseract für die Handschrifterkennung sein kann, wenn es mit Großbuchstaben in eigenen kleinen Kästchen in einem Formular verwendet wird.

Ich weiß, dass Sie es trainieren können, Ihre eigene Handschrift etwas zu erkennen, aber das Problem in meinem Fall ist, dass ich es für mehrere Handschriften verwenden muss. Kann mich jemand in die richtige Richtung weisen?

Vielen Dank.

Verwenden von Tesseract fur die Handschrifterkennung
hcham1

Kurz gesagt, Sie müssten die Tesseract-Engine trainieren, um die Handschrift zu erkennen. Schau dir mal diesen Link an:

Tesseract-Handschrift mit Wörterbuchtraining

So steht es im verlinkten Beitrag:

Es ist möglich, Tesseract zu trainieren, um Handschrift zu erkennen. Hier sind die Anweisungen:
https://tesseract-ocr.github.io/tessdoc/Training-Tesseract

Aber erwarten Sie keine sehr guten Ergebnisse. Akademiker haben in der Regel Genauigkeitsergebnisse von über 90 % erzielt. Hier sind ein paar Referenzen für Wörter und Zahlen. Wenn Ihr Anwendungsfall also mit mindestens 1/10 Fehlern umgehen kann, könnte dies für Sie funktionieren.

Auch hier ist ein guter wissenschaftlicher Artikel zu diesem Thema:

Erkennung von handschriftlichen Textanmerkungen mit Tesseract Open Source OCR Engine für Informationen Just In Time (iJIT)

  • Danke! Das war sehr hilfreich.

    – Dohle

    20. September 2016 um 2:37 Uhr

  • @hcam1 Wie vergleicht sich Tesseract in Bezug auf die Genauigkeit mit anderen OCR-as-a-Service-Anwendungen?

    – Ted Taylor des Lebens

    21. Februar 2017 um 20:29 Uhr

  • Zu Ihrer Information, ich habe Tesseract für R verwendet, aber mit der Handschrifterkennung keine sehr genauen Ergebnisse erzielt. Haben Sie versucht, es in R zu verwenden?

    – Der harte Dave

    26. September 2018 um 4:24 Uhr

  • Ich habe in R persönlich nicht verwendet, aber Sie müssen die Engine trainieren, um die Handschrift zu erkennen. Sie sollten auch Schritte in Ihren Formularen unternehmen, die Sie erkennen müssen, um die Chance auf eine gute Anerkennung zu erhöhen. Hier ist ein Forumsbeitrag mit Informationen darüber, wie Sie Ihre Formulare gestalten können, um die genauesten Ergebnisse zu erhalten: leadtools.com/support/forum/posts/…

    – hcham1

    3. Oktober 2018 um 14:16 Uhr

  • @TedTaylorofLife, tesseract as-is ist im Vergleich zu anderen OCR-as-a-Service-Anwendungen nicht sehr gut, aber es gibt Ihnen eine Basis, um mit Ihrer Anwendung zu arbeiten und sie an Ihre Anwendung anzupassen (da es Open Source ist). Wenn Sie nicht die Zeit haben, Tesseract zu schulen und anzupassen, sind Closed-Source-OCR-as-a-Service-Anwendungen wahrscheinlich genauer, da sie über Ingenieure und Ressourcen verfügen und bereits die meiste Arbeit für Sie erledigt haben.

    – hcham1

    3. Oktober 2018 um 14:27 Uhr

997120cookie-checkVerwenden von Tesseract für die Handschrifterkennung

This website is using cookies to improve the user-friendliness. You agree by using the website further.

Privacy policy