Ich habe mich nur gefragt, wie genau Tesseract für die Handschrifterkennung sein kann, wenn es mit Großbuchstaben in eigenen kleinen Kästchen in einem Formular verwendet wird.
Ich weiß, dass Sie es trainieren können, Ihre eigene Handschrift etwas zu erkennen, aber das Problem in meinem Fall ist, dass ich es für mehrere Handschriften verwenden muss. Kann mich jemand in die richtige Richtung weisen?
Vielen Dank.
Kurz gesagt, Sie müssten die Tesseract-Engine trainieren, um die Handschrift zu erkennen. Schau dir mal diesen Link an:
Tesseract-Handschrift mit Wörterbuchtraining
So steht es im verlinkten Beitrag:
Es ist möglich, Tesseract zu trainieren, um Handschrift zu erkennen. Hier sind die Anweisungen:
https://tesseract-ocr.github.io/tessdoc/Training-Tesseract
Aber erwarten Sie keine sehr guten Ergebnisse. Akademiker haben in der Regel Genauigkeitsergebnisse von über 90 % erzielt. Hier sind ein paar Referenzen für Wörter und Zahlen. Wenn Ihr Anwendungsfall also mit mindestens 1/10 Fehlern umgehen kann, könnte dies für Sie funktionieren.
Auch hier ist ein guter wissenschaftlicher Artikel zu diesem Thema:
Erkennung von handschriftlichen Textanmerkungen mit Tesseract Open Source OCR Engine für Informationen Just In Time (iJIT)