PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Einsatzmonitor - tesseract und traineddata



2Maik2
18.06.2017, 01:30
Hallo,

ich benötige Hilfe bei dem Erstellen einer traineddata-datei für tesseract.
Dabei beziehe ich mich auf diesen foreneintrag:

https://www.funkmeldesystem.de/archive/index.php/t-55649.html


-> wie kann ich eine traineddata datei selber erstellen?
-> aktuell funktioniert die Umwandlung von PDF zu einer Tiff und die Auflösung ist auch sehr gut, aber an einigen Stellen ist die Erkennung nicht richtig.


hat zu diesen Thema jemand Erfahrung?

2Maik2
27.06.2017, 06:27
Ich habe den ersten Schritt selber herausgefunden

> jTessBoxEditor - da kann die TIFF Datei hochgeladen werden und die BOX-Datei erstellt werden -> da müssen die Pfade im Editor angepasst werden
> nun kann jeder Buchstabe angelernt werden - zwischenspeichern nicht vergessen ;-)
> Serak tesseract trainer -> Tiff Datei hochladen (zieht die BOX Datei mit) traineddata kann erstellt werden

!!! WICHTIG !!!
bei dem Serak-tool gibt es eine configdatei -> die unbedingt anpassen und zwar wo tesseract liegt, dann funktioniert es

Aktuell tüftle ich noch daran, mehrere PDF´s zu einer traineddata datei zusammenzuschließen - falls Erfahrungen, bitte schreiben ;-)