Ergebnis 1 bis 2 von 2

Thema: Einsatzmonitor - tesseract und traineddata

Hybrid-Darstellung

Vorheriger Beitrag Vorheriger Beitrag   Nächster Beitrag Nächster Beitrag
  1. #1
    Registriert seit
    18.06.2017
    Beiträge
    2

    Einsatzmonitor - tesseract und traineddata

    Hallo,

    ich benötige Hilfe bei dem Erstellen einer traineddata-datei für tesseract.
    Dabei beziehe ich mich auf diesen foreneintrag:

    https://www.funkmeldesystem.de/archi...p/t-55649.html


    -> wie kann ich eine traineddata datei selber erstellen?
    -> aktuell funktioniert die Umwandlung von PDF zu einer Tiff und die Auflösung ist auch sehr gut, aber an einigen Stellen ist die Erkennung nicht richtig.


    hat zu diesen Thema jemand Erfahrung?

  2. #2
    Registriert seit
    18.06.2017
    Beiträge
    2
    Ich habe den ersten Schritt selber herausgefunden

    > jTessBoxEditor - da kann die TIFF Datei hochgeladen werden und die BOX-Datei erstellt werden -> da müssen die Pfade im Editor angepasst werden
    > nun kann jeder Buchstabe angelernt werden - zwischenspeichern nicht vergessen ;-)
    > Serak tesseract trainer -> Tiff Datei hochladen (zieht die BOX Datei mit) traineddata kann erstellt werden

    !!! WICHTIG !!!
    bei dem Serak-tool gibt es eine configdatei -> die unbedingt anpassen und zwar wo tesseract liegt, dann funktioniert es

    Aktuell tüftle ich noch daran, mehrere PDF´s zu einer traineddata datei zusammenzuschließen - falls Erfahrungen, bitte schreiben ;-)

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •