http://wiki.ubuntuusers.de/tesseract...ocr_trainieren
Die Programme gibts auch für Windows, die Anleitung bleibt gleich.
http://wiki.ubuntuusers.de/tesseract...ocr_trainieren
Die Programme gibts auch für Windows, die Anleitung bleibt gleich.
Wir lassen Messer und Gabel liegen ...
... um mit der "Schere" anderen zu helfen.
Danke....
dan werd ich mich mal da rein setzen :-)
Gruß MasterOfFire
Schau mal in den Thread hier, falls eure Leitstelle Cobra verwendet oder ihr eine "Schreibmaschinenschrift" auf dem Fax habt, da hat jemand Tesseract schon eine Schrift beigebracht, vielleicht funktioniert es dann auch mit eurer:
http://www.funkmeldesystem.de/foren/...0&postcount=59
Falls du den Thread schon kennst (du hattest damals auch da gepostet) dann will ich nix gesagt haben, ich vergesse manchmal auch wo ich schon überall gepostet hab...
Problem bei dem Post is, dass das Daten für eine alte Tesseract Version sind ... ==> Inkompatibel.
Ein versuch wäre es die deutschen Daten von der Tesseract Seite selber zu verwenden.
Sonst ich hab mal eine Schriftart für unsere Faxe "erlernnt" vielleicht hilft die weiter. (s.Anhang)
Notfalls erlerne ich se dir schnell ich brauch mindestens 3-4 verschiedene Faxe (je mehr desto besser) :D Rest geht eig ganz easy einfach ma "nachtippen".
Geändert von Flori95 (11.11.2012 um 09:18 Uhr)
Ich stand vor dem selben Problem. Hab mich damals dann dafür entschieden, einfach die Version 2 anstatt der Version 3 zu nehmen, da die neuen Funktionen für mich nicht relevant waren. Und in Version 2 geht dann auch die hier eingestellte Tesseract-Schrift.
Läuft alles absolut reibungslos. Probleme gibt es nur beim großen Ö was als O erkannt wird und ein paar Sonderzeichen, aber das ist so gering und selten dass die menschliche Fehlerkorrektur das ohne Probleme hin bekommt ;-)
Sers,
ich weiß ned ob das hier noch von Interesse ist aber ich hab nun aufgrund von meiner Mithilfe bei AlarmWorkflow ne bessere TrainedData erstellt.
Diese bassiert auf knapp 40-50 Faxen verschiendener ILS'sen
Derzeit vorhanden sind folgende Zeichen bzw diese wurden speziell von mir trainiert.
Desweiteren hab ich ein "Wörterbuch" mit den häufigsten Wörtern auf so einem Fax eingebaut (Straße, Stichwort,...) sodass es da zu einer höheren Trefferrate kommt.
Ich hoffe das hilft euch ggf. noch weiter.Code:'0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '-', '!', '#', '&', '(', ')', ',', '.', '/', ':', '[', ']', '‚', '+', '=', '>', 'A', 'a', 'ä', 'B', 'b', 'c', 'C', 'd', 'D', 'e', 'E', 'f', 'F', 'g', 'G', 'h', 'H', 'I', 'i', 'j', 'J', 'K', 'k', 'l', 'L', 'm', 'M', 'n', 'N', 'o', 'O', 'ö', 'Ö', 'P', 'p', 'Q', 'r', 'R', 'S', 's', 'ß', 'T', 't', 'u', 'U', 'Ü', 'ü', 'V', 'v', 'W', 'w', 'x', 'X', 'y', 'z', 'Z'
LG
Wie bekomme ich die Datei ins Tesseract
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)