s. https://code.google.com/p/tesseract-...ningTesseract3 :)
Ist da schön Schritt für Schritt erklärt.
s. https://code.google.com/p/tesseract-...ningTesseract3 :)
Ist da schön Schritt für Schritt erklärt.
Danke für die zahlreichen Rückmeldungen.
Allerdings soweit ich das Beurteilen kann, wäre auch für das Training von Tesseract die originale Font Datei wichtig. Aufzutreiben ist diese Font anscheinend nicht !?!?
"Unter Windows: C:\Windows\Fonts"
Ich würde diese dann schon selbst trainieren....
Thx
+-----------------------------------------------------
| Server: ML110G7 | RAID5 | 12GB | ESXi5.5U2
| FE-Server: Ubuntu12.04 LTS (on ESXi)
| AM3-Client: Windows 2008 R2 (on ESXi)
+------------------------------------------------------
Also nachdem ich die bisherige tesseract Schriftart trainiert habe mal kurz 2 3 Kommentare meinerseits:
1. Man braucht nicht die orginale Schriftart. Das ist nur nötig wenn man sich "Training Images" erzeugen möchte.
2. Eingescannte Faxe sind leider i.d.R. nicht das wahre. Habe uhrsprünglich mal meine Schrift auf Basis von rund 20 eingescannten gebaut gehabt... mit kaum zufriedenstellendem Ergebnis. Daher kann ich nur appellieren richtig empfangene Faxe zu verwenden.
3. Habe die bisherige Schriftart nun schon an einer vielzahl von versch. Faxen testen können. Klar es findet sich immer mal wieder ein Zeichen was nicht genau so ausgewertet wird wie erwünscht aber zu 99% passt eigentlich die Schriftart was die "David Faxe" angeht. Versuchs mal damit... ;)
Wir lassen Messer und Gabel liegen ...
... um mit der "Schere" anderen zu helfen.
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)