Hier wurde alles schön (bildlich) beschrieben.
http://firemergency-wiki.de/mediawik...tle=FaxAnalyse
Kurz und knapp:
Wenn Tesseract verwendet wird, wird ein .tiff erwartet. Wenn ABBYY verwendet wird, dann wird eine .txt erwartet.
Hier wurde alles schön (bildlich) beschrieben.
http://firemergency-wiki.de/mediawik...tle=FaxAnalyse
Kurz und knapp:
Wenn Tesseract verwendet wird, wird ein .tiff erwartet. Wenn ABBYY verwendet wird, dann wird eine .txt erwartet.
Also mit Tesseract ist es eigentlich ohne gelernte Schrift unmöglich eine vernünftige Analyse hinzubekommen.
Auch mit euren Ersetzungen ist es unmöglich in meinen Augen damit zu arbeiten, da er 8 und 6 gleichermaßen als B behandelt.
Wäre es möglich das ihr Tesseract 2 in euer Programm einbindet, dafür hab ich eine funktionstüchtige Schrift.
Wir lassen Messer und Gabel liegen ...
... um mit der "Schere" anderen zu helfen.
Daher empfehlen wir jedem ABBYY Finereader
Nutzt Tesseract 2 die gleichen Aufruf-Parameter wie Tesseract 3? Wenn ja, dann sollte es bereits jetzt gehen, indem du als Pfad die V2 angibst und nicht die V3.
Aber wie feodor schon gesagt hat:
Ich kann nur ABBYY empfehlen. Wir bekommen kein Geld von denen weil wir Werbung machen oder ähnliches. Wir nutzen es nur selbst, und meine Erfahrung zeigt bisher, dass die Erkennung eigentlich perfekt ist. Und wenn sie nicht perfekt ist, kann man sie ganz einfach (nicht wie bei Tesseract) trainieren.
Auch mit dem Layout des Faxes hat ABBYY keine Probleme, weil man das ganz einfach angeben kann.
Holt euch die Testversion und probiert es einfach 30 Tage aus. Ich kann es 100% empfehlen !
Schade, scheint nicht zu gehen.
Bekomme diese Fehlermeldung.
11:08:02 [INFO] [Timer-2] [FaxInput][422] Fax 2011105_10-31_ALARMFAX.tif hinzug
f³gt
11:08:02 [ERROR] [Timer-2] [FaxInput][433] Fehler beim Scannen des Dokumentes
org.apache.commons.exec.ExecuteException: Process exited with an error: 1 (Exit
value: 1)
at org.apache.commons.exec.DefaultExecutor.executeInt ernal(DefaultExecu
or.java:377)
at org.apache.commons.exec.DefaultExecutor.execute(De faultExecutor.java
160)
at org.apache.commons.exec.DefaultExecutor.execute(De faultExecutor.java
147)
at faxInput.TesseractOCR.OCR(TesseractOCR.java:66)
at faxInput.FaxInput$FaxTask.run(FaxInput.java:425)
at java.util.TimerThread.mainLoop(Unknown Source)
at java.util.TimerThread.run(Unknown Source)
Wir lassen Messer und Gabel liegen ...
... um mit der "Schere" anderen zu helfen.
Die Texterkennung (Buchstaben) habe ich in ABBYY soweit im Griff. Das mit dem Layout bekomme ich aber nicht hin, selbst wenn ich die Anleitung des Programms nach dem Wort "Layout" durchsuche werde ich nicht schlauer, wo ich vordefinierte Layouts hinterlegen kann.
Mein Problem ist das er manchmal das Layout so komisch macht, das es in der .txt danach komplett durcheinander ist.
Einfach nen kleinen Tipp wo man es im Programm einrichten kann würde mir reichen.
Danke und Gruß,
FFSSBZ
Das Problem hatten wir auch (vor allem mit Tabellen). Lässt sich sehr einfach lösen:
1. Öffne FineReader
2. Öffne ein Beispiel-Fax
3. Klicke in das Fax und ziehe einen Rahmen (über die komplette Seite)
4. Im rechten oberen Eck des Rahmens, kannst du den Typ des Rahmens festlegen. Wähle hier "Text"
5. Klicke nun auf "Lesen" (jetzt sollte alles korrekt eingelesen und formatiert werden)
6. Gehe auf "Bereich" > "Bereichsvorlage speichern" und speichere diese Vorlage
In HotFolder
7. Unter "Schritt 3" deines Taskes, gibt es den Punkt "Einstellungen für die Dokumentenanalyse". Dort wählst du unter "Vorlage verwenden" deine eben erstelle Bereichsvorlage aus
Das wars. Jetzt sollten die Ergebnisse perfekt sein!
Hallo. Habe das Fax Input Plugin nun getestet.
Ich habe nur ein Kleines Problem. Bei uns ist das Fax folgendermasen aufgebaut (siehe Anhang)
bei Ort: 12345 GENANNTERORT - GENANNTERORT IM ROTTAL
ist es hier möglich nach dem - (Bindestrich) zu suchen und alles was dahinter ist Abzuschneiden?
Wie Kann ich die Bemerkung am Ende des Fax mit Einbinden?
bei den Schlüsselwörter verwende ich
EINSATZORT;Abschnitt;likestraße
Abschnitt;Objekt;likeort
Schlagw.;Stichwort;likeschlagwort
das Ergebnis ist:
Straße: xxxxxxxx Haus-Nr.: xxxxxxxxxxx
Ort: 12345 xxxxxxxxxx
B3 Brand Wohnhaus
in den Ersetzungen.txt kann ich schlecht schreiben: Straße:; oder Ort:;
wie bekomme ich nur z.B Musterstraße 1 12345 Musterstadt?
Abschnitt;-;likeort
Probier das mal.
Vielleicht schneidet er dann alles ab dem Bindestrich weg.
Wir lassen Messer und Gabel liegen ...
... um mit der "Schere" anderen zu helfen.
Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)