Zitat Zitat von firEmergency Beitrag anzeigen
Eure Vorschläge?
Mein Vorschlag, aus der (sehr positiven) Erfahrung mit openfiresource heraus:

Dort kann im Übrigen zwischen Tesseract und Cuneiform als OCR Software gewählt werden, standardmässig wird letzteres verwendet. Was mich ein wenig wundert, ist der Begriff "Schriftartentraining"?! Cuneinform liefert mit der (simplen) Einstellung "einspaltig, deutsch" zu 99% perfekte Ergebnisse. Härtefälle wie "ß --> B" wird es in jeder Software geben, aber das lässt sich bei dem sehr begrenzten Wortschatz eines Alarmfaxes (Alle Stichwörter sind bekannt, alle Straßen im Einsatzgebiet und alarmierbare Fahrzeuge auch) leicht durch Textersetzungen lösen.

Hauptproblem ist bei openfiresource ist, dass die individuellen Anpassungen für ein spezielles Alarmfax vor dem Kompilieren im Quellcode festgelegt werden müssen. Wenn man die Einstellungen in eine GUI "rausziehen" würde, sehe ich technisch überhaupt kein Problem für die Umsetzung eines ähnlich/genauso gestalteten Fax Input-Plugins für FE.

Konkreter Vorschlag:

Programmierung eines Plugins, dass einen (frei wählbaren) Ordner alle x Sekuknden auf eingehende Faxe (*.tif) überwacht und bei Eingang diese einer Texterkennung zuführt.

Einstellungsmöglichkeiten:
*Eine vom Benutzer verwaltbare Tabelle mit Textersetzungen (z.B. StraBe --> Straße)

*Eine vom Benutzer anpassbare Liste zur Zuordnung von im Text gefundenen Wörtern zu Variablen z.B. (Falls Wort "Schlagw." im *.tif gefunden, Variable %Stichwort = Zeileninhalt der nach "Schlagw. :" kommt.)

*Möglichkeit einen Alarmtext aus den einzelnen Variablen zu basteln (%Datum, %Uhrzeit, %Stichwort, %Strasse %Hausnummer) etc.

Daraus könnten dann (Blacklist/Whitelist) je nach Wunsch und Stichwort individuelle Einheiten alarmiert werden.