PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Fax-Erkennung: Professionelle Anbieter oder Open Source?



firEmergency
02.05.2012, 20:16
Hi,
es gibt ja bereits einige Produkte (auch hier im Forum), welche sich mit der Alarmfax-Auswertung beschäftigen.

Das wichtigste dabei ist ja die OCR-Erkennung (Bild in Text-Umwandlung). Hierbei werden meistens Open-Source Varianten (cuniform oder tesseract) verwendet.
Allerdings schwankt deren Qualität mehr oder weniger. Ein Schriftarten-Training hilft dabei die Qualität zu verbessern.
Der Vorteil ist natürlich der, dass das alles kostenlos ist.

Nun meine Frage:

Wer wäre bereit, für eine hoch professionelle OCR-Erkennung auch Geld auszugeben?

Ich würde jetzt hier mal als Beispiel die Engine von ABBYY nennen. Diese sind Profis im Bereich OCR-Erkennung (ABBYY Fine Reader).
Allerdings kostet deren Lizenz natürlich Geld.
Dafür erhält man allerdings eine nahezu 100%ige Erkennung OHNE Schriftarten-Training etc.

Als Beispiel hab ich mal ein Fax der ILS Würzburg angehängt (ist ein Musterfax von deren Website).

Das Resultat der Erkennung:



27-04-2012 12:22:33
fax-senden.de p.01
ILS Bayern Alarmschreiben
Nr: B 8.1 080407 628
ID:3985581
Montag, 07.04.2008 13:25:02 Einsatzart: Brand Nr:B 8.1 080407 628 Priorität: 1

SCHLAGWORT:
STICHWORT B:
STICHWORT R:
Zimmerbrand
B 3
RD 2
— EINSATZORT ---------------
Straße: Bahnhofsplatz 4
Obj / Abt: /
Melder:
Kreuzung:
PLZ/Ort:
Ortsfeuerwehr:
- ZIELORT
Straße:
Obj / Abt: /
Kreuzung:
PLZ/Ort: /
Ortsfeuerwehr:
97318 / Kitzingen
FF Kitzingen
STICHWORT T:
STICHWORTS:
Ortsteil: Kitzingen
Gemeinde: Kitzingen
Kreis: Kitzingen
ILS; ILS Würzburg
PLANNUMMER:
Ortsteil:
Gemeinde:
Kreis:
ILS:
---MITTEILER ------------------------------------
Name: Huber GErhard
TelefonNr: 1234567898
Adresse: Straße:
PLZ /Ort: /
— HINWEISE aus strukturierte Notrufabfrage
PATIENT
Name:
Transportart:
Nr:
HINWEISE aus Freitext
Rauch aus Fenster im 2. OG, 3 Personen stehen am Balkon, Wohnungsinhaber wird vermisst
---EINSATZMITTEL ------------------------------------------------------------------
aldep.rpt
V: 26.07.2007
12:54:50
Druckdalum: 07.04.2008 13:27:56
Seile 1 von 4
gedruckt von:Dürr Georg



Ich persönlich muss sagen bin begeistert. Das Ergebnis übertrifft alle Versuche mit den Open-Source Varianten.


Wie ist eure Erfahrung in dem Bereich?
Ich denke vor allem wenn Tetra kommt (ja ich weiß!), könnte auf längere Sicht ein Fax die einzige Möglichkeit sein, eine kostengünstige Zusatzalarmierung zu realisieren.

FFSSBZ
02.05.2012, 22:39
In welchem Geldbereich bewegen wir uns denn wenn wir von "etwas zu bezahlen" sprechen?

Wenn ich mir das Output der Texterkennung anschaue bin ich echt begeistert, hätte kein Problem bis zu 50€ einmalig zu zahlen.

112Fireman112
03.05.2012, 00:11
Ja, wichtig wäre zu wissen von wieviel EUR wir sprechen.

felix000
03.05.2012, 00:18
Ich hab vor einiger Zeit mal mit Cuneiform getestet und sehr gute Ergebnisse mit dem Faxmodus erzielt...

firEmergency
03.05.2012, 12:11
Zum Thema kosten wissen wir auch noch nicht viel mehr. Wir sind da gerade beim verhandeln.

Ich persönlich hoffe einen zweistelligen Preis zu erzielen. Aber eine so gute OCR-Engine ist definitiv nicht umsonst zu haben.


Was ich noch anmerken möchte:

Bei dem Beispiel-Output-File wurde KEINE Ersetzung meinerseits vorgenommen. Es wurde also 1 zu 1 so von ABBYY-Engine zurückgeliefert.
Bei den Open Source Lösungen gibt es ja doch immer wieder "Ersetzungslisten" die häufig gemachte Fehler der Engine ersetzen sollen.

firEmergency
03.05.2012, 17:34
Nochmal zum Thema Preis:

Als grober Richtwert könnten wir uns bei 20 bis 30 Cent pro Fax bewegen.

Wir sind mit ABBYY im Kontakt um das genau zu klären.

FFSSBZ
03.05.2012, 18:49
20 bis 30 Cent pro Fax finde ich persönlich zu viel, wenn man überlegt dass es dann jedes Jahr wiederkehrende Kosten sind ...

Narkose07
03.05.2012, 20:58
Also meiner Erfahrung nach sind die Open Source Programme dennoch sehr gut!!!
Denke, dass es nicht die luxus Variante sein muss.

feodor
03.05.2012, 21:13
Ich bin am verhandeln, aber der erste Vorschlag war ein Preis, den sicher keiner bezahlen möchte :-)

Welchen Preis wäre euch das wert für eine einmalige, dauerhafte Lizenz. Ohne Folgekosten.

zatsch
03.05.2012, 23:55
Hi,

ich bin auch der Meinung, dass eine "nicht 100%ige" Auswertung zu verkraften wäre.
Da die Faxe sich ja nicht wirklich in ihrer Art voneinander unterscheiden (man bekommt Diese idR immer vom gleichen Leitrechner) wird sich mithilfe einer einmaligen Anpassung doch so einiges machen lassen.

Und wenn dann im Text mal ein (Sonder)zeichen nicht korrekt dargstellt wird, macht das nun auch nicht unbedingt so viel aus.

Viele Grüße
Sascha

chrish
04.05.2012, 08:53
Dem ist nichts mehr hinzuzufügen!

Dr.MirakulixX
04.05.2012, 09:36
Also bei uns gibt das die Faxe so gar nicht. Wir haben nur den DME, zumindest FF mässig. Eine 100%ige Auswertung ist nicht erforderlich schreibst du. Gut auf der einen Seite gebe ich dir recht denn auch ein Programm was das "Professionell" macht kann Fehler machen aber ich finde sowas ist mit Vorsicht zu geniessen, gerade was mit Ersetzten. Zugegeben ist weit hergeholt aber möglich : Die Einheit war im letzten Jahr 3 mal auf der Burg Str. also merkt sich der Rechner das Wort Burg ganz gut. Heute kommt aber ein Brand auf der Berg Str. der Rechner ist sich nicht sicher und entscheidet Burg Str. weil er dieses ja kennt.
Gut an sich kein Problem man sollte ja das Fax noch ansehen. Aber jetzt weiss ja jeder ach schon wieder die Burg Str... und los gehts.
Klar gehört das zu Kategorie mega Dumm gelaufen, aber will mal behaupten nicht unmöglich.
Aber das ist ganz alleine meine Meinung.

firEmergency
04.05.2012, 09:59
So ähnlich sehe ich es auch.
Es macht überhaupt nichts aus, ob da jetzt "Zimmerbrand" oder "Zimnerbrand" in der SMS steht.
Jeder weiß was gemeint ist.

Wenn es aber um solch sensible Daten wie die Adresse geht, bin ich mit Rechtschreibfehler sehr pingelig.

Ich denke auch es ist eine Sache, wie man eine Alarmfax-Analyse einsetzt. Wenn man es nur zu seiner persönlichen Informationen benutzt, reichen OpenSource-Lösungen eigentlich aus.
Soll aber das Alarmfax an 20 oder 30 Leute verteilt werden, bin ich persönlich der Meinung, wenn ich schon 30 SMS bezahlen muss, dann kann ich auch nochmal 30 Cent pro Alarm bezahlen.

Narkose07
04.05.2012, 11:00
Kurze Frage: Wie bekomm ich das Fax vom FFW Haus in FE? Bin da noch nicht ganz durchgestiegen.

Dr.MirakulixX
04.05.2012, 11:14
Am günstigsten bzw einfachsten FE im Gerätehaus. Fax nicht in Papierform sondern auf dem Rechner Empfangen und als Grafik verarbeiten. Wenn du das Fax natürlich in Papierform erhälst und es erst Scannen musst um es auszuwerten... naja ähhh Dumm gelaufen. Oder Fax nachhause weiterleiten.

Narkose07
10.05.2012, 21:02
Am günstigsten bzw einfachsten FE im Gerätehaus. Fax nicht in Papierform sondern auf dem Rechner Empfangen und als Grafik verarbeiten. Wenn du das Fax natürlich in Papierform erhälst und es erst Scannen musst um es auszuwerten... naja ähhh Dumm gelaufen. Oder Fax nachhause weiterleiten.

Geht es auch, wenn die Fax als Anhang in einer Email kommt?

firEmergency
11.05.2012, 07:43
Prinzipiell ja.
Du musst nur dafür sorgen, dass der Anhang in den entsprechenden Überwachungs-Ordner landet.

Bei genügend Nachfrage, werden wir eventuell unser Mail-Input-Plugin soweit anpassen, dass es Anhänge in einen speziellen Ordner speichert. Somit würde dies funktionieren.

Narkose07
11.05.2012, 08:36
Hört sich gut an!
Somit wird das Plugin schon langsam interessant;)

Bayerfire
24.05.2012, 14:08
Prinzipiell ja.
Du musst nur dafür sorgen, dass der Anhang in den entsprechenden Überwachungs-Ordner landet.

Bei genügend Nachfrage, werden wir eventuell unser Mail-Input-Plugin soweit anpassen, dass es Anhänge in einen speziellen Ordner speichert. Somit würde dies funktionieren.

Das wärs !!!
Dann noch anpassen das es gleich automatisch mehrmals (eines für jedes Fahrzeug) ausgedruckt wird und ich wär begeistert :)

Narkose07
24.05.2012, 14:19
Das wärs !!!
Dann noch anpassen das es gleich automatisch mehrmals (eines für jedes Fahrzeug) ausgedruckt wird und ich wär begeistert :)

Nicht nur du;)

FFSSBZ
24.05.2012, 18:46
Wurde denn mittlerweile entschieden ob es eine Open Source oder eine Professionelle Version gibt?

firEmergency
24.05.2012, 19:05
Also wir werden definitiv OpenSource verwenden.
Dabei wird der User die Wahl haben zwischen Cuniform oder Tesseract. Je nach dem was er präferiert.
Ich persönlich habe aktuell gute Erfahrung mit Tesseract gemacht, ohne das ich irgendwelche eigenen Trainingsdaten eingegeben habe. Ich verwende dazu die offiziellen Deutschen Trainingsdaten von Tesseract direkt.

Wir planen aber auch CloudOCR von ABBYY einzubinden. Dieser Dienst berechnet die Schrifterkennung über eigene OCR-Server von ABBYY im Internet. Dabei wird das Fax an deren Server gesendet und der Server liefert die Daten zurück.

Eine besser OCR Engine wird es wohl auf dem Markt nicht geben.

Allerdings müsste dann das Thema Abrechnung noch geklärt werden, da ja pro Umrechnung ein Betrag fällig wird.

Das ist jetzt alles nicht in Stein gemeißelt, aber eine Auswahl von allen drei Diensten wäre für mich die Beste Variante.

112Fireman112
24.05.2012, 19:25
Hi,

könntet ihr ein Fax von mir testen? Ich habe bis jetzt mit allen opensource Anwendungen Probleme gehabt. In unserem Fax sind Striche mit denen die Erkennung nicht ganz klar kommt.

Wäre echt super, wenn das klappen würde.

Gruß

Sven0705
09.07.2012, 03:02
Was eventuell noch interessant wäre, wäre die Verarbeitung eines Alarmfaxes, das in E-Mail-Form kommt (also Plain-Text). Da brauchts dann auch kein OCR für ;-)

firEmergency
09.07.2012, 09:33
Das kann ja unsere Software (firEmergency) bereits. Eingehende Email als Alarmierungsgrundlage verwenden und weiterleiten (SMS, Anruf, etc.)