Ergebnis 1 bis 15 von 182

Thema: Alarmfax Auswertung & Anzeige

Hybrid-Darstellung

Vorheriger Beitrag Vorheriger Beitrag   Nächster Beitrag Nächster Beitrag
  1. #1
    Registriert seit
    27.02.2002
    Beiträge
    5.256
    Zu dem Auswerteprogramm?
    Ich kenne keins.
    Wir lassen Messer und Gabel liegen ...
    ... um mit der "Schere" anderen zu helfen.

  2. #2
    Registriert seit
    28.01.2007
    Beiträge
    696
    Schade dan werd ich meine Arbeit einstellen müssen....


    Danke
    Gruß MasterOfFire

  3. #3
    Registriert seit
    16.12.2004
    Beiträge
    1.102
    Ich habe mal eine Frage an alle Tesseract-Nutzer:

    Ich habe, inspiriert von diesem Thread, auch eine Alarmauswertung geschrieben. Da wir ein paar andere Funktionen brauchen bzw. diese anders realisieren müssen fällt das fertige Programm hier leider aus. Programmiert habe ich in einer Kombination aus Batch, PHP und MySQL. Um das Programm der Allgemeinheit zur Verfügung zu stellen ist es aber vermutlich zu sehr auf meine Feuerwehr bzw. vor allem auch auf unser Leitstellenfax angepasst, das wäre vermutlich schneller neu geschrieben als für eine allgemeine Nutzung angepasst.

    Auch bei meiner Lösung wird das Alarmfax, das von unserem Faxgerät direkt als tif auf dem Rechner abgespeichert wird und damit eine sehr gute Qualität hat, von Tesseract ausgelesen um die Daten danach weiter zu verarbeiten. Die Schriftart ist (schätze ich mal) Courier, also so eine Schreibmaschinenschrift.
    Normale Wörter werden sehr gut erkannt, Umlaute und das scharfe s fast gar nicht. Das ist kein allzu großes Problem und lässt sich noch ganz gut verschmerzen bzw. auch größtenteils durch Buchstabenersetzungen abfangen.

    Ein wirkliches Problem sind aber Fehlerkennungen von Ziffern, hier ist vor allem auffällig das eine 6 mal als 8 oder auch mal als B erkannt wird oder jeweils umgekehrt. Während sich das bei der PLZ auch noch ganz gut abfangen lässt, wird dies bei der Hausnummer echt schwierig und hält mich bis jetzt noch etwas davon ab das ganze Teil im Produktivbetrieb zu verwenden. Anstatt die Hausnummer 62 als Ziel zu haben fährt man sonst zur 82 oder zur B2 (ok, das wäre allerdings etwas weit weg... :-) ). Ansonsten werden Einser auch mal gerne als kleines L erkannt (oder auch hier wieder umgekehrt).
    Dies schließt außerdem leider die Nutzung der auf dem Fax angegebenen Gauß-Krüger-Koordinaten aus, welche vermutlich präziser wären als der von Google Maps zur Adresse ausgespuckte Marker.

    Nun die eigentliche Frage:
    Hat jemand bei euch ähnliche Probleme bzw. diese vielleicht sogar gelöst?
    Es gibt ja die Möglichkeit, Tesseract neue Schriften beizubringen. Allerdings soll da zwischen allen Zeichen jeweils immer ein Leerzeichen sein, und dafür eignet sich natürlich kein normales Alarmfax und selbst erzeugen fällt dabei aus nachvollziehbaren Gründen auch aus (oder ich müsste bei der Leitstelle vorstellig werden und fragen welche Schriftart verwendet wird).
    Ich kann mir nicht vorstellen, dass nicht irgendjemand schon das Problem gelöst hat eine Schreibmaschinenschrift korrekt zu erkennen, gerade weil ja sowas genau eine Anwendung für den Bereich Texterkennung wäre.

    Leider ist Tesseract sehr schlecht dokumentiert und auch in Foren etc. nicht sehr stark behandelt; ich hatte gehofft vielleicht über so ein configfile (was als Parameter hinter der zu verwendenden Sprache angegeben wird) die Schriftart anzugeben, aber daraus wird anscheinend auch nichts.


    Grüße und danke für die Hilfe,

    Christoph

  4. #4
    Registriert seit
    08.04.2009
    Beiträge
    36
    Hi Allmächtiger,

    Wir haben auch in unserem Alarmfax eine Schriftart die zwar Courier ähnlich sieht aber nicht Hundertprozentig identisch ist.
    Ich hab aus den gesammelten Alarmfaxen tesseract die neue Schriftart beigebracht. Hat zwar 2 Wochen gedauer bis ich mich in tesseact eingearbeitet hatte, aber jetzt funktioniert undere Auswertung ohne Fehler.
    Die Alarmfaxe eignen sich ohne Probleme zum lernen der Schriftart...

    Ich hab mich mit dieser Anleitung durchgekämpft: http://wiki.ubuntuusers.de/tesseract...ocr_trainieren und als Hilfsprogramm BBtesseract genutzt.

    Du bist nicht zufällig aus dem ILS-Bereich Straubing?

    Gruß
    Bablu

  5. #5
    Registriert seit
    16.12.2004
    Beiträge
    1.102
    Hallo Bablu,

    vielen Dank für deine Antwort. Wenn du es geschafft hast die neue Schriftart nur über Alarmfaxe zu trainieren dann sollte das wohl auch bei mir möglich sein wenn ich genug Faxe gesammelt habe.

    Ich komme nicht aus deinem Leitstellenbereich, für uns ist die ILS Kaiserslautern zuständig. Soweit ich weiß verwenden die als Leitstellensoftware Cobra, vielleicht sind unsere Faxe ja trotzdem nahezu identisch? Ich habe mal ein etwas anonymisiertes Fax angehängt (in einer Zip-Datei, tif ist hier nicht erlaubt).

    Grüße, Christoph
    Angehängte Dateien Angehängte Dateien

  6. #6
    Registriert seit
    08.04.2009
    Beiträge
    36
    Hi,

    ja unsere Schriftart sieht identisch aus.
    Wenn du willst kann ich dir den trainierten Datensatz morgen zukommen lassen. Muß den aktuellen erst vom Alarmrechner kopieren.

    Mir Fehlen allerdings noch das große Ä, Ü und Q und ein paar Sonderzeichen, die jedoch kaum jemals in einem Alarmfax vorkommen dürften.

    Gruß
    Bablu

  7. #7
    Registriert seit
    16.12.2004
    Beiträge
    1.102
    Vielen Dank, das wäre klasse. Ich melde mich per PN.

  8. #8
    Registriert seit
    27.02.2002
    Beiträge
    5.256
    Zitat Zitat von Bablu Beitrag anzeigen
    Mir Fehlen allerdings noch das große Ä, Ü und Q und ein paar Sonderzeichen, die jedoch kaum jemals in einem Alarmfax vorkommen dürften.
    Dann laß dir doch ein Fax von der Leitstelle schicken.
    Unsere sind da sehr kooperativ.
    Bei Bemerkung kannst dir ja eine Geschichte schicken lassen.
    Wir lassen Messer und Gabel liegen ...
    ... um mit der "Schere" anderen zu helfen.

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •