Also wir werden definitiv OpenSource verwenden.
Dabei wird der User die Wahl haben zwischen Cuniform oder Tesseract. Je nach dem was er präferiert.
Ich persönlich habe aktuell gute Erfahrung mit Tesseract gemacht, ohne das ich irgendwelche eigenen Trainingsdaten eingegeben habe. Ich verwende dazu die offiziellen Deutschen Trainingsdaten von Tesseract direkt.

Wir planen aber auch CloudOCR von ABBYY einzubinden. Dieser Dienst berechnet die Schrifterkennung über eigene OCR-Server von ABBYY im Internet. Dabei wird das Fax an deren Server gesendet und der Server liefert die Daten zurück.

Eine besser OCR Engine wird es wohl auf dem Markt nicht geben.

Allerdings müsste dann das Thema Abrechnung noch geklärt werden, da ja pro Umrechnung ein Betrag fällig wird.

Das ist jetzt alles nicht in Stein gemeißelt, aber eine Auswahl von allen drei Diensten wäre für mich die Beste Variante.