Ich habe den ersten Schritt selber herausgefunden

> jTessBoxEditor - da kann die TIFF Datei hochgeladen werden und die BOX-Datei erstellt werden -> da müssen die Pfade im Editor angepasst werden
> nun kann jeder Buchstabe angelernt werden - zwischenspeichern nicht vergessen ;-)
> Serak tesseract trainer -> Tiff Datei hochladen (zieht die BOX Datei mit) traineddata kann erstellt werden

!!! WICHTIG !!!
bei dem Serak-tool gibt es eine configdatei -> die unbedingt anpassen und zwar wo tesseract liegt, dann funktioniert es

Aktuell tüftle ich noch daran, mehrere PDF´s zu einer traineddata datei zusammenzuschließen - falls Erfahrungen, bitte schreiben ;-)