Hab ne Idee für ein kleines Projekt aber keine Muße mich dran zu setzen und bevor ich die Idee komplett verwerfe poste ich sie mal, vielleicht fühlt sich ja jemand motiviert,...
Idee: automatisches idx/vob -> srt (crossplatform + command line)
Schritt 1: VobSub mit subp2tiff (aus dem ogmrip project) in eine Reihe von Tiff Bildern umwandeln
-> man muss gucken, dass man subp2tiff alleine kompiliert bekommt (die Abhängikeit von libtiff ist okay, die brauch man auch bei Tesseract)
Schritt 2: tiff Bilder automatisch mit Tesseract per OCR umwandeln.
-> ist simple
Schritt 2+: Ausgaben von 2. auffangen und anhand der Zeiten aus dem .idx File ein .srt file erstellen
-> einfach die STDOUT Ausgabe abfangen und merken, idx lässt sich einfach parsen und srt ist einfach zu erstellen
Denke das größte Problem ist den subrip Teil von ogmrip alleine zu kompilieren. (soweit ich das sehe besteht keine Abhängigkeit zu anderen Bibliotheken außer libtiff, welches es als .lib und dll bei Tesseract im svn gibt)
Der Teil danach ist eher ne Fingerübung.
Cu Selur
Ps.: Denke von dem Projekt hätten auch andere was, da dann zig GUI tools automatisches OCR hätten,..