Festgebannte Untertitel von der VHS/Laserdiscs (closed captioned) rippen

  • Noch ein tool gefunden https://sites.google.com/site/cphktool/esrxp

    Es scannt zunächst das ganze Video und zeigt jeweils den Sub an, diesen kann man dann per Hand aufschreiben. 1 Subblock = 1 Zeile. Quasi die viel bessere "SubRip per Hand eingabe" alternative.


    Die Positionen der Untertitel kann man glaube ich mit keinem der Tools wirklich mitabspeichern. Das Srt Format erlaubt das auch nicht. Da wäre sowas wie ASS wohl notwendig.


    p.s. Ich habe das mkv video per vdub nach lagarith AVI YV12 abgespeichert.

    Shu5tPr.png

  • Habe noch was gefunden https://github.com/SubtitleEdit/subtitleedit/releases

    das in Verbindung mit diesem Video


    Da ist ocr, subs zusammenführen, vergleichen, anpassen... alles eingebaut. In dem video öffnet er ja die Bilder vom VideoSubFinder und der Dateiname ist gleich der Zeit. Unser script sollte man ja dementsprechend anpassen können.


    Hab ganz am Anfang auch mit VideoSubFinder vieles ausprobiert, bevor ich diesen Thread erstellt habe.

    Bei helleren Videobild erkennt er zwar ca.85% Subs, 15% werden als vermisst, bzw. ignoriert. Hab dann später mit SubtitleEdit bemerkt, dass einige Subs fehlen. Bei dunkleren gecroppten Videobild (nach editieren mit Vapoursynth) wird komplett ignoriert.

    Idealerweise wäre toll, wenn Subs keinen schwarzen Hintergrund haben und er erkennt alle Subs (99-100%). Hab mal mit einem kleineren Video mit nur weißen Untertitel getestet und es war Erfolg. Aber für diejenige, die mit schwarzen Hintergrund haben, muss eine andere OCR Software installiert werden.


  • Hab auch ganz kurz ausprobiert (ohne Anleitung und Wissen) und ich verstand diese Einstellungen nicht, habe dann aufgegeben, weil es nicht geklappt hat. Ich werde noch einmal mich bemühen, mit Anleitung damit zurecht kommen.

  • Eben das ganze mal auch noch mal per subrip ausprobiert. Und es funktioniert doch sehr gut! Ich habe das Rechteck sehr groß gewählt sodass alle 4 Zeilen erfasst werden. Dann per manuellen Eingabe jeweils den Text eingeben. Dass es der selbe sub ist kam auch nur ein paar mal



    Edit, du kannst subrip auch 2 mal durchlaufen lassen. Zuerst die oberen 2 Zeilen, dann die Unteren... Es gab ein gutes Subtitle Edit tools was untertitel zusammenführen kann.Habe den Namen vergessen, muss ich suchen.

    Das habe ich auch gemacht, den größeren Rechteck mit rechten Maustaste.


    Du meinst, nach wählen des größeren Rechtecks direkt zur manuelle Eingabe ohne vorher was einzustellen?


    Eher 4x durchlaufen lassen, weil oben auch subs (1-4 Zeilen) gibt, vor allem der Anfangscredits, aber auch bewegende Objekte im Film, damit dies von den schwarzen Hintergründe der Untertiteln nicht bedeckt wird, sonst wäre es wie eine Zensur für Taube Zuschauern. ;-)

  • Hab ganz am Anfang auch mit VideoSubFinder vieles ausprobiert, bevor ich diesen Thread erstellt habe.

    Bei helleren Videobild erkennt er zwar ca.85% Subs, 15% werden als vermisst, bzw. ignoriert. Hab dann später mit SubtitleEdit bemerkt, dass einige Subs fehlen. Bei dunkleren gecroppten Videobild (nach editieren mit Vapoursynth) wird komplett ignoriert.

    Idealerweise wäre toll, wenn Subs keinen schwarzen Hintergrund haben und er erkennt alle Subs (99-100%). Hab mal mit einem kleineren Video mit nur weißen Untertitel getestet und es war Erfolg. Aber für diejenige, die mit schwarzen Hintergrund haben, muss eine andere OCR Software installiert werden.

    Ich habe vorhin gemerkt dass ich ne ältere Version vom VideoSubFinder habe 2.10, aber es wurde tatsächlich weiter entwickelt. 2.50 ist aktuell.
    Man muss die Grenzwerte alle deutlich runterschrauben bei der Quelle (VS gefiltert). Aber selbst dann werden manche trotzdem nicht erkannt. Aber ich weiß halt auch nicht was jeder Parameter genau macht....

  • Mit esrXP ist ein No-Go. Immer muss man an der Tastatur tippen und das will ich auf keinen Fall tun.

    Mit SubRip kommen die Untertitel mit 4 Zeilen gut klar, aber das Problem ist, dass bei jede Wörter jeweils eine Space frei zwischen zweier Buchstaben haben und das sieht man auch am Bild. Wenn OCR schlechte Untertitel findet, dann muss man einige Sätze manuell tippen - das ist klar.

    Ich vermute das Problem ist, dass auf der VHS/Laserdisc andere Untertitel-Schriftarten haben, so dass sie mit etwas größere Abstände als normale Untertitel zu sehen sind.





    Ich habe noch eine Idee, was ich eine Funktion im esrXP entdeckt habe, mit dem kann man entweder schwarzen mit weißen Untertitel oder weißen Hintergrund mit schwarzen Untertitel wählen und abspeichern. Vielleicht wäre was für VideoSubFinder? Vielleicht erkennt er dann besser als mit den schwarzen Hintergrund mit weißen Untertitel. Meine Frage, kann man mit Vapoursynth oder Avisynth einen weißen Hintergrund mit schwarzen Untertitel hinkriegen wie esrXP es kann? Eine Art Black/White Option.



  • Ok du willst also das komplett automatisch haben? Aber am Ende musst du doch alle eh korrigieren!? Bei diesem Sub wird kein Programm das so perfekt hinbekommen...


    Für den weißen Hintergrund kannst du einfach ein invert nehmen

    Clip=Clip.std.Invert()

    (über Clip.set_output() plazieren)



    Subrip ist ja eher für DVD-Untertitel gedacht und da sind diese eher enger zusammen. Ist mir aber auch schon aufgefallen, ne Lösung kenne ich dafür nicht.

  • Edit: Hab Clip=Clip.std.Invert() ganz am Ende platziert, Line 235, über Clip.set-output() und trotzdem wird schwarzer Hintergrund mit weißen UT ausgegeben.


    Ja, fast komplett automatisch. Nur bisschen mit der Hand für die verbesserte Stellen nacharbeiten, ähnlich wie bei den DVDs mit SubRip.

    Um die Buchstaben enger zu bekommen, kann das nur Omnipage nach VideoSubFinder. Zunächst Subs und Timecodes erfassen, dann mit OCR Software Omnipage oder Abby Finereader ins Texte konvertieren. Ich bevorzuge auf Omnipage, da sie saubere Texte erstellen können, Abby nicht.



  • Speichere mal ab und starte vseditor neu um ganz sicher zu gehen.


    Ich habe die version mit weißem hintergrund nochmal mit dem VideSubFinder ausprobiert. Scheint etwas besser zu klappen. An sich muss man da die "fast" checkbox wegklicken, dann praktisch alle Grenzwerte deutlich runtersetzen, statt 0.5 auf 0.1 oder sogar 0.01. Auch wichtig die "color SUM irgendwas" auf 0 einfach setzen. In der Vorschau wird es zwar teilweise trotzdem noch komisch angezeigt, aber es hat eig die ganzen subs erkannt (im RGB order), waren sogar doppelte dabei.


    Und es ist am Ende abgestürzt sodass ich die Einstellungen nicht speichern konnte ...


    Mit Abby habe ich auch nur Müll rausbekommen. Omnipage habe ich schon ganz vergessen :D

  • Echt? Es hat geklappt? Das wäre super, wenn man das mit weißen Hintergrund macht.


    Okay, ich werde es später ausprobieren. Wenn das wirklich alles gut klappt, will ich eine Dokumentation bereitstellen, da keiner so etwas gemacht hat, wie wir es ausprobiert haben. Das wäre ein brauchbares Stück. ;-)

  • Trotzdem klappt nicht. Bleibt schwarzer Hintergrund. Habe abgespeichert und vseditor neugestartet, nichts ist passiert.

    Im Preview Video sehe ich auch schwarzen Hintergrund.


    Vielleicht findest du einen Fehler?


    Edit: Endlich klappt mit weißen Hintergrund. Es muss vor Clip.set_output() platziert werden, nicht über. ;-)

  • Naja, dann habe ich anders verstanden. Aber es lief gut.


    So, mit VideoSubFinder hab ich ein bisschen intensiv erarbeitet, leider werden einige Untertitel nicht komplett erfasst. Sieht zwar besser als mit Film (ohne Verwendung von Filter von VSEditor).


    Du meinst alle Werte auf 0.1 oder sogar 0.01 setzen auf beide Seiten (links und rechts), ja?

    Ich habe statt After Third Filtration den VEdges Points Image gewählt, da die Untertiteln bei After Third F. noch schlechter erfasst werden. Aber für was beziehen solche Einstellungen After First, Second und Third Filtration sowie auch VEdges, NEdges und Edges Points Image?


    Wer kann hier von Russisch auf Englisch übersetzen? Da alle Überschriften ja auf Russisch beschriftet sind.