Festgebannte Untertitel von der VHS/Laserdiscs (closed captioned) rippen

  • Ich bin Schwerhörig und bin auf Untertitel angewiesen.

    Hoffentlich hat jemand mit dieser Software gute Erfahrungen gemacht und zwar Untertitel von den Medien zu rippen.

    Also, ich habe versucht, mit Avi Sub Detector zu beschäftigen, der am besten und einfachsten von OCRs festgebrannte Untertitel (closed captioned) von der VHS/Laserdiscs rippt, die ich den Film mit UT aufgezeichnet habe.

    Ich habe eine kurze Position in der Ausgabe getestet. Es zeigt mir, dass neben den richtigen Untertitelsätzen auch schlechte Untertitelsätze zu sehen sind und man sieht, dass die Abstände zweier Buchstaben sowie auch viele Sätze sind verdoppelt. Und außer diese Sätzen gibt es auch alle mit „Frame...“ zu sehen, wie zum Beispiel das hier:


    Code
    1. Frame=142:DLC=8;MED=60;MBC=4;MBX=2;LMB=236;RMB=368;



    Das ist sehr schlecht, weil es zu viel mit Rechtschreibprüfung zu tun hat, dass ich das nicht tun möchte. So sie sehen aus:



    Kann man das in der Einstellung von dieser obengenannte verlinken Software einstellen, damit die Untertitelsätze korrekt ausgegeben werden? Oder gibt solche Software wie zum Bsp.: Subtitle Edit, der es bearbeiten kann. Dort kann man Untertitel für Hörgeschädigte autom. weglassen, wenn man es will und habe gedacht, vielleicht kann man auch für diese machen? Mit manuell (mit Hand) ist doch blöd und Zeitverschwendung. Soweit ich weiß kann Aegisub nur ersetzen.


    Hab auch versucht mit andere Software VideoSubFinder oder SubRip. Beide können nur schlecht erstellen, am schlimmstenfalls ist SubRip, da er zu kompliziert ist und kann die richtige Sätze nicht erfassen, weil der hintere schwarze Hintergrund/Balken von weiße Sätzen gemattet sind und die Buchstaben werden verschwommen und braucht viel Arbeit als wenn die Untertitel ohne schwarze Hintergrund haben (das habe ich schon bei anderen Film gemacht) und bei VideoSubFinder werden viele Sätze vermisst, bzw. fehlen. Das geht ja gar nicht.


    Hat jemand einen Tipp?

  • Ich finde was das finden von Untertiteln angeht ist VideoSubFinder am besten/einfachsten (auch wenn es etwas buggy ist). Eine richtig gute OCR-Erkennung habe ich noch mit keinem Programm hinbekommen. Allerdings habe ich mal ein tool gesehen was ein Stapel an Bildern zum OCR an google senden kann. Wäre ggf die beste Kombination.


    Ansonsten versuch doch mal im internet auf seiten wie opensubtitles zu schauen ob es den sub nicht schon gibt.


    Wichtig beim VideoSubFinder ist, dass man bei Settings "Using fast version" das Häckchen wegmacht! Und das cropping nicht vergessen.

  • Mit VideoSubFinder habe ich trotz das Häckchen "Using fast version" deaktiviert und die Images von Untertiteln werden nicht erfasst und im RGBImages gespeichert. Ebenso werden die Bilder der Untertitel im FRDImages nicht richtig aufgezeichnet. Siehe Bilder:


    RGBImages



    FRDImages




    Und bei AVI Sub Detector werden Zeilen aufgeteilt oder manche werden beschnitten und sehen sie zum Bsp. aus:


    Schnitt 1:



    Schnitt 2:



    Woran liegt das, dass aus einem Untertitel mit 2 Sätzen in 2 Teile aufgeteilt wird?

    Weißt du mit welchen Einstellung soll ich nehmen? Finde nichts, wo man UT in gewünschten Zeilen wählt, Hab zwar richtig gecroppt und trotzdem bekomme ich solches Problem. Auf eure Hilfe freue ich mich sehr.

  • Mit avi sub detector habe ich auch nur einmal etwas ausprobiert, also -> quasi 0 erfahrungen damit.

    Wenn du einen Ausschnitt mit mehrern Untertiteln hochladen könntest, dann könnte ich auch mal rumprobieren wenn du möchtest. (denke eine gecroppte version sollte reichen).


    Subrip könnte hier evtl auch ganz gut funktionieren da der Hintergrund immer schwarz ist. Siehe hier


    Edit

    hier ist noch eine Anleitung für avi sub detector

    http://www.wxfs.org/guides/How…leUsingAviSubDetector.pdf

  • Danke für deine Antwort. Ich kenne beide und habe auch versucht damit klar zu kommen, leider ohne Erfolg.

    Heute in der Nacht werde ich eine kleine Datei (1-2 Min. Film) erstellen und poste mal hier, dann kannst du es versuchen.

  • Hier zum download: https://www94.zippyshare.com/v/3E5RyONY/file.html

    PW: utrip


    Für den Fall gebe ich dir Link: http://zuggy.wz.cz/guides/video.htm

    Mach mir ein Screenshots von deiner Einstellung, falls du Erfolg hast und auf welchen Buchstaben du gezielt hast (siehe Bild 4 mti Text).

    Hatte auch kein Erfolg mit den Seiten blau zu füllen (Bild 8-14), oft werden Sätze mit blauen Zeile bedeckt (befüllt).


    Zur Info, auf dem Video sind 4 Zeilen Untertitel. Damit muss man 4 Linien aufteilen und bei mir klappte es nicht, alle Buchstaben in weiß erhalten zu bleiben, manche Buchstaben werden in grau gezeigt, obwohl ich versucht habe richtig einzustellen - leider erfolglos.


    Ich hoffe, du kriegst es hin. Viel Erfolg! :)

  • Es gibt Teilerfolge mit Subrip und Avisubdetector, mit VideoSubFinder hat es nicht wirklich geklappt.

    Im Grunde ist Avisubdetector schon eine super Lösung, nur ist das Teil zu buggy, friert öfters ein und hat 1 mio Einstellungen ohne eine Anleitung.


    Mit Subrip habe ich glaube ich das maximum rausgeholt. Aber es hat ein großes Problem: Es kann mit "instabielen" Untertiteln schlecht umgehen, sprich die werden eher als neuer Untertitel erkannt. Gut, dafür gibt es den "same subtitel" Knopf. Und das "Fill" rechts und links schluckt einzelne Wörter, also muss man darauf verzichten. UND mehr als 2 Zeilen sind eher schlecht -> also 2 Durchläufe nötig.



    Mit dem Avisubdetector klappt das Finden der Untertitel eig ganz gut in der Vorschau. Das Problem sind die Grenzwerte, also wann es ein neuer Sub ist oder nicht bzw dass es ein sub ist. Dieser Teil ganz untem im Settings Tab bei Detection ist ein großes Fragezeichen für mich. Das muss man irgendwie mit den Werten aus dem Stats Tab korrekt einstellen.


    Mit dem manual mode kann man natürlich auch arbeiten dh Text selber eingeben. Quasi wie bei Subrip ohne ocr.

    Generell denke ich die Beste Lösung wäre wenn man alle subs als Bild extrahieren kann (was Avisubdetector ja theoretisch kann). Die Bilder werden dann aber mit https://de.wikipedia.org/wiki/Tesseract_(Software) OCRt. Das ist quasi das "Beste" ocr programm was öffentlich verfügbar ist.




    j0t99Rp.png


    ttlM437.png




    Übrigens ich habe das Video leicht mittel VapourSynth bearbeitet. Mit MotionMask werden bewegung maskiert und diese werden dann einfach sehr dunkel gemacht mittels Tweak. Damit hat man schon mal weniger Fehlerquellen die eine ähnliche Helligkeit wie die subs haben.

    Wenn man hier die Subs quasi mittels FreezeFrame perfekt stabilisieren könnte, dann wäre die Erkennung in Subrip zb sehr viel besser. Dann hätten wir fast eine DVD-Sub Situation.

    Code
    1. clip= core.ffms2.Source(r"D:\Download\Video.avi")
    2. c = adjust.Tweak(clip, bright =-180)
    3. clip = haf.SMDegrain(clip, tr=3, thSAD=600, prefilter=1)
    4. m = clip.motionmask.MotionMask(th1 = 5, th2=10)
    5. clip = core.std.MaskedMerge(clip, c, m)


    Edit:

    VideoSubFinder funktioniert doch, aber nur für helle Szenen. Da aber erstaunlich gut. Die oberen Subs nimmt er gar nicht, erkennt nur "Müll". Evtl braucht man mehr (Video)-Bild dafür. Man kann das eig recht gut anpassen, wenn man den Test Button nutzt und die einzelnen Tests jeweils durchschaltet und dann jeweils die Werte anpasst.

  • Was neues gefunden https://github.com/pocketsnizort/pythOCR

    Allerdings bekomme ich pyenchant über pip nicht installiert, muss wohl kompiliert werden.


    Aber, ich konnte das filter script testen. Das Ergebnis sieht schon mal sehr gut aus https://www87.zippyshare.com/v/qOW0Sk3p/file.html (adblocker nutzen!)

    Wenn man jetzt noch mit einem avisynthfilter wie http://avisynth.nl/index.php/E…Duplicate_Frame_Detectors das quasi stabilisieren könnte dann wäre schon ne menge vorarbeit geleistet für die ocr Programme.



    Im script musste alle write csv befehle entfernen, da stimmt was mit windows nicht. Wichtig ist der SeuilI und SeuilO parameter.


  • Vielen liebend Dank für deine Tipps!

    Ich bin über dein Können sehr begeistert und beneide es auch. Leider wird bei mir mit AviSubDetector eine Fehlermeldung aufgetreten, wenn ich eine avs-Datei (Avisynth) abrufe. Fehlermeldung: "Cannot open file "". Die Syntax für den Dateinamen, Verzeichnisnamen oder die Datenträgerbezeichnug ist falsch". Diesen Fehlermeldung verstehe ich nicht, obwohl avs-Datei im Desktop mit dem Namen existiert.

    Wenn ich diesen Fehlermeldung ignoriere und trotzdem geht es auch. Bei OCR und Auto Mode werden unbekannte Formen zu häufig abgefragt, als ob sie Untertitel erkannt hätten, was aber nicht stimmt. Da müsste ich den Button "No subtitle" bei Auto Mode, oder "Ignore" bei OCR häufiger klicken.


    Ich hab schon mal einen anderen Film (B-Movie) komplett manuell gearbeitet. also Sätze selbst eingegeben und lief sehr gut, aber das war nur einmal. Nochmals will ich nicht mehr machen, weil sie mir viel Zeit kostet.


    Hab nach deine Tipps VapourSynth und co. installiert, leider ich kann mit der manuellen Installation von VapourSynth nichts anfangen. Mir wäre lieber eine vernünftige Installation, wo alles automatisch in den Ordner installiert und nicht von Hand an, in diversen Ordner verschiebt und einfügt.

    Mit Ausnahme kann ich mit Avisynth umgehen, aber soweit bin ich auch noch nicht gekommen, hab erst vor ein paar Monate mit Avisynth zum ersten Mal auf mein 32bit Rechner installiert und ein bisschen studiert und bisher lief ganz gut. Neben Win10 64bit habe ich auch Win7 32bit auf separate Festplatte installiert, um Videos mit Avisynth zu bearbeiten.


    Ich hoffe, mit Avisynth geht das auch, nur ich weiß nicht welche Filter installiert werden muss und wie es funktioniert. Muss ja, erstmal dll-Dateien in den Plugins installieren, dann ausprobieren.

    Mit VirtualDub habe ich auch ähnliches gemacht und zwar mit dem Filter von SubLog Extractor, um Bild schwarz zu kriegen und die Untertitel in weiß erhalten zu bleiben, aber dann sind die Buchstaben verändert und sie bewegen auch, das man bei der OCR für jede Buchstaben häufiger den Button akzeptieren wiederholen müsste. Wie du es gesagt hast, dass man sie stabilisieren kann, wäre eine super Lösung für mich. Aber Problem ist, dass dort auch außer Untertitel sehr viele unnötige Formen auftreten. Siehe Bild:


  • So kurz vorm ausrasten habe ich es doch noch geschafft mit pythOCR.

    Das Problem warum man keine CSV schreiben konnte lag an 2 Dingen

    1. der Pfad war fehlerhaft UND

    2. das Beispielscript will zb. nach Video.avi/default schreiben, aber es darf keinen Ordner der Video.avi heißt geben!



    Die Kopfzeile des Beispielscriptes sieht also wie folgt aus:

    Das cropping ist hier blöderweise mit Absolutwerten statt relativen gelöst. 710,120 ist die Video resolution, damit nix gecroppt wird.


    Etwas weiter im script steht dann

    displayname = os.path.basename(FichierSource) + "_"

    + "_" habe ich einfach hinzugefügt damit wir einen Video.avi_ ordner bekommen.


    Das Ergebnis ist im Anhang.


    Das OCR Script selber hat auch nicht so richtig funktioniert, also habe ich die aufrufe für die Bilder im "alt" Ordner mal per Hand gemacht:


    tesseract 1945.png 1945.png -l eng --psm 6


    Die Erkennung ist nicht schlecht, aber natürlich nicht perfekt.



    ---


    Der Ansatz mit der szenenerkennung bzw der csv datei ist ja eig nicht schlecht. Man könnte in einem 2ten Durchlauf diese Werte nehmen und per FreezeFrame jeweils von frame x bis y einfrieren. Das als Video abspeichern und per Subrip oder avisubdetector PER HAND dann jeweils eintragen. Ein paar doppelte Bilder werden vorkommen, aber diese kann man ja dann per "same sub-Button" easy abarbeiten.



    Edit:

    Ne andere Idee ist mir noch gekommen um die subs zu verbessern. Um dieses "wabern" zu reduzieren müsste man alle frames eines subs ineinander mischen, dann sollten diese eigentlich recht gut aussehen. Natürlich klappt das nur wenn es bei der Aufnahme keine starken Ruckler gab.

    Wäre jetzt nur für das OCR notwendig.

  • Vielen Dank erstmal.


    Muss ich Vapisynth64.exe installieren, dann die zu Entpackte Dateien entpacken und in den Ordner verschieben und einfügen, oder reicht nach Entpacken sofort bedienen? Ich kannte Vapoursynth zuvor nicht.

  • Die 7z entpacken reicht, ist ja portable.

    Den Vapoursynth editor dann starten. Das script von pythocr anpassen. Wichtig ist dass das script am Ende einmal komplett durchläuft damit alle Szenen erkannt werden und in die csv geschrieben werden können. Dafür kannst du den eingebauten Benchmark nutzen.


    Tipp: Wenn du Windows 10 nutzt und OCR ausprobieren willst, dann installier dir Ubuntu aus dem store. Mit WSL kannst du dann einfach per apt-get tesseract installieren.

  • Das ganze sieht für mich viel zu intensiv und kompliziert aus, das ich von Vapour nur Bahnhof verstehe. Auch ich habe nach youtube geguckt, wie man damit umgeht, leider ist sehr unterschiedlich. Außerdem will ich benötigte Programme nicht auf mein Win10 noch einmal extra installieren lassen. Alles was zur Videobearbeitung mit Avisynth und co. zu tun hat, werden nur auf Win7 32bit gearbeitet.


    Hab Vapoursynth gestartet und die Script in den Vapourscript hineinkopiert, dann Videosource geändert und abgespeichert, dann mit Subrip versucht die abgespeicherte Datei zu öffnen, leider wird Avisynth benötigt, was ich auf Win10 nicht haben will. Einfacher geht's nicht? Zum Bsp. mit Avisynth Script?


    Edit: Außerdem habe ich pythocr nicht finden können. Wo finde ich den?

  • Beitrag von DeafYakuza ()

    Dieser Beitrag wurde vom Autor aus folgendem Grund gelöscht: Doppelsatz ().