MeGUI und Umlaute in Kapiteln

  • Hallo!

    Ich habe jetzt mal den Chapter Creator von MeGUI ausprobiert und wollte damit einem x264 Film Kaptil hinzufügen. Es hat auch wunderbar funktioniert, nur scheint es mit Umlauten (ö, ä, ü) und dem "ß" Probleme zu geben. Zumindest der Media Player Classic und der Haali Media Splitter zeigen anstatt der Umlaute nur wirre Zeichen an.

    Ist das jetzt ein Fehler von MeGUI, des Media Players oder kann man einfach keine Umlaute in den Kapitel-Bezeichnungen verwenden?
    Gibt es vielleicht einen Workaround oder muss ich wirklich auf altmodische Art und Weise oe, ue, etc. schreiben?

    Ich wäre euch sehr für eure Hilfe dankbar.

    gertschi

  • Weißt du, wie viele "Codepages" existieren, um alle Zeichen zu beschreiben, die über 7-bit-ASCII (also nur die Buchstaben, die in englischen Wörtern vorkommen = 52 bei Groß- und Kleinschreibung) hinausgehen?

    Bereits "Latin 1" (ISO-8859-1) und "Windows/ANSI 1252" unterscheiden sich leicht, sind aber noch die verbreitetsten im deutschen Sprachraum. Die CP 437 und 850 waren mal unter DOS üblich, da liegen die Umlaute an ganz anderen Stellen. Welche wohl der MPC erwartet?! Vielleicht will der sogar UTF8-Codierung, dann hätte ein Umlaut sogar 2 bis 3 Bytes pro Zeichen (Mehrbyte-Zeichen auf Bedarf, mit Signalbyte).

    Oder es liegt letztendlich bloß an der Schriftart, die zur Darstellung benutzt wird. Nicht alle Schriftarten sind vollständig mit sämtlichen Buchstaben ausgestattet.

  • Um welchen Container gehts denn? Matroska? MP4? Ist jedenfalls ziemlich wahrscheinlich ein Zeichencodierung-Problem.

    Brother John
    ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
    DVD nach MPEG-4 klappt nicht? Verzweifelt? Auf zum Encodingwissen!

  • Um welchen Container gehts denn? Matroska? MP4? Ist jedenfalls ziemlich wahrscheinlich ein Zeichencodierung-Problem.


    Ist ein MP4 Container. Das es ein Problem mit der Zeichencodierung ist, hab ich auch schon vermutet. Ich weiß eben nur nicht, wo das Problem steckt. Macht da MeGUI einen Fehler oder ist es der Player (leider konnte ich für Windows nur den MPC finden, der überhaupt Chapters unterstützt) oder ist es überhaupt ein Problem mit dem MP4 / H.264?
    Ich nehme einmal an, die Kapitel-Funktion wird sehr selten verwendet, sonst hätte doch schon früher mal jemand Probleme mit Umlauten oder auch sonstigen Zeichen (im UTF-8 gibt es ja viele ;)) haben müssen. Ich konnte jedenfalls nirgendwo was darüber finden.

  • Hab gerade bemerkt, dass MeGUI die Textdatei mit den Kapiteln nur als ANSI abspeichert. Ich hab die Datei jetzt mal nach UTF-8 konvertiert und werde es nochmal probieren.
    Soweit ich bis jetzt herausfinden konnte sollte das MP4Box (ich nehme mal an, das wird zum Erstellen des MP4 verwendet) auch mit UTF-8 umgehen können.

  • In Matroska muss sämtlicher Text UTF-8 sein (UTF-16/UTF-32 weiß ich nicht sicher). Alles andere muss vor dem Muxen konvertiert werden. Ich kann mir gut vorstellen, dass das bei MP4 genauso ist.

    Werden für jeden Umlaut genau zwei kryptische Zeichen angezeigt? Das passiert dann, wenn UTF-8-Text als ANSI interpretiert wird. Das sagt aber noch nicht eindeutig, auf welcher Seite der Fehler liegt. Leerzeichen oder kleine Quadrate erscheinen nicht, oder? Das wäre dann ziemlich sicher ein Problem mit der Schriftart.

    Brother John
    ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
    DVD nach MPEG-4 klappt nicht? Verzweifelt? Auf zum Encodingwissen!

  • Im Anhang ist jetzt mal ein Screenshot, der einen Ausschnitt aus der Navigation im Media Player Classic zeigt. Die verstümmelten Kapitel-Namen sollten eigentlich "Begrüßung", "Eröffnungsrede" und "Eröffnungswalzer" lauten. Ein Auszug aus der verwendeten Textdatei ist ebenfalls im Anhang.

    Mein Versuch mit der als UTF-8 gespeicherten Textdatei, die die Chapters enthält, hat leider auch nichts gebracht. Das Ergebnis ist genau das gleiche.

  • MP4Box mag offenbar keinen UTF-8-Input. Deine angehängte Datei ist aber UTF-8. Ich hab sie als normalen ANSI-Text gespeichert (am einfachsten per Copy&Paste in ein neues Editorfenster) und gemuxt (MP4Box - GPAC version 0.4.3-DEV): passt, wackelt und hat Luft.

    Brother John
    ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
    DVD nach MPEG-4 klappt nicht? Verzweifelt? Auf zum Encodingwissen!

  • MP4Box mag offenbar keinen UTF-8-Input. Deine angehängte Datei ist aber UTF-8. Ich hab sie als normalen ANSI-Text gespeichert (am einfachsten per Copy&Paste in ein neues Editorfenster) und gemuxt (MP4Box - GPAC version 0.4.3-DEV): passt, wackelt und hat Luft.

    Danke für den Hinweis! Jetzt hat es einwandfrei funktioniert. :cool:

    Kann man irgendwo Bugs fürs MeGUI melden?
    Ich hab das jetzt nochmals ausprobiert. Solange keine Umlaute in den Kapitelnamen sind, speichert der Chapter Creator im MeGUI die Datei als ANSI ab. Sobald aber Umlaute verwendet werden, geht irgendwas schief. Notepad++ zeigt als Kodierung dann "ANSI as UTF-8" an. Was immer das auch ist!? Es ist jedenfalls kein reines ANSI und auch kein reines UTF-8.

  • "ANSI as UTF-8" an. Was immer das auch ist!?


    UTF-Dateien sollen prinzipiell einen BOM (Byte Order Marker) am Dateianfang haben, der aussagt, welche UTF-Variante genau da drin steckt. Manche Programme kommen mit dem BOM nicht klar, deswegen lässt man ihn oft weg. Dann hast du eine UTF-Datei, die nicht ausdrücklich als UTF gekennzeichnet ist => "ANSI as UTF". Deine chapters.txt hatte allerdings einen BOM.

    Brother John
    ––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
    DVD nach MPEG-4 klappt nicht? Verzweifelt? Auf zum Encodingwissen!

  • UTF-Dateien sollen prinzipiell einen BOM (Byte Order Marker) am Dateianfang haben, der aussagt, welche UTF-Variante genau da drin steckt. Manche Programme kommen mit dem BOM nicht klar, deswegen lässt man ihn oft weg. Dann hast du eine UTF-Datei, die nicht ausdrücklich als UTF gekennzeichnet ist => "ANSI as UTF".


    Aha. Danke für die Info.

    Deine chapters.txt hatte allerdings einen BOM.


    Ja, ich weiß. Das war die Datei die ich explizit nach UTF-8 konvertiert hatte und nicht die, die vom MeGUI erzeugt wurde. Blöderweise kam ich ja nicht auf die Idee, es einmal mit einer nur als ANSI kodierten Textdatei zu versuchen. Denn damit hat es schlussendlich wunderbar geklappt.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!