Audio bleibt asyncron

an3k

Hallo,

bin neu hier, habe allerdings schon die Suchfunktion maltretiert, leider nichts hilfreiches gefunden.

Ich habe eine Audio (mp2) aus einem 25fps Video in eine PCM-WAV extrahiert und möchte diese in ein 23.976fps Video muxen. Dass das einfach so nicht geht ist mir klar. Habe deswegen mit BeSweet (1.5b31) die ursprüngliche 25fps-WAV in eine 23.976fps-WAV umgewandelt und dann mit VDubMod in das Ziel-Video gemuxed.

Das Ergebnis ist das selbe, Audio ist asyncron. Ebenfalls ist die 25fps-WAV genauso lang wie die 23.976fps-WAV, wobei doch letztere kürzer sein sollte.

Am Delay selbst liegt es nicht, da am Anfang A/V noch Syncron ist und nach und nach asyncron wird.

Das Ziel-Video möchte/muss ich nicht bearbeiten. Evtl. hilfreich zur Info ist evtl. die Infos von GSpot:

Interleave: 1 vid frame (42 ms), preload=480
Audio frames: Aligned on interleaves

Ich habe auch die Möglichkeit mit Sony Sound Forge 7.0a zu arbeiten, hier habe ich ebenfalls die Möglichkeit das "Tempo" des Audio zu verändern, allerdings nicht nach 23.976, nur zu "SMPTE Film Sync (24 fps)", "SMPTE EBU (25 fps, Video)", "SMPTE Non-Drop (29.97 fps, Video)", "SMPTE Drop (29.97 fps, Video)" und "SMPTE 30 (30 fps, Audio)". Auch kann ich Samples, Time, Seconds, Time & Frames, Absolute Frames und Measures & Beats auswählen, hier würde ich allerdings wissen müssen wie ich die korrekte (neue) Länge berechne (Formel für 25 auf 23.976).

Hoffe es kann mir geholfen werden, trotz der vielen gleichartigen Postings.

LigH

Zitat von an3k

Habe deswegen mit BeSweet (1.5b31) die ursprüngliche 25fps-WAV in eine 23.976fps-WAV umgewandelt

Schon wieder einer, der bei Tonspuren von Bildraten faselt. Audio hat keine Bilder. Die Videos haben nur je Format eine unterschiedliche Spieldauer, weshalb die Tonspuren daran angepasst werden mussten.

Du hast also BeSweet benutzt ... dann hätten wir gern mal die Log-Datei dieser Konvertierung. Es gibt nämlich drei Möglichkeiten, die Spieldauer zu verändern. Eine davon ist falsch, und eine etwas fortgeschrittener, aber recht unbekannt.

Selur

Hat BeSweet nicht extra ne SpeedUp-Funktion? (oder war das BeHappy :))

LigH

SoundTouch.

an3k

Zitat von LigH

Schon wieder einer, der bei Tonspuren von Bildraten faselt. Audio hat keine Bilder.

Das ist mir bekannt, hatte die Angaben nur der Übersicht halber angegeben, damit eindeutig klar ist was von was ich in was muxen möchte

Zitat von LigH

Die Videos haben nur je Format eine unterschiedliche Spieldauer, weshalb die Tonspuren daran angepasst werden mussten.

Mehr nicht, nur die Dauer ist unterschiedlich? Ok, das war mir neu.

Zitat von LigH

Du hast also BeSweet benutzt ... dann hätten wir gern mal die Log-Datei dieser Konvertierung. Es gibt nämlich drei Möglichkeiten, die Spieldauer zu verändern. Eine davon ist falsch, und eine etwas fortgeschrittener, aber recht unbekannt.

Meine Befehlszeile: C:\BeSweet.exe -core( -input C:\input.wav -output C:\output.wav -payload -logfile C:\BeSweet.log )

Log als Anhang

an3k

Ok, nun weiss ich wieder warum ich keine GUIs mag *shame on BeSweet GUI*

Ich teste das eben nochmals, diesmal mit korrekter Befehlszeile: C:\BeSweet.exe -core( -input C:\input.wav -output C:\output.wav -2ch -logfile C:\BeSweet.log ) -ota( -r 25000 23976 )

LigH

In dieser Kommandozeile ist kein Parameter, der auf die Spieldauer irgend einen Einfluss hätte. Es fehlt die OTA-Parametergruppe

-ota( -r 25000 23976 )

oder SoundTouch, wenn man beim Anpassen der Dauer trotzdem die Tonhöhe erhalten will.

Außerdem ... "-payload" sorgt doch dafür, dass gar nichts an den Daten verändert wird. Zum Ändern der Dauer muss aber recodiert werden.

Welches Format soll noch mal am Ende herauskommen? MP2 könnte BeSweet ja direkt lesen, man müsste dafür keine WAV erzeugen.

an3k

Die neue Logfile als Anhang.

Nach der Umwandlung ist die "Verzerrung" noch größer als vorher.

LigH

Dann die Zahlen anders herum?

Du musst wissen, ob du PAL => NTSC oder NTSC => PAL brauchst. Die BeSweetGUI von DanniDin hilft bei der Parameterwahl (nur SoundTouch unterstützt sie noch nicht), BeLight ebenfalls ("Mehr Optionen" - verwendet SoundTouch).

an3k

Ich teste es mal eben mit -ota( -r 23976 25000 ) allerdings glaube ich dass dies falsch rum ist.

Ich nutze das GUI von DanniDin, dort habe ich unter Presets "PAL -> NTSC (25.000 to 23.976)" ausgewählt. Das umzuwandelnde Audio stammt ja aus einem PAL-Video.

Die Informationen die GSpot bzgl. der Framerate anzeigt sind doch korrekt, oder kann es sich hierbei auch mal irren? Habe die "Verzerrung" der originalen und der mit BeSweet umgewandelten Audio-File vergleichen, bei 23.976 ist diese größer als bei 25. 29.97 scheint mir aber ein bisschen zu hoch zu sein.
Wäre es möglich dass es was halbes und nichts ganzes ist wie 27fps?

an3k

Ok, habe nun alles ausprobiert, Audio als "25fps", als "23.976fps" sowie als "29.97fps" aber immer ist es nicht passend.

Hat es vielleicht damit zu tun, dass das ursprüngliche Audio 48.000Hz hatte, das einzufügende aber 44.100Hz ?

Welches kostenfreie Tool könnte ich benutzen wenn ich markante Stellen im Video und Audio markieren möchte, sodass sich das Tool automatisch errechnen kann wie stark das Audio gestreckt/gestaucht werden muss?

LigH

Dividiere die jeweiligen Längen (umgerechnet in Sekunden), und verwende den Quotient als Streckungsfaktor in SoundTouch (BeLight).

an3k

Audio 25.000: 6222 Sekunden (01:43:42) - Original
Audio 23.976: 6488 Sekunden (01:48:08)
Audio 29.970: 5190 Sekunden (01:26:30)

Ich soll nun 6222 / 6488 / 5190 und das Ergebnis als Streckungsfaktor nutzen? Oder nur zwei Audio-Files?

LigH

a) Wie lang ist das Audio, bevor du es verarbeitest?
b) Wie lang soll das Audio werden, nachdem es bearbeitet wurde?

Selur

Video hat 23.976fps und der Audiostream ist 6488 Sekunden lang, dieser soll nun durch einen 6222 Sekunden langen ersetzt werden, d.h. der 6222er muss gebremst werden, so dass er 6488 Sekunden läuft.

6488/6222 = 1,0427515268402442944390871102539 (=a)

-> 6222er um den Faktor a Bremsen
bzw. mit einer Geschwindigkeit von 1/a (=0,95900123304562268803945745992602) Anstelle der normalen Geschwindigkeit (=1) abspielen.

Cu Selur

LigH

Selur, du hast das völlig missverstanden.

Die erste Angabe ist die gemessene Länge des Originals.

Die beiden anderen Längen sind die, die beim Konvertieren nach Presets entstanden sind, aber keine der beiden passt zum Film. Deshalb sind beide unbrauchbar.

Ich müsste jetzt diejenige Länge haben, die nach dem Konvertieren erreicht werden soll, damit es synchron wird. Daraus läßt sich dann der nötige Streckungsfaktor berechnen.

an3k

Ich danke euch allen für eure Hilfe bei diesem leidigen Thema dass ihr bestimmt schon 500x durchgekaut habt. Werde wohl mal (wenn ich alles kapiert habe ein kleines Howto schreiben.

Das ersetzende Audio (25fps) ist leider kürzer (Am Anfang/Ende geschnitten) als das zu ersetzende Video, d.h. ich muss da noch ein bisschen rechnen, das mache ich aber morgen da ich heute nicht mehr die geistige Leistung aufbringe *einschlaf*

Grüße aus dem sonnigen München

[EDIT]: Habe mir überlegt beide Audio-Files (das ersetzende und das zu ersetzende) in Sound Forge zu laden, übereinander zu legen, auszurichten und dann die fehlenden Teile beim ersetzenden Audio einzufügen, Dann könnte ich es relativ genau Berechnen.

Dazu die Frage ob es möglich ist von einer unbestimmten Framerate auf 25fps zu konvertieren, evtl. weil ein Audio für ein 25fps Video genau 50Samples jede Sekunde hat? Mit Samples könnte ich arbeiten (Sound Forge).

Selur

Höh?

Dachte:
1. er hat eine Videospur die 23.976 fps hat
2. er will die Tonspur (6488 Sekunden) dieser durch eine andere Tonspur (6222 Sekunden) ersetzen
-> neue Tonspur muss gebremst werden da sie zu kurz ist.

Falls ich da jetzt was durcheinander gebracht habe: Sorry.

Cu Selur

an3k

Zitat von Selur

Höh?

Dachte:
1. er hat eine Videospur die 23.976 fps hat
2. er will die Tonspur (6488 Sekunden) dieser durch eine andere Tonspur (6222 Sekunden) ersetzen
-> neue Tonspur muss gebremst werden da sie zu kurz ist.

Falls ich da jetzt was durcheinander gebracht habe: Sorry.

Cu Selur

Soweit korrekt, nur dass die Tonspur des 23.976-Videos nicht 6488 Sekunden lang ist sondern länger. Die von mir angegebenen Werte in Sekunden waren für die ein und die selbe Tonspur, jeweils nach der Konvertierung von 25fps auf 23.976, bzw. 29.970.

Die Tonspur des 23.976-Videos ist 6465 Sekunden lang, hat aber auch mehr Inhalt als die andere Tonspur.

Das Ziel-Video kann aber eigentlich keine 23.976fps haben, oder das Quell-Audio ist nicht 25fps denn umgewandelt auf 23.976fps hat dies eine Länge von 6488 Sekunden was eindeutig mehr ist als die längere Tonspur des 23.976-Videos. Ich teste es mal mit 24fps - irgenwas zwischen 23.976 und 25fps muss es sein

an3k

Ich hab nun mal beide Tonspuren in Sound Forge geladen und verglichen. Bei der neuen Tonspur fehlen rund 4 Minuten am Ende. Insgesamt ist die neue Tonspur eben diese 4 Minuten kürzer - dennoch waren die Ausschläge unterschiedlich.

Habe dann ein resample der neuen Tonspur auf 48kHz gemacht, nun stimmen die Ausschläge überein, bedeutet, dass beide Tonspuren den selben Speed haben / für ein Video mit der selben Framerate sind - oder - dass Sound Forge den Speed ignoriert und die tatsächliche Länge anzeigt, bzw. Tonspuren unterschiedlichen Speeds gleich anzeigt.

[EDIT]: Asyncron bleibt es trotzdem, nach 12 Minuten rund 1 Sekunde...langsam bin ichs leid.

Jetzt mitmachen!