MeGui Audio Encoding: Normalize Peaks?

  • Tonspuren, die in komprimierter Form vorliegen, werden meist als eine Art Frequenzspektren für kurze Zeitabschnitte gespeichert, weil sie sich so effizienter komprimieren lassen als ihre tatsächlichen Samplewerte zu jedem einzelnen Sampling-Zeitpunkt. Die Anteile bestimmter Frequenzbereiche am gesamten Spektrum werden üblicherweise als Fließkommawerte in diesen komprimierten Formaten gespeichert, das aber nur mit eingeschränkter Genauigkeit.

    Beim Abspielen muss aber daraus wieder ein PCM-Ton mit einzelnen Samples zurückgerechnet werden. Wenn dies mit Ganzzahlwerten geschieht, dann ist nur ein bestimmter Wertebereich erlaubt (bei 16 bit: -32768 .. 32767). Würde beim Decodieren ein Wert berechnet werden, der darüber hinausgeht, müsste dieser auf den erlaubten Bereich begrenzt werden, was den Klang verschlechtert; das ist aber immer noch besser, als wenn solche Samples durch Abschneiden von höchstwertigen Bits, die den Wertebereich übersteigen, einzeln ins Negative "umgebrochen" werden, das würde ein lautes Kratzen im Klang verursachen.

    Die Option "Normalize peaks" soll verhindern, dass die lautesten Stellen übersteuern, indem zunächst ermittelt wird, wie laut denn die eine allerlauteste Stelle der gesamten Tonspur überhaupt ist, und dann einen Verstärkungsfaktor so berechnet, dass während der Konvertierung diese lauteste Stelle nur #% des erlaubten Wertebereiches erreicht. Umgekehrt würde die Normalisierungs-Funktion aber auch Tonspuren, die insgesamt eher leise sind, in der Lautstärke so erhöhen, dass der erlaubte Wertebereich gut ausgeschöpft wird.

    Wenn man normalisieren lassen will, sollte man als gewünschtes Maximum etwas weniger als 100% wählen, weil theoretisch die Frequenzanteile, die bei psychoakustischer Komprimierung als "vermutlich unhörbar" weggelassen werden, vielleicht gerade die waren, die – rein theoretisch – hier und da eine Übersteuerung durch Gegenphase verhindert hätten; häufig wird 98% vorgeschlagen.

  • Danke für die Antwort.

    Jetzt habe ich noch eine Frage, die damit nichts zu tun hat.

    Ist es sinnvoll bei einer Multichannel Audio Spur,(AC-3 6 Channel) einen - Downmix to Stereo - vorzunehmen?

  • Da wäre es eigentlich am sinnvollsten, die Tonspur gar nicht zu konvertieren, soweit möglich, sondern wie im Original zu übernehmen. Dolby Digital enthält einige Zusatzinformationen, die optimale Wiedergabe unterstützen sollen; die würden bei jeder Konvertierung (zusätzlich zu einem gewissen Grad Audioqualität) verlorengehen.

    Aber wenn es nötig ist, dann hängt es v.a. vom gewünschten Zielformat ab. MP3 unterstützt beispielsweise ohnehin maximal 2 Kanäle, und wenn man unbedingt viel Bitrate sparen will, dann sind Tonspuren mit nur 2 Knälen auch besser komprimierbar als Mehrkanal. Man sollte dann aber eine Matrix nach Dolby ProLogic wählen, meist DPL II (die erlaubt mit ProLogic-II-Surround-Decoder noch eine gewisse Unterscheidbarkeit zwischen links-hinten und rechts-hinten, und klingt auch ohne Surround-Decoder mit nur zwei Lautsprechern immer noch recht angenehm).

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!