Das MP3 Pegelanpassungsthema

  • Hallo

    Ich weiß das es ein Tool mit dem Namen Mp3Gain gibt um z.B. eine Sammlung von Mp3 Dateien auf eine einheitliche Lautstärke "Pegel" zu bringen. Natürlich gibt es auch die Möglichkeit die maximale Lautstärke ohne Clipping aus einer Mp3 rauszuholen jedoch frage ich mich jetzt folgendes...

    Ist es wircklich so das 89db Standard ist und digitale Audiodateien diesen Wert wenn möglich nicht überschreiten sollten? falls ja warum?
    Meiner Meinung nach ist das doch eigentlich zu leise, für tragbare Mp3 Player auf alle Fälle.

    Ich habe das nämlich mal getestet, ich habe eine Vinyl digitaliiert und mit GoldWave bearbeitet und dann in Mp3 - VBR encodiert, auf der HIFI Anlage, Autoradio sowie Mp3 Player fand ich den Klang und die Lautstärke ok.

    Dann habe ich halt ein Stück durch MP3Gain gejagt und das Resultat war dann um einiges leiser da ich die 89db Anpassung vorgenommen habe.
    Also, ausser das die Mucke leiser ist habe ich keine Unterschiede feststellen können, für mich persöhnlich ist 89db eher ein Nachteil, man muss die Player höher drehen um auf Lautstärke zu kommen.

    Was hat das ganze jetzt aufsich und welcher Trick steckt dahinter? ich verstehe das ganze nämlich nicht.
    Wenn doch z.B. nur 1-3 Samples in einem Stück ganz kurz übersteuern dann muss man doch nicht das ganze Stück auf 89db runterdrehen oder?

    Hat jemand richtig Ahnung davon?

  • Also richtig Ahnung habe ich eigentlich nicht, jedoch benutze ich auch mp3gain und bin ebenso der Meinung, dass 89db zu leise ist. Meiner Meinung nach ist dieser Wert von den Machern des Programms gewählt worden, weil es ab diesem Wert quasi kein Clipping mehr gibt. Ich habe bei mp3gain einen Wert von 95db eingestellt und habe keine Probleme damit. Selbst wenn ein Clipping angezeigt wird, hören tue ich es nicht.

    Quapla'
    Gothmog

    Gegen jeden, der es unternimmt, diese Ordnung zu beseitigen, haben alle Deutschen das Recht zum Widerstand, wenn andere Abhilfe nicht möglich ist. (Art. 20(4) GG)[SIZE=-1]
    [/SIZE]

  • So wie ich das verstanden habe, ein Metal Stück mit 90db hört sich für uns Menschen lauter an als ein 90db Pop oder Klassik-Stück.
    Wenn man jetzt das Klassik-Stück auf die für uns hörbare Lautstärke des Heavy-Stückes anpasst dann übersteuert das Klassische-Stück, also muss erst das Metal-Stück mit der Lautstärke runter und zwar soweit bis das Klassiche-Stück an das Niveau des Heavy-Stückes rankommt ohne zu übersteuern. Im Endeffekt sind dann aber beide Stücke etwas zu leise wobei aber kein Clipping mehr vorhanden. Ein einheitliches anheben der Gesamtlautstärke eines Liedes z.B. auf den ruhigen Passagen wäre ne Katastophe, wer sowas macht hat kein Plan von Musik.

    Die Materie ist wohl insoweit problematisch, wenn man eine Zusammenstellung diverser Musik Genres normalisieren möchte, es ist wohl dann rein technisch nicht möglich alles auf ein angemessenes Lautstärkenniveau zu bringen ohne das viele Lieder übersteuern.

    @got..
    Wir hören kein Clipping wenn es nur paar Samples sind, aber drech mal den Peak so auf das fast 50% des Liedes übersteuert sind dann hörst du schon das es verzerrt, knistert und kreischt.
    Deshalb denke ich, MP3Gain ist nix, dem Tool fehlt eine Waveform kontrolle wo man genau sehen kann was also welche Passagen übersteuern und wieviel.

  • Vielleicht solltet ihr auch mal den kleinen Unterschied zwischen "Maximum" und "Durchschnitt" beachten (auch bekannt als Klang-Dynamik).

    Ich glaube ja nicht, dass die heutige Jugend sich noch dafür interessiert ... aber eine wunderbare Demonstration dieses Dilemmas ist "Die Sinfonie mit dem Paukenschlag": Die fängt erst gemütlich an, wird dann immer leiser ... und haut plötzlich einen Tusch rein. In den paar Sekunden hat man ein extrem lautes Maximum. Der Rest ist eher moderat.

    Ja, bei Pop trifft das in etwa auch zu - eher ein mäßiger Durchschnittspegel, nur kurze Maximal-Stellen. Heavy-Metal dagegen ist praktisch durchgängig am Maximum. Logisch, dass man da anders herangehen muss.

  • Kennen tue ich auch so einiges nur mit dem hören ist es dann halt so ne Sache ;)

    So, an die Spezialisten hier, was ist denn jetzt der optimale db Wert den man bei MP3 benutzen sollte, also der maximale Peak die eine MP3 haben sollte ist?

    Ich weiß z.B. von früher als noch MCs und TapeDecks in Mode waren und ich Vinyls daruf aufnahm, man immer bis zum Dolby Zeichen ausgesteuert hat um eine saubere UNVERZERTE Aufnahme zu bekommen, das war bei 0db wenn ich mich nicht irre. Aber das ist ja nicht digital gewesen sondern analog also kann man sich wohl 0db bei Mp3 wohl knicken.

  • Bei der magnetischen Aufzeichnung (MC, Tapedecks), wird soweit ausgesteuert, das die Magnetisierung des Bandes möglichst dicht in die Sättigungskurve fährt. Da diese eine weich auslaufende Kurve im oberen Sättigungsbereich ist, kann man mit dem Pegel bis quasi 0 dB gehen, ein Klipping (Übersteuern) ist da nicht hörbar. Geschuldet sind die 0 db auch dem (damals) geringem SNR (Signal/Rauschabstand) von gerade mal 40-60 db, auch bei Dolby. Heutige digitale Aufzeichnungsgeräte haben einen SNR von wenigstens 90 db. Ausgesteuert wird hier mit max. -12 dB. Ab 0 dB gibt es aufgrund des digitalen Aufzeichnungsverfahrens (A/D-Wandlung) ein gnadenlos hörbares Klipping (Kratzen, Knallen). Vergleichen kann man das in etwa mit einer Schaumstoffmatte (analog) und einer Betonplatte (digital). Wenn Du mit dem Finger ins Schaumstoff drückst (0dB) hast Du immer noch etwas Luft zum Nachdrücken (übersteuern), in Beton geht da ab Oberfläche nichts mehr.

    BJ1

  • -12db sind doch wohl ein Witz, das ist doch für MP3 die man z.B. im Auto hört doch ziemlich leise. Da musst du ja ne Menge an Watt haben um das ganze auch zu verstärken. Von portablen MP3 Player will ich erst garnicht sprechen da wird man dann wohl fast nix hören.

  • Du verlierst schon wieder den Unterschied zwischen digital und analog aus den Augen.

    Es geht bei der Antwort von BJ1 nicht um MP3s zum Zeitvertreib, sondern um qualitativ hochwertige PCM-Digital-Aufzeichnungen. Diese brauchen einen "Headroom" (Reserve), damit sie aber auch im ungünstigsten Zufall nicht übersteuern könnten. Später im Tonstudio wird dann alles abgemischt, normalisiert, meist auch dynamikkomprimiert ... und das Ergebnis wird dann den verfügbaren Wertebereich zum Großteil ausreizen.

    Jetzt muss man nur beachten, dass psycho-akustische Komprimierung verlustbehaftet ist. Es werden Frequenzanteile unterdrückt, die man kaum wahrnimmt. Bei der Wiedergabe werden also weniger Frequenzanteile aufsummiert, als in den MP3-Encoder hineinkamen. Da aber Summanden auch mal negativ sein können, kann das Weglassen von Frequenzanteilen durchaus zum Übersteuern führen. Klingt paradox, ist aber so.


    Beispiel:

    Man nehme die Summanden 0.55, 0.3, 0.2 und -0.1; deren Summe ergibt 0.95.

    Die Psychoakustik entscheidet nun: Der Anteil von -0.1 ist (z.B. wegen des Frequenzbereiches) "unwichtig". Er wird nicht mitgespeichert.

    Bei der Wiedergabe bleiben als Summanden nun 0.55, 0.3 und 0.2 -- deren Summe ergibt nun 1.05! Und schon haben wir eine Übersteuerung, die im Original nicht enthalten war.


    Die hier genannten Werte sind sicherlich stark vereinfacht und übertrieben. Bei der Kompression von MP3 oder ähnlichen psychoakustischen Formaten werden in jedem Block mit einer Dauer von Sekundenbruchteilen mehrere Hundert / Tausend Frequenzkomponenten bewertet, skaliert, quantisiert und zum Teil verworfen. Mit einem Headroom von vielleicht 0,5 bis 1,0 dB ist man bei nahezu transparenter Qualität bereits sehr sicher.

    Es ist gut möglich, dass dein Original bereits voll ausgereizt war, oder gar schon Wiedergabe-Clipping hatte. Da man über die bereits vorliegenden MP3-Stücke nichts weiß, kann man auch schlecht Ratschläge geben, wie (und ob) man sie verändern sollte.

    Messen kann man die Dynamik eines Musikstückes eigentlich nur, wenn es unkomprimiert vorliegt. Dann kann man leiseste und lauteste Bereiche vergleichen und ein Verhältnis bilden. Dieses wird auch von der Auflösung der Samples abhängen. Die Skalierungsfaktoren in den MP3-Blöcken geben darauf nur einen recht ungenauen Hinweis.

  • Naja mir geht es um genau das in diesem Thread, wenn man doch was anderes meint dann könnte man das doch eventuell dazuschreiben, woher soll ich das denn wissen? wenn ich das alles wüsste würde ich nicht hier fragen und einen schlecht bezahlten Job ausüben.

    Ich meine den Apfel und die Antwort bezieht sich auf ne Birne toll, mir geht es genau darum, um MP3 Musik für den Zeitvertreib, bis wieviel dB man diese aussteuern darf um nicht zu übersteuern. Und, wenn nur 2-3 Sammples im Lied übersteuern ist das denn dann wircklich notwendig die Gesamtlautstärke runterzusetzen oder kann man das ignorieren. 89dB was das Tool MP3Gain vorschlägt "Standard" scheint mir zu niedrig, wenn ich mir die Datei in einem WaveEditor anschaue dann muss man kein Profi sein um zu sehen das da noch ohne Ende Platz ist bis zum kritischen Peak wo es zu Clipping kommen KÖNNTE also 0dB.

    Wenn ich doch im WaveEditor ein Sample Sehe der z.B. bis 92db geht der Rest des Liedes sich aber im Bereich 90dB aufhält dann kann doch hier keine Rede von Clipping sein, MP3Gain aber sagt CLIPPING, wo bitte ist da Clipping? kein Sample geht auf 0dB also ist das Tool MP3Gain Schrott oder ich habe die Materie komplett falsch verstanden.

  • Ich verstehe Angaben von +8x/9x dB nicht. Zumindest nicht in diesem Zusammenhang.

    Das absolute Maximum bei digitalem Audio (-100% bis +100% = der gesamte Umfang des Wertebereiches, bei 16-bit Integer wäre das -32767 bis 32768) ist definiert als "0 dB". Absolute Stille hat -∞ dB. Das feinste Signal für 16-bit Integer-Samples (Wechsel zwischen Samplewert -1 und 0, also 1/65536 des Wertebereiches) hat etwa -96 dB, das nächststärkere Signal (-1 bis +1 = 1/32768 des Wertebereiches) sind etwa -90 dB.

    Ich empfehle dir, für WAV, das du in MP3 konvertieren willst, eine Aussteuerung von maximal -0,5 dB (etwa 95%) zu verwenden. Für die Veränderung existierender MP3s kann ich gar nichts empfehlen.


    Im Anhang: ZIP-Archiv mit Excel-2003-Tabelle als Demonstration.
    __

    P.S.:

    Was du im WAV-Editor zu sehen glaubst, kann schon eine bereinigte Decodierung sein. Wer will dir garantieren, dass beim Import einer MP3 in einen WAV-Editor nicht die Lautstärke verringert wurde, um Clipping von Samples zu vermeiden?

  • Das versichert mir der Autor des bezahlten WaveEditors, ich denke das GoldWave sowie WaveLab was nicht gerade billig ist das nicht ohne dem Wissen des Benutzers machen würde, warum auch?

    Danke für die angehänge Datei.

    Ich habe ein Bild angehängt welches zeigt wie hoch ich meine Audio Dateien aussteuere, sach mir anhand der Grafik ob das jetzt übersteuert ist oder nicht. Die Scala zeigt dB Werte, oben die 0 ist halt 0dB.
    [Blockierte Grafik: http://home.arcor.de/famkun/screenshot.jpg]

    PS. Ich möchte dir für deine Mühe und Interesse mir Dinge zu erklären danken.

  • Bei der Vergrößerung ist das schwer zu erkennen. Stellt GoldWave jede senkrechte Pixel-Linie als Maximum oder als Durchschnitt über diese Zeitdauer dar, die eine Linie breit ist? Wenn es Durchschnitt ist, dann wirst du bei der Vollansicht keine Übersteuerung sehen. Aber (wenn GoldWave diese Funktion hat) lass mal nach der Stelle mit maximaler Amplitude suchen...

  • Laut Hilfedatei ist eine Pixellinie die maximale Aussteuerung an dieser Stelle. Leider hat GW keine Funktion mit der man in einem Lied die lauteste Stelle suchen kann. Hmm...wenn ich erlich bin ist das schon arm irgendwie, jetzt wo du es erwähnt hast wäre so eine Funktion doch recht hilfreich.
    Muss den Autor mal anschreiben.

    Und was heisst jetzt das man das nicht sehen kann, also ich kann sehen das nicht eine Pixellinie an die 0dB ist, oder übersteuert das jetzt auch schon VOR 0dB?

  • Also wenn laut Doku das Maximum verwendet wird, sollte in dem Fall die Anzeige tatsächlich relativ sicher sein. Dennoch muss man schon die betreffende Stelle bis auf Einzelsample-Level zoomen und dann beurteilen, ob da eine abgeschnittene Welle zu sehen ist.

    Aber wie gesagt: Es ist denkbar, dass ein MP3-Decoder anders arbeitet. Übersteuernde Decodierergebnisse auf das Maximum beschränken (clamping) ist nur eine Möglichkeit. Eine andere wäre, dass der übersteuerte Anteil vom Positiven ins Negative (oder andersherum) überklappt - das wäre noch schlimmer, und bei dieser Vergrößerung nicht zu bemerken. Eine dritte und bessere Möglichkeit wäre, die Lautstärke weich sättigen zu lassen (so wie ich das im "Booster", der auch von BeSweet verwendet wird, programmiert hatte).

    Letztlich hängt das vor allem davon ab, welcher MP3-Decoder verwendet wird. Die gibt's ja heute in ausreichender Anzahl, und mit Extremfällen gehen die alle ein wenig anders um. Teste doch mal, wie es aussieht, wenn du eine absichtlich übersteuerte MP3 öffnest.

  • Vorweg: Ich kannte bis jetzt MP3Gain nicht, und hab es daher auch noch nie genutzt.

    Als Grundlage für ReplayGain empfehle ich diesen Artikel von AudioHQ unbedingt zu lesen!

    Praxis:
    Persönlich benutz ich foobar2000 (siehe Signatur) und dessen integriertes ReplayGain. Ich hab bei mir die Referenzlautstärke um +3db (also auf 92db) erhöht, noch höher zu gehen würde ich nicht raten (Clippinggefahr zu stark). Mein Archiv besteht zum Großteil aus lossless komprimierten FLAC-Dateien. Für meinen MP3-Player ( = Handy) encode ich die FLAC mit LAME inklusive der ReplayGain-Werte in MP3.
    Ein lossy zu lossy Transcoding (z.B. OGG --> MP3) ist generell nicht empfehlenswert.
    MP3Gain arbeitet anders als foobar2000 (fb2k). Während fb2k die ReplayGain-Informationen im ID3-Tag hinterlegt, ändert MP3Gain die Audiodatei direkt. Dass kann von Vorteil sein, wenn du z.B. eine bestehende MP3 ohne Transcoding mit ReplayGain-Encodeten Dateien mischst und trotzdem eine einheitliche Lautstärke haben möchtest.

    Theorie:
    Wenn du bei einer Audio-Datei die Lautstärke bis auf knapp vor 0db erhöhst (typischer Weise 95% bis 98%, 0db = 100%), ist das eine Normalisierung. Es wird versucht die Audio-Datei so laut wie möglich zu machen, ohne das Clipping auftritt (<0db). (Verlustbehaftet)
    ReplayGain macht etwas anderes. Es Hinterlegt Lautstärkeinformationen in der Audio-Datei, die es auf einen bestimmte "Lautheit" bringt; die Referenzlautstärke 89db. Selbst wenn du zwei Dateien hast, die du Normalisierst, müssen diese sich nicht "gleich laut" anhören. ReplayGain analysiert die Dateien (mit Hilfe psychoakustischer Modelle), wann beide 89db "laut" klingen und schreibt diese Information hinein. (Verlustfrei)

    ___

    Der Booster in BeSweet ist ein Kompressor; d.h. er kann laute und leise Stellen einander angleichen. ("Flüstern klingt genauso laut wie ein Pistolenschuss")

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!