Lohnt Downsampling von 48 kHz auf 44100 Hz?

  • Die Frage im Betreff ist vereinfacht. Mir ist bewusst, dass Downsampling immer mit Verlust verbunden und deshalb nicht günstig ist. Meine Situation (und das ist keine so exotische) ist aber die, dass ich aus der Quelle ein ABR MP3 machen möchte mit ca. 128 kbps.

    Wenn ich die Quelle bei 48 kHz lasse, muss lame mehr Samples encodieren und trotzdem mit derselben Bandbreite auskommen, muss also etwas stärker komprimieren. Wenn ich dagegen downsample, verliere ich Qualität beim Downsamplen. In FAQs habe ich keine klare Antwort auf diese Frage bekommen können außer "nicht downsamplen wenn's nicht nötig ist". Aber womit fahre ich bei fester Bandbreite besser?

  • Vor der Komprimierung werden "einzelne Samples" über einen kurzen Zeitbereich in ein Frequenzspektrum umgewandelt; es werden also nicht Samples komprimiert, sondern Frequenzen. Und bei mäßigen Bitraten schneiden die MP3-Encoder (außer man verhindert das) sowieso Frequenzen oberhalb einer bestimmten Grenze ab, damit sie nicht unnötig Daten an fast unhörbare Höhen verschwenden.

    Das zur Verfügung gestellte Frequenzspektrum wird in eine feste Anzahl von Subbändern unterteilt. Insofern sind diese bei einem geringeren Gesamt-Frequenzumfang vielleicht etwas feiner aufgelöst. Aber ich glaube, bei gerade mal nur 128 kbps musst du dir keine Sorgen um solche Kleinigkeiten machen, der hörbare Verlust durch die Psychoakustik wird größer sein als die sicher unhörbar feinere Auflösung, oder die fast unhörbaren Resamplingeffekte.

    Genau kannst du es aber nur in einem ABX-Feldversuch herausfinden.

  • Danke für die Antwort.

    Zitat von LigH

    Aber ich glaube, bei gerade mal nur 128 kbps musst du dir keine Sorgen um solche Kleinigkeiten machen, der hörbare Verlust durch die Psychoakustik wird größer sein als die sicher unhörbar feinere Auflösung, oder die fast unhörbaren Resamplingeffekte.


    Ja ich geb's zu, ich hab Platznot :hm:, aber gerade weil ich nicht viel Bandbreite hab, möcht ich gerne das Beste herausholen. Ich tendiere derzeit zu 48 kHz mit nem Tiefpass bei 44 kHz, da sollte für die hörbaren Anteile genug übrigbleiben (wenn's klirrt auch bissl mehr, ist immerhin ABR).

    Zitat

    Genau kannst du es aber nur in einem ABX-Feldversuch herausfinden.


    Hehe, das wollte ich schon immer mal. Ein guter Anlass für nen Pepsi-Test. Naja, hätte ja sein können, dass es dazu schon allgemein anerkannte Erfahrungswerte gibt (ich hielt meine Frage für eine häufige).

  • Zitat von Eastermeyer

    Wie wär's mit aacPlus ?


    dann hat er aber das problem das er die files nicht auf jeden player wiedergeben kann.

    gibts überhauptschon aac fähige stand alone player ?

  • Zitat von Eastermeyer

    Wie wär's mit aacPlus ?

    Naja nee, das wird ne Tonspur für ein Video und das muss auch auf DVD-Playern laufen wie RiPpMaStER schon vermutet hat. Außerdem ist AACplus kein freies Verfahren.

    Zitat von Kika

    Tiefpass bei 44 kHz? Häh? Hier geht's doch um Sampling- und nicht um Tonfrequenzen.


    Es geht um Kompression und wenn oberhalb 44 kHz gedämpft wird, lässt sich's besser komprimieren (hohe Frequenzen sind "teuer", je nach dem wie gut der Codec sich anstellt).

  • Zitat

    Außerdem ist AACplus kein freies Verfahren.

    MP3 auch nicht.
    Trotzdem gibt es für beides freie Encoder.

    Die Rotation der Erde wurde in den letzten Jahren primär durch sich im Grab umdrehende Musiker angetrieben - Mainstream sei dank.

  • Sweeet
    Mir ist die Wirkung von Filter durchaus bekannt. Aber bei 44 kHz zu filtern..., wo haben wir im Audio-Bereich überhaupt so hohe Frequenzen? Nirgens!

    Die maximale Tonfrequenz bei einer Samplingfrequenz von 44.1 kHz ist 22 kHz - und auch das nur theoretisch, denn nur 2 Samples pro Schwingung würde ich nicht mehr als "Ton" bezeichnen... ;)

  • Ich kann dir nur eines empfehlen:

    Lass LAME da mal machen (bzw. die LAME-DLL, die von BeSweet benutzt wird). Die Entwickler von LAME haben jahrelang nach optimalen Einstellungen gesucht, und gerade die "Presets" (z.B. "--preset name" oder "--preset bitrate") sind schon wirklich hervorragend ausgeklügelt.

    Bevor du anfängst, den Tiefpassfilter zu verändern, müsstest du schon besser als die HydrogenAudio-Leute wissen, warum und wie.

  • Zitat von Kika


    Die maximale Tonfrequenz bei einer Samplingfrequenz von 44.1 kHz ist 22 kHz - und auch das nur theoretisch, denn nur 2 Samples pro Schwingung würde ich nicht mehr als "Ton" bezeichnen... ;)

    Genau die 2 Samples reichen aber aus - vorausgesetzt dein DAC arbeitet vernünftig, dein Ton (wir reden von einer Sinusschwingung bestimmter Frequenz) wird durch mehr samples nicht besser. (wenn der DAC natürlich Rechteckwellen erzeugt generierst du Frequenzen, die nicht vorhanden waren.) Nur das die gewünschte Amplitude besser getroffen wird, wird wahrscheinlicher.

  • Na ja, so kann man das nicht stehen lassen. Was einen Sinus betrifft, klar, den kann man restaurieren, aber Musik? Niemals, dazu ist das viel zu komplex.
    Und was der DAC erzeugt... nun, interpoliert ist auch nicht immer besser. Besonders, wenn am Ziel vorbei interpoliert wird. Das "Glattbügeln" eines Rechtecks macht noch lange keinen original Ton aus.

    Aber OK: Nehmen wir mal an, wir haben eine Sinus-Schwingung und nehmen uns mit den 2 Samples nur einen halben Wellendurchgang vor. Dann hast Du schon jetzt das Problem, dass der Zeitpunkt, zu dem das Sampling erfolgt, masgeblich am Ergebnis beteiligt ist. Startet das erste Sample am Nulldurchgang und das zweite am Max.-Wert - was bei 22 kHz Ton- und 44 kHz Sampling-Frenquenz theoretisch vorkommen kann - und weiß ich dann, dass da ein Sinus gesampled wurde, dann ist ja alles OK. Aber eben NUR dann. Und das sind Bedingungen, die in der Praxis niemals vorkommen.
    Wirklich sauber aufgelöst kriegt man bei 44.1 kHz höchstens den Bereich bis 12-13 kHz, danach hat das mehr mit Raten zu tun. Die Qualität des Ratespiels entscheidet dann über die Klangqualität.
    Ist doch beim Video-Digitalisieren genau dasselbe - aus ca. 900 Samples werden 702 (704) Pixel erzeugt, wobei genau genommen ca. 670-690 eigentlich optimal währen, der Rest ist Zugeständnis an die Digitaltechnologie, die's gern durch 4,8,16 teilbar mag.

  • Danke für die schnellen Antworten :daumen:. Meine Frage ist damit beantwortet und entspricht auch meiner Vermutung.

    /edit: Kika: Danke für die Theorie (ich liebe sowas). Das wär natürlich doch ein Argument für nen Filter, aber ich vermute, lame & Co. machen das raffiniert genug. Der Encoder müsste eigentlich eine Änderung der Bitrate besser machen können als ein vorgeschaltetes Tool, das von den Spektren nichts weiß.

  • Sweeeet
    Es gibt durchaus Programme, die sowas können, wie es Dir vorschwebt, aber LigH hat es schon angedeutet: Man muss zu 100% genau wissen, was man da eigentlich tut, sonst verschlimmbessert man, statt zu verbessern.

    Zitat

    Danke für die Theorie (ich liebe sowas).



    Geht mir auch so, die Praxis ist dann Sache anderer Leute. ;)
    Eigentlich interessiert mich an dem ganzen Video- und Audio-Krempel nur die Theorie.

  • Zitat von Kika

    Sweeeet
    Es gibt durchaus Programme, die sowas können, wie es Dir vorschwebt, aber LigH hat es schon angedeutet: Man muss zu 100% genau wissen, was man da eigentlich tut, sonst verschlimmbessert man, statt zu verbessern.


    Ja. Bis zu einem gewissen Grad von Kompliziertheit komm ich mit meinem Grundwissen plus gesundem Menschenverstand aus beziehungsweise liege ich statistisch verteilt oft richtig. Aber spätestens bei psychoakustischen Modellen isses natürlich Sense wenn man nicht etliches dazu gelesen hat.

    Zitat von Kika

    Geht mir auch so, die Praxis ist dann Sache anderer Leute. ;)
    Eigentlich interessiert mich an dem ganzen Video- und Audio-Krempel nur die Theorie.


    Hm, weiß nicht, macht schon Spaß, aber zu einem gewissen Teil isses sicher auch Handwerk und Trial & Error hilft auch oft weiter. Natürlich immer toll wenn man dank Theorie wenig Error hat und nicht viel Trial braucht.

  • Theorie schützt auch vor Trial & Error nicht - davon zeugt schon meine beachtliche Sammlung leerer CD-Cases. Denn jede Theorie muss in der Praxis überprüft werden. ;)
    Denn die Theorie ist das eine - wie die entsprechenden Tools die dann in die Wirklichkeit umsetzen, das ist eine ganz andere Sache. Aber OK, das kriegt jetzt schon fast einen philosopischen Touch.

    Tatsache ist, dass man, wenn man kein absoluter Experte ist, besser beraten ist, auf die entsprechenden Tools zu vertrauen, als irgendwie herumzuexperimentieren. Einzige Ausnahme: Man mag gerade das Experimentieren (so wie ich z.B.). Aber dann sind die theoretischen Grundkenntnisse auch nur eine Hilfe, nie was absolutes.

  • Zitat von Kika

    Tatsache ist, dass man, wenn man kein absoluter Experte ist, besser beraten ist, auf die entsprechenden Tools zu vertrauen, als irgendwie herumzuexperimentieren.

    Puh, also mir sind gerade bei OpenSource schon weniger tolle Sachen untergekommen. Ich will jetzt nicht meckern, ganz im Gegenteil, ich finde es toll, dass Leute Zeit und Mühe für die Allgemeinheit opfern. Nur gibt es halt etliche motivierte Programmierer, die einfach mal loslegen und nicht so viele, die einen Haufen Ahnung von Audio haben. Naja, die prominenten Programme, die jeder kennt, sind meist schon wirklich gut. Andererseits... damals war den Xing-Encoder auch wirklich populär :D.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!