Advanced Audio Coding
Aus Gleitz DVDWiki
(Weitergeleitet von MPEG-2 AAC)
Advanced Audio Coding (kurz AAC) ist ein verlustbehaftetes Audiokompressionsverfahren des MPEG-Standards und kann als Nachfolger für MP3 angesehen werden.
Inhaltsverzeichnis |
MPEG-2 Part 7: Advanced Audio Coding
"MP3" + TNS + IS + … + TP = MPEG-2-AAC
MPEG-2-AAC verwendet ähnliche/gleiche Verfahren wie beim MPEG-1 Audio Layer 3 (MP3) zur Kompression (daher MP3 in Anführungszeichen), die jedoch inkompatibel zum MP3-Standard sind, da bei der Entwicklung von AAC die Schwächen des MP3-Verfahrens ausgebügelt und dessen Kodierungsverfahren verbessert wurden.
MPEG-4 Part 3: Advanced Audio Coding
MPEG-2-AAC + PNS + … + LTP = MPEG-4-AAC
- MPEG4-AAC unterstütz i.d.R. bis zu 48 Haupttonkanäle (bei bis zu 96 kHz Abtastrate) und bis zu 15 Tief-Frequenz-Kanäle (bis 120 Hz). Dies entspricht 48.15 (z.Z. gebräuchlich ist 5.1 bis 7.1).
MPEG4-AAC Object Types
Der Standard MPEG-4 Part 3 (AAC) unterscheidet verschiedene Object Types (heißen Profiles bei MPEG2-AAC). In diesen werden spezielle Komprimierungsverfahren für entsprechende Anwendungsbereiche verwendet.
Main
- Standardprofil
SSR (Scalable Sample Rate)
- für Streaming mit skalierbarer Bitrate
LTP (Long Term Prediction)
LD (Low Delay)
- für Streaming in Echtzeit (z.B. bei Videokonferenzen)
LC (Low Complexity)
MPEG-4-AAC ohne LTP = LC-AAC
- Der bekannteste Object Type dürfe AAC-LC sein. Er ist für mittlere bis hohe Bitraten (96kbps bis 320kbps) gedacht.
- Verwendung findet AAC-LC z.B. in verschiedenen Online-Musikshops und ist auch in einigen Handys implementiert.
HE (High Efficiency)
- Weiterhin gibt es AAC-HE, das für niedrige bis sehr niedrige Bitraten (24kbps bis 64kbps) gedacht ist.
- AAC-HE ist abwärtskompatibel zu LC-AAC.
- AAC-HE gibt es in zwei Versionen:
AAC-HEv1
AAC-LC + SBR = AAC-HEv1
- Bei HEv1 wird LC-AAC um Spectral Band Replication (SBR) ergänzt. Bei SBR werden hohe Frequenzen beim Encoding abgeschnitten und bei der Wiedergabe synthetisch aus den darunter liegenden mittleren Frequenzen errechnet. Dieses Verfahren lohnt sich besonders bei einer geringen Bitrate, jedoch geht unweigerlich Transparenz verloren.
- AAC-HEv1 = AAC+ v1 = AACplus v1
AAC-HEv2
AAC-HEv1 + PS = AAC-HEv2
- Bei HEv2 wird HEv1 um Parametric Stereo (PS) ergänzt. Das Stereosignal wird in ein Monosignal (!) umgewandelt und zusätzlich Steuerinformationen gespeichert. Der Decoder reproduziert aus dem Monosignal mit den Steuerinformationen ein Stereosignal (kein "echtes" Stereo, hört sich nur wie Stereo an).
- AAC-HEv2 = AAC+ v2 = AACplus v2 = Enhanced AAC+
Fachbegriffe
- LTP = Long Term Prediction
- Vorhersagen über den wahrscheinlichen Signalverlauf im nächsten Zeitabschnitt.
- IS = Intensity Stereo
- Stereosignal wird in ein Monosignal (!) umgewandelt und zusätzlich Richtungsinformationen gespeichert. Dadurch gehen Phaseninformationen verloren, die allerdings bei bestimmten Frequenzen (über 2kHz) nicht vom Menschen wahrgenommen werden können. Der Decoder produziert den Stereoklang aus dem Monosignal mithilfe der Richtungsinformationen.
- LTP = Long Term Prediction
- Vorhersagen über den wahrscheinlichen Signalverlauf im nächsten Zeitabschnitt.
- PNS = Perceptual Noise Substitution
- Wahrnehmbares Rauschen wird durch künstlich erzeugtes Rauschen bei der Wiedergabe ersetzt.
- PS = Parametric Stereo
- Stereosignal wird in ein Monosignal (!) umgewandelt und zusätzlich Steuerinformationen gespeichert. Der Decoder reproduziert aus dem Monosignal mit den Steuerinformationen eine Stereosignal (kein "echtes" Stereo, hört sich nur Stereo an).
- SBR = Spectral Band Replication
- Hohe Frequenzen werden bei der Kodierung (Encoding) abgeschnitten und bei der Wiedergabe (Decoding) synthetisch aus den darunter liegenden mittleren Frequenzen errechnet.
- TNS = Temporal Noise Shaping
- Quantisierungsrauschen wird im Zeitbereich so positioniert, dass es von lauteren Klängen übertönt wird.
- TP = Temporal Prediction
- Erhöht die Komprimierbarkeit von fest stehenden Signalen.

