Hi!
Ich hoffe ich poste hier mein Problem im richtigen Teil des Forums, passt
jedoch wohl noch am besten:
Ich bin derzeit im Rahmen meiner Diplomarbeit dabei einen MPEG-2 Enkoder in
Matlab zu programmieren (Den verlustbehafteten Teil). Eigentlich funzt schon alles relativ gut. Jedoch habe ich noch zwei Probleme. Zunächst einmal wie die Quantisierung bei Interframe Coding genau funktioniert. Hierzu habe ich das Buch Bilddatenkompression - Grundlagen, Codierung, Wavelets, JPEG, MPEG, H.264 von Tilo Strutz. Dort steht eine relativ komplizierte Formel für die Rekonstruktion der quantisierten Werte (Ich erspar mir momtan noch diese hier zu posten vllt lässt sich das Problem auch so beheben). In anderer Literatur oder anderen Webseiten ist meistens jedoch nur die Rede von einer Rekonstruktion durch Multiplikation der quantisierten Werte wieder mit der Quantisierungsmatrix (was auch logisch ist). Die Frage ist nun was wird bei den normalen Encodern/Decodern hier verwendet? Leider gibt es zu diesem Bereich im Internet sehr wenig genaue Information, nur "gefährliches Halbwissen"
Meine zweite Frage bezieht sich auf die bidirektionale Prädiktion (B-Bilder) und deren Funktionsweise. Hier ähnliche Frage, wie funktioniert diese explizit ? Werden die Bewegungsvektoren zum vorhergehenden Bild und zum nachfolgenden Bild berechnet, die zugehörigen Differenzfehlerbilder und dann ein Mittelwert derer gebildet ? Wie werden die Vektoren komibiniert ? Diese Frage wird ebenfalls in Litertur und Internet nicht tiefgehend geklärt. Ich weiss auch hier das die Vorgehensweise nicht festgelegt wird durch den MPEG Standard, jedoch wäre es trotzdem interessant hier eine gängige Lösung in Standardencodern zu erfahren!
Danke schonmal im Vorraus, hoffe es kann mir jmd helfen!
Ciao
Jojo