Fachbegriffe übersetzen ?

Selur

OT: Ich lese einfach einiges und habe brauchbare Grundkenntnisse im Videobereich.

Interessant wäre vor allem wenn jemand zu den nicht so Mainstream Codecs in MeGui etwas schreiben könnte. (Snow, LMP4)

Vor allem zu den Motion Estimation Compare Functions in Snow.

Henrik

Selur
Bei der Sucheingabe Motion Estimation Compare Function kommt weder bei Google,noch bei doom9/Forum Gleitz irgendetwas raus,womit ich was anfangen könnte. Wo suchen ? Oder wie sich die dem Thema annähern ?
Im Snow Thread bei doom9 ist auch nichts zu finden. Was machen sprach Zeus,bzw ich.

mad-eddy

Henrik: Weisst Du was die Funktion tut? Wenn ja, dann beschreibs doch einfach mit eigenen Worten. Die Übersetzung kann dann auch gern ma jemand in der Wiki winfügen der es weiss.

Henrik

mad-eddy

Zitat

Weisst Du was die Funktion tut

Ja zu sagen, wäre schlicht weg gelogen. Nach den ich mich fransig gesucht habe, bin ich hier drauf gestoßen :
global motion estimation, special case
http://forum.doom9.org/showthread.php…imation+Compare
Dort wird ein Link zur Correlation gegeben.
http://en.wikipedia.org/wiki/Correlation und da sage ich Ach du dickes Ei...
Gibt es zum Glück auch auf Deutsch:
http://de.wikipedia.org/wiki/Korrelationen Geht schon besser

Zitat

Die Korrelation ist gerade bei der Bildverarbeitung ein- oder mehrdimensionalen Daten bzw. Bilder von großer Bedeutung. Bei der Bildverarbeitung wird jedoch der Zeitfaktor (z.B. t) durch eine Ortsvariable (z.B. x) einfach ersetzt. Das Bild wird gewissermaßen als Signalfolge über den Ort interpretiert. Anders als bei Zeitfunktionen liegen bei Bildern nicht eine Zeitbasis sondern Bildpunkte vor, die sog. Ortsfrequenzen. Die Ortsfrequenzen sind gewissermaßen die Auflösung des Bildes. Bei der Korrelation zweidimensionaler Bilder sind entsprechend zwei statt einer Ortsvariablen anzusetzen.
Bei der Bildverarbeitung kann dann beispielsweise mittels Autokorrelation festgestellt werden, ob oder wo sich ein bestimmtes Objekt in einem Bild befindet. Das heißt Objekterkennung ist möglich.

und jmac698 sagt :

Zitat

In 2d case, this means, that if same colored pixels (within, linear effects of contrast, brightness), are present in each area (X,Y ) compared, then there is a match. For example, 8x8 block X will match 8x8 block Y even if Y is mirror image, or rotated 90 image, or even random shuffled pixels (64 shuffled random order pixels) image, it is matching perfectly.

wenn gleiche farbige Pixel (innerhalb, lineare Wirkungen des Kontrasts, Helligkeit) vorhanden sind, in jedem Bereich (X, Y), wird verglichen ob es eine Übereinstimmung gibt. ...oder so ähnlich.
Muß mich da erst durcharbeiten...weiß jedoch nicht ob ich da auf dem richtigen Weg bin.

Selur,LigH,Kopernikus,Broter John,u.a Hilfe

LigH

"Motion Estimation Compare Functions" ~ Vergleichsfunktionen für Bewegungsvorhersage

Eigentlich gar nicht so kompliziert:

Codecs, die Bewegungen schätzen wollen, um Ähnlichkeiten von aufeinander folgenden Bildern auszunutzen, brauchen Funktionen, mit denen sie die Ähnlichkeit von Bildausschnitten sinnvoll berechnen können.

Bewegungsschätzung wird ja bei DCT-basierten Formaten meist so durchgeführt, dass ein Block in seiner Umgebung bewegt wird, und jeweils die Differenz zum darunter liegenden Bildausschnitt in angrenzenden unabhängigeren Bildern (bei P-Frames: das vorherige I-Frame; bei B-Frames: umliegende I/P-Frames) minimiert wird. Es wird dazu aber meist nicht einfach die simple Subtraktion verwendet, sondern teilweise etwas aufwändigere Funktionen.

Diese Funktionen (Metriken) sind nun bereits in der ffdshow-Dokumentation erwähnt worden:

SAD = sum of absolute differences: Summe der absoluten Differenzen
SSE = sum of squared errors: Summe der quadratischen Abweichungen
SATD = sum of absolute hadamard transformed differences: Summe der absoluten Hadamard-transformierten Differenzen
DCT = sum of absolute dct transformed differences: Summe der absoluten DCT-transformierten Differenzen
PSNR = sum of the squared quantization errors: Summe der quadrierten Quantisierungsabweichungen / Peak Signal-to-Noise Ratio: Höchstes Signal-Rausch-Verhältnis

SAD ist als die simple arithmetische Summe der Absolutbeträge der Differenzen die schnellste Methode, aber nicht gerade die psychovisuell sinnvollste. SATD ist durch die Hadamard-Transformation der Differenzen näher an der "gefühlten Abweichung", besonders für etwas größere Suchradien, aber mathematisch etwas aufwändiger. Such-"Radius" ist dabei die Dimension der "Diamant-Umgebung" (ein um 45° gedrehtes Quadrat, weil eher senkrechte oder waagerechte Bewegungen i.A. wahrscheinlicher sind).

Henrik

LigH
Danke für die Erklärung !
Können wir gleich in die Wiki übernehmen.

Zitat

Eigentlich gar nicht so kompliziert

:eek::redface:

LigH

Übernehmen ... na, eventuell. Aber ich bezog mich hier zunächst auf DCT, weil die das Bild in Blöcke zerlegt, denen man einzeln einen "Motion Vector" zuweisen kann.

Wie das bei Wavelet-Fransformation aussieht, die das Bild ja meist als Gesamtheit darstellt, weiß ich nicht. Und Snow basiert ja auf Wavelets. Sicher gibt es dort statt dessen eine Verschiebung der Wavelet-Positionsparameter.

Falk

Salve

Oh mein Gott!!! Zu diesem Thema würde ich ganz gerne als einfacher Hauptschüler meine Meinung mal abgeben. Sorry. Nicht jeder hat im IT Bereich gelernt.
@ Henrik: Deinen ersten Beitrag und die dazugehöhrigen Erklärungen finde ich gut.
@all: Inzwischen habe ich ein Computerlexikon, und bin froh wenn ich dort einfache Erklärungen finde. Man muss doch die Geschichte nicht komplizierter gestalten als es eh schon ist. Dann ist es auch kein Wunder wenn die meisten heutzutage keine Lust auf PC haben.

MfG von Falk

Henrik

Falk
Sicherlich klingt und ist das ein oder andere kompliziert,ist aber nun mal Bestandteil einiger Grundlagen im Video/DVD Bereich.

Beispiel aus dem MeGUI Wiki
https://gleitz.info/wiki/index.php/MeGUI#Advanced
# No DCT Decimation
# ~ Keine Diskrete Kosinustransformation Dezimierung
So,und jetzt hoffen das keiner fragt: Was ist das ?

Und da kann man hier von Glück reden,das wir Leute im Forum haben, wie in diesem Fall LigH, die in der Lage sind, Sachen recht präzise zu erklären,selbst wenn man es nicht mathematisch/technisch nachvollziehen kann ,aber zumindest darüber ein abstraktes Verständnis dafür entwickeln kann.
Ganz nebenbei könnte ich die MeGUI Wiki ohne solche Erklärungen auch direkt dicht machen.
Und das es einfach wird hat keiner gesagt,das man nicht den Spaß dabei verlieren soll,das hat aber einer gesagt.

LigH

Lass mal die DCT ruhig DCT sein. Es gibt ja Programme, deren Label eine begrenzte Breite haben.

Was ist "DCT Decimation"? => doom9-Forum

Eine Beschleunigung der P-Frame-Encodierung durch den völligen Verzicht auf die Speicherung einiger Blöcke, vermutlich wenn die mit dem vorherigen I-Frame exakt genug überein stimmen. Sollte bei Trellis-Quantisierung ausgeschaltet werden (also die Option "Disable ..." einschalten).

Kopernikus

Nach der Transformation haben wir anstatt 64 Bildpunkten 64 Koeffizienten, die die Amplituden der Cosinusbasisfunktionen beschreiben. Diese werden durch bestimmte Zahlen geteilt und dann gerundet (Quantisierung). Die übrigbleibenden quantisierten Koeffizienten werden dann in den Bitstream geschrieben.

DCT Decimation verwirft Frequenzkomponenten, die nach der Quantisierung nur sehr kleine Amplituden haben. Das erhöht die Effizienz der nachfolgenden verlustfreien Kompression in einen Bitstream mit RLE und Huffman.

Trellis geht an das selbe Problem etwas professioneller (aber halt auch alangsamer) ran und findet eine nach RD Gesichtspunkten optimale Quantisierung.

Redfox

@Kopernikus:Interesant, und was ist "RD"?
BTW: benutzt H.264 zur verlustfreien (nach?-)Komprimierung nicht CABAC(bzw. CAVLC)?

Henrik

LigH
Kopernikus
Danke für eure Erklärungen.
Kein einfaches,eher ein schwieriges Thema,finde ich.

LigH

"Rate Distortion" -- Abweichung vom durchschnittlichen Verhältnis zwischen Vergleichs-Framegröße aus dem 1st-pass und der gewünschten Ziel-Framegröße für den 2nd-pass. Durch Anpassung der Quantisierung erreicht man ja zwar eine Verkleinerung, aber normalerweise kein Ergebnis, das auf das Byte genau so groß wird wie ein gewisser Prozentsatz der 1st-pass-Größe, und muss deshalb ab und zu die Quantisierung nachregeln.

Selur

Nur mal so angemerkt:

Hier sollte es doch um die Übersetzung von Begriffen gehen und nicht um die Erklärung wie H.264 funktioniert,.... (dafür haben wir extra Bereiche, in denen das Übrigends auch schon durchgekaut wurde, soweit ich mich entsinne)

Henrik

Selur
Nur auch mal so angemerkt:Es ging doch auch um deine Frage
http://forum.gleitz.info/showpost.php?p=312150&postcount=61
Das sich das Thema etwas ausbreitet,wer hätte das gedacht...

https://gleitz.info/wiki/index.php…mpare_Functions
https://gleitz.info/wiki/index.php/Rate_Distortion
https://gleitz.info/wiki/index.php/DCT_Decimation

Selur

Zitat

Es ging doch auch um deine Frage

Was es nicht besser macht.

Dies hier war als Übersetzungssthread gedacht, was aber anscheinend keinen interessiert,...

Cu Selur

Henrik

Selur

Zitat

Was es nicht besser macht

Verstehe ich jetzt überhaupt nicht,zu mindestens ein Teil deiner Frage,müsste doch jetzt auch beantwortet sein .

LigH

Selur,... - man kann Fachbegriffe nicht sinnvoll übersetzen, ohne zu wissen, was sie bedeuten. Ansonsten kannst du auch gleich "Babelfish" verwenden.

Dass dir die Diskussionen zu Bedeutungen zu ausführlich sind, kann ich teilweise nachvollziehen. Dennoch ist es mir lieber, sie mit hier einzubringen, als ein halbes Dutzend Einzelbeiträge dazu zu "vernetzen".

Henrik

Selur
LigH
OT
Vielleicht wäre es eine Möglichkeit,einen eigenen Thread rund um MeGUI Wiki zu eröffnen, mit Fachbegriffen und deren Bedeutung/Herkunft? Das Programm ist der dermaßen umfangreich und wirf auch genauso viele Frage auf.Ich will und kann ja nicht ins Detail gegen wie Selurs x264 man ,aber was ein Begriff bedeutet und wo er herkommt sollte schon erklärt werden.

Jetzt mitmachen!