Fachbegriffe übersetzen ?

  • Selur
    Bei der Sucheingabe Motion Estimation Compare Function kommt weder bei Google,noch bei doom9/Forum Gleitz irgendetwas raus,womit ich was anfangen könnte. Wo suchen ? Oder wie sich die dem Thema annähern ?
    Im Snow Thread bei doom9 ist auch nichts zu finden. Was machen sprach Zeus,bzw ich.

  • Henrik: Weisst Du was die Funktion tut? Wenn ja, dann beschreibs doch einfach mit eigenen Worten. Die Übersetzung kann dann auch gern ma jemand in der Wiki winfügen der es weiss.

  • mad-eddy

    Zitat

    Weisst Du was die Funktion tut

    Ja zu sagen, wäre schlicht weg gelogen. Nach den ich mich fransig gesucht habe, bin ich hier drauf gestoßen :
    global motion estimation, special case
    http://forum.doom9.org/showthread.php…imation+Compare
    Dort wird ein Link zur Correlation gegeben.
    http://en.wikipedia.org/wiki/Correlation und da sage ich Ach du dickes Ei...
    Gibt es zum Glück auch auf Deutsch:
    http://de.wikipedia.org/wiki/Korrelationen Geht schon besser

    Zitat

    Die Korrelation ist gerade bei der Bildverarbeitung ein- oder mehrdimensionalen Daten bzw. Bilder von großer Bedeutung. Bei der Bildverarbeitung wird jedoch der Zeitfaktor (z.B. t) durch eine Ortsvariable (z.B. x) einfach ersetzt. Das Bild wird gewissermaßen als Signalfolge über den Ort interpretiert. Anders als bei Zeitfunktionen liegen bei Bildern nicht eine Zeitbasis sondern Bildpunkte vor, die sog. Ortsfrequenzen. Die Ortsfrequenzen sind gewissermaßen die Auflösung des Bildes. Bei der Korrelation zweidimensionaler Bilder sind entsprechend zwei statt einer Ortsvariablen anzusetzen.
    Bei der Bildverarbeitung kann dann beispielsweise mittels Autokorrelation festgestellt werden, ob oder wo sich ein bestimmtes Objekt in einem Bild befindet. Das heißt Objekterkennung ist möglich.


    und jmac698 sagt :

    Zitat

    In 2d case, this means, that if same colored pixels (within, linear effects of contrast, brightness), are present in each area (X,Y ) compared, then there is a match. For example, 8x8 block X will match 8x8 block Y even if Y is mirror image, or rotated 90 image, or even random shuffled pixels (64 shuffled random order pixels) image, it is matching perfectly.

    wenn gleiche farbige Pixel (innerhalb, lineare Wirkungen des Kontrasts, Helligkeit) vorhanden sind, in jedem Bereich (X, Y), wird verglichen ob es eine Übereinstimmung gibt. ...oder so ähnlich.
    Muß mich da erst durcharbeiten...weiß jedoch nicht ob ich da auf dem richtigen Weg bin.

    Selur,LigH,Kopernikus,Broter John,u.a Hilfe

  • "Motion Estimation Compare Functions" ~ Vergleichsfunktionen für Bewegungsvorhersage

    Eigentlich gar nicht so kompliziert:

    Codecs, die Bewegungen schätzen wollen, um Ähnlichkeiten von aufeinander folgenden Bildern auszunutzen, brauchen Funktionen, mit denen sie die Ähnlichkeit von Bildausschnitten sinnvoll berechnen können.

    Bewegungsschätzung wird ja bei DCT-basierten Formaten meist so durchgeführt, dass ein Block in seiner Umgebung bewegt wird, und jeweils die Differenz zum darunter liegenden Bildausschnitt in angrenzenden unabhängigeren Bildern (bei P-Frames: das vorherige I-Frame; bei B-Frames: umliegende I/P-Frames) minimiert wird. Es wird dazu aber meist nicht einfach die simple Subtraktion verwendet, sondern teilweise etwas aufwändigere Funktionen.

    Diese Funktionen (Metriken) sind nun bereits in der ffdshow-Dokumentation erwähnt worden:

    SAD = sum of absolute differences: Summe der absoluten Differenzen
    SSE = sum of squared errors: Summe der quadratischen Abweichungen
    SATD = sum of absolute hadamard transformed differences: Summe der absoluten Hadamard-transformierten Differenzen
    DCT = sum of absolute dct transformed differences: Summe der absoluten DCT-transformierten Differenzen
    PSNR = sum of the squared quantization errors: Summe der quadrierten Quantisierungsabweichungen / Peak Signal-to-Noise Ratio: Höchstes Signal-Rausch-Verhältnis

    SAD ist als die simple arithmetische Summe der Absolutbeträge der Differenzen die schnellste Methode, aber nicht gerade die psychovisuell sinnvollste. SATD ist durch die Hadamard-Transformation der Differenzen näher an der "gefühlten Abweichung", besonders für etwas größere Suchradien, aber mathematisch etwas aufwändiger. Such-"Radius" ist dabei die Dimension der "Diamant-Umgebung" (ein um 45° gedrehtes Quadrat, weil eher senkrechte oder waagerechte Bewegungen i.A. wahrscheinlicher sind).

  • Übernehmen ... na, eventuell. Aber ich bezog mich hier zunächst auf DCT, weil die das Bild in Blöcke zerlegt, denen man einzeln einen "Motion Vector" zuweisen kann.

    Wie das bei Wavelet-Fransformation aussieht, die das Bild ja meist als Gesamtheit darstellt, weiß ich nicht. Und Snow basiert ja auf Wavelets. Sicher gibt es dort statt dessen eine Verschiebung der Wavelet-Positionsparameter.

  • Salve

    Oh mein Gott!!! Zu diesem Thema würde ich ganz gerne als einfacher Hauptschüler meine Meinung mal abgeben. Sorry. Nicht jeder hat im IT Bereich gelernt.
    @ Henrik: Deinen ersten Beitrag und die dazugehöhrigen Erklärungen finde ich gut.
    @all: Inzwischen habe ich ein Computerlexikon, und bin froh wenn ich dort einfache Erklärungen finde. Man muss doch die Geschichte nicht komplizierter gestalten als es eh schon ist. Dann ist es auch kein Wunder wenn die meisten heutzutage keine Lust auf PC haben.

    MfG von Falk

    Plex Tool Pro+XL, Plextor PX 750A+755SA BenQ 1650 LiteOn LH-20A1P LiteON DH 20A1L ( SATA )
    Online: Gigabyte M61P-S3 AMDX2 4600 Dual Channel 2GB HD Segate SATA 2 XP H
    Arbeit: ASUS P4C800-E Deluxe SATA1 P4 3GHZ XP H Netzwerk Dual Channel 1.5 GB
    Office: Asrock AM2NF6G-VSTA SATA2 AMD 64 3500+ XP Pro Netzwerk
    Alte Möhre: Gygabyte BX 2000 P3 550MHZ Slot 1 W98SE Netzwerk

  • Falk
    Sicherlich klingt und ist das ein oder andere kompliziert,ist aber nun mal Bestandteil einiger Grundlagen im Video/DVD Bereich.

    Beispiel aus dem MeGUI Wiki
    https://gleitz.info/wiki/index.php/MeGUI#Advanced
    # No DCT Decimation
    # ~ Keine Diskrete Kosinustransformation Dezimierung
    So,und jetzt hoffen das keiner fragt: Was ist das ?

    Und da kann man hier von Glück reden,das wir Leute im Forum haben, wie in diesem Fall LigH, die in der Lage sind, Sachen recht präzise zu erklären,selbst wenn man es nicht mathematisch/technisch nachvollziehen kann ,aber zumindest darüber ein abstraktes Verständnis dafür entwickeln kann.
    Ganz nebenbei könnte ich die MeGUI Wiki ohne solche Erklärungen auch direkt dicht machen.
    Und das es einfach wird hat keiner gesagt,das man nicht den Spaß dabei verlieren soll,das hat aber einer gesagt.

  • Lass mal die DCT ruhig DCT sein. Es gibt ja Programme, deren Label eine begrenzte Breite haben. ;)

    Was ist "DCT Decimation"? => doom9-Forum

    Eine Beschleunigung der P-Frame-Encodierung durch den völligen Verzicht auf die Speicherung einiger Blöcke, vermutlich wenn die mit dem vorherigen I-Frame exakt genug überein stimmen. Sollte bei Trellis-Quantisierung ausgeschaltet werden (also die Option "Disable ..." einschalten).

  • Nach der Transformation haben wir anstatt 64 Bildpunkten 64 Koeffizienten, die die Amplituden der Cosinusbasisfunktionen beschreiben. Diese werden durch bestimmte Zahlen geteilt und dann gerundet (Quantisierung). Die übrigbleibenden quantisierten Koeffizienten werden dann in den Bitstream geschrieben.


    DCT Decimation verwirft Frequenzkomponenten, die nach der Quantisierung nur sehr kleine Amplituden haben. Das erhöht die Effizienz der nachfolgenden verlustfreien Kompression in einen Bitstream mit RLE und Huffman.

    Trellis geht an das selbe Problem etwas professioneller (aber halt auch alangsamer) ran und findet eine nach RD Gesichtspunkten optimale Quantisierung.

    Es gibt eine Theorie, die besagt, dass das Universum sofort verschwinden und etwas noch Unerklärlicheres und Bizarres an seine Stelle treten wird, sobald jemand herausfindet, wofür es gut ist und warum es existiert.

    Es gibt eine andere Theorie, die besagt, dass das bereits geschehen ist.

  • "Rate Distortion" -- Abweichung vom durchschnittlichen Verhältnis zwischen Vergleichs-Framegröße aus dem 1st-pass und der gewünschten Ziel-Framegröße für den 2nd-pass. Durch Anpassung der Quantisierung erreicht man ja zwar eine Verkleinerung, aber normalerweise kein Ergebnis, das auf das Byte genau so groß wird wie ein gewisser Prozentsatz der 1st-pass-Größe, und muss deshalb ab und zu die Quantisierung nachregeln.

  • Selur,... - man kann Fachbegriffe nicht sinnvoll übersetzen, ohne zu wissen, was sie bedeuten. Ansonsten kannst du auch gleich "Babelfish" verwenden.

    Dass dir die Diskussionen zu Bedeutungen zu ausführlich sind, kann ich teilweise nachvollziehen. Dennoch ist es mir lieber, sie mit hier einzubringen, als ein halbes Dutzend Einzelbeiträge dazu zu "vernetzen". ;)

  • Selur
    LigH
    OT
    Vielleicht wäre es eine Möglichkeit,einen eigenen Thread rund um MeGUI Wiki zu eröffnen, mit Fachbegriffen und deren Bedeutung/Herkunft? Das Programm ist der dermaßen umfangreich und wirf auch genauso viele Frage auf.Ich will und kann ja nicht ins Detail gegen wie Selurs x264 man ,aber was ein Begriff bedeutet und wo er herkommt sollte schon erklärt werden.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!