4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

mogobime

Zitat von Selur

Okay, das war zu erwarten, da sich die Arbeitsweise der Bibliothek ja nicht ändert, wenn sie von Vapoursynth anstatt Avisynth aufgerufen wird.
Cu Selur

Das merkwürdige ist, dass die Fehler bei 4K Material bei mir im mode 2 unabhängig von der verwendeten precision auftreten, wenn man bw/bh < 64 einstellt.

Sonst scheint es da in allen modes so so zu sein, dass wenn man bw/bh erhöht man irgendwann auch die precision erhöhen muss (also 32 bit floats statt 16 bit floats verwendet) um Bildfehler zu vermeiden.

Kommt einem fast so vor, als ob das ein bug ist und intern bei mode 2 mit bw/bh < 64 versehentlich immer precision 0, also nur 16 bit floats verwendet werden.

Kann das was ich hier niedergeschrieben habe eigentlich jemand reproduzieren? Vielleicht interessiert das ja pinterf?

Selur

LigH: Trenn doch mal bitten den die Ganze FF3D... Diskussion hier ab, hab ja nicht wirklich was mit Hybrid zu tun. Danke!

mogobime: keine Zeit + nutzt so gut wie gar nicht Avisynth und entsprechend auch nicht fft3dgpu

mogobime

Besonders das Problem mit mode 2 und bw/bh < 64 meinte ich (das schlägt nämlich aus der Reihe)

Das wäre nur ein Versuch

EDIT: Sorry, weiß gerade nicht, wo ich das sonst posten soll...

Selur

hab mal wegen precision=0 in einen Issue angelegt: https://github.com/pinterf/FFT3dGPU/issues/9

Hab die Woche kaum Zeit, am besten meldeste Dich bei github an und machst selber ein oder mehrer issues auf.

Cu Selur

LigH

Zitat von Selur

LigH: Trenn doch mal bitten den die Ganze FF3D... Diskussion hier ab, hab ja nicht wirklich was mit Hybrid zu tun. Danke!

Ich hoffe, ich habe einen guten Anfang gefunden; und auch nur das Relevante verschoben...

mogobime

Zitat von Selur

hab mal wegen precision=0 in einen Issue angelegt: https://github.com/pinterf/FFT3dGPU/issues/9
Hab die Woche kaum Zeit, am besten meldeste Dich bei github an und machst selber ein oder mehrer issues auf.
Cu Selur

Ich hab mal in dem von dir eröffneten issue ein paar Infos + Screenshots meinerseits hinzugefügt, vielleicht hilft's pinterf ja weiter...

Selur

Falls pinterf da nachforscht ist es vermutlich einiges an Arbeit, denn so wie es aussieht, ist das Problem schon im Original Sourcecode von tsp.

mogobime

Vielleicht ist es ja wirklich nur so, dass Rundungsfehler die wegen 16 bit floats auftreten zu diesen seltsamen Bildfehlern führen, dann besteht vielleicht Hoffnung, dass er es fixed. Jedenfalls hoffe ich das irgendwie.

Wenn du in dem Video, dass bei dir black frames mit Gittermuster ausgegeben hat, weiter nach vorne spulst, wirst du möglicherweise feststellen, dass nach wenigen Bildern das Bild nicht mehr komplett schwarz mit diesen Mustern ist, sondern dass sich die Muster dann durchs normale Video ziehen.

Jedenfalls war das bei mir so, dass das nur in den ersten paar dunklen frames so war.

Selur

Ich hatte BlankClip verwendet Der ist immer schwarz, zeigt aber einfach, dass es ein Problem unabhängig von der Quelle ist.

Rundungsfehler glaub ich auch nicht, sieht eher aus als ob da die Blockstruktur nicht passt und da irgendwo ein Überlauf passiert.

Vermute Assmblercodefehler oder etwas in die Richtung.

Selur

Scheint zu gehen wenn man FFT3DGPU 16bit Material füttert -> vermute ein Teil des Problems ist 8->16bit Umwandlung in FFT3DGPU.

Selur

Okay, wenn man FFT3DGPU mit 10+bit Material füttert wird intern immter 32bit verwendet und precision macht dann nix mehr.

-> Werde in der nächsten Hybrid version wohl erstmal precision=0 rauswerfen oder die precision hoch setzen wenn with > 1920 oder height > 1080.

Cu Selur

Ps.: pinterf steckt auf jeden Fall einiges seiner Freizeit in die Suche nach der Ursache des FFT3DGPU Problems.

Selur

Nebenbei: Mal drüber nach gedacht KNLMeansCL anstatt FFT3D... zu nutzen?

mogobime

Zitat von Selur

Nebenbei: Mal drüber nach gedacht KNLMeansCL anstatt FFT3D... zu nutzen

Hab ich schon das ein oder andere Mal ausprobiert. Kommt aber für mich bzw. den Verwendungszweck den ich hauptsächlich mit Rauschfiltern verfolge nicht an FFT3DGPU ran.

Ich versuche in erster Linie mit möglichst viel Leistung/Watt zu encoden und dabei 10-35% Bitrate einzusparen ohne dabei das Bildmaterial signifikant zu verhunzen / weichzuzeichnen.

Das gelingt imho mit temporal Denoising ziemlich gut, besonders wenn man es z.B. mit X264 10bit kombiniert, da dadurch das Risiko von Banding, welches dabei entstehen könnte, massiv sinkt.

3-4 Frames einzubeziehen bringt (jedenfalls bei fft3dgpu) einen guten Vorteil bei der Komprimierbarkeit, ohne bei Sigma-Werten so zwischen 1.2 und 1.8 je das Material signifikant entstellt zu haben.

Wenn man mehr Wert auf "Original Look" legt, sind 4 Frames imho empfehlenswerter, ich nehme meistens 3 frames wegen der besseren Komprimierbarkeit + Performance und senke Sigma, je nach Material, wie oben erwähnt meist etwas unter 2.0 ab.

Um (zumindest beim allermeisten Bildmaterial) ähnliche Bitrateneinsparungen bei vergleichbarer Qualität mit x264 veryslow o.ä. zu erreichen muss ich ein vielfaches an Rechenzeit inverstieren, mit x265 bestenfalls die 1,5fache Zeit.

-> Das ist alles nicht gerade effizient und passt irgendwie nicht mehr in die Zeit.

FFT3DGPU kostet mich in den meisten Szenarien 1-5% Rechenzeit und erhöht den Gesamtverbrauch meines Systems um maximal 10% bzw. etwa 30W.

Old but gold, man merkt halt, dass es mal für deutlich lahmere Karten entwickelt wurde, als heute üblich sind

KNLMeansCL bringt meine 75W Grafikkarte (irgendwann war die auch mal die damals modernste GPU Generation, aber davon halt eine der low power/ low budget Karten ) schon bei FHD/1080p ans Limit und bremst, wenn ich da distance von 0 auf 1 erhöhe und damit mehr als 1 Frame (genauer 3 frames), also temporal filtere.

Um damit Einsparungen in der Größenordung von 25-30% zu erreichen musste ich die strength auf etwa das vierfache des defaults von 1,2 erhöhen und dann sah das Material an detailreichen Stellen stellenweise schon gut gesmoothed um nicht zu sagen vermatscht aus (Haare usw.)

Kannst ja mal fft3dgpu Sigma 2.0 mit 3 frames mit KNLMeansCL 4.8 mit 3 frames vergleichen.

Da gefällt mir das Ergebnis von fft3dgpu besser.

Für Einsparungen bis 10% ohne großartige Qualitätseinbußen scheint mir auch FluxSmooth eine guter und flotter temporal denoiser zu sein. Bremst auch nur so um die 5%, und das ganz ohne GPU Einsatz.

Sorry, ist was länger geworden, da lag mir wohl was auf der Seele

FatFaster

Habe fft3d direkt lange nicht mehr benutzt, aber ich erinnere mich dass es gerne mal Banding erzeugt hat. Mein Favorit ist immer noch SMDegrain. Auch flott, stabilisiert / entfernt das Rauschen ohne alles Platt zu machen.

mogobime

Zitat von FatFaster

Habe fft3d direkt lange nicht mehr benutzt, aber ich erinnere mich dass es gerne mal Banding erzeugt hat. Mein Favorit ist immer noch SMDegrain. Auch flott, stabilisiert / entfernt das Rauschen ohne alles Platt zu machen.

Kann sein, dass SMDegrain im Vergleich zu fft3dfilter vom Speed her mithält oder sogar etwas schneller ist.

Hab's gerade mal wieder kurz angetestet mit 4K 10bit yuv420 60fps video und 10 bit output in X264.

Ich gebe zu, ich hab mich nicht mit den ganzen Optionen auseinandergesetzt, hab's erst mit default angetestet, da war mir die erzeugte Bitrate wegen subPixel 2: (sharper Wiener (6 tap, similar to Lanczos) zu hoch. Dann habe ich subPixel 1: bicubic (4 tap Catmull-Rom) genommen, da mir das als Mittelding (nicht zu scharf, nicht zu stark weichzeichnend) dargestellt wird.

Da kam dann etwa die Bitrate raus, die ich mit FFT3DGPU(sigma=1.00,bw=64,bh=64,plane=4,mode=2,bordersize=1,precision=1) erreicht habe. bw+bh < 64 ist bei 4K buggy, mit 32 wäre es vermutlich sogar noch etwas schneller. Mode 2 finde ich empfehlenswerter und effizienter als mode 1 - erzeugt ebenfalls weniger Artefakte als der etwas schnellere mode 0.

Mit Sigma 1.0 (default ist 2.0) habe ich beim 3,5x Speed dieselbe Bitrate erreicht.

Mit so einem extrem niedrigen Sigma Wert ist mir selbst bei 8bit Output noch nie sowas wie Banding aufgefallen.

mogobime

Ich bin da bei fft3dgpu und YUV444P10 input auf was gestoßen, was den ein oder anderen interessieren könnte, da es einen ziemlichen Unterschied in der Performance macht, aber so gut wie nichts bringt. Es scheint nämlich mit dem YUV444 Sampling nicht besonders schnell umgehen zu können.

Hab YUV444P10 an fft3dgpu gefüttert, und wollte nur im normal üblichen Farbraum als YUV420P10 ausgeben.

Also ein ConvertToYUV420() Aufruf nach dem fft3dgpu(...) Aufruf (ich filtere mit fft3dgpu(plane=4,...) chroma immer mit, bringt weitere Vorteile bei der Komprimierbarkeit). So macht es beispielsweise auch Hybrid.

Am Ende stehen immer die Benchmark-Werte, das vorangestellte x1 x2 x3 usw. sind die verwendeten avisynth threads bzw. die prefetch(x) Einstellung am Ende:

Code

REM ### First 3 lines will be skipped when generating AVS/VPY script from this file. 2nd line must have vspipe/ffmpeg/avs2yuv64 call. Do not remove GOTO :EOF in 3rd line!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --crf 19.00 --profile high10 --level 5.2 --ref 2 --no-mixed-refs --keyint 250 --min-keyint 0 --scenecut 40 --bframes 3 --b-bias 0 --b-pyramid normal --direct spatial --b-adapt 1 --sync-lookahead 16 --cplxblur 20.0 --qcomp 0.60 --qblur 0.50 --mbtree --rc-lookahead 20 --ipratio 1.40 --pbratio 1.30 --chroma-qp-offset 0 --qpmin 0 --qpmax 69 --qpstep 4 --partitions i4x4,i8x8,p8x8,b8x8 --8x8dct --me hex --merange 16 --mvrange -1 --subme 4 --cabac --trellis 1 --weightp 1 --aq-mode 1 --aq-strength 1.00 --vbv-maxrate 240000 --vbv-bufsize 720000 --nr 0 --deadzone-inter 21 --deadzone-intra 11 --cqm flat --threads 16 --sar 1:1 --deblock 0:0 --psnr --ssim --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-csp i420 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE",MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\d3d9.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
# LoadCPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\ffms2.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\FFT3dGPU.dll")
# loading source: $$SOURCEVID$$
# color sampling YV24@10, matrix: bt709, scantyp: progressive, luminance scale: limited
#####
# LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P16", prefer_hw=0,repeat=true)
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P10", prefer_hw=0,repeat=true)
# FFVideoSource("$$SOURCEVID$$",colorspace="YV12")

#####
# current resolution:
# denoising using fft3dgpu
#####
FFT3DGPU(sigma=$$SIGMA$$,bw=$$BW$$,bh=$$BH$$,bt=$$BT$$,plane=$$PLANE$$,mode=$$MODE$$,bordersize=$$BORDERSIZE$$,precision=$$PRECISION$$)
PreFetch(1,$$DYNMEASUREVARGAP$$)
#####

#####
# scaling to 1920x804
# Spline16Resize(1920,804)
#####

# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()

PreFetch($$DYNMEASUREVAR$$)
#####
# setting output fps to 24.000fps
AssumeFPS(24,1)
#####
#  output: color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\4K\cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/4K/cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '1,1,4'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '1,1,4' +- gap of '+1'

--------------------------------------------------------------------------------

x0 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974328 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.954 V:58.165 Avg:55.766 Global:55.167 kb/s:10863.78
encoded 1418 frames, 5.52 fps, 10863.78 kb/s

x1 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974325 (25.905db)
x264 [info]: PSNR Mean Y:54.887 U:58.954 V:58.165 Avg:55.766 Global:55.166 kb/s:10865.54
encoded 1418 frames, 5.60 fps, 10865.54 kb/s

x2 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974327 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.954 V:58.166 Avg:55.767 Global:55.167 kb/s:10864.74
encoded 1418 frames, 5.50 fps, 10864.74 kb/s

x3 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974329 (25.906db)
x264 [info]: PSNR Mean Y:54.889 U:58.955 V:58.168 Avg:55.768 Global:55.168 kb/s:10868.22
encoded 1418 frames, 5.43 fps, 10868.22 kb/s

x4 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974326 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.957 V:58.168 Avg:55.767 Global:55.167 kb/s:10863.29
encoded 1418 frames, 5.56 fps, 10863.29 kb/s

x5 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974331 (25.906db)
x264 [info]: PSNR Mean Y:54.888 U:58.955 V:58.167 Avg:55.767 Global:55.167 kb/s:10866.97
encoded 1418 frames, 5.53 fps, 10866.97 kb/s

x6 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974326 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.957 V:58.165 Avg:55.767 Global:55.167 kb/s:10865.28
encoded 1418 frames, 5.46 fps, 10865.28 kb/s

Alles anzeigen

mogobime

Dann hab ich ConvertToYUV420() vor den fft3dgpu(...) Aufruf verschoben (Für Benchmark Werte wie gesagt ganz runter scrollen):

Code

REM ### First 3 lines will be skipped when generating AVS/VPY script from this file. 2nd line must have vspipe/ffmpeg/avs2yuv64 call. Do not remove GOTO :EOF in 3rd line!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --crf 19.00 --profile high10 --level 5.2 --ref 2 --no-mixed-refs --keyint 250 --min-keyint 0 --scenecut 40 --bframes 3 --b-bias 0 --b-pyramid normal --direct spatial --b-adapt 1 --sync-lookahead 16 --cplxblur 20.0 --qcomp 0.60 --qblur 0.50 --mbtree --rc-lookahead 20 --ipratio 1.40 --pbratio 1.30 --chroma-qp-offset 0 --qpmin 0 --qpmax 69 --qpstep 4 --partitions i4x4,i8x8,p8x8,b8x8 --8x8dct --me hex --merange 16 --mvrange -1 --subme 4 --cabac --trellis 1 --weightp 1 --aq-mode 1 --aq-strength 1.00 --vbv-maxrate 240000 --vbv-bufsize 720000 --nr 0 --deadzone-inter 21 --deadzone-intra 11 --cqm flat --threads 16 --sar 1:1 --deblock 0:0 --psnr --ssim --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-csp i420 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE",MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\d3d9.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
# LoadCPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\ffms2.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\FFT3dGPU.dll")
# loading source: $$SOURCEVID$$
# color sampling YV24@10, matrix: bt709, scantyp: progressive, luminance scale: limited
#####
# LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P16", prefer_hw=0,repeat=true)
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P10", prefer_hw=0,repeat=true)
# FFVideoSource("$$SOURCEVID$$",colorspace="YV12")

# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()

#####
# current resolution:

#####
# denoising using fft3dgpu
FFT3DGPU(sigma=$$SIGMA$$,bw=$$BW$$,bh=$$BH$$,bt=$$BT$$,plane=$$PLANE$$,mode=$$MODE$$,bordersize=$$BORDERSIZE$$,precision=$$PRECISION$$)
PreFetch(1,$$DYNMEASUREVARGAP$$)
#####

#####
# scaling to 1920x804
# Spline16Resize(1920,804)
#####

PreFetch($$DYNMEASUREVAR$$)
#####
# setting output fps to 24.000fps
AssumeFPS(24,1)
#####
#  output: color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\4K\cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/4K/cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '1,2,3'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '1,2,3' +- gap of '+1'

--------------------------------------------------------------------------------

x0 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974359 (25.911db)
x264 [info]: PSNR Mean Y:54.896 U:59.880 V:59.359 Avg:55.944 Global:55.345 kb/s:10697.20
encoded 1418 frames, 7.58 fps, 10697.20 kb/s

x1 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974355 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.878 V:59.359 Avg:55.943 Global:55.344 kb/s:10694.98
encoded 1418 frames, 7.64 fps, 10694.98 kb/s

x2 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974359 (25.911db)
x264 [info]: PSNR Mean Y:54.895 U:59.879 V:59.357 Avg:55.944 Global:55.344 kb/s:10695.23
encoded 1418 frames, 7.70 fps, 10695.23 kb/s

x3 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974357 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.879 V:59.359 Avg:55.943 Global:55.344 kb/s:10694.30
encoded 1418 frames, 7.54 fps, 10694.31 kb/s

x4 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974356 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.881 V:59.357 Avg:55.943 Global:55.344 kb/s:10695.41
encoded 1418 frames, 7.63 fps, 10695.41 kb/s

x5 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974356 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.879 V:59.358 Avg:55.943 Global:55.344 kb/s:10695.60
encoded 1418 frames, 7.63 fps, 10695.60 kb/s

x6 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974354 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.878 V:59.356 Avg:55.943 Global:55.343 kb/s:10697.17
encoded 1418 frames, 7.50 fps, 10697.17 kb/s

Alles anzeigen

-> ConvertToYUV420() vor fft3dgpu(...) war 37,5% schneller bei den jeweiligen Bestwerten!

mogobime

Dann wollte ich noch wissen ob es großartige Unterschiede bei den erzeugten files gibt und habe sie mit ffmpeg direkt miteinander verglichen (PSNR + SSIM ermittelt).

SSIM:

Code

SSIM Y:0.998378 (27.900152) U:0.999227 (31.120617) V:0.999125 (30.582179) All:0.998644 (28.678402)

n:1 Y:0.999912 U:0.999999 V:0.999989 All:0.999939 (42.150198)
n:2 Y:0.999958 U:0.999999 V:0.999990 All:0.999970 (45.258967)
n:3 Y:0.999954 U:0.999999 V:0.999989 All:0.999968 (44.886552)
n:4 Y:0.999943 U:0.999999 V:0.999989 All:0.999960 (43.967627)
n:5 Y:0.999946 U:0.999999 V:0.999988 All:0.999962 (44.208437)
n:6 Y:0.999931 U:0.999999 V:0.999988 All:0.999951 (43.137295)
n:7 Y:0.999955 U:0.999999 V:0.999988 All:0.999968 (44.888230)
n:8 Y:0.999946 U:0.999999 V:0.999988 All:0.999962 (44.167589)
n:9 Y:0.999941 U:0.999999 V:0.999988 All:0.999958 (43.816310)
n:10 Y:0.999932 U:0.999999 V:0.999988 All:0.999952 (43.218555)
n:11 Y:0.999926 U:0.999999 V:0.999987 All:0.999948 (42.845369)
n:12 Y:0.999921 U:0.999999 V:0.999987 All:0.999945 (42.572114)
n:13 Y:0.999922 U:0.999999 V:0.999987 All:0.999945 (42.630192)
n:14 Y:0.999915 U:0.999998 V:0.999986 All:0.999941 (42.261585)
n:15 Y:0.999873 U:0.999992 V:0.999960 All:0.999907 (40.324472)
n:16 Y:0.999768 U:0.999942 V:0.999879 All:0.999815 (37.334301)
n:17 Y:0.999693 U:0.999911 V:0.999829 All:0.999752 (36.055911)
n:18 Y:0.999550 U:0.999831 V:0.999778 All:0.999635 (34.377439)
n:19 Y:0.999434 U:0.999744 V:0.999695 All:0.999529 (33.271871)
n:20 Y:0.999356 U:0.999729 V:0.999651 All:0.999467 (32.733872)
n:21 Y:0.999253 U:0.999675 V:0.999539 All:0.999371 (32.010720)
n:22 Y:0.999145 U:0.999625 V:0.999515 All:0.999287 (31.468849)
n:23 Y:0.998543 U:0.999381 V:0.999155 All:0.998784 (29.152299)
n:24 Y:0.998427 U:0.999405 V:0.999170 All:0.998714 (28.906665)
n:25 Y:0.998577 U:0.999367 V:0.999128 All:0.998800 (29.209741)
n:26 Y:0.998398 U:0.999424 V:0.999220 All:0.998706 (28.879578)
n:27 Y:0.998206 U:0.999377 V:0.999156 All:0.998560 (28.415509)
n:28 Y:0.998278 U:0.999403 V:0.999206 All:0.998621 (28.602880)
n:29 Y:0.998360 U:0.999359 V:0.999120 All:0.998653 (28.707090)
n:30 Y:0.998298 U:0.999411 V:0.999203 All:0.998634 (28.646355)
n:31 Y:0.998202 U:0.999386 V:0.999159 All:0.998559 (28.413206)
n:32 Y:0.998305 U:0.999416 V:0.999204 All:0.998640 (28.665454)
n:33 Y:0.998200 U:0.999372 V:0.999129 All:0.998550 (28.386538)
n:34 Y:0.998376 U:0.999446 V:0.999233 All:0.998697 (28.851003)
n:35 Y:0.998257 U:0.999417 V:0.999213 All:0.998610 (28.568783)
n:36 Y:0.998368 U:0.999443 V:0.999260 All:0.998696 (28.846266)
n:37 Y:0.998206 U:0.999393 V:0.999173 All:0.998565 (28.432683)
n:38 Y:0.998488 U:0.999469 V:0.999299 All:0.998786 (29.159272)
n:39 Y:0.998312 U:0.999446 V:0.999256 All:0.998658 (28.723603)
n:40 Y:0.998468 U:0.999468 V:0.999300 All:0.998773 (29.112244)
n:41 Y:0.998157 U:0.999419 V:0.999195 All:0.998541 (28.358103)
n:42 Y:0.998387 U:0.999473 V:0.999284 All:0.998717 (28.919207)
n:43 Y:0.998018 U:0.999428 V:0.999195 All:0.998449 (28.093050)
n:44 Y:0.996459 U:0.998906 V:0.998312 All:0.997176 (25.491316)
n:45 Y:0.996236 U:0.999182 V:0.998602 All:0.997121 (25.407904)
n:46 Y:0.996127 U:0.999249 V:0.998606 All:0.997061 (25.317296)
n:47 Y:0.995889 U:0.999245 V:0.998594 All:0.996899 (25.085376)
n:48 Y:0.995950 U:0.999231 V:0.998567 All:0.996933 (25.133300)
n:49 Y:0.995690 U:0.999151 V:0.998357 All:0.996712 (24.830293)
n:50 Y:0.996003 U:0.999276 V:0.998561 All:0.996975 (25.192168)
...

Alles anzeigen

-> 0.99x durchgängig sowohl bei Y als auch bei UV sieht nur nach minimalsten Unterschieden aus.

PSNR:

Code

PSNR y:55.682510 u:59.221674 v:58.550806 average:56.509825 min:51.185110 max:72.324075
n:1 mse_avg:0.10 mse_y:0.15 mse_u:0.00 mse_v:0.03 psnr_avg:70.08 psnr_y:68.54 psnr_u:85.03 psnr_v:75.89 
n:2 mse_avg:0.06 mse_y:0.08 mse_u:0.00 mse_v:0.03 psnr_avg:72.32 psnr_y:70.91 psnr_u:85.60 psnr_v:76.15 
n:3 mse_avg:0.07 mse_y:0.10 mse_u:0.00 mse_v:0.03 psnr_avg:71.84 psnr_y:70.39 psnr_u:85.79 psnr_v:76.19 
n:4 mse_avg:0.09 mse_y:0.12 mse_u:0.00 mse_v:0.03 psnr_avg:70.90 psnr_y:69.39 psnr_u:85.83 psnr_v:76.10 
n:5 mse_avg:0.08 mse_y:0.11 mse_u:0.00 mse_v:0.03 psnr_avg:71.28 psnr_y:69.82 psnr_u:84.83 psnr_v:75.75 
n:6 mse_avg:0.10 mse_y:0.14 mse_u:0.00 mse_v:0.03 psnr_avg:70.16 psnr_y:68.63 psnr_u:84.83 psnr_v:75.78 
n:7 mse_avg:0.07 mse_y:0.10 mse_u:0.00 mse_v:0.03 psnr_avg:71.74 psnr_y:70.30 psnr_u:85.88 psnr_v:75.78 
n:8 mse_avg:0.08 mse_y:0.11 mse_u:0.00 mse_v:0.03 psnr_avg:71.24 psnr_y:69.77 psnr_u:85.71 psnr_v:75.75 
n:9 mse_avg:0.09 mse_y:0.12 mse_u:0.00 mse_v:0.03 psnr_avg:70.79 psnr_y:69.28 psnr_u:85.49 psnr_v:75.98 
n:10 mse_avg:0.10 mse_y:0.15 mse_u:0.00 mse_v:0.03 psnr_avg:70.06 psnr_y:68.52 psnr_u:85.40 psnr_v:75.86 
n:11 mse_avg:0.11 mse_y:0.16 mse_u:0.00 mse_v:0.03 psnr_avg:69.71 psnr_y:68.15 psnr_u:85.53 psnr_v:75.80 
n:12 mse_avg:0.12 mse_y:0.17 mse_u:0.00 mse_v:0.03 psnr_avg:69.38 psnr_y:67.80 psnr_u:85.21 psnr_v:75.83 
n:13 mse_avg:0.12 mse_y:0.17 mse_u:0.00 mse_v:0.03 psnr_avg:69.36 psnr_y:67.78 psnr_u:85.15 psnr_v:75.78 
n:14 mse_avg:0.13 mse_y:0.19 mse_u:0.00 mse_v:0.03 psnr_avg:68.92 psnr_y:67.34 psnr_u:84.80 psnr_v:75.44 
n:15 mse_avg:0.18 mse_y:0.24 mse_u:0.02 mse_v:0.10 psnr_avg:67.59 psnr_y:66.34 psnr_u:77.14 psnr_v:70.09 
n:16 mse_avg:0.32 mse_y:0.37 mse_u:0.14 mse_v:0.28 psnr_avg:65.18 psnr_y:64.49 psnr_u:68.85 psnr_v:65.73 
n:17 mse_avg:0.36 mse_y:0.42 mse_u:0.18 mse_v:0.33 psnr_avg:64.58 psnr_y:63.95 psnr_u:67.72 psnr_v:65.07 
n:18 mse_avg:0.58 mse_y:0.69 mse_u:0.32 mse_v:0.40 psnr_avg:62.57 psnr_y:61.82 psnr_u:65.17 psnr_v:64.16 
n:19 mse_avg:0.76 mse_y:0.88 mse_u:0.49 mse_v:0.55 psnr_avg:61.38 psnr_y:60.74 psnr_u:63.26 psnr_v:62.80 
n:20 mse_avg:0.85 mse_y:1.00 mse_u:0.51 mse_v:0.60 psnr_avg:60.88 psnr_y:60.19 psnr_u:63.08 psnr_v:62.39 
n:21 mse_avg:1.04 mse_y:1.18 mse_u:0.67 mse_v:0.84 psnr_avg:60.04 psnr_y:59.49 psnr_u:61.94 psnr_v:60.94 
n:22 mse_avg:1.22 mse_y:1.45 mse_u:0.67 mse_v:0.82 psnr_avg:59.34 psnr_y:58.57 psnr_u:61.93 psnr_v:61.08 
n:23 mse_avg:2.10 mse_y:2.52 mse_u:1.10 mse_v:1.42 psnr_avg:56.97 psnr_y:56.18 psnr_u:59.78 psnr_v:58.69 
n:24 mse_avg:2.20 mse_y:2.71 mse_u:1.02 mse_v:1.33 psnr_avg:56.77 psnr_y:55.86 psnr_u:60.10 psnr_v:58.96 
n:25 mse_avg:2.02 mse_y:2.38 mse_u:1.13 mse_v:1.43 psnr_avg:57.15 psnr_y:56.43 psnr_u:59.66 psnr_v:58.65 
n:26 mse_avg:2.19 mse_y:2.74 mse_u:0.97 mse_v:1.23 psnr_avg:56.79 psnr_y:55.82 psnr_u:60.32 psnr_v:59.30 
n:27 mse_avg:2.37 mse_y:2.96 mse_u:1.04 mse_v:1.34 psnr_avg:56.46 psnr_y:55.49 psnr_u:60.03 psnr_v:58.94 
n:28 mse_avg:2.31 mse_y:2.90 mse_u:0.99 mse_v:1.25 psnr_avg:56.57 psnr_y:55.57 psnr_u:60.24 psnr_v:59.24 
n:29 mse_avg:2.22 mse_y:2.71 mse_u:1.10 mse_v:1.42 psnr_avg:56.72 psnr_y:55.87 psnr_u:59.78 psnr_v:58.69 
n:30 mse_avg:2.28 mse_y:2.86 mse_u:0.98 mse_v:1.26 psnr_avg:56.62 psnr_y:55.64 psnr_u:60.30 psnr_v:59.20 
n:31 mse_avg:2.34 mse_y:2.93 mse_u:1.00 mse_v:1.32 psnr_avg:56.51 psnr_y:55.53 psnr_u:60.18 psnr_v:59.00 
n:32 mse_avg:2.26 mse_y:2.84 mse_u:0.97 mse_v:1.25 psnr_avg:56.65 psnr_y:55.66 psnr_u:60.35 psnr_v:59.23 
n:33 mse_avg:2.36 mse_y:2.93 mse_u:1.06 mse_v:1.39 psnr_avg:56.46 psnr_y:55.53 psnr_u:59.95 psnr_v:58.76 
n:34 mse_avg:2.14 mse_y:2.68 mse_u:0.91 mse_v:1.20 psnr_avg:56.90 psnr_y:55.92 psnr_u:60.61 psnr_v:59.42 
n:35 mse_avg:2.27 mse_y:2.86 mse_u:0.96 mse_v:1.22 psnr_avg:56.64 psnr_y:55.64 psnr_u:60.39 psnr_v:59.33 
n:36 mse_avg:2.18 mse_y:2.75 mse_u:0.91 mse_v:1.14 psnr_avg:56.82 psnr_y:55.80 psnr_u:60.61 psnr_v:59.62 
n:37 mse_avg:2.33 mse_y:2.93 mse_u:1.01 mse_v:1.30 psnr_avg:56.52 psnr_y:55.54 psnr_u:60.17 psnr_v:59.06 
n:38 mse_avg:2.03 mse_y:2.56 mse_u:0.87 mse_v:1.08 psnr_avg:57.12 psnr_y:56.11 psnr_u:60.78 psnr_v:59.86 
n:39 mse_avg:2.20 mse_y:2.79 mse_u:0.90 mse_v:1.15 psnr_avg:56.77 psnr_y:55.75 psnr_u:60.64 psnr_v:59.59 
n:40 mse_avg:2.07 mse_y:2.62 mse_u:0.88 mse_v:1.09 psnr_avg:57.04 psnr_y:56.02 psnr_u:60.76 psnr_v:59.84 
n:41 mse_avg:2.45 mse_y:3.11 mse_u:0.98 mse_v:1.27 psnr_avg:56.31 psnr_y:55.27 psnr_u:60.30 psnr_v:59.15 
n:42 mse_avg:2.18 mse_y:2.77 mse_u:0.88 mse_v:1.13 psnr_avg:56.81 psnr_y:55.77 psnr_u:60.76 psnr_v:59.67 
n:43 mse_avg:2.68 mse_y:3.45 mse_u:0.98 mse_v:1.30 psnr_avg:55.92 psnr_y:54.83 psnr_u:60.29 psnr_v:59.07 
n:44 mse_avg:4.30 mse_y:5.24 mse_u:1.63 mse_v:3.22 psnr_avg:53.86 psnr_y:53.00 psnr_u:58.07 psnr_v:55.11 
n:45 mse_avg:4.37 mse_y:5.48 mse_u:1.27 mse_v:2.99 psnr_avg:53.80 psnr_y:52.81 psnr_u:59.16 psnr_v:55.44 
n:46 mse_avg:4.45 mse_y:5.62 mse_u:1.19 mse_v:3.04 psnr_avg:53.71 psnr_y:52.70 psnr_u:59.45 psnr_v:55.36 
n:47 mse_avg:4.69 mse_y:5.97 mse_u:1.16 mse_v:3.09 psnr_avg:53.49 psnr_y:52.44 psnr_u:59.55 psnr_v:55.30 
n:48 mse_avg:4.65 mse_y:5.89 mse_u:1.18 mse_v:3.14 psnr_avg:53.53 psnr_y:52.50 psnr_u:59.46 psnr_v:55.23 
n:49 mse_avg:5.05 mse_y:6.41 mse_u:1.30 mse_v:3.35 psnr_avg:53.16 psnr_y:52.13 psnr_u:59.04 psnr_v:54.95 
n:50 mse_avg:4.62 mse_y:5.85 mse_u:1.14 mse_v:3.19 psnr_avg:53.55 psnr_y:52.53 psnr_u:59.63 psnr_v:55.17 
...

Alles anzeigen

-> Auch hier durchgängig niedrige einstellige Werte.

Komplette files im Anhang, war zu groß um es als Text zu posten...

mogobime

Hab das zusätzlich noch durch avsmeter64 gejagt, und da sind die Unterschiede noch viel deutlicher:

x1 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F.avs (ConvertToYUV420 nach FFT3DGPU):

Code

[Clip info]
Number of frames:                     1418
Length (hh:mm:ss.ms):         00:00:59.083
Frame width:                          3840
Frame height:                         1608
Framerate:                          24.000 (24/1)
Colorspace:                      YUV420P10
Audio channels:                        n/a
Audio bits/sample:                     n/a
Audio sample rate:                     n/a
Audio samples:                         n/a


[Runtime info]
Frames processed:                   1418 (0 - 1417)
FPS (min | max | average):          0.815 | 8.290 | 5.653
Process memory usage (max):         1349 MiB
Thread count:                       40
CPU usage (average):                13.1%

GPU usage (average):                87%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:04:10.853

Alles anzeigen

x1 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F.avs (ConvertToYUV420 vor FFT3DGPU):

Code

[Clip info]
Number of frames:                     1418
Length (hh:mm:ss.ms):         00:00:59.083
Frame width:                          3840
Frame height:                         1608
Framerate:                          24.000 (24/1)
Colorspace:                      YUV420P10
Audio channels:                        n/a
Audio bits/sample:                     n/a
Audio sample rate:                     n/a
Audio samples:                         n/a


[Runtime info]
Frames processed:                   1418 (0 - 1417)
FPS (min | max | average):          1.386 | 22.46 | 10.29
Process memory usage (max):         1134 MiB
Thread count:                       40
CPU usage (average):                19.1%

GPU usage (average):                79%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:02:17.863

Alles anzeigen

-> 82% schneller, da hat wohl beim encoding mit X264 meine überlastete CPU gebremst!

Selur

Nebenbei: Mal überlegt anstatt AviSynth&Co zu nutzen mal eher die Noisereduction in x264&x265 zu verwenden?

Zumindest wenn es vor allem um erhöhte Komprimierbarkeit geht sollte die NoiseReduction nicht schlecht sein.

Jetzt mitmachen!