Beiträge von mogobime

mogobime

H.266? Ich bin echt in der Zeit stehen geblieben

Hab schon h.265 nicht die Beachtung geschenkt, die es vielleicht verdient hätte, weil ich einfach schon zu viele total weichgezeichnete Videos damit gesehen habe. Viele Leute glauben wohl den Mythos, dass man damit mit der halben Bitrate von h.264 arbeiten kann.

Was in meinen Augen, jedenfalls auf einen aktuellen x264 encoder bezogen, weit von der Wahrheit entfernt ist.

Auf jeden Fall wenn man z.B. mit 10 Bit x264 mit aktivierter "Automatic Adaptive Quantization" (-aq-mode 2) vergleicht. Keine Ahnung warum dieser aq-mode nie zur Standardeinstellung gemacht wurde. Im 10 Bit Betrieb kann mann dann auf jeden Fall -aq-strength gut absenken, ohne dass Probleme wie Banding entstehen und ordentlich Bitrate einsparen.

Möchte da mal das h.265 Video sehen, dass bei der halben Bitrate vergleichbare Qualität liefert. Sieht bestimmt aus wie das x264 h.264 video mit Blur Filter.

Aber jetzt wird's zu sehr OT

mogobime

Klar...

Mein ja nur, wenn man eh nach 420 encodet und hat warum auch immer ein 444 file vorliegen, dann scheint das für normale Augen keinerlei Unterschied zu machen, wenn man im Skript gleich als erstes das sampling auf 420 runterskaliert.

Sonst werden folgende Filter u.U. bis zum Faktor 2 runtergebremst. Das dann bewußt in Kauf zu nehmen ist wohl eher was für Gourmets, oder irgendwelche ganz speziellen Skripte, die im Verlauf irgendwo irgendwie ganz speziell die Chroma Informationen separat verwursten.

Ich als Otto-normal Avisynthler kenn da keinen Anwendungsfall, aber es gibt ihn bestimmt...

mogobime

Deswegen kann man entsprechenden 444/422 Input auch auf 420 downsampeln, und das am Besten in einem AviSynth Skript gleich als allerestes, im Falle von 444 spart das immens Rechenleistung...

Jedenfalls ist es (außer vielleicht in irgendwelchen ganz speziellen Fällen, wo man irgendwas einzeln mit dem Chroma machen will) ziemlich unsinnig das erst am Ende des Skripts zu machen und desewegen bei 444 schlimmstenfalls die doppelte Rechenzeit in Anspruch zu nehmen.

OT: Putin hasst das...

mogobime

Nachtrag zum YUV422 Vergleich:

Hab bei den 3 Filtern noch SSIM und vor allem die Netflix Qualitätsmetrik VMAF ergänzt, die KI basiert arbeitet um die menschliche Wahrnehmung möglichst gut abzubilden.

Um es kurz zu machen: Die files bei denen die Farbraumkonvertierung vor dem Filteraufruf durchgeführt wurden Unterscheiden sich auch hier praktisch nicht. VMAF score liegt jedesmal über 99 (100 ist max).

So hohe Werte werden z.B. in der Praxis bei einem Vergleich Quelle -> encodetes file praktisch nie erreicht. Auch der SSIM liegt immer bei 0.99x.

Zip-Files hab ich durch neue mit den Logfiles und Werten für jedes einzelne Frame ersetzt

mogobime

Fazit für YUV422

Gleich vorneweg nochmal: Alle Messungen wurden, wie zuvor auch, per Skript mind. 2-3x durchgeführt und nur das beste Messergebis gespeichert um Zufallsschwankungen durch startende Hintergrundprozesse etc. möglichst auszuschließen bzw. zu reduzieren.

Hier sieht es doch so aus, als ob nicht nur das Multithreading bei neo_fft3d verbessert wurde.

CPU Auslastung war bei neo zwar 5-8% höher, aber neo_fft3d war bei bei

X264 bis zu 40,5% (regular) / 36% (early yuv420 conversion) schneller als das normale FFT3DFilter und bei AVSMeter bis zu 31,2% (regular) / 41,8% (early yuv420 conversion).

FFT3DGPU setzt sich hier logischerweise noch weiter von FFT3DFilter ab:

X264 213% (regular) / 193% (early yuv420 conversion) und AVSMeter 88,2% (regular) / 77,3% (early yuv420 conversion).

Bei X264 muss man bedenken, dass bei FFT3DGPU und x264 preset superfast die CPU zu nur etwa 15% ausgelastet war.

Bei einem im realen Einsatz verwendeten preset fast oder medium müssten die Unterschiede noch gravierender sein, da dürften sich neo_fft3d + fft3dfilter nochmal knapp halbieren, während FFT3DGPU nur 10-25% langsamer werden sollte. Also selbst mit dieser älteren Budget GPU vermutlich real world Zugewinne um bis zum Dreifachen durch FFT3DGPU, da über 90% der Rechenkapazität fürs encoding freibleiben.

Für YUV422 input bei FFT3DFilter + neo_fft3d gilt: Sie kommen damit noch schlechter klar als FFT3DGPU, und der Geschwindigkeitsvorteil durch "early yuv420 conversion" bringt (im Fall von neo_fft3d) sogar fast doppelt so viel Geschwindigkeitszuwachs wie bei FFT3DGPU!

Hier sollte man erst Recht darüber nachdenken, den ConverToYUV420 call vorzuziehen, wenn man das chroma subsampling aufs übliche YUV420 ändert.

mogobime

cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv - 4K, 10 bit, YUV422 mit FFT3DFilter

FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log:

Code

REM ### Don't remove '%cd%\%dynFileName%' at beginning and end of cli call, this won't work! You should only modify the x264 parameters!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --preset ultrafast --crf 10.00 --profile high10 --level 5.2 --sync-lookahead 16 --vbv-maxrate 240000 --vbv-bufsize 720000 --threads 16 --sar 1:1 --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE", MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\libfftw3f-3.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
LoadPlugin("C:\PROGRA~1\Hybrid\64bit\Avisynth\avisynthPlugins\FFT3DFilter.dll")
# loading source: $$SOURCEVID$$
# color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV422P10", prefer_hw=0,repeat=true)
# current resolution: 3840x1608
# denoising using fft3dgpu
FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)
PreFetch($$DYNMEASUREVAR$$)
# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()
PreFetch($$DYNMEASUREVAR$$)
# setting output fps to 24.000fps
AssumeFPS(24,1)
#  output: color sampling YV16@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\YUV422\cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/YUV422/cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '0,3,6'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '0,3,6' +- gap of '+1'

--------------------------------------------------------------------------------

0 FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 2.10 fps, 95773.04 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845151 (8.100927) U:0.980056 (17.001849) V:0.978293 (16.633982) All:0.889826 (9.579198) ## PSNR y:17.838652 u:33.644813 v:32.996736 average:19.538374 min:7.664827 max:inf

3 FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 2.97 fps, 95770.98 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100931) U:0.980056 (17.001861) V:0.978293 (16.633976) All:0.889826 (9.579202) ## PSNR y:17.838652 u:33.644812 v:32.996737 average:19.538373 min:7.664827 max:inf

6 FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 3.68 fps, 95768.74 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100936) U:0.980055 (17.001760) V:0.978293 (16.633974) All:0.889826 (9.579204) ## PSNR y:17.838655 u:33.644794 v:32.996752 average:19.538376 min:7.664828 max:inf

Alles anzeigen

Bestwert 3.68 fps

ConvertToYUV420-prefetch(X)-FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log:

Code

REM ### Don't remove '%cd%\%dynFileName%' at beginning and end of cli call, this won't work! You should only modify the x264 parameters!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --preset ultrafast --crf 10.00 --profile high10 --level 5.2 --sync-lookahead 16 --vbv-maxrate 240000 --vbv-bufsize 720000 --threads 16 --sar 1:1 --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE", MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\libfftw3f-3.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
LoadPlugin("C:\PROGRA~1\Hybrid\64bit\Avisynth\avisynthPlugins\FFT3DFilter.dll")
# loading source: $$SOURCEVID$$
# color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV422P10", prefer_hw=0,repeat=true)
# current resolution: 3840x1608
# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()
PreFetch($$DYNMEASUREVAR$$)
# denoising using fft3dgpu
FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)
PreFetch($$DYNMEASUREVAR$$)
# setting output fps to 24.000fps
AssumeFPS(24,1)
#  output: color sampling YV16@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\YUV422\cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/YUV422/cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '0,3,6'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '0,3,6' +- gap of '+1'

--------------------------------------------------------------------------------

0 ConvertToYUV420-prefetch(X)-FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 2.68 fps, 94831.87 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100933) U:0.980484 (17.096095) V:0.978839 (16.744582) All:0.889988 (9.585607) ## PSNR y:17.838654 u:33.654218 v:33.006380 average:19.538509 min:7.664828 max:inf

3 ConvertToYUV420-prefetch(X)-FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 3.79 fps, 94836.51 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100936) U:0.980484 (17.096087) V:0.978839 (16.744598) All:0.889988 (9.585611) ## PSNR y:17.838654 u:33.654218 v:33.006381 average:19.538509 min:7.664828 max:inf

6 ConvertToYUV420-prefetch(X)-FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 4.61 fps, 94839.48 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100939) U:0.980484 (17.096089) V:0.978839 (16.744582) All:0.889988 (9.585613) ## PSNR y:17.838654 u:33.654221 v:33.006401 average:19.538509 min:7.664827 max:inf

Alles anzeigen

Bestwert 4.61 fps

-> X264 25,3% schneller mit ConvertToYUV420() for Filteraufruf.

6 FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log (AVSMeter64):

Code

[Runtime info]
Frames processed:                   1383 (0 - 1382)
FPS (min | max | average):          0.189 | 91743 | 3.935
Process memory usage (max):         6547 MiB
Thread count:                       31
CPU usage (average):                81.2%

GPU usage (average):                2%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:05:51.466

Alles anzeigen

6 ConvertToYUV420-prefetch(X)-FFT3DFilter(bw=64,bh=64,plane=4,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log (AvsMeter64):

Code

[Runtime info]
Frames processed:                   1383 (0 - 1382)
FPS (min | max | average):          0.122 | 74074 | 4.945
Process memory usage (max):         5460 MiB
Thread count:                       30
CPU usage (average):                83.5%

GPU usage (average):                1%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:04:39.701

Alles anzeigen

-> Avsmeter64 25,8% schneller mit ConvertToYUV420() vor Filteraufruf!

Qualitätsmetriken - direkter Vergleich der beiden output clips miteinander:

Code

PSNR y:56.688991 u:59.165395 v:58.551171 average:57.296540 min:51.909493 max:inf
SSIM Y:0.998295 (27.682848) U:0.998983 (29.925964) V:0.998815 (29.264141) All:0.998496 (28.228635)
VMAF score: 99.151086

mogobime

Bei neo_fft3d waren die Geschwindigkeitsunterschiede bei exakt gleichem Setup sogar noch deutlicher.

cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv - 4K, 10 bit, YUV422 mit neo_fft3d

neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log:

Code

REM ### Don't remove '%cd%\%dynFileName%' at beginning and end of cli call, this won't work! You should only modify the x264 parameters!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --preset ultrafast --crf 10.00 --profile high10 --level 5.2 --sync-lookahead 16 --vbv-maxrate 240000 --vbv-bufsize 720000 --threads 16 --sar 1:1 --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE", MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\libfftw3f-3.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\neo-fft3d.dll")
# loading source: $$SOURCEVID$$
# color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV422P10", prefer_hw=0,repeat=true)
# current resolution: 3840x1608
# denoising using fft3dgpu
neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)
PreFetch($$DYNMEASUREVAR$$)
# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()
PreFetch($$DYNMEASUREVAR$$)
# setting output fps to 24.000fps
AssumeFPS(24,1)
#  output: color sampling YV16@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\YUV422\cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/YUV422/cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '0,3,6'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '0,3,6' +- gap of '+1'

--------------------------------------------------------------------------------

0 neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 4.39 fps, 95777.60 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100933) U:0.980055 (17.001720) V:0.978293 (16.634040) All:0.889826 (9.579202) ## PSNR y:17.838652 u:33.644785 v:32.996759 average:19.538374 min:7.664826 max:inf

3 neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 5.17 fps, 95782.19 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100950) U:0.980056 (17.001863) V:0.978293 (16.634034) All:0.889826 (9.579221) ## PSNR y:17.838653 u:33.644781 v:32.996762 average:19.538374 min:7.664827 max:inf

6 neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 4.77 fps, 95781.57 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100942) U:0.980055 (17.001685) V:0.978294 (16.634162) All:0.889826 (9.579213) ## PSNR y:17.838653 u:33.644775 v:32.996723 average:19.538375 min:7.664828 max:inf

Alles anzeigen

Bestwert 5.17 fps

ConvertToYUV420-prefetch(X)-neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log:

Code

REM ### Don't remove '%cd%\%dynFileName%' at beginning and end of cli call, this won't work! You should only modify the x264 parameters!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --preset ultrafast --crf 10.00 --profile high10 --level 5.2 --sync-lookahead 16 --vbv-maxrate 240000 --vbv-bufsize 720000 --threads 16 --sar 1:1 --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE", MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\libfftw3f-3.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\neo-fft3d.dll")
# loading source: $$SOURCEVID$$
# color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV422P10", prefer_hw=0,repeat=true)
# current resolution: 3840x1608
# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()
PreFetch($$DYNMEASUREVAR$$)
# denoising using fft3dgpu
neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)
PreFetch($$DYNMEASUREVAR$$)
# setting output fps to 24.000fps
AssumeFPS(24,1)
#  output: color sampling YV16@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\YUV422\cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/YUV422/cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '0,3,6'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '0,3,6' +- gap of '+1'

--------------------------------------------------------------------------------

0 ConvertToYUV420-prefetch(X)-neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 5.14 fps, 94848.29 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100933) U:0.980484 (17.096091) V:0.978838 (16.744484) All:0.889988 (9.585604) ## PSNR y:17.838651 u:33.654234 v:33.006405 average:19.538507 min:7.664827 max:inf

3 ConvertToYUV420-prefetch(X)-neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 6.27 fps, 94846.35 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845152 (8.100931) U:0.980484 (17.096086) V:0.978838 (16.744504) All:0.889988 (9.585602) ## PSNR y:17.838652 u:33.654225 v:33.006364 average:19.538507 min:7.664827 max:inf

6 ConvertToYUV420-prefetch(X)-neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 5.84 fps, 94847.81 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.845153 (8.100963) U:0.980485 (17.096244) V:0.978839 (16.744653) All:0.889989 (9.585641) ## PSNR y:17.838652 u:33.654230 v:33.006356 average:19.538507 min:7.664827 max:inf

Alles anzeigen

Bestwert 6.27 fps

-> X264 21,3% schneller mit ConvertToYUV420() for Filteraufruf.

6 neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false)-prefetch(X)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log (AVSMeter):

Code

[Runtime info]
Frames processed:                   1383 (0 - 1382)
FPS (min | max | average):          0.215 | 105264 | 5.162
Process memory usage (max):         6057 MiB
Thread count:                       60
CPU usage (average):                89.5%

GPU usage (average):                1%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:04:27.938

Alles anzeigen

6 ConvertToYUV420-prefetch(X)-neo_fft3d(bw=64,bh=64,y=3,u=3,v=3,interlaced=false) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log (AvsMeter):

Code

[Runtime info]
Frames processed:                   1383 (0 - 1382)
FPS (min | max | average):          0.310 | 114942 | 7.011
Process memory usage (max):         5009 MiB
Thread count:                       56
CPU usage (average):                88.1%

GPU usage (average):                1%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:03:17.261

Alles anzeigen

-> Avsmeter64 35,8% schneller mit ConvertToYUV420() vor Filteraufruf!

Qualitätsmetriken - Beide output clips direkt miteinander verglichen:

Code

PSNR y:56.610453 u:59.156317 v:58.542447 average:57.234147 min:51.751340 max:inf
SSIM Y:0.998271 (27.620884) U:0.998980 (29.914837) V:0.998813 (29.254114) All:0.998479 (28.179166)
VMAF score: 99.146489

Btw - obwohl FFT3DGPU bei 4K 10 Bit YUV422 content bereits meiner RX 560 Budget GPU mit 4 GB die Grenzen aufzeigt und sie mit knapp 80% auslastet, ist es immer noch 25,1% schneller. Stromverbrauch geht dabei, wie schonmal erwähnt um max 10% oder 30W hoch, in dem Fall ist er sogar niedriger, da die CPU sich die meiste Zeit langweilt

Und neofft3d lastet hier die CPU bereits mit rund 90% aus, da ist also für nen codec nicht viel Rechenkapazität übrig...

mogobime

Zitat von Selur

Yes, if you feed FFT3DGPU with a color space which holds less data to filter it is faster.

Antworte mal auf deutsch, sonst brauch ich hier noch länger um was "zu Papier" zu bringen

Am deutlichsten ist's wohl beim YUV444 Farbraum, aber auch hier bei YUV422.

Am Ende der x264 logfiles sind diesmal jeweils per ffmpeg die Unterschiede im SSIM/PSNR zwischen dem unveränderten input video und dem output Video ermittelt (keine Werte von x264, welches den Unterschied zwischen gefiltertem input und dem output video wiedergeben würde).

Man muss bedenken, dass ich hier mit CRF 10 gearbeitet habe, d.h. schon das sind Werte, die wohl die meisten als "nahe losless" bezeichnen würden.

Die Werte, wenn das akuratere setting mit ConvertToYUV420() erst am Ende verwendet wurde, Vergleich input mit output:

Code

SSIM Y:0.846540 (8.140056) U:0.980199 (17.033228) V:0.978513 (16.678183) All:0.890812 (9.618259) 
PSNR y:17.832339 u:33.634492 v:32.988516 average:19.532021 min:7.664472 max:64.968725

Die Werte beim Vergleich output FFT3DGPU-ConvertToYUV420 mit output ConvertToYUV420()-FFT3DGPU:

Code

SSIM Y:0.998395 (27.944505) U:0.998879 (29.505425) V:0.998719 (28.925446) All:0.998530 (28.325625)
PSNR y:56.946899 u:58.587585 v:58.052360 average:57.355967 min:51.789978 max:inf

-> PSNR + SSIM sind bei logarithmischer Skala im UV Bereich trotz der vorgezogenen Farbraumkonvertierung fast doppelt so hoch wie zwischen Original und einem "regulär" mit CRF 10 enkodierten Video, nur um mal einen Maßstab zu haben um was für mickrige Unterschiede es da geht!

mogobime

cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv - 4K, 10 bit, YUV422 mit FFT3DGPU

FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-prefetch(1,X+1)-ConvertToYUV420() [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log:

Code

REM ### Don't remove '%cd%\%dynFileName%' at beginning and end of cli call, this won't work! You should only modify the x264 parameters!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --preset ultrafast --crf 10.00 --profile high10 --level 5.2 --sync-lookahead 16 --vbv-maxrate 240000 --vbv-bufsize 720000 --threads 16 --sar 1:1 --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE", MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\d3d9.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\FFT3dGPU.dll")
# loading source: $$SOURCEVID$$
# color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV422P10", prefer_hw=0,repeat=true)
# current resolution: 3840x1608
# denoising using fft3dgpu
FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)
PreFetch(1,$$DYNMEASUREVARGAP$$)
# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()
PreFetch($$DYNMEASUREVAR$$)
# setting output fps to 24.000fps
AssumeFPS(24,1)
#  output: color sampling YV16@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\YUV422\cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/YUV422/cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '0,3,6'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '0,3,6' +- gap of '+1'

--------------------------------------------------------------------------------

0 FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-prefetch(1,X+1)-ConvertToYUV420() [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 7.83 fps, 92400.77 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.846540 (8.140056) U:0.980199 (17.033228) V:0.978513 (16.678183) All:0.890812 (9.618259) ## PSNR y:17.832339 u:33.634492 v:32.988516 average:19.532021 min:7.664472 max:64.968725

3 FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-prefetch(1,X+1)-ConvertToYUV420() [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 7.84 fps, 92407.90 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.846540 (8.140059) U:0.980199 (17.033229) V:0.978513 (16.678194) All:0.890812 (9.618263) ## PSNR y:17.832339 u:33.634493 v:32.988517 average:19.532021 min:7.664472 max:64.968725

6 FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-prefetch(1,X+1)-ConvertToYUV420() [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 7.82 fps, 92406.58 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.846540 (8.140060) U:0.980200 (17.033251) V:0.978513 (16.678214) All:0.890812 (9.618265) ## PSNR y:17.832339 u:33.634496 v:32.988517 average:19.532021 min:7.664472 max:64.968725

Alles anzeigen

Bestwert: 7.84 fps

ConvertToYUV420-prefetch(X)-FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-PreFetch(1,X+1) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log:

Code

REM ### Don't remove '%cd%\%dynFileName%' at beginning and end of cli call, this won't work! You should only modify the x264 parameters!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --preset ultrafast --crf 10.00 --profile high10 --level 5.2 --sync-lookahead 16 --vbv-maxrate 240000 --vbv-bufsize 720000 --threads 16 --sar 1:1 --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE", MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\d3d9.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\FFT3dGPU.dll")
# loading source: $$SOURCEVID$$
# color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV422P10", prefer_hw=0,repeat=true)
# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()
PreFetch($$DYNMEASUREVAR$$)
# current resolution: 3840x1608
# denoising using fft3dgpu
FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)
PreFetch(1,$$DYNMEASUREVARGAP$$)
PreFetch($$DYNMEASUREVAR$$)
# setting output fps to 24.000fps
AssumeFPS(24,1)
#  output: color sampling YV16@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\YUV422\cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/YUV422/cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '0,3,6'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '0,3,6' +- gap of '+1'

--------------------------------------------------------------------------------

0 ConvertToYUV420-prefetch(X)-FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-PreFetch(1,X+1) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 8.92 fps, 91635.39 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.846541 (8.140065) U:0.980629 (17.128533) V:0.979057 (16.789703) All:0.890975 (9.624733) ## PSNR y:17.832339 u:33.644858 v:32.999214 average:19.532167 min:7.664472 max:64.968725

3 ConvertToYUV420-prefetch(X)-FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-PreFetch(1,X+1) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 8.77 fps, 91641.51 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.846541 (8.140066) U:0.980629 (17.128522) V:0.979057 (16.789685) All:0.890975 (9.624733) ## PSNR y:17.832339 u:33.644858 v:32.999212 average:19.532167 min:7.664472 max:64.968725

6 ConvertToYUV420-prefetch(X)-FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-PreFetch(1,X+1) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv]
encoded 1383 frames, 8.76 fps, 91637.83 kb/s
ffmpeg quality metric comparing sourceVidWin and dynfileName:
SSIM Y:0.846540 (8.140060) U:0.980629 (17.128507) V:0.979057 (16.789653) All:0.890975 (9.624726) ## PSNR y:17.832339 u:33.644854 v:32.999213 average:19.532167 min:7.664472 max:64.968725

Alles anzeigen

Bestwert: 8.92 fps

-> X264 13,8% schneller mit ConvertToYUV420() for Filteraufruf.

6 FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-prefetch(1,X+1)-ConvertToYUV420 [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log (AvsMeter64):

Code

[Runtime info]
Frames processed:                   1383 (0 - 1382)
FPS (min | max | average):          0.388 | 46948 | 7.404
Process memory usage (max):         2250 MiB
Thread count:                       45
CPU usage (average):                13.2%

GPU usage (average):                79%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:03:06.782

Alles anzeigen

6 ConvertToYUV420-prefetch(X)-FFT3DGPU(bw=64,bh=64,degrid=1.00,plane=4,mode=2,bordersize=1,precision=2)-PreFetch(1,X+1) [cut_TGM_TLR-C_3840x1608_HEVC_YUV422_10bit.mkv].log (AvsMeter64):

Code

[Runtime info]
Frames processed:                   1383 (0 - 1382)
FPS (min | max | average):          0.393 | 30960 | 8.769
Process memory usage (max):         1947 MiB
Thread count:                       51
CPU usage (average):                13.5%

GPU usage (average):                77%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:02:37.717

Alles anzeigen

-> Avsmeter64 18,4% schneller mit ConvertToYUV420 vor Filteraufruf.

Qualitätsmetriken - direkter Vergleich der beiden output clips miteinander:

Code

SSIM Y:0.998380 (27.904786) U:0.998879 (29.502780) V:0.998719 (28.923470) All:0.998520 (28.296061)
PSNR y:56.946899 u:58.587585 v:58.052360 average:57.355967 min:51.789978 max:inf
PSNR y:56.907363 u:58.585376 v:58.050940 average:57.326495 min:51.783484 max:inf
VMAF score: 99.142670

-> Auch hier für Normalnutzer vernachlässigbare marginale Unterschiede zwischen den beiden output videos.

mogobime

Hab noch was zu fft3dgpu in Hybrid. Ein paar Optionen sind in Hybrid nicht umgesetzt, aber die ein oder andere ist vielleicht doch nützlich:

Zitat

float degrid = 1.0
Enables degriding. Only works well with mode=1. Doesn't degrid the Kalman filter (but it does degrid the sharpening (if enabled) after kalman filter). default 1.0 for mode=1, 0.0 for mode=0 or 2.

float scutoff = 0.3

Sharpening cutoff frequency, relative to max.

float svr = 1.0

Sharpening (and dehalo) vertical ratio (to horizontal) (default=1.0 - same as horizontal, 0 - no vertical sharpening)

float smin = 4.0

float smax = 20.0

Minimum and maximum limit (approximate noise margin) for sharpening stage.

float kratio = 2.0

Ratio of threshold to sigma to reset Kalman filter. Variation threshold = sigma*kratio, good value is about from 1.5 to 3.0

int ow = bw/2

int oh = bh/2

Overlap width and height. This only works with mode=1. This specifies how big the overlap between the blocks are. Overlap size must be less than or equal to half the blocksize. ow must be even.

int wintype = 0

weighting windows type:

0 : same analysis and synthesis half-cosine window, used in all versions before 1.4.
1 : intermediate between 0 and 2
2 : flat analysis window, rised cosine (Hanning) synthesis window.

Alles anzeigen

Vielleicht bekommt man mit degrid den ein oder anderen Gitterartefakt, der bei manchen Auflösungen, bestimmten bw Größen und beim Erhöhen von bordersize im mode 2 auftritt, damit in den Griff...

Und was ich auch erst jetzt bemerkt habe, ist dass negative Werte beim Sharpening ein Smoothing bewirken. Damit sind auch die ganzen sharpening Feintuning Einstellungen scutoff, smin und smax (den Schreibfehler ausm AviSynth Wiki hab ich gleich mal oben entfernt, da steht 2x smin...) interessant. Sharpening bzw. Smoothing auf bestimmte Bereiche zu begrenzen hört sich auch gut an, da es sich auch eher nur um einen leichten Effekt handelt, kann man den möglicherweise durch Anheben des smin Wertes oder ändern der scutoff Frequenz noch etwas verstärken/verändern.

Kann ja auch durch setzen von bw=-1 unabhängig vom denoising verwendet werden, und schon hat man einen GPU basierten sharpener/smoother.

Wintype verstehe ich zwar nicht wirklich, aber möglicherweise beeinflusst das die Arbeitsweise und auch Performance des Filters?!?

Auch noch Wert drüber nachzudenken:

https://gleitz.info/forum/index.ph…5948#post465948 https://gleitz.info/forum/index.ph…5948#post465948 4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

mogobime

4K content mit fft3dgpu im mode 2 nur Y zu filtern scheint tatsächlich eine Alternative zu sein (bei meiner mittlerweile etwas schwachbrüstigen GPU). Den üblichen, selbst nervig auffälligen noise bekommt man trotzdem gut reduziert. Wenn man dann noch den Codec-internen noise filter mit z.B. nur 1000 mitlaufen lässt, passt auch die Komprimierbarkeit. Chroma noise reduction bei 4K werde ich mir (außer für Testzwecke) denke ich künftig schenken, wenn's nicht gerade explizit in der Hinsicht stark verhunztes Material mit irgendwelchem stark auffälligem Farbflimmern ist.

Selur:

Und hast du mal überlegt bei fft3dgpu die Konvertierung ins Zielfarbformat per default for den Filteraufruf zu setzen?

Kann ja heute Abend mal noch testen wie's bei YUV422 aussieht. RGB content hab ich leider keinen.

Ich finde potentiell bis zu 82% mehr Speed sind ein Effizienzgewinn, der nicht ignoriert werden sollte, wenn da am Ende praktisch identischer content rauskommt und gerade im UV Bereich der SSIM fast durchgängig bei 0.999x liegt. Bei PSNR + MSE sieht's ähnlich aus, selbst einzelne Ausschläge bewegen sich in einem bei 10 Bit content völlig unbedenklichen Bereich. Würde fast wetten, dass crf 16 statt crf 19 bei x264 die Unterschied noch weiter marginalisiert (und das ist es ja, was ein Adlerauge vermutlich verwenden würde).

Für den einen User, der's unbedingt braucht heutzutage so viel zusätzliche Rechenzeit zu verplempern um einen nicht sichtbaren Unterschied im Output zu haben, könnte man diese Avisynth TuneUp Einstellung ja umkehrbar machen. aber vermutlich existiert dieser User ohnehin nicht, denn der würde vermutlich gar keinen noise filter verwenden

Werde bei Gelegenheit auch mal checken wie's sich mit fft3dfilter + neo_fft3d verhält und ob das eher was mit den fft Algorithmen oder mit fft3dgpu im speziellen zu tun hat.

mogobime

Zitat von Selur

Nebenbei: Mal überlegt anstatt AviSynth&Co zu nutzen mal eher die Noisereduction in x264&x265 zu verwenden?
Zumindest wenn es vor allem um erhöhte Komprimierbarkeit geht sollte die NoiseReduction nicht schlecht sein.

Ja, kenn ich die Funktion, und es wäre aufgrund der Anmerkung von LigH bezüglich der Erhöhung der Komprimierbarkeit ohne wirkliches Reduzieren des Rauschens eine Idee, das künftig bei Videos mit eher wenig Artefakten zusätzlich mit moderaten Werten zuzuschalten und bei fft3dgpu Sigma etwas abzusenken.

Oder aus Performancegründen (bei 4K, 10Bit & Co) wäre es bei solchen Videos wohl auch einen Versuch Wert nur Y mit fft3dgpu zu filtern, und dann noch den x264 denoiser mit 1000-2500 zuzuschalten.

Allerdings geht es mir nun auch nicht ausschließlich um die Komprimierbarkeit, es dürfen auch gerne hässliche Effekte im Original reduziert werden.

Die Möglichkeit z.B. mit Hybrid "Only Dark" Bereiche an fft3dgpu zu geben, oder in fft3dgpu nur Y oder UV oder bestimmte Frequenzbereiche stärker zu filtern, ist schon nicht schlecht. So kann man sich auf Bereiche konzentrieren, die besonders durch Artefakte auffallen, da mit hohen Sigma Werten filtern und den Rest schonend behandeln.

mogobime

Hab das zusätzlich noch durch avsmeter64 gejagt, und da sind die Unterschiede noch viel deutlicher:

x1 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F.avs (ConvertToYUV420 nach FFT3DGPU):

Code

[Clip info]
Number of frames:                     1418
Length (hh:mm:ss.ms):         00:00:59.083
Frame width:                          3840
Frame height:                         1608
Framerate:                          24.000 (24/1)
Colorspace:                      YUV420P10
Audio channels:                        n/a
Audio bits/sample:                     n/a
Audio sample rate:                     n/a
Audio samples:                         n/a


[Runtime info]
Frames processed:                   1418 (0 - 1417)
FPS (min | max | average):          0.815 | 8.290 | 5.653
Process memory usage (max):         1349 MiB
Thread count:                       40
CPU usage (average):                13.1%

GPU usage (average):                87%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:04:10.853

Alles anzeigen

x1 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F.avs (ConvertToYUV420 vor FFT3DGPU):

Code

[Clip info]
Number of frames:                     1418
Length (hh:mm:ss.ms):         00:00:59.083
Frame width:                          3840
Frame height:                         1608
Framerate:                          24.000 (24/1)
Colorspace:                      YUV420P10
Audio channels:                        n/a
Audio bits/sample:                     n/a
Audio sample rate:                     n/a
Audio samples:                         n/a


[Runtime info]
Frames processed:                   1418 (0 - 1417)
FPS (min | max | average):          1.386 | 22.46 | 10.29
Process memory usage (max):         1134 MiB
Thread count:                       40
CPU usage (average):                19.1%

GPU usage (average):                79%
GPU Power Consumption (average):    0.5 W

Time (elapsed):                     00:02:17.863

Alles anzeigen

-> 82% schneller, da hat wohl beim encoding mit X264 meine überlastete CPU gebremst!

mogobime

Dann wollte ich noch wissen ob es großartige Unterschiede bei den erzeugten files gibt und habe sie mit ffmpeg direkt miteinander verglichen (PSNR + SSIM ermittelt).

SSIM:

Code

SSIM Y:0.998378 (27.900152) U:0.999227 (31.120617) V:0.999125 (30.582179) All:0.998644 (28.678402)

n:1 Y:0.999912 U:0.999999 V:0.999989 All:0.999939 (42.150198)
n:2 Y:0.999958 U:0.999999 V:0.999990 All:0.999970 (45.258967)
n:3 Y:0.999954 U:0.999999 V:0.999989 All:0.999968 (44.886552)
n:4 Y:0.999943 U:0.999999 V:0.999989 All:0.999960 (43.967627)
n:5 Y:0.999946 U:0.999999 V:0.999988 All:0.999962 (44.208437)
n:6 Y:0.999931 U:0.999999 V:0.999988 All:0.999951 (43.137295)
n:7 Y:0.999955 U:0.999999 V:0.999988 All:0.999968 (44.888230)
n:8 Y:0.999946 U:0.999999 V:0.999988 All:0.999962 (44.167589)
n:9 Y:0.999941 U:0.999999 V:0.999988 All:0.999958 (43.816310)
n:10 Y:0.999932 U:0.999999 V:0.999988 All:0.999952 (43.218555)
n:11 Y:0.999926 U:0.999999 V:0.999987 All:0.999948 (42.845369)
n:12 Y:0.999921 U:0.999999 V:0.999987 All:0.999945 (42.572114)
n:13 Y:0.999922 U:0.999999 V:0.999987 All:0.999945 (42.630192)
n:14 Y:0.999915 U:0.999998 V:0.999986 All:0.999941 (42.261585)
n:15 Y:0.999873 U:0.999992 V:0.999960 All:0.999907 (40.324472)
n:16 Y:0.999768 U:0.999942 V:0.999879 All:0.999815 (37.334301)
n:17 Y:0.999693 U:0.999911 V:0.999829 All:0.999752 (36.055911)
n:18 Y:0.999550 U:0.999831 V:0.999778 All:0.999635 (34.377439)
n:19 Y:0.999434 U:0.999744 V:0.999695 All:0.999529 (33.271871)
n:20 Y:0.999356 U:0.999729 V:0.999651 All:0.999467 (32.733872)
n:21 Y:0.999253 U:0.999675 V:0.999539 All:0.999371 (32.010720)
n:22 Y:0.999145 U:0.999625 V:0.999515 All:0.999287 (31.468849)
n:23 Y:0.998543 U:0.999381 V:0.999155 All:0.998784 (29.152299)
n:24 Y:0.998427 U:0.999405 V:0.999170 All:0.998714 (28.906665)
n:25 Y:0.998577 U:0.999367 V:0.999128 All:0.998800 (29.209741)
n:26 Y:0.998398 U:0.999424 V:0.999220 All:0.998706 (28.879578)
n:27 Y:0.998206 U:0.999377 V:0.999156 All:0.998560 (28.415509)
n:28 Y:0.998278 U:0.999403 V:0.999206 All:0.998621 (28.602880)
n:29 Y:0.998360 U:0.999359 V:0.999120 All:0.998653 (28.707090)
n:30 Y:0.998298 U:0.999411 V:0.999203 All:0.998634 (28.646355)
n:31 Y:0.998202 U:0.999386 V:0.999159 All:0.998559 (28.413206)
n:32 Y:0.998305 U:0.999416 V:0.999204 All:0.998640 (28.665454)
n:33 Y:0.998200 U:0.999372 V:0.999129 All:0.998550 (28.386538)
n:34 Y:0.998376 U:0.999446 V:0.999233 All:0.998697 (28.851003)
n:35 Y:0.998257 U:0.999417 V:0.999213 All:0.998610 (28.568783)
n:36 Y:0.998368 U:0.999443 V:0.999260 All:0.998696 (28.846266)
n:37 Y:0.998206 U:0.999393 V:0.999173 All:0.998565 (28.432683)
n:38 Y:0.998488 U:0.999469 V:0.999299 All:0.998786 (29.159272)
n:39 Y:0.998312 U:0.999446 V:0.999256 All:0.998658 (28.723603)
n:40 Y:0.998468 U:0.999468 V:0.999300 All:0.998773 (29.112244)
n:41 Y:0.998157 U:0.999419 V:0.999195 All:0.998541 (28.358103)
n:42 Y:0.998387 U:0.999473 V:0.999284 All:0.998717 (28.919207)
n:43 Y:0.998018 U:0.999428 V:0.999195 All:0.998449 (28.093050)
n:44 Y:0.996459 U:0.998906 V:0.998312 All:0.997176 (25.491316)
n:45 Y:0.996236 U:0.999182 V:0.998602 All:0.997121 (25.407904)
n:46 Y:0.996127 U:0.999249 V:0.998606 All:0.997061 (25.317296)
n:47 Y:0.995889 U:0.999245 V:0.998594 All:0.996899 (25.085376)
n:48 Y:0.995950 U:0.999231 V:0.998567 All:0.996933 (25.133300)
n:49 Y:0.995690 U:0.999151 V:0.998357 All:0.996712 (24.830293)
n:50 Y:0.996003 U:0.999276 V:0.998561 All:0.996975 (25.192168)
...

Alles anzeigen

-> 0.99x durchgängig sowohl bei Y als auch bei UV sieht nur nach minimalsten Unterschieden aus.

PSNR:

Code

PSNR y:55.682510 u:59.221674 v:58.550806 average:56.509825 min:51.185110 max:72.324075
n:1 mse_avg:0.10 mse_y:0.15 mse_u:0.00 mse_v:0.03 psnr_avg:70.08 psnr_y:68.54 psnr_u:85.03 psnr_v:75.89 
n:2 mse_avg:0.06 mse_y:0.08 mse_u:0.00 mse_v:0.03 psnr_avg:72.32 psnr_y:70.91 psnr_u:85.60 psnr_v:76.15 
n:3 mse_avg:0.07 mse_y:0.10 mse_u:0.00 mse_v:0.03 psnr_avg:71.84 psnr_y:70.39 psnr_u:85.79 psnr_v:76.19 
n:4 mse_avg:0.09 mse_y:0.12 mse_u:0.00 mse_v:0.03 psnr_avg:70.90 psnr_y:69.39 psnr_u:85.83 psnr_v:76.10 
n:5 mse_avg:0.08 mse_y:0.11 mse_u:0.00 mse_v:0.03 psnr_avg:71.28 psnr_y:69.82 psnr_u:84.83 psnr_v:75.75 
n:6 mse_avg:0.10 mse_y:0.14 mse_u:0.00 mse_v:0.03 psnr_avg:70.16 psnr_y:68.63 psnr_u:84.83 psnr_v:75.78 
n:7 mse_avg:0.07 mse_y:0.10 mse_u:0.00 mse_v:0.03 psnr_avg:71.74 psnr_y:70.30 psnr_u:85.88 psnr_v:75.78 
n:8 mse_avg:0.08 mse_y:0.11 mse_u:0.00 mse_v:0.03 psnr_avg:71.24 psnr_y:69.77 psnr_u:85.71 psnr_v:75.75 
n:9 mse_avg:0.09 mse_y:0.12 mse_u:0.00 mse_v:0.03 psnr_avg:70.79 psnr_y:69.28 psnr_u:85.49 psnr_v:75.98 
n:10 mse_avg:0.10 mse_y:0.15 mse_u:0.00 mse_v:0.03 psnr_avg:70.06 psnr_y:68.52 psnr_u:85.40 psnr_v:75.86 
n:11 mse_avg:0.11 mse_y:0.16 mse_u:0.00 mse_v:0.03 psnr_avg:69.71 psnr_y:68.15 psnr_u:85.53 psnr_v:75.80 
n:12 mse_avg:0.12 mse_y:0.17 mse_u:0.00 mse_v:0.03 psnr_avg:69.38 psnr_y:67.80 psnr_u:85.21 psnr_v:75.83 
n:13 mse_avg:0.12 mse_y:0.17 mse_u:0.00 mse_v:0.03 psnr_avg:69.36 psnr_y:67.78 psnr_u:85.15 psnr_v:75.78 
n:14 mse_avg:0.13 mse_y:0.19 mse_u:0.00 mse_v:0.03 psnr_avg:68.92 psnr_y:67.34 psnr_u:84.80 psnr_v:75.44 
n:15 mse_avg:0.18 mse_y:0.24 mse_u:0.02 mse_v:0.10 psnr_avg:67.59 psnr_y:66.34 psnr_u:77.14 psnr_v:70.09 
n:16 mse_avg:0.32 mse_y:0.37 mse_u:0.14 mse_v:0.28 psnr_avg:65.18 psnr_y:64.49 psnr_u:68.85 psnr_v:65.73 
n:17 mse_avg:0.36 mse_y:0.42 mse_u:0.18 mse_v:0.33 psnr_avg:64.58 psnr_y:63.95 psnr_u:67.72 psnr_v:65.07 
n:18 mse_avg:0.58 mse_y:0.69 mse_u:0.32 mse_v:0.40 psnr_avg:62.57 psnr_y:61.82 psnr_u:65.17 psnr_v:64.16 
n:19 mse_avg:0.76 mse_y:0.88 mse_u:0.49 mse_v:0.55 psnr_avg:61.38 psnr_y:60.74 psnr_u:63.26 psnr_v:62.80 
n:20 mse_avg:0.85 mse_y:1.00 mse_u:0.51 mse_v:0.60 psnr_avg:60.88 psnr_y:60.19 psnr_u:63.08 psnr_v:62.39 
n:21 mse_avg:1.04 mse_y:1.18 mse_u:0.67 mse_v:0.84 psnr_avg:60.04 psnr_y:59.49 psnr_u:61.94 psnr_v:60.94 
n:22 mse_avg:1.22 mse_y:1.45 mse_u:0.67 mse_v:0.82 psnr_avg:59.34 psnr_y:58.57 psnr_u:61.93 psnr_v:61.08 
n:23 mse_avg:2.10 mse_y:2.52 mse_u:1.10 mse_v:1.42 psnr_avg:56.97 psnr_y:56.18 psnr_u:59.78 psnr_v:58.69 
n:24 mse_avg:2.20 mse_y:2.71 mse_u:1.02 mse_v:1.33 psnr_avg:56.77 psnr_y:55.86 psnr_u:60.10 psnr_v:58.96 
n:25 mse_avg:2.02 mse_y:2.38 mse_u:1.13 mse_v:1.43 psnr_avg:57.15 psnr_y:56.43 psnr_u:59.66 psnr_v:58.65 
n:26 mse_avg:2.19 mse_y:2.74 mse_u:0.97 mse_v:1.23 psnr_avg:56.79 psnr_y:55.82 psnr_u:60.32 psnr_v:59.30 
n:27 mse_avg:2.37 mse_y:2.96 mse_u:1.04 mse_v:1.34 psnr_avg:56.46 psnr_y:55.49 psnr_u:60.03 psnr_v:58.94 
n:28 mse_avg:2.31 mse_y:2.90 mse_u:0.99 mse_v:1.25 psnr_avg:56.57 psnr_y:55.57 psnr_u:60.24 psnr_v:59.24 
n:29 mse_avg:2.22 mse_y:2.71 mse_u:1.10 mse_v:1.42 psnr_avg:56.72 psnr_y:55.87 psnr_u:59.78 psnr_v:58.69 
n:30 mse_avg:2.28 mse_y:2.86 mse_u:0.98 mse_v:1.26 psnr_avg:56.62 psnr_y:55.64 psnr_u:60.30 psnr_v:59.20 
n:31 mse_avg:2.34 mse_y:2.93 mse_u:1.00 mse_v:1.32 psnr_avg:56.51 psnr_y:55.53 psnr_u:60.18 psnr_v:59.00 
n:32 mse_avg:2.26 mse_y:2.84 mse_u:0.97 mse_v:1.25 psnr_avg:56.65 psnr_y:55.66 psnr_u:60.35 psnr_v:59.23 
n:33 mse_avg:2.36 mse_y:2.93 mse_u:1.06 mse_v:1.39 psnr_avg:56.46 psnr_y:55.53 psnr_u:59.95 psnr_v:58.76 
n:34 mse_avg:2.14 mse_y:2.68 mse_u:0.91 mse_v:1.20 psnr_avg:56.90 psnr_y:55.92 psnr_u:60.61 psnr_v:59.42 
n:35 mse_avg:2.27 mse_y:2.86 mse_u:0.96 mse_v:1.22 psnr_avg:56.64 psnr_y:55.64 psnr_u:60.39 psnr_v:59.33 
n:36 mse_avg:2.18 mse_y:2.75 mse_u:0.91 mse_v:1.14 psnr_avg:56.82 psnr_y:55.80 psnr_u:60.61 psnr_v:59.62 
n:37 mse_avg:2.33 mse_y:2.93 mse_u:1.01 mse_v:1.30 psnr_avg:56.52 psnr_y:55.54 psnr_u:60.17 psnr_v:59.06 
n:38 mse_avg:2.03 mse_y:2.56 mse_u:0.87 mse_v:1.08 psnr_avg:57.12 psnr_y:56.11 psnr_u:60.78 psnr_v:59.86 
n:39 mse_avg:2.20 mse_y:2.79 mse_u:0.90 mse_v:1.15 psnr_avg:56.77 psnr_y:55.75 psnr_u:60.64 psnr_v:59.59 
n:40 mse_avg:2.07 mse_y:2.62 mse_u:0.88 mse_v:1.09 psnr_avg:57.04 psnr_y:56.02 psnr_u:60.76 psnr_v:59.84 
n:41 mse_avg:2.45 mse_y:3.11 mse_u:0.98 mse_v:1.27 psnr_avg:56.31 psnr_y:55.27 psnr_u:60.30 psnr_v:59.15 
n:42 mse_avg:2.18 mse_y:2.77 mse_u:0.88 mse_v:1.13 psnr_avg:56.81 psnr_y:55.77 psnr_u:60.76 psnr_v:59.67 
n:43 mse_avg:2.68 mse_y:3.45 mse_u:0.98 mse_v:1.30 psnr_avg:55.92 psnr_y:54.83 psnr_u:60.29 psnr_v:59.07 
n:44 mse_avg:4.30 mse_y:5.24 mse_u:1.63 mse_v:3.22 psnr_avg:53.86 psnr_y:53.00 psnr_u:58.07 psnr_v:55.11 
n:45 mse_avg:4.37 mse_y:5.48 mse_u:1.27 mse_v:2.99 psnr_avg:53.80 psnr_y:52.81 psnr_u:59.16 psnr_v:55.44 
n:46 mse_avg:4.45 mse_y:5.62 mse_u:1.19 mse_v:3.04 psnr_avg:53.71 psnr_y:52.70 psnr_u:59.45 psnr_v:55.36 
n:47 mse_avg:4.69 mse_y:5.97 mse_u:1.16 mse_v:3.09 psnr_avg:53.49 psnr_y:52.44 psnr_u:59.55 psnr_v:55.30 
n:48 mse_avg:4.65 mse_y:5.89 mse_u:1.18 mse_v:3.14 psnr_avg:53.53 psnr_y:52.50 psnr_u:59.46 psnr_v:55.23 
n:49 mse_avg:5.05 mse_y:6.41 mse_u:1.30 mse_v:3.35 psnr_avg:53.16 psnr_y:52.13 psnr_u:59.04 psnr_v:54.95 
n:50 mse_avg:4.62 mse_y:5.85 mse_u:1.14 mse_v:3.19 psnr_avg:53.55 psnr_y:52.53 psnr_u:59.63 psnr_v:55.17 
...

Alles anzeigen

-> Auch hier durchgängig niedrige einstellige Werte.

Komplette files im Anhang, war zu groß um es als Text zu posten...

mogobime

Dann hab ich ConvertToYUV420() vor den fft3dgpu(...) Aufruf verschoben (Für Benchmark Werte wie gesagt ganz runter scrollen):

Code

REM ### First 3 lines will be skipped when generating AVS/VPY script from this file. 2nd line must have vspipe/ffmpeg/avs2yuv64 call. Do not remove GOTO :EOF in 3rd line!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --crf 19.00 --profile high10 --level 5.2 --ref 2 --no-mixed-refs --keyint 250 --min-keyint 0 --scenecut 40 --bframes 3 --b-bias 0 --b-pyramid normal --direct spatial --b-adapt 1 --sync-lookahead 16 --cplxblur 20.0 --qcomp 0.60 --qblur 0.50 --mbtree --rc-lookahead 20 --ipratio 1.40 --pbratio 1.30 --chroma-qp-offset 0 --qpmin 0 --qpmax 69 --qpstep 4 --partitions i4x4,i8x8,p8x8,b8x8 --8x8dct --me hex --merange 16 --mvrange -1 --subme 4 --cabac --trellis 1 --weightp 1 --aq-mode 1 --aq-strength 1.00 --vbv-maxrate 240000 --vbv-bufsize 720000 --nr 0 --deadzone-inter 21 --deadzone-intra 11 --cqm flat --threads 16 --sar 1:1 --deblock 0:0 --psnr --ssim --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-csp i420 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE",MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\d3d9.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
# LoadCPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\ffms2.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\FFT3dGPU.dll")
# loading source: $$SOURCEVID$$
# color sampling YV24@10, matrix: bt709, scantyp: progressive, luminance scale: limited
#####
# LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P16", prefer_hw=0,repeat=true)
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P10", prefer_hw=0,repeat=true)
# FFVideoSource("$$SOURCEVID$$",colorspace="YV12")

# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()

#####
# current resolution:

#####
# denoising using fft3dgpu
FFT3DGPU(sigma=$$SIGMA$$,bw=$$BW$$,bh=$$BH$$,bt=$$BT$$,plane=$$PLANE$$,mode=$$MODE$$,bordersize=$$BORDERSIZE$$,precision=$$PRECISION$$)
PreFetch(1,$$DYNMEASUREVARGAP$$)
#####

#####
# scaling to 1920x804
# Spline16Resize(1920,804)
#####

PreFetch($$DYNMEASUREVAR$$)
#####
# setting output fps to 24.000fps
AssumeFPS(24,1)
#####
#  output: color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\4K\cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/4K/cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '1,2,3'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '1,2,3' +- gap of '+1'

--------------------------------------------------------------------------------

x0 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974359 (25.911db)
x264 [info]: PSNR Mean Y:54.896 U:59.880 V:59.359 Avg:55.944 Global:55.345 kb/s:10697.20
encoded 1418 frames, 7.58 fps, 10697.20 kb/s

x1 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974355 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.878 V:59.359 Avg:55.943 Global:55.344 kb/s:10694.98
encoded 1418 frames, 7.64 fps, 10694.98 kb/s

x2 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974359 (25.911db)
x264 [info]: PSNR Mean Y:54.895 U:59.879 V:59.357 Avg:55.944 Global:55.344 kb/s:10695.23
encoded 1418 frames, 7.70 fps, 10695.23 kb/s

x3 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974357 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.879 V:59.359 Avg:55.943 Global:55.344 kb/s:10694.30
encoded 1418 frames, 7.54 fps, 10694.31 kb/s

x4 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974356 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.881 V:59.357 Avg:55.943 Global:55.344 kb/s:10695.41
encoded 1418 frames, 7.63 fps, 10695.41 kb/s

x5 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974356 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.879 V:59.358 Avg:55.943 Global:55.344 kb/s:10695.60
encoded 1418 frames, 7.63 fps, 10695.60 kb/s

x6 ConvertToYUV420-FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1) - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974354 (25.910db)
x264 [info]: PSNR Mean Y:54.895 U:59.878 V:59.356 Avg:55.943 Global:55.343 kb/s:10697.17
encoded 1418 frames, 7.50 fps, 10697.17 kb/s

Alles anzeigen

-> ConvertToYUV420() vor fft3dgpu(...) war 37,5% schneller bei den jeweiligen Bestwerten!

mogobime

Ich bin da bei fft3dgpu und YUV444P10 input auf was gestoßen, was den ein oder anderen interessieren könnte, da es einen ziemlichen Unterschied in der Performance macht, aber so gut wie nichts bringt. Es scheint nämlich mit dem YUV444 Sampling nicht besonders schnell umgehen zu können.

Hab YUV444P10 an fft3dgpu gefüttert, und wollte nur im normal üblichen Farbraum als YUV420P10 ausgeben.

Also ein ConvertToYUV420() Aufruf nach dem fft3dgpu(...) Aufruf (ich filtere mit fft3dgpu(plane=4,...) chroma immer mit, bringt weitere Vorteile bei der Komprimierbarkeit). So macht es beispielsweise auch Hybrid.

Am Ende stehen immer die Benchmark-Werte, das vorangestellte x1 x2 x3 usw. sind die verwendeten avisynth threads bzw. die prefetch(x) Einstellung am Ende:

Code

REM ### First 3 lines will be skipped when generating AVS/VPY script from this file. 2nd line must have vspipe/ffmpeg/avs2yuv64 call. Do not remove GOTO :EOF in 3rd line!
"%hybridFolderWin%\64bit\Avisynth\avs2yuv64.exe" -depth 10 -nstdr "%cd%\%dynFileName%.avs" -o - | "%hybridFolderWin%\64bit\x264.exe" --crf 19.00 --profile high10 --level 5.2 --ref 2 --no-mixed-refs --keyint 250 --min-keyint 0 --scenecut 40 --bframes 3 --b-bias 0 --b-pyramid normal --direct spatial --b-adapt 1 --sync-lookahead 16 --cplxblur 20.0 --qcomp 0.60 --qblur 0.50 --mbtree --rc-lookahead 20 --ipratio 1.40 --pbratio 1.30 --chroma-qp-offset 0 --qpmin 0 --qpmax 69 --qpstep 4 --partitions i4x4,i8x8,p8x8,b8x8 --8x8dct --me hex --merange 16 --mvrange -1 --subme 4 --cabac --trellis 1 --weightp 1 --aq-mode 1 --aq-strength 1.00 --vbv-maxrate 240000 --vbv-bufsize 720000 --nr 0 --deadzone-inter 21 --deadzone-intra 11 --cqm flat --threads 16 --sar 1:1 --deblock 0:0 --psnr --ssim --non-deterministic --range tv --colormatrix bt709 --demuxer y4m  --input-range tv --fps 24/1 --output-csp i420 --output-depth 10 --output "%cd%\%dynFileName%.264" -
goto :EOF

ClearAutoloadDirs()
SetFilterMTMode("DEFAULT_MT_MODE",MT_MULTI_INSTANCE)
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LoadDll.dll")
LoadDLL("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\d3d9.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\LSMASHSource.dll")
# LoadCPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\ffms2.dll")
LoadPlugin("$$HYBRIDFOLDER$$\64bit\Avisynth\avisynthPlugins\FFT3dGPU.dll")
# loading source: $$SOURCEVID$$
# color sampling YV24@10, matrix: bt709, scantyp: progressive, luminance scale: limited
#####
# LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P16", prefer_hw=0,repeat=true)
LWLibavVideoSource("$$SOURCEVID$$",cache=false,format="YUV444P10", prefer_hw=0,repeat=true)
# FFVideoSource("$$SOURCEVID$$",colorspace="YV12")

#####
# current resolution:
# denoising using fft3dgpu
#####
FFT3DGPU(sigma=$$SIGMA$$,bw=$$BW$$,bh=$$BH$$,bt=$$BT$$,plane=$$PLANE$$,mode=$$MODE$$,bordersize=$$BORDERSIZE$$,precision=$$PRECISION$$)
PreFetch(1,$$DYNMEASUREVARGAP$$)
#####

#####
# scaling to 1920x804
# Spline16Resize(1920,804)
#####

# adjust color to YV12 (color matrix: Rec709)
ConvertToYUV420()

PreFetch($$DYNMEASUREVAR$$)
#####
# setting output fps to 24.000fps
AssumeFPS(24,1)
#####
#  output: color sampling YUY2@10, matrix: bt709, scantyp: progressive, luminance scale: limited
return last
--------------------------------------------------------------------------------

REPLACEMENTS:
$$SIGMA$$ replaced with '2.00'
$$BW$$ replaced with '64'
$$BH$$ replaced with '64'
$$BT$$ replaced with '3'
$$PLANE$$ replaced with '4'
$$MODE$$ replaced with '2'
$$PRECISION$$ replaced with '1'
$$BORDERSIZE$$ replaced with '1'
$$HYBRIDFOLDER$$ replaced with 'C:\Program Files\Hybrid'
$$HYBRIDFOLDER_VS$$ replaced with 'C:/Program Files/Hybrid'
$$SOURCEVID$$ replaced with 'C:\BENCH_AVS_VPS_FILTER\fft3dgpu convert2yuv420\4K\cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$SOURCEVID_VS$$ replaced with 'C:/BENCH_AVS_VPS_FILTER/fft3dgpu convert2yuv420/4K/cut_TBM_TLR-5_3840x1608_HEVC_444_10bit.mkv'
$$DYNMEASUREVAR$$ replaced dynamically [start,step,end] with '1,1,4'
$$DYNMEASUREVARGAP$$ replaced dynamically [start,step,end] with '1,1,4' +- gap of '+1'

--------------------------------------------------------------------------------

x0 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974328 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.954 V:58.165 Avg:55.766 Global:55.167 kb/s:10863.78
encoded 1418 frames, 5.52 fps, 10863.78 kb/s

x1 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974325 (25.905db)
x264 [info]: PSNR Mean Y:54.887 U:58.954 V:58.165 Avg:55.766 Global:55.166 kb/s:10865.54
encoded 1418 frames, 5.60 fps, 10865.54 kb/s

x2 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974327 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.954 V:58.166 Avg:55.767 Global:55.167 kb/s:10864.74
encoded 1418 frames, 5.50 fps, 10864.74 kb/s

x3 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974329 (25.906db)
x264 [info]: PSNR Mean Y:54.889 U:58.955 V:58.168 Avg:55.768 Global:55.168 kb/s:10868.22
encoded 1418 frames, 5.43 fps, 10868.22 kb/s

x4 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974326 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.957 V:58.168 Avg:55.767 Global:55.167 kb/s:10863.29
encoded 1418 frames, 5.56 fps, 10863.29 kb/s

x5 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974331 (25.906db)
x264 [info]: PSNR Mean Y:54.888 U:58.955 V:58.167 Avg:55.767 Global:55.167 kb/s:10866.97
encoded 1418 frames, 5.53 fps, 10866.97 kb/s

x6 FFT3DGPU(sigma=2.00,bw=64,bh=64,bt=3,plane=4,mode=2,bordersize=1,precision=1)-ConvertToYUV420 - lsmash - avs2yuv - 4K YUV444P10 in YUV420P10 out 0-7T +1F
x264 [info]: SSIM Mean Y:0.9974326 (25.905db)
x264 [info]: PSNR Mean Y:54.888 U:58.957 V:58.165 Avg:55.767 Global:55.167 kb/s:10865.28
encoded 1418 frames, 5.46 fps, 10865.28 kb/s

Alles anzeigen

mogobime

Zitat von FatFaster

Habe fft3d direkt lange nicht mehr benutzt, aber ich erinnere mich dass es gerne mal Banding erzeugt hat. Mein Favorit ist immer noch SMDegrain. Auch flott, stabilisiert / entfernt das Rauschen ohne alles Platt zu machen.

Kann sein, dass SMDegrain im Vergleich zu fft3dfilter vom Speed her mithält oder sogar etwas schneller ist.

Hab's gerade mal wieder kurz angetestet mit 4K 10bit yuv420 60fps video und 10 bit output in X264.

Ich gebe zu, ich hab mich nicht mit den ganzen Optionen auseinandergesetzt, hab's erst mit default angetestet, da war mir die erzeugte Bitrate wegen subPixel 2: (sharper Wiener (6 tap, similar to Lanczos) zu hoch. Dann habe ich subPixel 1: bicubic (4 tap Catmull-Rom) genommen, da mir das als Mittelding (nicht zu scharf, nicht zu stark weichzeichnend) dargestellt wird.

Da kam dann etwa die Bitrate raus, die ich mit FFT3DGPU(sigma=1.00,bw=64,bh=64,plane=4,mode=2,bordersize=1,precision=1) erreicht habe. bw+bh < 64 ist bei 4K buggy, mit 32 wäre es vermutlich sogar noch etwas schneller. Mode 2 finde ich empfehlenswerter und effizienter als mode 1 - erzeugt ebenfalls weniger Artefakte als der etwas schnellere mode 0.

Mit Sigma 1.0 (default ist 2.0) habe ich beim 3,5x Speed dieselbe Bitrate erreicht.

Mit so einem extrem niedrigen Sigma Wert ist mir selbst bei 8bit Output noch nie sowas wie Banding aufgefallen.

mogobime

Zitat von Selur

Nebenbei: Mal drüber nach gedacht KNLMeansCL anstatt FFT3D... zu nutzen

Hab ich schon das ein oder andere Mal ausprobiert. Kommt aber für mich bzw. den Verwendungszweck den ich hauptsächlich mit Rauschfiltern verfolge nicht an FFT3DGPU ran.

Ich versuche in erster Linie mit möglichst viel Leistung/Watt zu encoden und dabei 10-35% Bitrate einzusparen ohne dabei das Bildmaterial signifikant zu verhunzen / weichzuzeichnen.

Das gelingt imho mit temporal Denoising ziemlich gut, besonders wenn man es z.B. mit X264 10bit kombiniert, da dadurch das Risiko von Banding, welches dabei entstehen könnte, massiv sinkt.

3-4 Frames einzubeziehen bringt (jedenfalls bei fft3dgpu) einen guten Vorteil bei der Komprimierbarkeit, ohne bei Sigma-Werten so zwischen 1.2 und 1.8 je das Material signifikant entstellt zu haben.

Wenn man mehr Wert auf "Original Look" legt, sind 4 Frames imho empfehlenswerter, ich nehme meistens 3 frames wegen der besseren Komprimierbarkeit + Performance und senke Sigma, je nach Material, wie oben erwähnt meist etwas unter 2.0 ab.

Um (zumindest beim allermeisten Bildmaterial) ähnliche Bitrateneinsparungen bei vergleichbarer Qualität mit x264 veryslow o.ä. zu erreichen muss ich ein vielfaches an Rechenzeit inverstieren, mit x265 bestenfalls die 1,5fache Zeit.

-> Das ist alles nicht gerade effizient und passt irgendwie nicht mehr in die Zeit.

FFT3DGPU kostet mich in den meisten Szenarien 1-5% Rechenzeit und erhöht den Gesamtverbrauch meines Systems um maximal 10% bzw. etwa 30W.

Old but gold, man merkt halt, dass es mal für deutlich lahmere Karten entwickelt wurde, als heute üblich sind

KNLMeansCL bringt meine 75W Grafikkarte (irgendwann war die auch mal die damals modernste GPU Generation, aber davon halt eine der low power/ low budget Karten ) schon bei FHD/1080p ans Limit und bremst, wenn ich da distance von 0 auf 1 erhöhe und damit mehr als 1 Frame (genauer 3 frames), also temporal filtere.

Um damit Einsparungen in der Größenordung von 25-30% zu erreichen musste ich die strength auf etwa das vierfache des defaults von 1,2 erhöhen und dann sah das Material an detailreichen Stellen stellenweise schon gut gesmoothed um nicht zu sagen vermatscht aus (Haare usw.)

Kannst ja mal fft3dgpu Sigma 2.0 mit 3 frames mit KNLMeansCL 4.8 mit 3 frames vergleichen.

Da gefällt mir das Ergebnis von fft3dgpu besser.

Für Einsparungen bis 10% ohne großartige Qualitätseinbußen scheint mir auch FluxSmooth eine guter und flotter temporal denoiser zu sein. Bremst auch nur so um die 5%, und das ganz ohne GPU Einsatz.

Sorry, ist was länger geworden, da lag mir wohl was auf der Seele

mogobime

Vielleicht ist es ja wirklich nur so, dass Rundungsfehler die wegen 16 bit floats auftreten zu diesen seltsamen Bildfehlern führen, dann besteht vielleicht Hoffnung, dass er es fixed. Jedenfalls hoffe ich das irgendwie.

Wenn du in dem Video, dass bei dir black frames mit Gittermuster ausgegeben hat, weiter nach vorne spulst, wirst du möglicherweise feststellen, dass nach wenigen Bildern das Bild nicht mehr komplett schwarz mit diesen Mustern ist, sondern dass sich die Muster dann durchs normale Video ziehen.

Jedenfalls war das bei mir so, dass das nur in den ersten paar dunklen frames so war.

mogobime

Zitat von Selur

hab mal wegen precision=0 in einen Issue angelegt: https://github.com/pinterf/FFT3dGPU/issues/9
Hab die Woche kaum Zeit, am besten meldeste Dich bei github an und machst selber ein oder mehrer issues auf.
Cu Selur

Ich hab mal in dem von dir eröffneten issue ein paar Infos + Screenshots meinerseits hinzugefügt, vielleicht hilft's pinterf ja weiter...

Beiträge von mogobime

uvg266 VVC encoder,...

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

Hybrid: Input -> x264/x265/Xvid/VP8/VP9/AV1

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)

4K UHD Denoising mit FFT3DGPU,FFT3DFilter,neo_fft3d (Performance,Bugs,VapourSynth-Umsetzung,...)