POPPUR爱换

标题: 原来现在cuda软解已经这么强悍了 [打印本页]

作者: dollet    时间: 2009-11-4 12:08
标题: 原来现在cuda软解已经这么强悍了
解tf2 imax版的remux,40g,用coreavc,不开cuda,在imax的草地打斗场景,cup占用最高40%.开cuda,cpu占用最高10%, 画质无任何区别,用的是kmp的高质量模式!!! cpu是q9550 oc 3.6 ,显卡是华硕gtx260 冰刃版
作者: evilviper    时间: 2009-11-4 12:15
顶一个
CUDA解压确实很赞了
HTPC义无反顾的用了MCP7A
作者: Edison    时间: 2009-11-4 12:17
CoreAVC CUDA 是调用 GPU 的硬件解码电路进行解码,不属于软件解码,和 DXVA 相比, CUDA Decoder 的好处是 renderer 的适用性广得多。
作者: goodayoo    时间: 2009-11-4 13:07
CPU占用40%的耗电可能比用显卡进行CUDA解码的耗电要少,现在的U是45nm的,而显卡是55nm的多。
作者: boris_lee    时间: 2009-11-4 13:22
CPU占用40%的耗电可能比用显卡进行CUDA解码的耗电要少,现在的U是45nm的,而显卡是55nm的多。
goodayoo 发表于 2009-11-4 13:07

CPU对DSP,别指望功耗/性能比优势了
就是80nm的都可以秒CPU

CoreAVC CUDA 是调用 GPU 的硬件解码电路进行解码,不属于软件解码,和 DXVA 相比, CUDA Decoder 的好处是 renderer 的适用性广得多。

作者: pharaohs1024    时间: 2009-11-4 13:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: xreal    时间: 2009-11-4 13:31
dxva能解h264 4.1而已,cuda能解更高级别的
作者: Edison    时间: 2009-11-4 13:32
GTX 280 在 DXVA 下播放蓝光的耗电是 32 瓦特(闲置 25 瓦特),CoreAVC CUDA Decoder 估计比这个高不了哪里去。
作者: elisha    时间: 2009-11-4 13:32
CoreAVC CUDA 是调用 GPU 的硬件解码电路进行解码,不属于软件解码,和 DXVA 相比, CUDA Decoder 的好处是 renderer 的适用性广得多。
Edison 发表于 2009-11-4 12:17

这巴掌打得好
作者: palomino    时间: 2009-11-4 14:17
CPU占用40%的耗电可能比用显卡进行CUDA解码的耗电要少,现在的U是45nm的,而显卡是55nm的多。
goodayoo 发表于 2009-11-4 13:07


这个我用测功率插座粗略的测量过一次。我显卡是295,cpu是i7 920oc3.3。
解720p的bdrip电影时,硬解的功率略高过软解一点点(数是波动的,只能靠感觉,似乎高个1-2w);解1080p的bdrip时,硬解就比软解低几瓦了;解remux时低的更多(此时软解的cpu占用率大约17%左右不超过20%)。

另外一台家里htpc上的mcp7a硬解电影时功率比没看片时大约上升5-6w,相当省电了。
作者: shine    时间: 2009-11-4 14:44
cpu软解还要算上一个散热的功率消耗吧,cpu散热器耗电似乎比显卡的散热器大一些。
作者: ysyak47    时间: 2009-11-4 15:39
哎,对我来说没意义的东西。小屏幕,只看720P。在寝室,电费便宜。
作者: hiwind    时间: 2009-11-4 15:57
.......这里用笔记本的GTX260M
功耗不敢说
但是用cuda 显卡就满频运行 于是风扇也全速呼呼额吹
感觉极度不节能
作者: gz_easy    时间: 2009-11-4 16:05
如果CPU足够power宁愿用软解,坚信软解对编码还原度更佳。
作者: scowl    时间: 2009-11-4 20:30
火星人

780G很久前就办到的事

有什么好惊奇的?
作者: zajara    时间: 2009-11-4 20:37
如果一块CPU只做高清解码,不做别的,这个算软解还是算硬解?
作者: llgg025    时间: 2009-11-4 21:17
CUDA 是该叫硬解还是软解
作者: xiao069532    时间: 2009-11-4 21:38
没N卡,无法体验
作者: Theseus    时间: 2009-11-4 22:20
软解1080P时,CPU功耗也才15W
作者: AlanLW    时间: 2009-11-4 23:31
Q9550四核不用,却去用GPU
作者: piphy    时间: 2009-11-5 09:07
楼主又被高清党bs了,真是娱乐哦
作者: bill_max    时间: 2009-11-5 09:09
同上所述
作者: 66666    时间: 2009-11-5 09:09
火星人

780G很久前就办到的事

有什么好惊奇的?
scowl 发表于 2009-11-4 20:30


你拿个A卡给我硬解个ref=15的视频看看。。。
作者: knightmaster    时间: 2009-11-5 14:32
CoreAVC CUDA 是调用 GPU 的硬件解码电路进行解码,不属于软件解码,和 DXVA 相比, CUDA Decoder 的好处是 renderer 的适用性广得多。
Edison 发表于 2009-11-4 12:17


那么请问为何CoreAVC CUDA对显卡的SP数量与频率有要求呢
作者: jiangfannew    时间: 2009-11-5 15:01
管理员很牛呀
作者: sky1976    时间: 2009-11-5 15:15
cpu足以,硬解都没有什么实际意义
我们的需求是看高清电影,不看“硬件测试用视频”。
rx78meng 发表于 2009-11-4 16:14


+1
再硬也没有cpu硬
作者: Edison    时间: 2009-11-5 15:25
许多 16 sp 的显卡只有 256MB 内存容量,仅仅能满足 CUDA decoding 的最低要求,如果在 CoreAVC CUDA enabled 的情况下选择 overlay mixer renderer 的话,甚至会出现由于内存容量不足出现 frame flip 断档的问题。

视频播放本身不仅仅是解码,还有一些前处理和后处理,例如色彩空间转换、resize 等处理,这些部分在 CoreVC 中是有可能由 SP 完成。

http://cbaoth.dk/~cbaoth/nvcuvid.pdf

CUDA Video Decoder  
The CUDA Video Decoder API gives developers access to the VP2 video processor on NVIDIA GPUs. This API supports the following video stream formats:  MPEG(1/2) and H.264.  This API enables developers to decode video streams on the GPU and process the decoded uncompressed surfaces within CUDA programs.  The decoded surfaces can be transferred back to system memory using CUDA’s fast asynchronous read-backs, or the application can use CUDA’s 3D interoperability features to render the surfaces using a 3D API (OpenGL or DirectX).

Processing and Displaying Frames

The application’s main loop retrieves images from the FrameQueue  (copyDecodedFrameToTexture() in videoDecode.cpp) and renders the  texture to the screen. The DirectX device is set up to block on monitor vsync, throttling rendering to 60Hz for the typical flat-screen display. To handle frame rate conversion of 3:2 pulldown content, we also render the frame multiple-times, according to the repeat information passed from the parser.

copyDecodedFrameToTexture() is the method where the CUDA decoder API is used to map a decoded frame (based on its Picture-Index) into CUDA device memory.  Post processing on a frame is done by mapping the frame through cudaPostProcessFrame().  This returns a pointer to a NV12 decoded frame.  This then gets passed to a CUDA kernel to convert NV12 surface to a RGBA surface.  The final RGBA surface is then copied directly into a DirectX texture and then drawn to the screen.
作者: knightmaster    时间: 2009-11-5 19:43
知道了 谢谢CHO
作者: 显卡杀手    时间: 2009-11-6 09:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: zhlmnet1    时间: 2009-11-6 10:53
那些叫嚣cpu软解的,其实用GPU也是软解,画质只跟解码算法有关系,跟硬件没关系,不要再无知了
作者: everyoung    时间: 2009-11-6 15:19
linux下还要强,vapau,vc-1,h.264通吃,win上只有h.264解码
作者: yuanico    时间: 2009-11-6 18:26
最有用的cuda应用 不管原理是dxva还是真调用了sp 都是目前最好的h.264播放方案
作者: wangyics    时间: 2009-11-6 20:31
老的CUDA无法全硬解VC-1,新的210、220才可以。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4