POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5009|回复: 37
打印 上一主题 下一主题

GPU通用运算在桌面是不是已经遇到一个瓶颈了?

[复制链接]
跳转到指定楼层
1#
发表于 2010-8-21 10:41 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 slice 于 2010-8-21 14:29 编辑

就拿GPU比较适合的视频压缩来说吧,这么这么久了还是这个老样子。

B帧,2Pass等,是程序员不敬业么?为啥子从第一版出来到现在一点进步都没有,是不是GPU本身不适合逻辑太复杂的运算?本来GPU和CPU就是同时使用的,如果一定要在GPU上实现这些功能或者说GPU参与更多运算,会不会比CPU的速度还糟糕或者说加速作用已不明显?

一开始这样子可以理解,一年多了还是这样子我就考虑是不是目前GPU本身无法做好这些事情了。
这里神仙比较多,望大们解惑。
2#
发表于 2010-8-21 10:47 | 只看该作者
并行计算,总有串行部分,GPU 串行计算的性能还是太低了;
在视频压缩中,是有少量分支的,这样的分支,对于GPU 的效率是毁灭性的。
短期内,这样的局面,很难改变,需要CPU GPU 合作,而目前二者之间的互联带宽还很不理想。
从异构众核的角度,几个个大核和若干并行小核的性能,会更好一点,当然,核间的互联网络,现在还是很困难的。
回复 支持 反对

使用道具 举报

3#
发表于 2010-8-21 11:06 | 只看该作者
开启GPU压制视频 视频质量有时候真的不是那么尽人意

虽然速度有点提升 但是我感觉质量却差了点

这并不是我想要的效果 作为N卡的用户
回复 支持 反对

使用道具 举报

4#
发表于 2010-8-21 11:17 | 只看该作者
GPU压片子不好使,顶多也就空间转换、频域变换、宏块预测能秒一下CPU,遇到熵编码部分照样杯具。要想GPU视频编码有大发展除非以后直接在GPU里塞进CPU核吧。

不过GPU做图像和视频处理无敌,之前用过Musemage,比PS猛N倍,估计会是以后的趋势。
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2010-8-21 21:56 | 只看该作者
并行计算,总有串行部分,GPU 串行计算的性能还是太低了;
在视频压缩中,是有少量分支的,这样的分支,对 ...
tomsmith123 发表于 2010-8-21 10:47


谢谢~~~
回复 支持 反对

使用道具 举报

6#
发表于 2010-8-22 02:13 | 只看该作者
长见识了啊
回复 支持 反对

使用道具 举报

7#
发表于 2010-8-22 08:52 | 只看该作者
视频压缩方面不仅GPU,对于多线程CPU也是个难点,到目前为止X264最高质量下编码模式仍然推荐单线程模式,线程开的越多画质越烂,到8线程乃至16线程下X264的画质可以跟CUDA一比高下了。

所以现在国内的rip组一般压缩最多也就开2线程
回复 支持 反对

使用道具 举报

8#
发表于 2010-8-22 09:22 | 只看该作者
回复 11# 66666
X264 多线程支持是有些小问题的,不过质量下降是非常细微的,比如单线程PSNR 是38.438 到8线程也仅仅下降到38.397,要到CUDA 的水平,估计的128线程以上。
回复 支持 反对

使用道具 举报

9#
发表于 2010-8-22 09:45 | 只看该作者
回复 13# tomsmith123

另外X264 的多线程收益,是随着线程数增加,越来越低,8线程以上,也没什么意义了。
比较理想是8物理核心的8线程编码。
回复 支持 反对

使用道具 举报

10#
发表于 2010-8-22 10:25 | 只看该作者
回复  66666


少危言耸听, x264开16线程以内都不会有明显质量下降, 这是Dark Shikari说的, 你不信可以 ...
brl 发表于 2010-8-22 10:18




不好意思,我管你是谁,现在国内字幕组几乎没有人用超过4线程压1080P H264,双线程的最多。

国外很多人还在用XVID,X264对多线程的支持如何用得着我自己编造?好笑
回复 支持 反对

使用道具 举报

11#
发表于 2010-8-22 17:30 | 只看该作者
难得的技术贴,支持
回复 支持 反对

使用道具 举报

12#
发表于 2010-8-22 17:41 | 只看该作者
少出来恶心人, 用什么参数大家又不是看不到, mediainfo一看就知道了
没见过一个有"--threads 2"参数 ...
brl 发表于 2010-8-22 11:00


支持踢爆
Cuda的愚忠支持者要反省了
回复 支持 反对

使用道具 举报

13#
发表于 2010-8-22 17:42 | 只看该作者
只有Larrabee能拯救压片,AN都不行
回复 支持 反对

使用道具 举报

14#
发表于 2010-8-22 20:30 | 只看该作者
貌似有人妖言耸听被爆了
回复 支持 反对

使用道具 举报

15#
 楼主| 发表于 2010-8-22 21:58 | 只看该作者
本帖最后由 slice 于 2010-8-22 22:12 编辑

我不认为CPU处理线程多了会影响画质,因为CPU的每一个线程都和一个线程没有啥子区别,都能应付复杂的运算,每一个线程都不需要也不必要在算法上妥协,因为分配任务到多个线程应该不算难,因为每一个线程都能高效的完成复杂的运算。

就我外行来说,就算我能想到的最肤浅的任务分配方式,例如每隔多少关键帧或者多少时间,例如40分钟的视频每10分钟一段分成4段然后4个线程同时压,画质无需任何妥协,却可以轻松得到接近4倍的速度(当然你得是4核+),当然我这种任务分配方式现实中肯定是不可能的,我只是想说,分配任务到多线程的时候,在画质上不妥协是很容易做到的,因为每一个线程都和你单线程的时候一样的灵活无需算法上妥协,而且多一个线程就几乎多一倍的提升。

实际上的表现也是,单线程和8线程基本上没有区别,这里黑CPU的可以洗洗睡了。

我不了解他们任务分配的方式,这里有大愿意说说的话我洗耳恭听。
回复 支持 反对

使用道具 举报

16#
发表于 2010-8-22 23:49 | 只看该作者
现在的GPU只能在大规模的运算中提升很明显,相比民用级别更适合做科研。。。
回复 支持 反对

使用道具 举报

17#
发表于 2010-8-23 11:08 | 只看该作者
本帖最后由 左脚选手 于 2010-8-23 11:51 编辑
只有Larrabee能拯救压片,AN都不行
itany 发表于 2010-8-22 17:42

Larrabee还没出来,没出的东西没资格和已出来的比较,有的东西就算再差,也比没有好。
回复 支持 反对

使用道具 举报

18#
发表于 2010-8-23 11:35 | 只看该作者
楼主,Fusion可以解决一切问题。。。
回复 支持 反对

使用道具 举报

19#
发表于 2010-8-23 11:46 | 只看该作者
这个关键是压片也只是个小众的应用,操作系统和OFFICE之类软件中大量应用GPGPU才是GPGPU的真正春天的到 来,不过。。。。。。。。。。。。。。。。。。。。。
回复 支持 反对

使用道具 举报

20#
发表于 2010-8-23 20:41 | 只看该作者
Larrabee还没出来,没出的东西没资格和已出来的比较,有的东西就算再差,也比没有好。
左脚选手 发表于 2010-8-23 11:08


Knights Ferry已经出货了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-12-23 03:36

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表