POPPUR爱换

标题: intel 惨了(2)GT200+CUDA:超乎想象的视频转码速度 [打印本页]

作者: 飞鸟真    时间: 2008-5-27 12:14
标题: intel 惨了(2)GT200+CUDA:超乎想象的视频转码速度
NVIDIA的Editior's Day虽然过去好多天了,但消息依然不断,这次是关于GT200核心显卡与CUDA编程语言搭配下的高速视频转码的。
现场演示运行了两个DEMO,首先是将一段720p高清视频转换成iPod格式,转码工具是iTunes和一个价值20美元的MPEG-2编码器。首先在一颗3.0GHz的四核心处理器上,这一转换过程非常缓慢,需要几个小时之久;接下来换成GT200(应该是GeForce GTX280),仅仅几秒钟就完成了。事实上,GT200的转码速度能达到视频播放速度的5倍,也就是说视频帧率为30FPS,转码速度则达到了150FPS。打个比方,在欣赏这一视频片段的过程中GT200能重复完成五次编码转换。
不仅如此,GT200还可以同时处理多个视频的转码。如果你同时有iPod和Zune,那就可以在同一时间将视频转换成它们需要的格式。
第二个DEMO使用了一段1080i高清视频,编码格式H.264、帧率30FPS、码率25Mbps。在Adobe PremirePro里,使用Core 2 Duo E64002.13GHz双核心处理器进行处理速度只有2-6FPS,平均相当于实际速度的六分之一;换成GT200,处理速度达到了46FPS,仍然比播放速度快,也就是视频还没看完,转码就已搞定。


驱动之家的原文带视频连接
http://news.mydrivers.com/1/107/107237.htm


曾几何时,我们压一段劣质vcd都慢的让人暴走,世界发展的太快了
nv老这样玩,还有几个个人消费者对高端扣肉流口水呢?










++++++++++++++++++
SuperPi是全球玩家最常用的处理器性能测试工具,虽然它非常简单,虽然它只支持单线程,但计算100万位圆周率所用时间的长短仍然是我们目前衡量处理器性能的最直观指标。
日前,开发常用SuperPiMod包的XtremeSystems论坛掌门,也是知名超频玩家FUGGER宣布,他们正在开发GPU版本的SuperPi。具体一点,他们正在使用NVIDIA的CUDA显卡通用计算平台进行SuperPi的移植工作。预计在30天内,我们就能够看到测试版的CUDA-SuperPi发布。
毫无疑问,这将给整个PC性能测试领域带来一场风暴,相信GPU版SuperPi将轻松突破目前的SuperPi世界纪录(100万位的当前纪录为7.437秒)。我们终于有了一个直观的方式,可以对比CPU和GPU究竟谁的性能更强。或者现实一点说,GPU的数百个统一流处理单元究竟能够让GPU的运算性能超过当前最顶级CPU多少倍。
当然,即将到来的CUDA版SuperPi仅支持GeForce 8以上的NVIDIA显卡。但FUGGER表示,如果他们能够拿到AMD/ATI的显卡通用计算开发工具,也不会排斥开发ATI显卡版本的SuperPi。





扣肉集成的优秀算pi电路又被边缘化了,肯定没nv集成的快,对比成绩会很难看。:loveliness:
将来玩游戏看显卡,ps看显卡,算个pi也看显卡,听说CUDA编程比cell还难很多,将来如果能改善不就生生把无敌的intel废了。

[ 本帖最后由 飞鸟真 于 2008-5-28 12:52 编辑 ]
作者: kamov    时间: 2008-5-27 12:18
都来祭拜祖冲之吧...

下次RMAA里也集成个算PI工具好了.....
作者: tansailuffy    时间: 2008-5-27 12:35
看到的是一副小人请注意称呼用词。,GPU算个Pi也成新闻了,还把Intel边缘化?
某天能看到完美运行MS Windows的GPU再来发新闻吧。都没弄清楚CPU、GPU是什么领域的东西。你开家公交公司,清一色配备兰博基尼、法拉利来替换bus?
作者: itany    时间: 2008-5-27 12:46
PI是单线程的,有种GPU也用一个SP来跑PI啊
作者: 三毛妮    时间: 2008-5-27 12:49
不知道GPU能不能跑OR?
作者: asuscheng    时间: 2008-5-27 12:49
不看过程,只看结果和有效功耗才是有意义的
作者: agrantleung    时间: 2008-5-27 13:01
什么时候鼠标键盘都来个pi
作者: 飞鸟真    时间: 2008-5-27 13:08
原帖由 tansailuffy 于 2008-5-27 12:35 发表
看到的是一副小人请注意称呼用词。,GPU算个Pi也成新闻了,还把Intel边缘化?
某天能看到完美运行MS Windows的GPU再来发新闻吧。都没弄清楚CPU、GPU是什么领域的东西。你开家公交公司,清一色配备兰博基尼、法拉利来 ...


对业界冲击太大,if们已经恼羞成怒了。

gpu的运算能力超过cpu无数,只是老gpu的精度还有编程问题,如果解决了在运算密集型工作中,cpu起个管理输导作用就行了。

不承认pi这种intel御用程序gpu化带来的冲击是死鸭子嘴硬,gpu跑windows有p用,在ps ,3d软件 ,密集型科学计算大显身手才是用武之地。

pi没用但是个象征,nv轻易撤掉intel的军旗,if的反应我能充分理解。:loveliness:
作者: pentium    时间: 2008-5-27 13:09
如果你比较不同的配置,你会惊喜的发现:
1.至少8500GT级别的显卡都可以支持CUDA加速 和GPU编码视频,效率对于CPU来说高得多。
根据NVIDIA的惯例,就算不支持的爱好者也能强行让他支持。想想你压箱底的老显卡,说不定拿出来压片比Q6600还快。
2.8800GT级别的显卡转视频和CUDA执行效率比8500GT高得多,PS里面大概快5倍、转视频快10倍
看来以后做设计的也要败显卡了。
3.8800GT比Q6600转视频快6倍。
2小时的电影,8800GT再oc一下的话,能让你在15min内转完


from
http://we.pcinlife.com/thread-939120-1-1.html
作者: Rock·Will    时间: 2008-5-27 13:28
不好意思。。
我是专程进来看笑话的……
作者: Edison    时间: 2008-5-27 13:36
处理器区比较后知后觉了?:p

http://we.pcinlife.com/viewthread.php?tid=939133&highlight=
作者: Nowotny    时间: 2008-5-27 13:36
NV必定死的很难看。
作者: Prescott    时间: 2008-5-27 13:38
能比fast pi快再来喷
作者: Edison    时间: 2008-5-27 13:50
你说的是PiFast吧。
作者: pentium    时间: 2008-5-27 13:54
貌似这里还有人不知道RapidHD Encoder for G80 or later
这种东西
作者: acqwer    时间: 2008-5-27 14:01
原帖由 飞鸟真 于 2008-5-27 13:08 发表


对业界冲击太大,if们已经恼羞成怒了。

gpu的运算能力超过cpu无数,只是老gpu的精度还有编程问题,如果解决了在运算密集型工作中,cpu起个管理输导作用就行了。

不承认pi这种intel御用程序gpu化带来的冲击 ...

只有被洗脑的请注意文明用词。才会认为intel会为一个十几年前的大部分用于稳定性测试的软件来搞什么专门优化。真要优化,连源代码都可以帮你改的mark系列是更好的选择。
作者: 飞鸟真    时间: 2008-5-27 14:03
原帖由 acqwer 于 2008-5-27 14:01 发表

只有被洗脑的请注意文明用词。才会认为intel会为一个十几年前的大部分用于稳定性测试的软件来搞什么专门优化。真要优化,连源代码都可以帮你改的mark系列是更好的选择。


诽谤,我夸intel算pi用的电路优秀,没说intel优化pi,是否优化了不在我的兴趣里,血口喷人+人参攻击。:mad:
作者: acqwer    时间: 2008-5-27 14:06
原帖由 飞鸟真 于 2008-5-27 14:03 发表


诽谤,我夸intel算pi用的电路优秀,没说intel优化pi,是否优化了不在我的兴趣里,血口喷人+人参攻击。:mad:
扣肉集成的优秀算pi电路又被边缘化了

这句话不是你说的?当然你可以说“集成的优秀算pi电路”不等于“对PI优化”。
作者: kingofmx200    时间: 2008-5-27 14:13
N F的水准快降到 A F的水平了:funk:
作者: 飞鸟真    时间: 2008-5-27 14:14
原帖由 acqwer 于 2008-5-27 14:06 发表


这句话不是你说的?当然你可以说“集成的优秀算pi电路”不等于“对PI优化”。


变成偏执狂的intel才是最可怕的,重新设计的最优电路不是整天搞修修补补的优化的amd可比,我都快成if了:funk:

逞这种无聊的口舌之利不如预测一下立此存照,我觉得8800gt级的gpu算1M 保底是1.5秒,很可能超过大家能做的最乐观的预测。:loveliness:
作者: itany    时间: 2008-5-27 14:22
原帖由 飞鸟真 于 2008-5-27 14:14 发表


变成偏执狂的intel才是最可怕的,重新设计的最优电路不是整天搞修修补补的优化的amd可比,我都快成if了:funk:

逞这种无聊的口舌之利不如预测一下立此存照,我觉得8800gt级的gpu算1M 保底是1.5秒,很可能超过大 ...


拿GPU的PI和没有SSE优化,没有多线程优化等等的原始 CPU PI相比,有意思么?
为了公平,GPU只准使用一个SP
作者: acqwer    时间: 2008-5-27 14:23
原帖由 kingofmx200 于 2008-5-27 14:13 发表
N F的水准快降到 A F的水平了:funk:

其实各种fan的平均水准都差不多,不过在一方落后时,水平较高的要么就倒戈要么就潜水,所以显得落后者的fan水平较低。
作者: acqwer    时间: 2008-5-27 14:24
原帖由 itany 于 2008-5-27 14:22 发表


拿GPU的PI和没有SSE优化,没有多线程优化等等的原始 CPU PI相比,有意思么?
为了公平,GPU只准使用一个SP

一个SP?你太不厚道了,能不能跑过同频P4都是问题。
作者: lzy24    时间: 2008-5-27 14:25
对我个人来说,除了3D Game,如果GPU能使压片变快才比较有用,算pi只是娱乐而已
作者: itany    时间: 2008-5-27 14:27
原帖由 acqwer 于 2008-5-27 14:24 发表

一个SP?你太不厚道了,能不能跑过同频P4都是问题。


凭什么GPU多线程,CPU单线程
要单线程大家一起单线程
作者: acqwer    时间: 2008-5-27 14:29
原帖由 飞鸟真 于 2008-5-27 14:14 发表


变成偏执狂的intel才是最可怕的,重新设计的最优电路不是整天搞修修补补的优化的amd可比,我都快成if了:funk:

逞这种无聊的口舌之利不如预测一下立此存照,我觉得8800gt级的gpu算1M 保底是1.5秒,很可能超过大 ...

我很怀疑SuperPI是否纯粹能用GPU运算,不要搞得要想用8800GT算PI,CPU最少用XG的Core。
作者: teddytao    时间: 2008-5-27 14:34
cpu gpu 并存
作者: 飞鸟真    时间: 2008-5-27 14:41
原帖由 lzy24 于 2008-5-27 14:25 发表
对我个人来说,除了3D Game,如果GPU能使压片变快才比较有用,算pi只是娱乐而已


看9楼
作者: lzy24    时间: 2008-5-27 14:56
原帖由 飞鸟真 于 2008-5-27 14:41 发表


看9楼

看过了呀,然后去http://www.elementaltechnologies.com/ 逛了一下,发现RapiHD Transcoder及类似产品很多,但此类软件显然是价格不菲

[ 本帖最后由 lzy24 于 2008-5-27 15:16 编辑 ]
作者: tedsun    时间: 2008-5-27 15:47
原帖由 itany 于 2008-5-27 14:22 发表


拿GPU的PI和没有SSE优化,没有多线程优化等等的原始 CPU PI相比,有意思么?
为了公平,GPU只准使用一个SP


人家的GPU又不是胶水SP,为啥只许使用一个SP
作者: katerren    时间: 2008-5-27 15:47
CUDA有前途!
作者: 简单系美    时间: 2008-5-27 15:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: tansailuffy    时间: 2008-5-27 16:08
我也发现这是个笑话贴,后悔认认真真的回贴了,应该某种水产的。
Intel为Pi做了优化电路,如果说K8诞生的早没赶上的话,K10应该赶上了啊。为啥K10跑Pi还是那么慢呢,很不解啊。
作者: ddd999a    时间: 2008-5-27 16:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: tansailuffy    时间: 2008-5-27 16:23
原帖由 ddd999a 于 2008-5-27 16:22 发表
nv那么牛b,为何还要做人家cpu的平台?
nv那么吆喝cpu无用论,那又为何自己偷偷摸摸的买了个制造低能单核cpu的生产线?
nv既然说自己的gpu那么万能,那为何不自己开发个不用cpu的平台,再配个windows?

只能说n ...


终于有XD能看懂我的话了,老天开眼了,知己啊。
作者: 飞鸟真    时间: 2008-5-27 16:31
一些if嘴里光说没用的东西,开始抵制社会进步了。[shocked>

我们要的是比现在快几十倍上百倍的ps速度用,要不消耗时间的pi YY,要加速很多以前很慢的程序,看最后笑不出来的是谁。[closedeyes>
作者: asdc22    时间: 2008-5-27 16:32
[tongue> 什么gpu 跑pi? 南北桥芯片也能跑了?电脑里的芯片都能跑了?[devil> [shifty>
作者: 飞鸟真    时间: 2008-5-27 16:37
原帖由 asdc22 于 2008-5-27 16:32 发表
[tongue> 什么gpu 跑pi? 南北桥芯片也能跑了?电脑里的芯片都能跑了?[devil> [shifty>


你要的是速度还是什么,理智点八,假如nv能做出本身不算的GPU,靠抽扣肉几鞭子让扣肉加速100倍,出来的速度不管用?
完全不理解极端if的想法,你说科比厉害他说美国农民更强,没有农民科比还不饿死。他说科比是废物,有本事自己种地养牛治布采矿、,他说科比有本事从石头里蹦出来,别让人生,[sweatingbullets>

[ 本帖最后由 飞鸟真 于 2008-5-27 16:40 编辑 ]
作者: xx88xx88    时间: 2008-5-27 16:44
大笑几声
单线程的pi
作者: elisha    时间: 2008-5-27 16:56
等CUDA能跑个Spec CPU再说吧
作者: acqwer    时间: 2008-5-27 17:17
原帖由 lzy651 于 2008-5-27 17:04 发表
结果发现最强的GPU比P3跑的还慢....

如果只是把现在的SuperPI直接改成CUDA版的话,这个结果几乎是肯定的。如果加入多线程优化——这玩意还是SuperPI吗?
作者: tansailuffy    时间: 2008-5-27 17:23
集成一个跑Pi的功能,至于这么兴奋吗?不明白LZ的意图。
在GPU领域,NV对Intel的领先是不用说的。如果到CPU领域,NV的产品还是个未知数,难道给个Pi就说明它超越Intel了?那某国产手机如果通过编程的手段,也能把Pi跑进20sec,是否表示达到了Intel的水平了呢?
本身两个领域的事情,硬要扯在一起。好比胡荣华和聂卫平比赛,胡荣华说可以饶聂2个车,聂卫平说可以饶老胡八个子,是否比试两场,就能比出水平来了?
如果NV真这么想和Intel叫板,那就应该推出类似AMD Spider系统,从处理器、芯片组、显卡一整套平台的产品。

[ 本帖最后由 tansailuffy 于 2008-5-27 17:25 编辑 ]
作者: scowl    时间: 2008-5-27 17:59
原帖由 简单系美 于 2008-5-27 15:58 发表
毛爷爷说的好,不要搞盲目的个人崇拜。
什么IF AF,搞得跟超女快男一样的,幼稚。



貌似他自己就是搞个人崇拜的祖宗。。。。。。。。。。。。。。

遗毒影响之深远。。。。。。

史无前例
作者: the_god_of_pig    时间: 2008-5-27 18:32
就喜欢看掐架,哈哈

就PI来说GPU肯定不怎么样,当然了,可以和CPU比同时开100个看谁快啊,呵呵

BTW:我还是希望NV快点把伟大而强悍的GPU物理加速搞出个实用的给我们看看
作者: itany    时间: 2008-5-27 19:21
原帖由 飞鸟真 于 2008-5-27 16:31 发表
一些if嘴里光说没用的东西,开始抵制社会进步了。" src="./images/smilies/PCinlife2009/shocked.gif" border=0 smilieid="131">

我们要的是比现在快几十倍上百倍的ps速度用,要不消耗时间的pi YY,要加速很多以前很慢的程序,看最后笑不出来的是谁。" src="./images/smilies/PCinlife2009/closedeyes.gif" border=0 smilieid="132">


还是等PhotoS 4发布了之后再说吧
某PlayS 3 还说要模拟地球呢……

老黄说得好,任何产品在PPT上都是美好的,您老还是加强学习,深入领会NV的精神吧
作者: rtyou    时间: 2008-5-27 19:34
突然N饭跑CPU板块了,自己不羞愧?^_^
作者: 花泥    时间: 2008-5-27 20:15
CUDA大战那蜡笔
作者: smaller    时间: 2008-5-27 20:35
:loveliness: :loveliness:
作者: 轨迹    时间: 2008-5-27 20:36
算来算去也只有lz这一个"nfan"来踢馆吧,其余的基本没见到:p
作者: Allanstar    时间: 2008-5-27 21:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: bd7x    时间: 2008-5-27 21:27
筒直是胡说八道
作者: bwdinlife    时间: 2008-5-27 21:33
楼主曾经是Af来的

留名待挖坟
作者: 飞鸟真    时间: 2008-5-28 12:53
原帖由 bwdinlife 于 2008-5-27 21:33 发表
楼主曾经是Af来的

留名待挖坟


胡说,我一直是intel忠实用户,客观的评估需要的配件,不当谁的fan[innocent>
作者: elisha    时间: 2008-5-28 13:12
原帖由 飞鸟真 于 2008-5-28 12:53 发表


胡说,我一直是intel忠实用户,客观的评估需要的配件,不当谁的fan[innocent>

是啊,现在已经没有A饭了,只有客观饭,还有(自称)以前的I饭
作者: itany    时间: 2008-5-28 13:17
现在貌似已经很少有人承认自己是A-Fan了,就像一般人不会在没有触犯刑律的时候承认自己存在神经上的某些缺陷一样
作者: GZboy    时间: 2008-5-28 13:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: fineday    时间: 2008-5-28 13:26
你们这些Ifan啊,看到GT200能做这种事情都傻眼了?
NV什么时候说GPU取代CPU了?只是说GPU会变成加速电脑的第一动力,又不是要你用GPU来跑Windows。在NV想来,未来的电脑只需要一颗过得去的CPU,而其他的重负荷运算都由GPU完成,仅此而已。

所以那些“有本事让GPU来跑Windows罢”这样的论调可以歇歇了,别人从一开始就没打算让GPU来跑Windows。
作者: cadence    时间: 2008-5-28 13:34
虽然回这贴很无聊,但还是说几句吧
中国人看问题实在是太形而上学了,要么吹上天,要么打下18层地狱,无聊的很,民族劣根性不改
作者: lislee2001    时间: 2008-5-28 13:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2008-5-28 13:48
原帖由 fineday 于 2008-5-28 13:26 发表
你们这些Ifan啊,看到GT200能做这种事情都傻眼了?
NV什么时候说GPU取代CPU了?只是说GPU会变成加速电脑的第一动力,又不是要你用GPU来跑Windows。在NV想来,未来的电脑只需要一颗过得去的CPU,而其他的重负荷运算都 ...


ATI早就出过视频编码器,有什么好吃惊的,本来视频编码也应该是GPU的强项
但是GPU作为一个协处理器,搞通用计算,早晚也是x87 的命运
作者: 飞鸟真    时间: 2008-5-28 13:58
原帖由 itany 于 2008-5-28 13:48 发表


ATI早就出过视频编码器,有什么好吃惊的,本来视频编码也应该是GPU的强项
但是GPU作为一个协处理器,搞通用计算,早晚也是x87 的命运


肤浅,通用计算是斩断x86数十年来悲哀魔咒束缚的利剑,负责任的说搞定一个ps就能把cpu拽下马[cool>
作者: scowl    时间: 2008-5-28 14:03
原帖由 fineday 于 2008-5-28 13:26 发表
你们这些Ifan啊,看到GT200能做这种事情都傻眼了?
NV什么时候说GPU取代CPU了?只是说GPU会变成加速电脑的第一动力,又不是要你用GPU来跑Windows。在NV想来,未来的电脑只需要一颗过得去的CPU,而其他的重负荷运算都 ...




严重同意

GPU的运算能力远超过CPU十倍以上     如果未来CPU只需要跑跑系统      所有重负荷的东西都能交给GPU

那真是爽了。。。。
作者: kingofmx200    时间: 2008-5-28 15:19
nv跟sony合作,“模拟地球”的思想学得挺快

记号,到时看笑话
作者: acqwer    时间: 2008-5-28 15:38
本以为这个帖子会被ATI fan拿来喷NV的,没想到某Nfan自己拿出来吹了:funk:
作者: hdht    时间: 2008-5-28 16:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: rtyou    时间: 2008-5-28 17:00
GPU既然不是通用当然就是专用,既然是专用,当然就类似X87。
作者: 飞鸟真    时间: 2008-5-28 17:07
原帖由 hdht 于 2008-5-28 16:10 发表
特点不同没必要这样比较,CELL可以处理48个480P视频,不过在其他方面很可能连p4 2g都不如,这次的GT200挑战cpu其实也是一样的



就算cell能模拟地球,你能插在pc上用?现实点吧,如果买个显卡就能让ps快几十上百倍,大部分人会怎么做?
专业的不用说,业余想学设计的人不配出显卡加速还有心学ps吗?就这一块就是多大市场。
这一块intel的高端还卖给谁?[sweatingbullets>

[ 本帖最后由 飞鸟真 于 2008-5-28 17:08 编辑 ]
作者: katerren    时间: 2008-5-28 17:10
看好CUDA的前途!
尤其是在很多专业计算领域。
作者: itany    时间: 2008-5-28 17:11
原帖由 飞鸟真 于 2008-5-28 17:07 发表


就算cell能模拟地球,你能插在pc上用?现实点吧,如果买个显卡就能让ps快几十上百倍,大部分人会怎么做?
专业的不用说,业余想学设计的人不配出显卡加速还有心学ps吗?就这一块就是多大市场。


在Acrobat说明GPU气得作用之前,还是不要把话说绝
究竟是GPU起到了“加速图像显式”的功能,还是滤镜都能用GPU来执行了,我们拭目以待
作者: itany    时间: 2008-5-28 17:23
原帖由 飞鸟真 于 2008-5-28 17:07 发表

就算cell能模拟地球,你能插在pc上用?现实点吧,如果买个显卡就能让ps快几十上百倍,大部分人会怎么做?
专业的不用说,业余想学设计的人不配出显卡加速还有心学ps吗?就这一块就是多大市场。
这一块intel的 ...


使用Core 2 Duo E64002.13GHz双核心处理器进行处理速度只有2-6FPS,平均相当于实际速度的六分之一;换成GT200,处理速度达到了46FPS

请问传说中的次世代240SP的将近300W的大怪物可以跑到46FPS,那么G80能跑到多少呢?
128SP的G80能跑到20?
64SP的G80能跑到10? 和Q6600相比能好到哪去?
16SP的穷人卡能跑到3? 到时候2140小超一下就被打的满地找牙了

别美了。GPU加速方案好是好,可是并不廉价。
产品在PPT上看起来都是美好的


[ 本帖最后由 itany 于 2008-5-28 17:33 编辑 ]
作者: 飞鸟真    时间: 2008-5-28 17:23
原帖由 itany 于 2008-5-28 17:11 发表


在Acrobat说明GPU气得作用之前,还是不要把话说绝
究竟是GPU起到了“加速图像显式”的功能,还是滤镜都能用GPU来执行了,我们拭目以待


别死鸭子嘴硬了,adobe敢展示2G图片的处理效果,你说是gpu加速还是他们数学上取得了革命性突破?[cool>
作者: 飞鸟真    时间: 2008-5-28 17:25
原帖由 itany 于 2008-5-28 17:23 发表


使用Core 2 Duo E64002.13GHz双核心处理器进行处理速度只有2-6FPS,平均相当于实际速度的六分之一;换成GT200,处理速度达到了46FPS

请问传说中的次世代240SP的将近300W的大怪物可以跑到46FPS,那么G80能跑到 ...


你有话一口气说完好不好,有些东西不是线性的。[ninja>
作者: itany    时间: 2008-5-28 17:28
原帖由 飞鸟真 于 2008-5-28 17:23 发表

别死鸭子嘴硬了,adobe敢展示2G图片的处理效果,你说是gpu加速还是他们数学上取得了革命性突破?" src="./images/smilies/PCinlife2009/cool.gif" border=0 smilieid="127">


什么叫做死鸭子嘴硬?
到时候我们看看多少滤镜能支持GPU加速,到时候再算账

能显示一个大图,来个缩放,搞个蒙皮,就迫不及待的来吹嘘,其他的呢?
作者: itany    时间: 2008-5-28 17:29
原帖由 飞鸟真 于 2008-5-28 17:25 发表


你有话一口气说完好不好,有些东西不是线性的。" src="./images/smilies/PCinlife2009/ninja.gif" border=0 smilieid="149">


请问GF 8500转视频能比Core2快多少呢?
既然不是线形的,那就请您估计一个加速比吧……
作者: acqwer    时间: 2008-5-28 17:32
原帖由 飞鸟真 于 2008-5-28 17:25 发表


你有话一口气说完好不好,有些东西不是线性的。[ninja>

压片不是线性的什么是线性的?莫非你想说GT200压片的瓶颈在带宽上?
作者: 飞鸟真    时间: 2008-5-28 17:35
原帖由 itany 于 2008-5-28 17:28 发表


什么叫做死鸭子嘴硬?
到时候我们看看多少滤镜能支持GPU加速,到时候再算账

能显示一个大图,来个缩放,搞个蒙皮,就迫不及待的来吹嘘,其他的呢?


你不理解adobe的强大研发能力,还有ps的基础和运转方式,滤镜算什么,我们这样对ps有深厚理解的人通常很少用滤镜,滤镜是初学者的玩具,更好搞定,说不定假如gpu有500个处理单元,adobe就能把画面分成500份,一个单元给一份。(以上是假象,不负责)
作者: 飞鸟真    时间: 2008-5-28 17:38
原帖由 acqwer 于 2008-5-28 17:32 发表

压片不是线性的什么是线性的?莫非你想说GT200压片的瓶颈在带宽上?


那是我对哪种毫无逻辑的胡乱比较给的委婉的说法,鸦片什么性和gpu性能的表现无关,不同gpu更不能简单比较。
作者: acqwer    时间: 2008-5-28 17:38
原帖由 飞鸟真 于 2008-5-28 17:35 发表


你不理解adobe的强大研发能力,还有ps的基础和运转方式,滤镜算什么,我们这样对ps有深厚理解的人通常很少用滤镜,滤镜是初学者的玩具,更好搞定,说不定假如gpu有500个处理单元,adobe就能把画面分成500份,一个 ...

PS的多线程处理不是一直都是这样的吗?
作者: 飞鸟真    时间: 2008-5-28 17:39
原帖由 itany 于 2008-5-28 17:29 发表


请问GF 8500转视频能比Core2快多少呢?
既然不是线形的,那就请您估计一个加速比吧……


比双核总有2-3倍的提升,不然谁会开发很麻烦的gpu的通用计算。
作者: acqwer    时间: 2008-5-28 17:40
原帖由 飞鸟真 于 2008-5-28 17:38 发表


那是我对哪种毫无逻辑的胡乱比较给的委婉的说法,鸦片什么性和gpu性能的表现无关,不同gpu更不能简单比较。

SP频率较低的低端GPU每SP效率只有更差。
作者: itany    时间: 2008-5-28 18:14
原帖由 飞鸟真 于 2008-5-28 17:39 发表

比双核总有2-3倍的提升,不然谁会开发很麻烦的gpu的通用计算。


立此存正,准备挖坟…… :loveliness:
作者: the_god_of_pig    时间: 2008-5-28 18:22
汗死,又见着一个大宇宙帝国学院毕业的

直说吧,那个PI做出来,估计GPU跑起来成绩也只是一坨*

作者与其把时间浪费在吃NV回扣上,不如先把PI的SIMD优化做好了
作者: rtyou    时间: 2008-5-28 18:29
还在争论这个RZ问题,如果没有CPU,GPU就是一坨S
作者: leishen512    时间: 2008-5-28 18:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: Edison    时间: 2008-5-28 18:50
原帖由 itany 于 2008-5-28 17:28 发表
什么叫做死鸭子嘴硬?
到时候我们看看多少滤镜能支持GPU加速,到时候再算账
能显示一个大图,来个缩放,搞个蒙皮,就迫不及待的来吹嘘,其他的呢?

http://www.nvidia.com/object/tha ... op/CUDAFilters4.pdf

编译好的和源代码:
http://developer.download.nvidia ... /cudaFilters_02.zip

其实两年之前NVIDIA就post过一个for PS的OpenGL-based GPU filter,不过那个时候不是CUDA的。
作者: 墙外    时间: 2008-5-28 19:12
。。。无意义。。。。什么时候出产品了再说。
我们的生活不止是天天压缩视频的和跑π的。。
作者: faforever    时间: 2008-5-28 19:20
原帖由 itany 于 2008-5-28 17:23 发表


使用Core 2 Duo E64002.13GHz双核心处理器进行处理速度只有2-6FPS,平均相当于实际速度的六分之一;换成GT200,处理速度达到了46FPS

请问传说中的次世代240SP的将近300W的大怪物可以跑到46FPS,那么G80能跑到 ...



晕了,哪能这样子比的?
假设e6400只能跑6fps,但是如果要让它跑到46fps,他的成本就是非线性增长的。
目前来说,极限超频4核u,估计能5倍于e6400的性能,也就30fps左右。但成本和功耗呢?能普通环境用吗?
举例,服务器的单路系统的价钱可不是双路系统的1/2价钱,双路也做不到2倍性能于单路系统。
尤其对于性能最高端的时候,经常为了10%的性能增长,就可能需要多一倍的价格、多一倍的功耗。

[ 本帖最后由 faforever 于 2008-5-28 19:27 编辑 ]
作者: faforever    时间: 2008-5-28 19:25
原帖由 墙外 于 2008-5-28 19:12 发表
。。。无意义。。。。什么时候出产品了再说。
我们的生活不止是天天压缩视频的和跑π的。。


cuda本来就不是为普通用户设计的。但如果能加速专业人员设计的速度,普通人也能受惠
作者: Isrufile    时间: 2008-5-28 19:29
GPU用来加速的确不错,可谓物尽其用了。
但是替代CPU还为时尚早,就算有这种技术可能市场也很难接受。如果说NV作为唯一一家能够提供GPU代替CPU方案的公司来说(我不知道NV是否真的这样在做了但是看到论坛好多人都有这类言论),那么它要面临的对手太过强大以至于几乎不能完成,不仅技术,还有市场,手中握有的大量知识产权,软件的合作伙伴。。。
作者: acqwer    时间: 2008-5-28 19:40
原帖由 the_god_of_pig 于 2008-5-28 18:22 发表
汗死,又见着一个大宇宙帝国学院毕业的

直说吧,那个PI做出来,估计GPU跑起来成绩也只是一坨*

作者与其把时间浪费在吃NV回扣上,不如先把PI的SIMD优化做好了

SuperPI的大数运算是可以支持多线程优化的,不过优化后就不是SuperPI了,这个成绩的比较毫无意义。
作者: faforever    时间: 2008-5-28 19:56
原帖由 Isrufile 于 2008-5-28 19:29 发表
GPU用来加速的确不错,可谓物尽其用了。
但是替代CPU还为时尚早,就算有这种技术可能市场也很难接受。如果说NV作为唯一一家能够提供GPU代替CPU方案的公司来说(我不知道NV是否真的这样在做了但是看到论坛好多人都有 ...


现在希望的是amd和nv一起做一个gpu通用计算的标准出来,那样才不会太受限于人。
我同学在读博士,他说他同学为了加快图像识别和加解密,专门买支持cuda的显卡回去试验。不知道他现在结果如何
作者: notfishcc    时间: 2008-5-28 20:02
好吧,如果x264编码器愿意支持GPU加速,AviSynth也能支持的话~~可以考虑入个GT200系列~~~~
同时也会配上Nehalem

但是更看好Larrabee
作者: Edison    时间: 2008-5-28 20:13
标题: 回复 94# notfishcc 的帖子
http://avisynth.org/tsp/

fft3dGPU version 0.8.2
作者: itany    时间: 2008-5-28 21:06
原帖由 faforever 于 2008-5-28 19:20 发表

晕了,哪能这样子比的?
假设e6400只能跑6fps,但是如果要让它跑到46fps,他的成本就是非线性增长的。
目前来说,极限超频4核u,估计能5倍于e6400的性能,也就30fps左右。但成本和功耗呢?能普通环境用吗?
举 ...


对于一般的用户,也不会买GT200来运行CUDA应用程序,在低端,GPU也不会超越CPU的性能,也许极其个别的应用除外
阁下说的没有错,还是主要给行业用户用的,个人也就是沾光
NV自己也没有真正的认真想过在桌面上取代CPU,而就是在现在愈演愈烈的集成显卡的风潮中给GPU,尤其是中端的GPU增加卖点罢了

另外,在计算CPU速度的时候,用Nehalem的性能更加合适吧,SSE 4.1优化和超线程都应该算上
另外,有GT200的功耗,养两个高频四核心CPU没有问题了
个人认为行业用户在近期恐怕还是更偏爱CPU,而不是GPU。等到GPU起来,Larrabee估计遍地都是了
正如x64发端于A64而光大与Core2一样

[ 本帖最后由 itany 于 2008-5-29 01:45 编辑 ]
作者: Zeratul    时间: 2008-5-28 21:08
偶觉得,为了公平,可以用相同价位的来搞,比如G84和2XX0比,G94和82比,G92和q66比:loveliness:
作者: GZboy    时间: 2008-5-28 21:23
提示: 作者被禁止或删除 内容自动屏蔽
作者: littlemouse    时间: 2008-5-28 21:36
原帖由 notfishcc 于 2008-5-28 20:02 发表
好吧,如果x264编码器愿意支持GPU加速,AviSynth也能支持的话~~可以考虑入个GT200系列~~~~
同时也会配上Nehalem

但是更看好Larrabee


同意,個人用戶壓片,主要也就是用x264了。



原帖由 Edison 于 2008-5-28 20:13 发表
http://avisynth.org/tsp/

fft3dGPU version 0.8.2

唔,这个是降噪的,还有几个其他的GPU滤镜,都试用过。
现在压x264为了避免过分压缩,都不太需要降噪,有时候还要加噪。
但是有个问题,好像avs用GPU滤镜的话,需要内部做YV12-YUY2-YV12转换,会不会损失画质?
而且我也不知道为什么,我自己觉得实际速度也没比纯cpu快。
作者: Edison    时间: 2008-5-28 21:40
filter的品质好不好是一回事情,但是速度差别是另一回事情:
http://forum.doom9.org/showpost.php?p=624893&postcount=17

旧版+6800GT

fft3dGPU(bt=1,sigma=2)
fft3dfilter(bt=1,sigma=2)
on a 720x576 clip:

fft3dfilter 7.0 FPS
fft3dGPU 0.2 11.0 FPS
fft3dGPU 0.3 24.3 FPS

this is on an athlon XP 2400 MHZ (nforce-2 chipset 200 MHz DDR ram)
and a Geforce 6800 GT 128 MB RAM (411 MHz core/742 MHz mem).

问题的关键是,目前已经有了GPU加速的AVIsynth Filter,这证明了GPU加速的可行性,只要你愿意,移植到CUDA或者哪怕是上述旧版那样的DX9-based GPGPU上,效能也能显著提升。
作者: Edison    时间: 2008-5-28 21:44
原帖由 littlemouse 于 2008-5-28 21:36 发表
同意,個人用戶壓片,主要也就是用x264了。
唔,这个是降噪的,还有几个其他的GPU滤镜,都试用过。
现在压x264为了避免过分压缩,都不太需要降噪,有时候还要加噪。
但是有个问题,好像avs用GPU滤镜的 ...

DX9.0c以上的GPU都是FP32的,足够保证YUV转换所需要的Intermediate精度要求。
作者: GZboy    时间: 2008-5-28 21:49
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4