Benchmark Details*
NVIDIA® GeForce®-based graphics cards used are GeForce 8400 GS with 256MB DDR2 memory, GeForce 8500 GT with 256MB GDDR3, GeForce 8600 GT with 256MB GDDR3, GeForce 9600 GT with 512MB GDDR3, and GeForce 8800 GT with 512MB GDDR3 at default clocks.
NVIDIA GPU benchmarks are run on an EVGA nForce® 790i Ultra SLI motherboard with 2 GB DDR3 system memory using Windows Vista SP1. NVIDIA GPU driver is 174.74.
Intel GMA 3100 benchmarks are run on an Asus P5K-VM motherboard (Intel G33-based) with 2 GB DDR2 system memory using Windows Vista SP1. Intel CPUs are run at default clocks. Intel graphics media accelerator driver is 15.8.0.1437.
3DMark Vantage is run in Performance mode, 3DMark 06 is at 12x10 & 1x1x setting, PCMark Vantage is run at 10x7 setting, Company of Heroes is run at 12x10 & 4x8x setting, Sims2 is run at 12x10 & 4x8x setting, and Bioshock is run at 12x10 & 4x8x setting.
Intel GMA 3100 FPS score on Bioshock, Company of Heroes, and Sims2 are considered fails, as Intel GMA 3100 is not capable of running at 12x10 with anti-aliasing. 3DMark Vantage requires DX10, which GMA 3100 does not support.
The Adobe Photoshop image processing test uses deconvolution algorithms to deblur a 1024x1024 RGB color image. The Traditional PC is tested using a CPU to run an 'Interactive Deconvolution' filter available in the Fovea Pro 4.0 software developed by Reindeer Graphics. The Optimized PC is tested using a GPU to run a 'Lucy-Richard Deconvolution' algorithm available in a CUDA-based Photoshop plug-in developed by NVIDIA.
The HD Video Encoding test measures the time required to transcode a MPEG-2 1280x720x30 @ 20Mb/S video file to the iTunes Apple TV format. The CPU is tested with iTunes to do the transcoding. The GPU is tested using the RapiHD Transcoder from Elemental Technologies.
Relative PC performance is calculated as a mean of all successfully running benchmarks of Optimized PC as compared to Traditional PC.
* Refers to PC configurators located on the following web sites: www.nvidia.com/balancedpc, www.nvidia.com/balancedpc/config, www.nvidia.com/optimizedpc, and www.nvidia.com/optimizedpc/config.
原帖由 lzy24 于 2008-5-27 15:13 发表
去http://www.elementaltechnologies.com/ 逛了一下,发现RapiHD Transcoder及类似产品很多,但此类软件显然是价格不菲
软件支持不足,运算力再强也没用
原帖由 tedsun 于 2008-5-27 15:42 发表
盗版,或者开源的东西很快会出来的。
其实对于CPU的应用来说,又有几个人买正版了?
压片,用Mencoder的很少吧,还是都商业软件
图像处理,用photoshop的谁买得起啊
软件支持不足,运算力再强也没用
对CPU同 ...

原帖由 jhj9 于 2008-5-29 01:02 发表
是啊,要问也是问24线程编程如何协调的问题
不过要是Larrabee的Setup、ROP、TMU都不是固定式的,那么性能差距可就跟现在的显卡差距大了。
毕竟 ...
原帖由 Prescott 于 2008-5-29 01:34 发表
笑死人了,你对Larrabee知道多少?你对CUDA知道多少?这里比我懂CUDA的不超过3个。我原先不明白GPU,以为这边都是高人,看了几天资料发现GPU区没几个人懂GPU,更没几个人懂G80为什么要这么设计。
NV比你紧张多了 ...

原帖由 jhj9 于 2008-5-29 01:47 发表
我现在没有时间去看而已
如果你懂为什么不写点程序来证明一下?在Intel上班这么闲吗?
要不你试试用Larrabee跑一下Crysis DX10 VeryHigh 1920* ...

原帖由 jhj9 于 2008-5-29 01:02 发表
是啊,要问也是问24线程编程如何协调的问题
不过要是Larrabee的Setup、ROP、TMU都不是固定式的,那么性能差距可就跟现在的显卡差距大了。
毕竟 ...

原帖由 jhj9 于 2008-5-29 11:44 发表
你是想说压片都是几十个片一起压?
现在的多线程程序在2-4个核的时候还好说,几十个核的时候任务该如何分配?有些核心可能先算完,有些后算完,这时该如何调度?
这些都是现在的程序一句代码都不改就能搞定的吗 ...
原帖由 acqwer 于 2008-5-29 12:22 发表
我理解的多线程压片是视频分成N*N的小块,一个线程压一块,先算完的核心继续算其他没有算的块。现在的视频压缩多线程难道不是这样的?
PS:既然128个sp的GPU都可以充分利用了,几十个X86的核不是更容易,CUDA的 ...
原帖由 jhj9 于 2008-5-29 13:05 发表
理论上应该如此,但是目前压缩软件没有真正做到,因为多核心之间的任务调度也是需要消耗一定额外的资源的。
现在就有这样的压缩软件,只支持双核而不支持四核,这个跟程序的设计有关系。
CUDA的代码是针对性编 ...
原帖由 acqwer 于 2008-5-29 13:28 发表
GPU本身似乎也没有有任务调度的能力啊,Larrabee同样也不需要做调度,CPU总不能光看着不做事吧。
另,X86指令只是一种汇编到机器码的解释方式,和是否是适合于高并行度运算好像毫无关系。那是任务分配的事,与运 ...
原帖由 jhj9 于 2008-5-29 13:41 发表
这你就错了,你以为GPU内部的Threading是干嘛的?
G80效率之所以高就是因为有一个强力的调度控制部分,而Larrabee目前来看,如何调度要靠驱动或者软件本身来进行。
CUDA给GPU的指令都是GPU自己原本的指令集,这 ...
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |