|
原帖由 梦游的猪 于 2006-11-10 00:20 发表
首先,谁也没有期待什么线性提高。这个例子只是说明,在ROP不是瓶颈甚至可以忽略不计的情况下,内存带宽仍然对性能有影响,而不是你所说的,没事。
其次,你又提出了90%这么个数据,这个数据能够得到支持吗 ...
诚心找碴是不 同样内存频率下 高内存参数和低内存参数 对CPU跑SUPER-PI还有影响呢
这个时候你提高频率只是改善MC,ROP,TMU等Latency对GPU带来的影响。
DDRI 和 DDRIII 同样跑600mhz 性能还不同呢,你以为内存性能光一个带宽就代表一切了?,还有时序等 ok?,提高40%才能提高10%性能,也能用来说明带宽不够?满足ROP理论填充能力就需要消耗16G带宽 提高6.4G带宽就提高了10%(就且算是提高带宽带来的好处,不算latency方面的改进),还真说明GPU除了ROP还有其他东西很吃带宽阿 整整10%呢!
这个90% 还需要数据支持么? 90%已经是很保守的估计 Shader不访问显存 TMU只有Tex动作的时候才访问显存,Filter和显存也毫无关系。 现代GPU除掉 VS/PS TMU. ROP 还能剩下什么? 自己去看几本图形方面的书OK?
另外别一口一个pc,游戏机,都是计算机体系下的东西,只不够硬体构架不同,但是基本原理原则都是相同的。CPU到底能够解决多少应用,决定因素是CPU的IPC,而不是带宽,而为什么你就认为CPU的IP/C不会先成为瓶颈而是,系统带宽拖累CPU呢?
我承认CPU的IPC需要带宽做保证,但是别忘了CPU有Cache这种东西存在,如果不知道这个这个东西的意义可以去查一下。
不同设计的CPU对总线带宽的依赖是不同的。反观CELL forPS3 PPE搭配 64KB L1缓存和512KB ,而SPE则完全没有Cache
我还真不知道程序能否真的做到每次提前将数据MOV 到SPE的buffer中去。 PPE的负担负责协调7个SPE(1个备用的救险不算了)
本身还要负责通用计算,又只有512K cache,如果MISS ,访问主存,那性能就真叫好看了。这种构架软件优化的好就不错,如果优化不到位,性能完全没有保障。
太依赖外部环境的构架都是很危险的。 X-BOX 相当的保守 首先核心账面上不会和CELL for PS3那么多,3个核心都能做通用计算,都具备64k L1, 然后共享1MB L2.虽然保守。但是可靠。 22.4G内存带宽,21.6G前端总线 配合的相当不错啊
有什么问题么?而且CPU不是GPU的ROP 不断的读写内存 #那样会慢死的。
Cell for PS3一直都是SONY一个劲叫好 Derverloper一个一个叫苦 为啥?因为你?因为我? 或许PS3最后实际的表现会很不错
一下控制8个两种异质的CORE,上帝保佑伟大的DEVERLOPER
[ 本帖最后由 ayanamei 于 2006-11-10 01:03 编辑 ] |
|