POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Edison
打印 上一主题 下一主题

全球第一个第三方D3D10 shader级别性能测试

[复制链接]
101#
发表于 2007-7-20 23:57 | 只看该作者
原帖由 来不及思考 于 2007-7-20 23:50 发表


你还是没有弄清楚CPU和GPU的区别




GPU不存在这种体系

GPU不会不存在这种体系的,除非没有指令Cache,在现代处理器里这是不可想象的。
就我上面说的那个例子,if里的语句在cache内,而else的语句在cache外,就会造成这种情况
回复 支持 反对

使用道具 举报

头像被屏蔽
102#
发表于 2007-7-20 23:57 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

103#
发表于 2007-7-20 23:58 | 只看该作者
原帖由 来不及思考 于 2007-7-20 23:55 发表
你说的都是正确的,但是你对GPU存在很大的理解偏差

我不知道偏差在哪里,你能告诉我么?
不要光说我偏差撒
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
104#
发表于 2007-7-21 00:11 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

105#
发表于 2007-7-21 00:13 | 只看该作者
也许我的偏差在于:GPU也许没有cache~~~
回复 支持 反对

使用道具 举报

106#
发表于 2007-7-21 00:21 | 只看该作者
恩,GPU没有传统意义上的缓存

问一下,“GPU的Multi-threading不会在一个cycle里面同时执行两个指令”,这个应该是不对的,GPU并行性很高,内部执行单元一定多于一个,怎么不能同时执行2条指令呢?
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
107#
发表于 2007-7-21 00:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
108#
发表于 2007-7-21 00:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
109#
发表于 2007-7-21 00:25 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

110#
发表于 2007-7-21 00:36 | 只看该作者
好,谢谢

上次被一个兄弟欺骗说现在for DX10的GPU支持双精度运算以后,经过查找资料,发现还是float

现在就比较喜欢追根究底
回复 支持 反对

使用道具 举报

111#
发表于 2007-7-21 00:38 | 只看该作者
原帖由 来不及思考 于 2007-7-21 00:23 发表


这句要相对上一句话来理解 :wacko:

我想你的意思应该是同一个执行单元不会在一个周期内执行两条指令吧
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
112#
发表于 2007-7-21 00:39 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

113#
发表于 2007-7-21 01:40 | 只看该作者
原帖由 来不及思考 于 2007-7-21 00:39 发表


双精度...

等G9X吧 :p
不过,GPU不解决存储器瓶颈,就算跟CPU一样聪明,也永远不知道自己在算什么 :p


目前的狀況是:知道只會更慢。XD
(知道代表分類、分類代表可以管理比例、允許管理比例就是Xenos/R600做的事情)

G8x的設計是在輸入前透過不同的指令FIFO來區分,等到透過warp為單位輸入之後,SP/Shader/ALU....
不管是什麼,只負責執行、不問內容。所以TCP只知道透過行為來追求指令規模上的平衡,不去意識VS/PS/GS之類的指令"種類上"的平衡。

G8x的TCP還有一個特性是Threading processor、register file、Texture Cache、Constant Cache,以至於TMU、SP等全部都是固定的數量,所以其實很適合以TCP為單位製作多晶片的組態。

[ 本帖最后由 Eji 于 2007-7-21 01:46 编辑 ]
回复 支持 反对

使用道具 举报

pharaohs1024 该用户已被删除
114#
发表于 2007-7-21 02:18 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

115#
发表于 2007-7-21 03:59 | 只看该作者
原帖由 来不及思考 于 2007-7-21 00:22 发表
cache的hit rate,主要依赖的是时间区域性和空间区域性,这两点在GPU上的环境都不具备

GPU的绝大多数对外部存储器的读取请求(定址),都是发生在计算之后,是没有办法进行预测和prefetch的

因此GPU不会配 ...


为什么说在GPU上不具备?

没有cache是不可想象的,就算有multi-thread也不可能掩盖从memory到GPU那么长的延时,照你说gpu 是基于cache miss设计的, 如果没有prefetch, 那么你算算要多少个thread才够
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
116#
发表于 2007-7-21 09:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
117#
发表于 2007-7-21 14:14 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
118#
发表于 2007-7-21 14:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
119#
发表于 2007-7-21 14:20 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
120#
发表于 2007-7-21 14:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-1-11 03:07

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表