POPPUR爱换

标题: 7970按理说已经脱离VLIW4/5构架了,怎么破解速度还是这么快? [打印本页]

作者: niwei    时间: 2012-9-18 15:18
标题: 7970按理说已经脱离VLIW4/5构架了,怎么破解速度还是这么快?
本帖最后由 niwei 于 2012-9-18 16:12 编辑

看原来的解释是VLIW4/5单元比较适合做浮点运算,所以破密码快,怎么GCN构架比原来的更快?目前测试比同级N卡快了5~6倍。求高人解释。
鄙人目前组7970交火状态,发觉发热量确实大,尤其是破密码时,比玩3D游戏还热,看来目前充分利用VPU性能的是EWSA啊。


作者: niwei    时间: 2012-9-18 15:24
本帖最后由 niwei 于 2012-9-18 16:01 编辑

发现A卡也玩官超了,7970频率会自动升高地。
作者: coollab    时间: 2012-9-18 16:08
因为计算简单,暴力,不需要什么逻辑判断能力
N卡在单纯的暴力计算上一贯不擅长。
作者: wd19880427    时间: 2012-9-18 16:10
coollab 发表于 2012-9-18 16:08
因为计算简单,暴力,不需要什么逻辑判断能力
N卡在单纯的暴力计算上一贯不擅长。

什么叫一贯,580擅长得很
作者: niwei    时间: 2012-9-18 16:11
本帖最后由 niwei 于 2012-9-18 16:16 编辑
coollab 发表于 2012-9-18 16:08
因为计算简单,暴力,不需要什么逻辑判断能力
N卡在单纯的暴力计算上一贯不擅长。


从目前看好像GCN的分支预测更强吧,计算单元内寄存器也更多,按阁下的观点,双精度单精度浮点运算也是暴力咯?!依我看GTX680才是靠简单暴力OC的货呢,晚出这么久才和对手打平手。
作者: fakler    时间: 2012-9-18 16:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: niwei    时间: 2012-9-18 16:21
fakler 发表于 2012-9-18 16:19
除了GK104的680 670
==
660TI 660 650 640晚出那麼久還那個鳥樣。

是啊,号称拳打镇关西结果被镇关西他弟孽待。
作者: coollab    时间: 2012-9-18 16:22
niwei 发表于 2012-9-18 16:11
从目前看好像GCN的分支预测更强吧,计算单元内寄存器也更多,按阁下的观点,双精度单精度浮点运算也是暴 ...

硬件是一方面,关键是有软件环境支持没?
NV搞了整个CUDA的软件环境,AMD现在的OpenCL,摊子实际上也是一堆烂,OpenCL抄CUDA代码的事情还没扯清楚

作者: niwei    时间: 2012-9-18 16:26
coollab 发表于 2012-9-18 16:22
硬件是一方面,关键是有软件环境支持没?
NV搞了整个CUDA的软件环境,AMD现在的OpenCL,摊子实际上也是一 ...

唉~说道这个,为Stream默哀,AMD公关能力确实弱。
作者: goldman948    时间: 2012-9-18 16:28
AMD这麽牛逼何必取消FIRESTREAM捏?
作者: Windyson    时间: 2012-9-18 16:34
怎么看GCN也从VLIW4继承了部分
作者: goldman948    时间: 2012-9-18 16:35
niwei 发表于 2012-9-18 16:26
唉~说道这个,为Stream默哀,AMD公关能力确实弱。

原来公关单位是负责写软件的,长见识了

作者: fakler    时间: 2012-9-18 16:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: niwei    时间: 2012-9-18 16:39
Windyson 发表于 2012-9-18 16:34
怎么看GCN也从VLIW4继承了部分

继承了哪部分?
作者: coollab    时间: 2012-9-18 16:45
fakler 发表于 2012-9-18 16:37
不說就別笑死人了,firepro你擺哪去了,智商果然沒下限阿

专业市场有人要?还不是死路一条,改名字的话死的好看点,不至于整个产品线挂掉

作者: Windyson    时间: 2012-9-18 16:47
niwei 发表于 2012-9-18 16:39
继承了哪部分?

数数快,没其它了

作者: niwei    时间: 2012-9-18 16:50
Windyson 发表于 2012-9-18 16:47
数数快,没其它了

你说了跟没说一样,含金量太低。
作者: niwei    时间: 2012-9-18 16:53
不可否认,目前对我等P民而言,最YY的通用计算便是破密码了,其他的留给实验室里的迂腐子去完成吧,哈哈哈。
作者: goldman948    时间: 2012-9-18 16:57
fakler 发表于 2012-9-18 16:37
不說就別笑死人了,firepro你擺哪去了,智商果然沒下限阿

如果没人要又何必取消产品线捏?
我说取消firestream产品线,你说firepro,是谁智商低捏?

作者: eternal0    时间: 2012-9-18 17:13
niwei 发表于 2012-9-18 16:53
不可否认,目前对我等P民而言,最YY的通用计算便是破密码了,其他的留给实验室里的迂腐子去完成吧,哈哈哈。 ...

SVP插帧也很好用,这个是OpenCL的。

其他领域就没有价值了。


作者: nom8393    时间: 2012-9-18 17:25
这个现象我估计应该是由于AMD现有的通用计算开发包APP是源于Brook+ ,所以把老的的基于Firestream的暴力破解程序移植到GCN架构上表现应该也不错。
作者: jhj9    时间: 2012-9-18 17:26
本帖最后由 jhj9 于 2012-9-18 17:27 编辑
niwei 发表于 2012-9-18 16:11
从目前看好像GCN的分支预测更强吧,计算单元内寄存器也更多,按阁下的观点,双精度单精度浮点运算也是暴 ...


你连带宽、吞吐能力和运算能力都区分不清楚,还是少说通用计算比较好
要不然说得牛头不对马嘴就搞笑了

GCN也就带宽和吞吐能力强,运算能力方面从矩阵运算和sin、cos等函数计算能力来看简直就是一塌糊涂,四肢发达头脑简单,只能干些粗笨的体力活。
GTX680带宽、功耗、晶体管数量几乎都只有7970的80%左右,而实际性能却能反过来高出一筹,这正是体现计算能力高明的地方。NV拿一个中端级别的芯片就干掉了A家旗舰,这真是非常可笑的事情,哈哈

作者: fakler    时间: 2012-9-18 17:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2012-9-18 17:37
fakler 发表于 2012-9-18 17:34
騙子賺5毛是按字計算的還是按文章數呢?
你差甩尾貓一截呢

真正的骗子该去小黑屋里呆呆才对

作者: tom5627    时间: 2012-9-18 17:43
jhj9 发表于 2012-9-18 17:26
你连带宽、吞吐能力和运算能力都区分不清楚,还是少说通用计算比较好
要不然说得牛头不对马嘴就搞笑了 ...

喊了一辈子中断干高端~结果高端的吊毛都没见到~就见了个PPT以及代号就和打鸡血一样~
作者: niwei    时间: 2012-9-18 17:47
本帖最后由 niwei 于 2012-9-18 17:47 编辑
jhj9 发表于 2012-9-18 17:26
你连带宽、吞吐能力和运算能力都区分不清楚,还是少说通用计算比较好
要不然说得牛头不对马嘴就搞笑了 ...


阉割货还好意思谈晶体管数,别告诉我又学阿Q不承认DX11.1把双精浮点运算列入规范的事实。有本事降频别搞官超再来试试,完全的傻快权益之策卡还以为得了个宝。

至于YY中端灭什么的已经是你这个傻子的特色语言了,当初被人笑死的货色还好意思提及。


作者: fakler    时间: 2012-9-18 17:55
提示: 作者被禁止或删除 内容自动屏蔽
作者: burntank    时间: 2012-9-18 18:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2012-9-18 20:59
tom5627 发表于 2012-9-18 17:43
喊了一辈子中断干高端~结果高端的吊毛都没见到~就见了个PPT以及代号就和打鸡血一样~

高端这周已经出货1000多颗装在Titan系统中了。

明明是你自己选择性过滤看不见,客观世界和你的幻觉可是完全不同的

作者: fakler    时间: 2012-9-18 21:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2012-9-18 21:02
niwei 发表于 2012-9-18 17:47
阉割货还好意思谈晶体管数,别告诉我又学阿Q不承认DX11.1把双精浮点运算列入规范的事实。有本事降频别搞 ...

你是玩A卡玩出幻觉来了吧?GK104哪里不完整了?

DX11.1列入规范有什么用?哪个软件用到了吗?哪个软件支持DX11.1了吗?哪个软件用到双精度了吗?你只能拿出根本没人用的东西当阿Q,跟那些成天拿2560来YY的一样,还嫌脸被打得不够?

GK104这个代号末尾的4本身就表明了它是中端,这是一贯众所周知的东西,你这个阿Q就是无法面对事实。
A家无能,GK100根本没有必要出来,直接改进成GK110了。

作者: jhj9    时间: 2012-9-18 21:03
本帖最后由 jhj9 于 2012-9-18 21:04 编辑
fakler 发表于 2012-9-18 21:01
這周?

騙子去年不是喊得很大聲嗎


树要脸人要皮,你的证据在哪里?

倒是你撒谎骗人被当众踢爆的截图已经秒杀你这个不要脸到没有底线的骗子无数次,你还想再次被打脸?真是有自虐倾向啊,哈哈哈哈


[attach]2026838[/attach]

作者: fakler    时间: 2012-9-18 21:13
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2012-9-18 21:19
fakler 发表于 2012-9-18 21:13
騙子又轉移話題了

哈哈,骗子果然拿不出丝毫证据,脸又被再次打肿。我问你“去年”的证据在哪里,你果然只能装傻了,哈哈

作者: fakler    时间: 2012-9-18 21:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2012-9-18 21:55
fakler 发表于 2012-9-18 21:37
繼續吹吧騙子,大半年就在喊GK110還犯傻阿

证据在哪里?你这个骗子撒谎当场丢人现眼的截图我这里拿出来秒杀你无数次

而你撒谎了半天,拿不出丝毫证据再次证明真正撒谎的骗子是你无误,哈哈哈哈

作者: fakler    时间: 2012-9-18 22:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: jhj9    时间: 2012-9-18 22:11
fakler 发表于 2012-9-18 22:04
我還需要截圖

血淋淋的發文在你那破紀錄裡面阿

还是什么都拿不出来,你就继续丢人现眼show下限吧

作者: empressgirl2010    时间: 2012-9-18 23:05
這是每個GCN SP(計算單元)的內部架構略圖:
[attach]2027056[/attach]

作者: asdfjkl    时间: 2012-9-18 23:56
niwei 发表于 2012-9-18 17:47
阉割货还好意思谈晶体管数,别告诉我又学阿Q不承认DX11.1把双精浮点运算列入规范的事实。有本事降频别搞 ...

谁说DX11.1规定了双精度浮点, graphic的图形和双精度没半毛钱关系。。。还有GCN可不止IEEE格式的双精度浮点,你知道么???


作者: tom5627    时间: 2012-9-19 06:44
jhj9 发表于 2012-9-18 20:59
高端这周已经出货1000多颗装在Titan系统中了。

明明是你自己选择性过滤看不见,客观世界和你的幻觉可是 ...

你丫从曝出680代号是104开始就疯狂吹嘘~吹了半年了~总算是出了事物了~哎呀不清楚是否半年内能出民用版本啊~
作者: 水星思路    时间: 2012-9-19 08:17
nom8393 发表于 2012-9-18 17:25
这个现象我估计应该是由于AMD现有的通用计算开发包APP是源于Brook+ ,所以把老的的基于Firestream的暴力破解 ...

CUDA 也一样基于 Brook。做 Brook 的人就在 NVIDIA 当 CUDA 的大老板。

http://blogs.nvidia.com/author/ian-buck/

另外 OpenCL 是 Apple 的东西。

作者: 50857817    时间: 2012-9-19 13:35
本帖最后由 50857817 于 2012-9-19 13:36 编辑
jhj9 发表于 2012-9-18 21:02
你是玩A卡玩出幻觉来了吧?GK104哪里不完整了?

DX11.1列入规范有什么用?哪个软件用到了吗?哪个软件 ...


现在NV最牛逼的原来不是GTX680这个GK104啊,哦哦,这个只是中端。我是真心想买块NV旗舰的,你这边有吗?GTX680这个中端玩游戏不流畅啊,你卖我块旗舰的吧,价格好商量。要求单芯,NV的,比680玩游戏牛逼的就行,旗舰肯定能满足这个要求的吧
作者: jhj9    时间: 2012-9-19 14:31
50857817 发表于 2012-9-19 13:35
现在NV最牛逼的原来不是GTX680这个GK104啊,哦哦,这个只是中端。我是真心想买块NV旗舰的,你这边有吗? ...

GK110你可以去找NV总部的人定购

作者: niwei    时间: 2012-9-19 14:54
asdfjkl 发表于 2012-9-18 23:56
谁说DX11.1规定了双精度浮点, graphic的图形和双精度没半毛钱关系。。。还有GCN可不止IEEE格式的双精度浮 ...

DP Shader Ops (Double Precision Float Shader)被引入到DX11.1中的事实就这样被某些货无视了。

光线追踪和图形没关系?光线追踪和双精度浮点SHADER没关系?不带这么选择性无视的枪。

作者: fakler    时间: 2012-9-19 14:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: coollab    时间: 2012-9-19 14:57
niwei 发表于 2012-9-19 14:54
DP Shader Ops (Double Precision Float Shader)被引入到DX11.1中的事实就这样被某些货无视了。

光线追 ...

目前成熟并广泛应用的的光线追踪引擎,的确都只是用单精度计算

DX11.1的双精度只是规范,并没说明用途

另外,民用、甚至一些影视作品单精度绰绰有余,双精度给科学计算还差不多

作者: niwei    时间: 2012-9-19 15:00
今天用自己做得字典一小时内搞定个9位数字密码握手包,大伙以后无线路由还是字母加数字为好,破解难度可增加十倍。
作者: jhj9    时间: 2012-9-19 15:02
niwei 发表于 2012-9-19 14:54
DP Shader Ops (Double Precision Float Shader)被引入到DX11.1中的事实就这样被某些货无视了。

光线追 ...

早就说了,你懂的东西那么少就别胡说八道了

一个现在压根没人用,为了科学计算准备东西而已。
光线追踪关双精度P事?你果然又表现出无知丢人,这是你不懂装懂的必然结果

作者: jhj9    时间: 2012-9-19 15:03
本帖最后由 jhj9 于 2012-9-19 15:03 编辑
fakler 发表于 2012-9-19 14:56
買K20當取代680,Jhj9你這個騙子阿


GK110核心都是一样的,无知不是你的错,跳出来丢人现眼就是你的不对了

作者: niwei    时间: 2012-9-19 15:03
coollab 发表于 2012-9-19 14:57
目前成熟并广泛应用的的光线追踪引擎,的确都只是用单精度计算

DX11.1的双精度只是规范,并没说明用途 ...

不靠双精度光线追踪能普及吗?我看难。

再说你A/N饭谁家都好,其实都是MS的奴隶罢了,MS的DX规范一出,谁敢不从,这个就不需展开讲了。

作者: mooncocoon    时间: 2012-9-19 15:05
niwei 发表于 2012-9-19 14:54
DP Shader Ops (Double Precision Float Shader)被引入到DX11.1中的事实就这样被某些货无视了。

光线追 ...

截止到目前为止,微软没有任何官方描述称光线追踪将在DX11.1中被引入,更没有任何官方说明称DP Shader programs将会在DX11.1中出现。
对DP Shader Ops的支持只意味着该API预留了执行路径,不代表一定会有可执行的实例出现。我制作文章的目的也在于描述DP Shader Ops的引入对于未来的意义,并展示光线追踪交汇检查算法同DP精度之间关系和意义,并不是要告诉任何人DX11.1会支持DP Shader programs以及光线追踪。
我不希望我说的每一句话都被扭曲成别的样子,如果我力有不及没把话说清楚的话我道歉,但私以为在绝大多数情况下,我说的应该还是很清楚的,只不过遭遇到了截取以及断章取义……

作者: mooncocoon    时间: 2012-9-19 15:08
niwei 发表于 2012-9-19 15:03
不靠双精度光线追踪能普及吗?我看难。

再说你A/N饭谁家都好,其实都是MS的奴隶罢了,MS的DX规范一出, ...

不依赖光线交汇检查的光线追踪算法并不需要DP精度,交汇检查也并不是一个必须的步骤,针对交汇检查的争论一直没有在学界停息过,我认为以交汇检查算法和DP来作为衡量RT普及与否的标志是没有任何根据的……
作者: fakler    时间: 2012-9-19 15:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: niwei    时间: 2012-9-19 15:08
jhj9 发表于 2012-9-19 15:02
早就说了,你懂的东西那么少就别胡说八道了

一个现在压根没人用,为了科学计算准备东西而已。

一个固步自封的奇葩也只能用用傻快卡YY杀别人全家这类下三滥的构思了

从另一个方面来看,DX11.1中与桌面端最相关、也是最重要的更新就是引入了DP Shader Ops。通常来说,微软绝不会随随便便就更新DX的版本号,除了一些对之前DX11版本的Debug外,他们肯为DP Shader Ops这一点就将DX11加上“.1”版本号,那必然是有原因的。虽然我们无法知道微软这么做真正的用意是什么,但笔者推测这应该也与光线追踪脱不了干系。毕竟游戏厂商若想要推出“准光线追踪游戏”,也需要API的支持才行。而DX11.1就很有可能是微软为游戏厂商们准备的“垫脚石”。

作者: jhj9    时间: 2012-9-19 15:11
niwei 发表于 2012-9-19 15:08
一个固步自封的奇葩也只能用用傻快卡YY杀别人全家这类下三滥的构思了

从另一个方面来看,DX11.1 ...

你很好的诠释了什么叫做自作聪明。DX10.1按你的说法也意义重大,但是呢?现在还有几个DX10.1的游戏?还有谁提起??

作者: lxilikepal    时间: 2012-9-19 15:14
niwei 发表于 2012-9-19 15:08
一个固步自封的奇葩也只能用用傻快卡YY杀别人全家这类下三滥的构思了[w00t>

从另一个方面来看,DX11.1 ...

你跟上面的某月月到底是谁打谁的脸呢……

作者: jhj9    时间: 2012-9-19 15:15
fakler 发表于 2012-9-19 15:08
快去訂來打BF3阿,買的到你還會買680,騙子智商沒下限阿

BF3用680毫无压力,要早点买到需要额外代价,我又没有这样的需求,等8970出来再说吧,一定买个780把8970秒成渣都不如

作者: niwei    时间: 2012-9-19 15:15
jhj9 发表于 2012-9-19 15:11
你很好的诠释了什么叫做自作聪明。DX10.1按你的说法也意义重大,但是呢?现在还有几个DX10.1的游戏?还有 ...

HDR+狗牙的日子当然被N枪选择性无视了,哈哈
作者: jhj9    时间: 2012-9-19 15:17
niwei 发表于 2012-9-19 15:15
HDR+狗牙的日子当然被N枪选择性无视了,哈哈

7900GS轻松通过补丁实现HDR+AA

这回你诠释什么才是真正的固步自封的奇葩,居然还在拿HDR+AA来说事,自打耳光好快

作者: mooncocoon    时间: 2012-9-19 15:19
niwei 发表于 2012-9-19 15:08
一个固步自封的奇葩也只能用用傻快卡YY杀别人全家这类下三滥的构思了[w00t>

从另一个方面来看,DX11.1 ...

       •Shader tracing(shader追踪)  •Direct3D device sharing(D3D设备共享)
  •Check support of new Direct3D 11.1 features and formats(全新D3D特性支持)
  •Create larger constant buffers than a shader can access(允许创建大于shader可访问尺寸的常buffer)
  •Use logical operations in a render target(对渲染目标执行逻辑操作)
  •Force the sample count to create a rasterizer state(为每一个光栅化过程强制样本数)
  •Process video resources with shaders(通过shader处理视频过程)
  •Change subresources with new copy options(通过新的copy选项改进资源体系)
  •Discard resources and resource views(放弃传统的资源管理和资源视图模式)
  •Support a larger number of UAVs(支持大量的UAV[UnorderedAccessViews]操作)
  •Bind a subrange of a constant buffer to a shader(为shader绑定作为子区间的常buffer)
  •Retrieve the subrange of a constant buffer that is bound to a shader(检索每一个绑定常buffer作为子区间的shader的常buffer子区间)
  •Clear all or part of a resource view(清除所有关于资源视图的内容)
  •Map SRVs of dynamic buffers with NO_OVERWRITE(以非overwrite方式为SRVs动态buffer创建地图)
  •Use UAVs at every pipeline stage(在每条渲染管线上使用UAV)


抛开意义不谈,UAV的大量引入才是导致DX11提升版本号到11.1的原因。

作者: niwei    时间: 2012-9-19 15:22
mooncocoon 发表于 2012-9-19 15:19
•Shader tracing(shader追踪)  •Direct3D device sharing(D3D设备共享)
  & ...

多谢,学习了。
作者: coollab    时间: 2012-9-19 16:18
niwei 发表于 2012-9-19 15:03
不靠双精度光线追踪能普及吗?我看难。

再说你A/N饭谁家都好,其实都是MS的奴隶罢了,MS的DX规范一出, ...

光线追踪和双精度关系不大,甚至光线追踪在民用领域的发展和双精度完全没关系
双精度需要更高的计算负荷,如果光线追踪需要双精度,会严重推慢普及速度。

作者: 50857817    时间: 2012-9-21 08:02
jhj9 发表于 2012-9-19 14:31
GK110你可以去找NV总部的人定购

我可不要什么K10,K20哦,我要用民用GK110玩BF3替换掉GTX680哦亲




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4