POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: Prescott
打印 上一主题 下一主题

Intel对GPU宣战!

[复制链接]
potomac 该用户已被删除
21#
发表于 2007-4-12 23:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

来不及思考 该用户已被删除
22#
发表于 2007-4-12 23:39 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

23#
发表于 2007-4-13 08:15 | 只看该作者
原帖由 potomac 于 2007-4-12 23:00 发表

说的不是这个,
而是说今后X86提速是靠SIMD还是靠VLIW。:p

VLIW基本没戏,将来的趋势是in order,SIMD,many core
回复 支持 反对

使用道具 举报

24#
发表于 2007-4-13 11:48 | 只看该作者
原帖由 来不及思考 于 2007-4-12 23:39 发表
DX11 MS要加OOO进去


DX11 MS要加OOO进去做什么?这东西对3D图形有帮助吗?o:)

[ 本帖最后由 SM5 于 2007-4-13 16:39 编辑 ]
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
25#
发表于 2007-4-13 11:54 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

venturex 该用户已被删除
26#
发表于 2007-4-13 11:59 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

27#
发表于 2007-4-13 12:45 | 只看该作者
原帖由 potomac 于 2007-4-13 11:54 发表

对于通用计算来说,
OoO的效率肯定是大于in Order的。
想在通用计算上复辟?w00t) :lol:

SIMD,已经发展的很完善了。
再完善下去,偶已经看不出SIMD和VLIW的区别了。w00t) :lol:

至于超多核,
先 ...

In order的好处在于省电,性能/功耗比优势很大,通用计算的话In order是方向,就是要复辟了。
SIMD和VLIW还是有本质区别的:SIMD不能对数据进行不同的操作,而且数据的向量化很难的。
回复 支持 反对

使用道具 举报

28#
发表于 2007-4-13 13:11 | 只看该作者
原帖由 potomac 于 2007-4-13 11:54 发表

对于通用计算来说,
OoO的效率肯定是大于in Order的。
想在通用计算上复辟?w00t) :lol:

SIMD,已经发展的很完善了。
再完善下去,偶已经看不出SIMD和VLIW的区别了。w00t) :lol:

至于超多核,
先 ...


OoO是什么意思?:blink:
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
29#
发表于 2007-4-13 15:45 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
30#
发表于 2007-4-13 15:54 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

31#
发表于 2007-4-13 16:16 | 只看该作者
在线性代数的计算方面(图表的左边),GPU较CPU领先。而从图片和视频的处理,一直到分类、解析几何等等的用途上,CPU逐渐找到了自己的优势。这一图表中的用途有着这样的特点,越靠右边的领域其算法越是无序,也就是他所讲的“自然”,这是CPU的优势。而越靠左边的计算需求更加有序、“不自然”,这是GPU的优势所在。
因此,这场战争的关键所在似乎是程序算法的争夺。为了获取利润,GPU厂商会鼓励开发者编写更加整齐规律的算法,而CPU厂商则认为越无规律越好。

看谁拧得过谁,拭目以待了:lol:
回复 支持 反对

使用道具 举报

32#
发表于 2007-4-13 16:56 | 只看该作者
原帖由 potomac 于 2007-4-13 15:54 发表

算了吧,看看Power为了多线程所花的开销就知道谁是方向了。
顺带说下,SUN也要搞OoO啦。w00t) :lol:

提高处理器性能有两个途径。
1,是提高频率。
2,是提高指令数目。SIMD只能提高特定类型的处理能力 ...

performance = frequency * IPC(nstruction per cycle, 不是指令数)这是以前的公式,强调频率和指令间并行性(ILP)。
近些年来,体系结构设计者注意到提高frequency和IPC的难度和功耗的不经济性,都转移去考虑提高线程级并行性了(TLP)(你可以查查最近的体系结构和编译器方面的会议的文章,研究ILP的越来越少了,TLP很热),所以新的公式:
performance = frequency * IPC * number of core/thread
不是说多核的架构没有提升的余地了,但是提升的代价太大回报太小。
VLIW的本质是in order的,由编译器来发掘ILP,处理器不做任何调度,你看好VLIW却不看好In order,我不是太理解。
回复 支持 反对

使用道具 举报

33#
 楼主| 发表于 2007-4-13 17:10 | 只看该作者
原帖由 gazel 于 2007-4-13 16:56 发表

performance = frequency * IPC(nstruction per cycle, 不是指令数)这是以前的公式,强调频率和指令间并行性(ILP)。
近些年来,体系结构设计者注意到提高frequency和IPC的难度和功耗的不经济性,都转移去考 ...

这个还是要看设计针对的应用领域,服务器那当然是thread越多越好,用SMT的话也可以减轻in order的负面影响。
但是客户端不一样啊,OOO做了这么多年,潜力都被挖掘的差不多了,投入产出比远不如TLP嘛,所以发论文就都是TLP了。
不过我同意你的看法,这个领域里还是in-order + SMT + many core比较合适

[ 本帖最后由 Prescott 于 2007-4-13 17:12 编辑 ]
回复 支持 反对

使用道具 举报

34#
发表于 2007-4-13 17:27 | 只看该作者
原帖由 Prescott 于 2007-4-13 17:10 发表

这个还是要看设计针对的应用领域,服务器那当然是thread越多越好,用SMT的话也可以减轻in order的负面影响。
但是客户端不一样啊,OOO做了这么多年,潜力都被挖掘的差不多了,投入产出比远不如TLP嘛,所以发 ...


以我看来,客户端的长远发展方向也应该向着in-core, 异构many core前进(要么就是将来大家的客户端都很瘦,计算在服务器上做)。关键是现有的程序怎么办,还有怎么样帮助程序员写好新架构的程序(免费的午餐没了:a),程序员自己需要努力考虑怎样利用硬件才能发挥最大性能。
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
35#
发表于 2007-4-13 17:43 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

36#
发表于 2007-4-15 12:09 | 只看该作者
GPU HIT CPUw00t)
回复 支持 反对

使用道具 举报

37#
发表于 2007-4-16 12:34 | 只看该作者
原帖由 Albatron 于 2007-4-13 16:16 发表


看谁拧得过谁,拭目以待了:lol:


说白了还是在比钱,有了钱叫程序员干什么都行
回复 支持 反对

使用道具 举报

38#
发表于 2007-4-16 16:02 | 只看该作者
原帖由 SM5 于 2007-4-16 12:34 发表


说白了还是在比钱,有了钱叫程序员干什么都行


有钱能使鬼推磨:funk:
回复 支持 反对

使用道具 举报

39#
发表于 2007-4-17 12:16 | 只看该作者
原帖由 红发IXFXI 于 2007-4-12 12:27 发表
:funk: 这样搞下去cpu和图形区可以合并了。。。intel和amd在显卡上面又开始对战了


MAYBE:p
回复 支持 反对

使用道具 举报

40#
发表于 2007-4-17 13:01 | 只看该作者
什么时候可以出来???
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-1-8 01:54

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表