POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3905|回复: 21
打印 上一主题 下一主题

和CPU有关,也发这里。预示丹佛前途无量?--暴增20% 新研究可大幅提升AMD CPU

[复制链接]
跳转到指定楼层
1#
发表于 2012-2-8 11:40 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
2012-02-08 10:22:49 1843 人阅读 编辑:朝晖 [复制链接] [我要爆料]
AMD 2012-2013年的路线图中,高性能CPU已经不再是公司重点,而CPU性能也一直是A饭心中的痛,不过AMD虽然在CPU硬件设计落后了,但是还有机会后天补足,北卡罗纳大学的研究人员找到新方法可以让AMD Fusion APU性能有20%以上的提升,最重要的是这并不是通过超频来实现的
这项研究的基础还是之前谈论过的,CPU擅长任务分配、数据预读/解码,而GPU拥有强劲的浮点计算能力,目前APU虽然同时集成了CPU和GPU,但是二者依然是独立工作。为了达成性能提升的目标,研究人员将CPU的任务精简为预读/解码,而GPU将担负主要的计算工作,这样一来CPU就变成了只为GPU预读数据,而GPU则全速运行,成为计算的中心,最终实现20%以上的性能提升

集成CPU和GPU单元的APU也许就是AMD翻身的法宝
目前北卡罗纳的研究人员尚未公布具体细节,只知道是用软件方式调整的,他们可能会提供一份代码或者编译器。实际上北卡罗纳大学公布的新闻上也没有具体提及是系统运行提升20%或者是Crysis 2游戏性能提升20%,具体的细节还要等到2月27日召开的“高性能计算架构国际会议(International Symposium on High Performance Computer Architecture)”上才会公开。
论文合作者Huiyang Zhou(周惠阳?看名字倒像是是个华人或者华裔)之后公布了一些资料,这项研究并非在实际产品上进行的,而是用软件模拟了AMD还未发布的的、共享L3缓存的APU(可能是Trinity APU),也就是说目前的性能提升还只是理论上的。
无论如何,一旦这项研究成真,那么AMD的APU肯定是最大的受益者,而CPU性能孱弱的尴尬或许能得到缓解,AMD自己也在做这方面的研究,他们公布的HSA架构也是充分CPU和GPU所长,只是目前还没有具体成果罢了。
目前论文还没有公布,有兴趣的话可以去北卡罗纳大学的新闻页面去看看。(文/超能网


2#
发表于 2012-2-8 11:41 | 只看该作者
AMD以后主打的就是APU
回复 支持 反对

使用道具 举报

3#
发表于 2012-2-8 11:44 | 只看该作者
北卡罗莱纳州大学和AMD公司的研究人员们最近找到了一种新方法,能够让AMD APU、Intel Sandy Bridge这种集CPU、GPU于一体的融合型处理器获得平均20%以上的性能提升,最多可翻一番还多。工程师们主要是利用了x86处理器的一些独特性质,比如说数据预取和大容量缓存,从而在GPU上加速并行任务的执行。

研究论文作者之一、电子与计算机工程副教授周惠阳博士(Dr. Huiyang Zhou)认为:“芯片厂商开发了‘融合架构’的处理器,将CPU、GPU整合在单独一颗芯片上。这种方法降低了制造成本,让计算机更加高效,但是CPU核心、GPU核心仍然都几乎完全在执行各自不同的功能,很少能够合作执行任何程序,因此没有预想得那么高效。这就是我们要争取解决的问题。”

他进一步解释说:“我们的方法是让GPU核心去执行计算型功能,同时让CPU从片外主内存中预取GPU所需要的数据。这样做的效率更高,因为它能让CPU、GPU去做各自擅长的事情:GPU的长项是进行计算,CPU则适合做出决定、弹性获取数据。”

其实CPU、GPU从主内存中获取数据的速度是差不多的,但如果能让CPU来提前判断GPU所需数据,并拿来做好准备,GPU就可以减轻负担,全身心投入到执行和计算中去了,效率自然可以得到提升。

在一个由CPU辅助进行的GPGPU处理器中,CPU启动一个GPU程序后,会创建一个预执行程序。该程序使用编译器算法从GPU内核中自动生成,包含GPU内核多个线程块的内存访问指令。CPU预执行程序会在GPU内核之前运行,这是因为:第一,CPU预执行线程仅包含来自GPU内核的内存拾取指令,没有浮点计算;第二,相比于GPU标量核心,CPU的运行频率更高,指令级的并行度也更高。

研究人员们还利用了CPU二级缓存的预取能力,来提高CPU的内存带宽,因此GPU线程访问内存对三级缓存的依赖及其延迟都大为降低。

此外,因为预执行程序是直接由用户级的应用程序控制的,精度和弹性都非常高。

工程师们通过对一系列基准测试进行试验,最后得出结论称这种方法可将处理器性能平均提升21.4%,最多可达惊人的113%。

这篇名为《CPU-GPU融合架构上的CPU辅助GPGPU》(CPU-Assisted GPGPU on Fused CPU-GPU Architectures)的论文将于二月底在新奥尔良举行的第18届国际高性能计算机架构研讨会上公布。该论文的作者还有北卡罗来纳州大学的在校学生Yi Yang、Ping Xiang(看来都是华裔人士),以及来自AMD公司的Mike Mantor,而为研究提供资助的是美国国家科学基金会和AMD公司。
回复 支持 反对

使用道具 举报

4#
发表于 2012-2-8 11:54 | 只看该作者
本帖最后由 por008 于 2012-2-8 11:55 编辑

LS的,你们的信息过时了,看看最新的
AMD资助:新法让CPU+GPU融合处理器性能暴增113%
2012-02-08 11:23:51 1213 人阅读 作者:上方文Q 编辑:上方文Q [复制链接] [我要爆料]

北卡罗莱纳州大学和AMD公司的研究人员们最近找到了一种新方法,能够让AMD APU、Intel Sandy Bridge这种集CPU、GPU于一体的融合型处理器获得平均20%以上的性能提升,最多可翻一番还多。工程师们主要是利用了x86处理器的一些独特性质,比如说数据预取和大容量缓存,从而在GPU上加速并行任务的执行。

研究论文作者之一、电子与计算机工程副教授周惠阳博士(Dr. Huiyang Zhou)认为:“芯片厂商开发了‘融合架构’的处理器,将CPU、GPU整合在单独一颗芯片上。这种方法降低了制造成本,让计算机更加高效,但是CPU核心、GPU核心仍然都几乎完全在执行各自不同的功能,很少能够合作执行任何程序,因此没有预想得那么高效。这就是我们要争取解决的问题。”

他进一步解释说:“我们的方法是让GPU核心去执行计算型功能,同时让CPU从片外主内存中预取GPU所需要的数据。这样做的效率更高,因为它能让CPU、GPU去做各自擅长的事情:GPU的长项是进行计算,CPU则适合做出决定、弹性获取数据。”

其实CPU、GPU从主内存中获取数据的速度是差不多的,但如果能让CPU来提前判断GPU所需数据,并拿来做好准备,GPU就可以减轻负担,全身心投入到执行和计算中去了,效率自然可以得到提升。

在一个由CPU辅助进行的GPGPU处理器中,CPU启动一个GPU程序后,会创建一个预执行程序。该程序使用编译器算法从GPU内核中自动生成,包含GPU内核多个线程块的内存访问指令。CPU预执行程序会在GPU内核之前运行,这是因为:第一,CPU预执行线程仅包含来自GPU内核的内存拾取指令,没有浮点计算;第二,相比于GPU标量核心,CPU的运行频率更高,指令级的并行度也更高。

研究人员们还利用了CPU二级缓存的预取能力,来提高CPU的内存带宽,因此GPU线程访问内存对三级缓存的依赖及其延迟都大为降低。

此外,因为预执行程序是直接由用户级的应用程序控制的,精度和弹性都非常高。

工程师们通过对一系列基准测试进行试验,最后得出结论称这种方法可将处理器性能平均提升21.4%,最多可达惊人的113%。

这篇名为《CPU-GPU融合架构上的CPU辅助GPGPU》(CPU-Assisted GPGPU on Fused CPU-GPU Architectures)的论文将于二月底在新奥尔良举行的第18届国际高性能计算机架构研讨会上公布。该论文的作者还有北卡罗来纳州大学的在校学生Yi Yang、Ping Xiang(看来都是华裔人士),以及来自AMD公司的Mike Mantor,而为研究提供资助的是美国国家科学基金会和AMD公司。

很显然,AMD未来的Fusion APU非常有希望用到这些技术。
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2012-2-8 12:02 | 只看该作者
por008 发表于 2012-2-8 11:54
LS的,你们的信息过时了,看看最新的
AMD资助:新法让CPU+GPU融合处理器性能暴增113%
2012-02-08 11:23: ...

其实都是同一条。你的标题的113%是最高达到,我们的20%说的是平均提升。
回复 支持 反对

使用道具 举报

头像被屏蔽
6#
发表于 2012-2-8 13:07 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

7#
发表于 2012-2-8 13:54 | 只看该作者
再次坐等推土机似的笑话震惊业界
有阿曼达的地方就死心吧
坐等丹佛被atom踢爆
回复 支持 反对

使用道具 举报

8#
发表于 2012-2-8 15:14 | 只看该作者
搬板凳看戏,某些ID总是喜欢盲目乐观,似乎把开发这种异构运算的程序当成了Easy难度。
回复 支持 反对

使用道具 举报

9#
发表于 2012-2-8 15:17 | 只看该作者
异构运算在CELL上已经尝试过了,结果嘛……
回复 支持 反对

使用道具 举报

10#
发表于 2012-2-8 15:20 | 只看该作者
APU目前的价位提不起兴趣啊
回复 支持 反对

使用道具 举报

11#
 楼主| 发表于 2012-2-8 15:23 | 只看该作者
本帖最后由 gzpony 于 2012-2-8 17:27 编辑
eternal0 发表于 2012-2-8 15:14
搬板凳看戏,某些ID总是喜欢盲目乐观,似乎把开发这种异构运算的程序当成了Easy难度。

有paper,有软件,还怕骗了你不成。

依我看,这软件再提升一下兼容性之类就可能以补丁的方式由AMD或者MS来发放了。到时大家跑跑看就是。

没有一定难度的事情都写不成paper。
原本我认为AMD的搞不成,因为NV才在通用运算投入大和领先大,丹佛可能是第一个这种形式的融合cpu,AMD的要等下几代;现在没想到AMD依靠美国大学的力量,搞成一些了。当然硬件的融合还不很够,所以这软件的效果也不会很好,但有效果就好。
回复 支持 反对

使用道具 举报

12#
发表于 2012-2-8 16:20 | 只看该作者
还是在论文阶段呀,而且AU提升个20%也是不够的
回复 支持 反对

使用道具 举报

13#
发表于 2012-2-8 20:53 | 只看该作者
Tempestglen 发表于 2012-2-8 13:07
这不就是丹佛计划的思路嘛'amd也走上这条路了

丹佛计划就是把arm的cpu塞进maxwell的gpu里面'显存当内存用 ...

哈哈哈,t神又在脑补了,塞进gpu里面去,真的嫌面积不够大,不够热是吧,您的板子上没有cpu槽了是吧,您就直接说做集成板子不就完了么。思路,哼哼,nv显卡敢不兼容intel的u,首先死的就是整个显卡部门。
回复 支持 反对

使用道具 举报

14#
发表于 2012-2-8 20:55 | 只看该作者
gzpony 发表于 2012-2-8 15:23
有paper,有软件,还怕骗了你不成。

依我看,这软件再提升一下兼容性之类就可能以补丁的方式由AMD或者 ...

依你看,您大概不知道实验室里的技术和能转化成成品的技术之间隔着一道多大鸿沟吧。如果光靠论文的话,早在前几年光计算机和dna计算机就已经比这玩意实用的多了,而且都有过实际测试,论文里面比这个yy的太多太多了,要是这个也算的话,那个搞笑的反超线程早就实用化了。
回复 支持 反对

使用道具 举报

头像被屏蔽
15#
发表于 2012-2-8 21:08 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

16#
发表于 2012-2-8 21:17 | 只看该作者
Tempestglen 发表于 2012-2-8 21:08
你家intel不是吹嘘待机只有20mw的atom嘛
满载也不过2w

haha,apu才是什么性能等级啊,莫非您家maxwell也想要这个性能是吧,这对于a社来说可是个惊天好消息啊,一下子能独霸整个独立显卡市场,就是不知道您家nv敢不敢呢
回复 支持 反对

使用道具 举报

17#
 楼主| 发表于 2012-2-8 21:17 | 只看该作者
Tempestglen 发表于 2012-2-8 21:08
你家intel不是吹嘘待机只有20mw的atom嘛
满载也不过2w

amd目前看来也是属于中弱cpu+中强gpu的格局,和NV的类似。

intel嘛,强cpu弱gpu,而且强cpu赚钱这么多,怕是进步的动力不足,或者搞出来的也先躺在实验室晾一晾
回复 支持 反对

使用道具 举报

18#
发表于 2012-2-9 03:22 | 只看该作者
这个实现了也正常的,因为现在许多程序针对多核就没有优化过的,只要做优化,性能肯定是有提升的,只是幅度问题。AMD的推土机在设计的体系结构上更像INTEL的至强,是针对服务器和工作站负载重的情况设计的,用在家用有些不合适的。
回复 支持 反对

使用道具 举报

头像被屏蔽
19#
发表于 2012-2-9 07:50 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
发表于 2012-2-9 19:40 | 只看该作者
Tempestglen 发表于 2012-2-9 07:50
nv在显卡市场的占有率只有20%,独立显卡也只有50%,这部分市场的利润只有intel ibm的cpu市场的零头。我看你 ...

哟,终于按捺不住了呢,好吧,我承认您有B数,哈哈,做这种梦的好像不是nv而是t神而已。nv自己都不敢说的话,想不到t神说了,好吧,顶级gpu居然是集成显卡,可惜啊,当年sli坚贞了好几年最后也无奈的撤去了贞节牌坊。amd自己都不敢说gpu不兼容i社,t神又代表的先进生产力的发展方向?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-23 03:23

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表