POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: fzmailyl
打印 上一主题 下一主题

我对超线程的一个理解是CPU一旦碰到100%满戴的程序超线程就无用了。。对不对??

[复制链接]
21#
发表于 2013-5-22 17:40 | 只看该作者
xf-108 发表于 2013-5-22 16:44
haswell哪里有四个ALU啊,那是被毙掉的老方案了,不然也就不会只有这么点性能增长了。

您认为今年IDF beijing的幻灯片是胡扯的?
IVB的0、1、5 Port上挂了ALU,Haswell增加了两个Port,6号Port上边挂了一个ALU,同时有分支功能;7号Port上挂了Store AGU
回复 支持 反对

使用道具 举报

22#
发表于 2013-5-22 17:41 | 只看该作者
现在的单线程性能问题并不是说CPU的资源不够,而是桌面程序难以利用到增加的ALU
且看服务器好了。
回复 支持 反对

使用道具 举报

potomac 该用户已被删除
23#
发表于 2013-5-22 18:04 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

24#
发表于 2013-5-22 18:56 | 只看该作者
itany 发表于 2013-5-22 17:40
您认为今年IDF beijing的幻灯片是胡扯的?
IVB的0、1、5 Port上挂了ALU,Haswell增加了两个Port,6号Por ...

PRAM说那个是最初大改的老方案了,真的改动那么大的话,性能增长不会只有这么点。实际成品不是这样的,基本就是小打小闹,所以才造成性能停滞的现状。

更早之前还有一个大大改方案,同频单线程能提升30%,使用eDRAM取代SRAM作为Cache,这么激进的方案早就被pass了。
回复 支持 反对

使用道具 举报

25#
发表于 2013-5-22 18:58 | 只看该作者
本帖最后由 xf-108 于 2013-5-22 19:46 编辑
itany 发表于 2013-5-22 17:41
现在的单线程性能问题并不是说CPU的资源不够,而是桌面程序难以利用到增加的ALU
且看服务器好了。


原来intel用的是超标量设计,3个ALU给四个发射端口用,现在还是四个发射端口,所以单线程增长不大。但是超线程的时候,运算资源不足,增加的单元用处就来了。
现在很明显的,haswell多线程性能照样没多少增长,这其实已经说明了运算资源没怎么增加。
回复 支持 反对

使用道具 举报

26#
发表于 2013-5-22 19:34 | 只看该作者
acqwer 发表于 2013-5-22 16:22
Nahelem流水线16级

HASWELL 呢?  WIKI上说是14级 CORE以来 一直是短流水线了
回复 支持 反对

使用道具 举报

27#
发表于 2013-5-22 19:46 | 只看该作者
PRAM 发表于 2013-5-22 19:34
HASWELL 呢?  WIKI上说是14级 CORE以来 一直是短流水线了

SNB/IVB/HSW没听说有改流水线级数,姑且认为都是16级吧,不增加就算不错了,流水线也不是越短越好的。
回复 支持 反对

使用道具 举报

28#
发表于 2013-5-22 21:12 | 只看该作者
xf-108 发表于 2013-5-22 18:58
原来intel用的是超标量设计,3个ALU给四个发射端口用,现在还是四个发射端口,所以单线程增长不大。但是 ...

什么乱七八糟的啊
Ivy Bridge是6个发射端口(0-5),其中0、1、5挂的是ALU+整数SSE,再其中0、1上边挂浮点SSE和AVX。2、3上边挂的是读写AGU,4是写数据。Haswell增加到了8个口,增加了一个ALU+分支和一个写AGU

本来这就是公认的,哪来的四个发射口啊
回复 支持 反对

使用道具 举报

29#
发表于 2013-5-22 21:21 | 只看该作者
xf-108 发表于 2013-5-22 19:46
SNB/IVB/HSW没听说有改流水线级数,姑且认为都是16级吧,不增加就算不错了,流水线也不是越短越好的。

一般是这样算的,从微操作缓存(在decode环节之后)开始是14级,从取指到解码完毕应该是5级,这样如果微操作缓存没有命中是19级
回复 支持 反对

使用道具 举报

30#
发表于 2013-5-22 21:30 | 只看该作者
itany 发表于 2013-5-22 21:12
什么乱七八糟的啊
Ivy Bridge是6个发射端口(0-5),其中0、1、5挂的是ALU+整数SSE,再其中0、1上边挂浮 ...

好吧……我的意思是,haswell依然只是四发射处理器……

据说,这个方案是老方案了,因为功耗和进度不理想就砍了。新方案是个猴版,所以性能原地踏步。
回复 支持 反对

使用道具 举报

31#
发表于 2013-5-22 21:56 | 只看该作者
xf-108 发表于 2013-5-22 21:30
好吧……我的意思是,haswell依然只是四发射处理器……

据说,这个方案是老方案了,因为功耗和进度不理 ...

我认为对于x86来说,单线程瓶颈并不是在4发射上边了。
别看前边是4发射,因为x86的内存访问特性,决定了需要额外的AGU(因为内存-寄存器,寄存器-内存,等运算)

关键是传统的体系要提升IPC已经很难了,要提高也是搞新架构了。
回复 支持 反对

使用道具 举报

32#
发表于 2013-5-23 13:29 | 只看该作者
itany 发表于 2013-5-22 15:22
Haswell有四个ALU,没有哪个x86程序能神一样的让这四个都满载的。
现在就是数据依赖性导致的IPC拉升困难 ...

只是为了让alu全都满载而写个程序的话太轻松了
回复 支持 反对

使用道具 举报

33#
发表于 2013-5-23 13:31 | 只看该作者
itany 发表于 2013-5-22 15:37
AMD没有技术做超线程,也没有技术互联8个及以上的核心
不进行技术预研的后果,农企一样的经营态度

。。gpu其实就是N个核心但每个核心都很简单的cpu...
回复 支持 反对

使用道具 举报

34#
发表于 2013-5-23 13:32 | 只看该作者
kakaku.bj.cn 发表于 2013-5-23 13:29
只是为了让alu全都满载而写个程序的话太轻松了

说的是实际有用的程序,不是烤鸡程序
回复 支持 反对

使用道具 举报

35#
发表于 2013-5-23 15:40 | 只看该作者
大多数普通家庭的电脑不会百分百。。。。除非中了病毒。。。
所以。。。超线程无用
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-8-5 10:59

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表