POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 1724|回复: 17
打印 上一主题 下一主题

叹息啊!最该SMT的U没上SMT

[复制链接]
跳转到指定楼层
1#
发表于 2006-5-25 20:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Conroe的执行单元特别多,开SMT性能提高很大的。

Conroe应该有集成了HyperThreading功能的,只是还没打开而已。谣传打开功耗太大,不是特别可信,因为已有Netburst的先例了,散热、电源业已准备好了。可能45nm时候会打开。

所谓的Anti-HT,根本不是什么新东西,你认为它和SMT有什么区别?两个核心耦合更紧密而已,可以把一个核心的执行单元派遣给另外一个使用。这和单个集成很多执行单元的核心SMT有什么不同?如果我把P4E 叫做一个双核心U,每个Thread由其中一个核心发出,妥当吗?

双核心U的特点就是在于执行单元不共享,从而降低调度的exp(n)难度。如果可以共享,就不叫双核心,共享越多,就越有单核SMT的特征。

估计Anti-HT也只有在SIMD等调度不多的指令上应用。
RacingPHT 该用户已被删除
2#
发表于 2006-5-25 21:35 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

3#
发表于 2006-5-25 21:45 | 只看该作者
原帖由 RacingPHT 于 2006-5-25 21:35 发表
个人认为Anti-HT这样的技术是真正伟大的技术, 实现起来也可以想象难度非常高. 依靠线程来实现并行是十分困难的, 至少会造成软件开发能力的巨大倒退. 线程不仅OS相关, 而且与核心数量相关, 这样用户得到性能提升的 ...

从本质上说,所谓antiHT跟依靠线程实现并行是没有区别的,只不过一个固化在cpu内部而已。两者的难度是一样的
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
4#
发表于 2006-5-25 21:53 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

Woodcrest 该用户已被删除
5#
发表于 2006-5-25 22:13 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

6#
发表于 2006-5-25 22:18 | 只看该作者
原帖由 RacingPHT 于 2006-5-25 21:35 发表
个人认为Anti-HT这样的技术是真正伟大的技术, 实现起来也可以想象难度非常高. 依靠线程来实现并行是十分困难的, 至少会造成软件开发能力的巨大倒退. 线程不仅OS相关, 而且与核心数量相关, 这样用户得到性能提升的 ...

大师,问一下,逆向超线程不是
anti-HT技术刚好相反,它允许你将两个物理处理器作为一个虚拟处理器使用,从而在应用程序包括非多多线程应用程序中也能获得性能提高。
么?哪里来得
这样用户得到性能提升的几乎其实十分渺茫, 因为用户不会总同时干n件毫不相关的事.
?????越看越迷糊。。。。。。。。。
回复 支持 反对

使用道具 举报

7#
发表于 2006-5-25 22:22 | 只看该作者
原帖由 RacingPHT 于 2006-5-25 21:53 发表


如果说性能的话, 你是对的.

但是从软件的角度来说, 就完全不一样. 比如针对双核开发的游戏, 到四核上, 就不能发挥; 反之则是优化变成劣化. 如果硬件本身真可以实现抽象的话, 就变成类似于GPU的东西了, 无论 ...

我说的是难度,目前对于多线程并行开发没有什么好的方法
而如果antiHT可以实现的话,软件同样能够实现了
回复 支持 反对

使用道具 举报

8#
发表于 2006-5-25 22:39 | 只看该作者
看好K10的反超线程
回复 支持 反对

使用道具 举报

Woodcrest 该用户已被删除
9#
发表于 2006-5-25 22:42 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
10#
发表于 2006-5-26 20:37 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
11#
发表于 2006-5-26 20:40 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

12#
发表于 2006-5-26 23:09 | 只看该作者
首先我认为反向超线程技术上不可行,还是我原来那句:一个人可以同时搭两台车吗?当然技术上的东西我这种菜鸟知道的太少,可能哪天真会有了解决办法也不一定?但是我认为从实用角度同样不可行。两个物理核心当一个用?它们提升性能的办法无非就是加大了发射宽度,让指令并行化程度提高而已,但是提升IPC的方法近十年来早已被证明是效率最低的提升性能的办法了。单个线程很难找到如此多的可以同时发射的并行指令,RISC普遍做到4发射、5发射就停止了,而它们简单指令的特征做多发射是很容易的,增加执行单元的难度很低,但还是停止了毫无意义的IPC竞赛转而将增加的部件做成了第二个核心,率先实现多核概念。SMT和CMP这些以实现粗粒度并行为目标的技术,就是针对增大IPC的做法日益跟不上形势需要而出现的。所以才会说“多线程才是唯一的救世主”。所谓的反向超线程无非又是走回了利用资源增加增大IPC的老套路,一般的单线程实际应用IPC都不超过2,Conroe虽然加大了发射能力,但总体的性能提升还是综合了多方面的技术应用来实现,并不只是一个四指令发射就完了。做到四指令发射的CPU RISC体系那边老早就有了,不见得是四指令发射就很厉害吧?
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
13#
发表于 2006-5-27 13:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

14#
发表于 2006-5-27 15:40 | 只看该作者

回复 #13 RacingPHT 的帖子

EPIC不就是大编译思想的产物吗?但是同样也要走CMP和SMT的路子。如果把核心数量给屏蔽了,又如何实现核心间的资源分配?
回复 支持 反对

使用道具 举报

RacingPHT 该用户已被删除
15#
发表于 2006-5-27 17:23 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

16#
发表于 2006-5-27 17:34 | 只看该作者
原帖由 RacingPHT 于 2006-5-27 17:23 发表
如何在不确定的目标硬件上做核心资源分配呢?1核,2核,4核,SMT,...,难道全部要分别写?
用户关心的只是结果,而不是过程。

这就是现代编译器和操作系统要解决的问题,即实现并行处理的无缝扩展。
回复 支持 反对

使用道具 举报

17#
发表于 2006-5-27 17:36 | 只看该作者
原帖由 FENG950 于 2006-5-27 17:34 发表

这就是现代编译器和操作系统要解决的问题,即实现并行处理的无缝扩展。

但是并不意味着要无视核心喔。看到BLUE GENE了吧?简单的增加单元节点就可以提升性能将对手甩在后面,这里的系统编写也很重要喔。
回复 支持 反对

使用道具 举报

18#
发表于 2006-5-27 17:45 | 只看该作者
:sleeping:个人系统反正不会有太高的并行度,意义不大
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2026-1-10 15:35

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表