POPPUR爱换
标题: HT超线程是INTEL和微软好基友互撸的爱情结晶! 转载 [打印本页]
作者: AMD_BEST 时间: 2012-8-31 11:19
标题: HT超线程是INTEL和微软好基友互撸的爱情结晶! 转载
每一个贴子都是观点的论证和分析,我首先对发表上述贴子的网友的发贴劳动表示敬意。
但是上面贴子观点中说到对 HT超线程的“意淫”、“坑爹”论,我并不苟同,这完全有偏激的误导倾向了!
论坛的作用是交流个人体验和感受,而不是误导!因为误导而申精,是对大众的不负责任!
在阐述一种技术性话题,特别是武断定性作用下,产生莫需有的个人情绪和某种不容置疑的态度,不配谈技术!
本贴较长,会占用你大约一个小时的阅读和更多的思考时间!如果说本贴中有个人情绪所在,我只是对上述地址贴子的表达观点产生反驳,非人参公鸡!
文字不是用来装13的,而是用来阅读的!感谢您关注本贴!
十年前,P4+XP 是 HT超线程技术的初次登场,这是一种尝试,也代表着一种无奈和失败。而十年前使人们对 HT 的缺陷形成了惯性放大思维。
因此从正面角度宣传,来改变人们的固有观念,这很难,而且代价更大。而且到目前为止还有不少人继续坚持 XP ,继续以主频至上。
这给他们带来了一种幻觉——XP是够用的,超主频是很爽的,多线程是未来才会用的,HT 是坑爹的……
这种错觉是一种停滞的保守,是对未知的恐惧,更象是留恋坐井观天的安逸。
本贴将给大家带来的观点是:
一、HT超线程体现在 I7 上是一个卖点,体现在 E3 上是一个亮点;一千多块钱都舍得掏,不要白不要!
二、你不要HT还非要说这东西不好、浪费钱……只能说明 INTEL 和微软没有骋请你是它们最大的失败!
三、CPU的超线程技术是目前解决冯诺依曼计算机执行效率不高的最佳出路!
四、E3 被玩家们关注和仇恨,很有可能是 INTEL 故意为之——先不夸大宣传 I7 时期的第二代超线程有何特色,低调的让大家尝尝 HT 发威的甜头,以后……没有以后了,大家看着办吧!
序言:什么是第二代HT超线程技术
或许我们可以不用说“第二代”这三个字,因为从 HT 的本质特征以及一些专业术语的解释上来看,这与当初的 P4 HT 没有什么两样。
但是我们又在这里称之为第二代HT,主要是处理器的带宽、驱动程序的完善、操作系统的高度进步这些外界条件,促成了 HT超线程的新生!
操作系统对多线程的调度机制决定了HT超线程的实用价值
WINDOWS 7 对多线程的调度机制分为主动授予和被动授予。
主动授予是什么?
就是软件本身的进程划分了几个线程,那么操作系统根据软件的调度需求和设定,针对性的分配多少线程数量与并行执行的逻辑通道数量。
对于其本身就是单线程或双线程的任务,7系统还不会自作多情的把闲置的几个运算单元都用上,用多线程的热情去贴单线程的冷屁股:

主动授予的优点:
一、几线程的任务进程用几线程的 CPU 来跑,资源利用率在概定范围内是最合理的;
二、依靠 CPU 的主频频率可以提升软件执行效率的同步递增;
三、数据运算压力不大,满足于实时运算的需求。
缺点:
一、单线程或四线程以内的任务进程依靠CPU 的单核运算效率;
二、在线程数固定优化的前提下,多出来的逻辑运算单元被闲置;
三、面对即时瞬间增大的高密度运算力不从心,一个进程在几十倍甚至上百倍的线程分配时,CPU极易出现超负荷状态而使执行效率大大降低。
的确,单纯站在主动授予的立场上,你可以拳打 INTEL 脚踢 AMD ,并且可以气壮山河的把超线程丢进粪坑!
也的确,同为这种立场上,其实也可以认为——四核处理器最好提都不要提,因为按这种主观延伸,现在声称完全、绝对支持四线程的软件也是很少的,双核才是王道斯密大,四核浪费钱,或许单核 P4 也可以出来扬眉吐气……
被动授予是什么?
就是操作系统根据软件运算需求,在达到运算相应比例的临界点时,调用CPU的所有运算资源进行执行任务的分担。
被动授予的特点:
它是待机触发式,在 WINDOWS 7 的线程调度下根据实时运算和即时响应,实现智能管理逻辑运算单元的分配。而并非臆想中的HT 无序执行会“拖慢”软件的执行速度,下面两个 AION 的游戏截图中 CPU 占用明确的表达了被动授予的动作:

从这些简单的例子就可以看出微软对 WINDOWS 7 对 CPU 资源的调度用心所在。AION 官方并没说支持多核超线程,并不代表 7 系统也是傻子。
有效的、合理的被动授予,是今后操作系统和 CPU 构架设计的重要方向,这决定了软硬件的智能协调能力。
主频没有过高的提升,多核是必然,而多线程是使然。多核芯代表着物理层面,多线程代表着逻辑层面。
作者: AMD_BEST 时间: 2012-8-31 11:20
HT超线程有没有缺点?
在 WINDOWS 7 之前,我们可以认为它是有缺点的。
因为 HT 是随机动态超线程,并且 XP 系统并不能很好的对 I7 这种高带宽的CPU 提供良好的优化。
HT是把CPU的空闲利用上了,只是在CPU的内部需要一个原本针对一个物理核的排队数据流向的再次分配动作。之前说 HT 打开后会拖慢CPU速度,就是指在这里产生了数据分配动作的延迟(线程指令计数器、线程状态寄存器、线程寄存器资源分配),也可以理解为P4时代的软件、芯片组、驱动甚至操作系统并没有同步跟上线程的分配。这个看上去似有似无的延迟周期是超线程技术生来就俱有的,目前并没有准确的说法来给此事做个定义。请放心,INTEL 比我们用户更着急于如何解决这个问题,对于CPU本身来说,它的影响是很小很小很小很小的,就象 MMX 技术,谁能说开了这个指令,CPU自身就产生出一个莫虚有的延迟呢?
在目前我们所能找到的资料中,数据的分配周期只具有上限,不可能无休止增大(这要看微软的线程调度效率是否达到了让INTEL 兴奋的 G点),也就意味着这个周期可以减少、甚至在未来CPU构架技术更为先进时能够完全消除。我们目前看到的HT超线程功能的打开或关闭,是在主板BIOS下激活的,而不是软件激活,HT是CPU的内部功能,软件影响HT的拖滞很小,除非软件设计很脑残,或者软件的开发很原始。与以往支持 HT 超线程的CPU所不同的是,INTEL 给 I7 / E3 们提升了数据带宽后,也增大了三缓。这在第一代 P4 HT 处理器中是看不到或是局限于当时的技术水平无法实现的。
微软在Windows7之前的系统当中,对于多核心处理器的支持并不能说非常完美,以Vista或XP为例,只有特定软件优化之后才能充分利用多核心的效能,而且设计的时候最高只考虑了四核心设计,而对多线程它们的优化很单薄!
操作系统对多核处理器支持的缺失,无疑会造成多核处理器运算效能的下降。与游戏相同,如果系统提供了对多核处理器的有效支持,那么每个核心将会分担运算任务,大大减少CPU的负担,而如果没有提供相应的优化,那么将由单个或部分核心运算数据,其他核心将闲置,浪费了多核CPU的资源。
在INTEL和AMD的产品蓝图中,多核多线程的产品已经成为前进的固定路线,在这种情况下系统不支持对多核性能的发挥就设置了巨大的障碍,无法完整的利用CPU核心性能使得强大的CPU资源被白白的浪费掉。在操作系统中,在7系统问世之前只有Server2008支持最完善,不过作为服务器系统,对于娱乐项目的支持却显得非常苍白,所以急需在 Windows7 中加入完善的多核心超线程技术支持。
目前超线程序技术对运算资源空闲的利用原理,我们可以理解为提升效率或排序成高密度工作:

HT数据并行处理的原理

我们不难看出,给多个线程同时执行所需要的指令和数据,才是 HT 超线程的主要目的。如果学术点,可以称作“同步超线程并行处理”,多个线程之间是独立的,并不完全依懒于其它线程的执行,因此多个线程之间的任意指令均可以同时送到处理器被执行,即使提出一个单线程来看,于整个处理构架的影响是微乎其微的,但是融合为一体后从大局看,原来我们的处理器有这么多的执行动作。 I7 和 E3 表面上看是单独一块物理形态的 cpu ,实际上在它的内部是多个逻辑处理器。
四个水池子向一个大池子索求水,没有超线程的 I5 处理器,不过是四根相同粗细的消防带管子放在那里自由出水,水压不高,流量自然不大。超频也不过是增大管子的直径,流量比之前相比大了,但水压也只是相对之前的提高,依然不大。超频不等于执行效率的最大化。
而超线程处理器看上去每个逻辑单元比不上一个完整的物理运算单元,管子口径相同(必尽也是四个物理核),但是水压完全增大,同时流量也增大了。如果在这种情况下超频,那就更幸福了。
水压就是执行的效率,在本例中就是能不能把管子撑满。
游戏任务是一个系统化的软件工作流程。它要协调好处理器、内存、显卡、硬盘、芯片组总线、声卡等具体硬件项目;在软件上,它要进行主程序控制框架、人工智能、基础运算、伤害运算、网络数据、场景全局分析、图像工作指令、声音控制指令、内存单元分配、设备之间的互相调用、系统缓冲……等等一系列我们也许说不完整的宠大工作项目。这显然不是一个线程就可以办到的。
对于 AION 的程序员来说,具体支持多少核的处理器,是他们事先约定的一个出发点,比如 2005年就有双核了,2008年是 CORE2 普及年,程序员不可能精确到这个游戏一定要让多少核的处理器在跑,他们也不会刻意留心用户的系统是 XP 还是 7 ,他们始终是以 xp 平台来开发这个游戏的。在早期 7 系统对这个游戏兼容性并不是很好,直到微软在兼容性改进的 sp1 版发布后, AION 才登上 7 系统的大堂。
于 xp 来说,超线程的执行效率是很低下的,因为 2002 年的 XP 甚至连物理单元和虚拟单元都分不清楚。所以我们传统印象中对系统的线程调度和超线程的实际功效一直停留在十多年前。AION 这个软件也不例外。
与其说 AION 究尽支不支持多核超线程,不如说这是7系统在后台做出的努力。
7系统对线程调度的分配要求很简单,如果软件自己具备了多线程的优化或者它就是一个彻头彻底的单线程任务,那么就尊重软件的需要。如果软件处于高密度运算,而并没有对多线程逻辑运算单元进行限制时,7系统会根据处理器的工作负载占用情况,来对工作进程在合理范围内提供更多的运算资源。
图像引擎不能在中央处理器这种基础硬件的控制底层有任何小动作,7系统的绝对地位是不能被挑战的,INTEL 也不会允许它这么干。
超频的加入不过是增大管子的直径,但相对于最大水量来说的效率问题并没有解决。至少超线程的出发点是利用到更多的空闲,产生更高的效率。
这个在后面会给大家讲到——倍频超频CPU带来的HT超线程瓶颈。
作者: AMD_BEST 时间: 2012-8-31 11:20
主动授予式的双向支持是应用软件和操作系统一起并进的模式,效率是最高的。在明确声称支持几线程的单机游戏中,对应采用几个线程的处理器来执行也是最理想的。永恒之塔之类的大型 3D 游戏于cpu 的效率表现,也只能被动的授予。而评测报告中通常采用一些单机或联网对战游戏来评价超线程的作用实际上是一种很不公平的做法。单机游戏中即使联网对战,它所支持的玩家角色数量与真正意义上的纯网络游戏根本不是一个级别的,而网络游戏中的运算密度是即时动态的。
被动的授予只是提供了多线程处理器对软件的迎合机率及条件,在角色较少时超线程处理器的效率与普通双核和四核没有什么两样。在玩家角色较多时,面对 e3 这种不能超频的处理器,超线程的作用虽然在性质上无法与纯粹的物理运算核心相比、也无法与单机游戏中具体明确的双向支持相比,但在操作系统的作用下这些超线程运算单元被调用到了。
按线程动态状况分配处理器等资源,提高命令的并行执行度,这是超线程的本质。如果光靠处理器本身来完成线程的动态分配,这个我们在奔4时代也看到了,除非线程数持续周期比较多;否则它就是一个会影响线程数较少的环境下运算效率的鸡肋,这也是很久以来人们对它的传统认识,所以这与系统调度、处理器带宽、片内共享缓存等有直接的关系。P4 时代的 xp 系统,于线程的调度是很落后的。我一直反对用十年后的 I7 去装十年前的 XP 就是在这里。
7系统的线程调度是把任务进程进行运算线程到逻辑运算单元的对应划分,这与它调度的策略方案有关,我们说方案没有最好的,只有更好的。目前7系统和 sever 2008 应该是我们所能看到的更理想的线程调度平台(一般人很难从软件底层知道微软目前的调度方案是否绝对NB+宇宙第一,但至少我们看到在多线程运算方面7系统比XP 有进步)。
得益于数据带宽技术的发展进步,现的超线程处理器在比以往更短的时间里,于片内缓存中对线程运算指令和寄存器等进行了指令数据的排序,这与奔4在片内缓存的结构上也有不同,奔4的一缓16k,二缓2M,而 I7 一缓256K ,二缓 1M ,并为二缓提供更有效的缓冲存增开了 8M共享三缓,可以看出从片内缓存的细化分工上 I7 重新启用超线程的雄心就比较明朗了,至于自动加速的睿频,是按线程数和任务的活跃度开发的一个实用化功能。
在线程的调度中,对操作系统来说,判断其应用程序的主动性或被动性,来调用处理器的逻辑运算单元。对处理器来说,增大了各级缓存,并最终实现所有逻辑单元的共享缓存则对多线程的调度打下了硬件配合的基础。因此被动效率虽然无法与双向支持相比效率的完美,但至少它根据线程的数量提供了尽可能多的逻辑单元,而并不是简单到让人们看到八个框就产生一种心理上的优越感。在7系统下玩 AION ,超线程并没有无序杂乱。同种族场景中,2.4.6.8框喝茶的时候还是常有的。
于桌面民用级平台上玩大型3D游戏和网络游戏,这到是体现超线程价值的理想归宿
——你可以查看 WINDOWS 资源监视器的具体任务进程数。
被动授予是有极限的,在常规使用条件下,AION的线程数也平均最高在 106 - 110 左右。再高的话于 7 系统来说被认为是没有效率意义的,如果游戏软件身本没有针对多核多线程进行优化,即使操作系统后台再怎么进行调度分配,也不可能无休止的把一个进程划分出更多的线程,这样的话,系统完全崩溃,后台任务也跟着一起完蛋。而对于 AION 的开发者来说,也不可能给主进程划分更多的线程,每个被执行的序列动作只有是独立的才可能被认为是一个完整的线程。比如分支子程序、设备控制指令、公用计算函数、公用多维数组等。
在我们认识的一些小型工具软件任务的进程中,7系统也为之分配了多个线程数:
AMCAP 这个是通用的摄像头应用程序,也属于多线程任务,只是它不需要太多的并行运算,我们可以看到7系统给它分了十个线程。至于CPU波幅,那是后台运行 AION、画板、QQ、YY 语聊等任务。
——从发布I7 和 WIN7 的那一刻开始就定义了未来是多核多线程的天下,也是密集运算的天下!
你自己盲从到认为用不到那么多的线程调度,则只有WINDOWS 98、WINDOWS XP 甚至 DOS 欢迎你!
作者: AMD_BEST 时间: 2012-8-31 11:20
OK,我在电脑升级版发过一系列针对 HT 超线程的实践贴子。
没有实践就没有发言权,光靠百度复制粘贴学术用语,你永远也无法体验到事物的本质是如何(以下均为个人原创实践):
开启关闭HT超线程功能,对网络游戏《永恒之塔》的功效测试——(多视频对比)
http://diybbs.zol.com.cn/3/316_21327.html
超线程在被动授予的 WINDOWS 7 平台上,即使只有四个物理核心甚至只有两个物理核心在工作时,超线程并不是关闭和无序,而是待机。在HT 待机时,它的作用与纯四核四线程的 I5 是完全一样的。一旦数据量即时增大,超线程会最大程度上满足游戏的根本流畅性、使 CPU 占用持续走低,而 FPS 帧数则完全一样。
所以通过简单的 FPS 帧数来判断 HT 超线程的密集运算作用,这很无厘头。FPS 在绝大多数情况下只与显卡有关。CPU的作用是维持最基本的运算效率,图像渲染它基本上帮不了忙。
相反在一些密集运算超标量增大时,甚至还要依靠显卡 GPU 的通用计算来弥补 CPU 浮点能力的不足:
用显卡的通用计算来验证网络游戏《永恒之塔》的奇葩——老饭磁性嗓音讲解暗香深情!
http://diybbs.zol.com.cn/3/316_22048.html
相信懂汉字的都能看的明白,在 1200人至1500人的密集运算环境中,这些视频里出现的 CPU 使用率的区别!
超线程在我脚下——单主机单显卡实现多人独立3D游戏操作,一拖二把省钱进行到底!!!
http://diybbs.zol.com.cn/3/316_21744.html
多任务多进程本来就是属于超线程的天地,今天的主机一拖二独立操作,已经实现了 3D 大型游戏的多开和异步独立操作。而这在过去,只是一个梦!顺便说一下,显卡自 G80 时代到现在 GPU 构架也是基于超线程技术的。不难看出,在今天的 WINDOWS 7 + I7 的黄金搭档中,我们的执行方式和执行效率比以前提升的幅度有多大。至少在 I7 和 WIN 7 之前,我们常见的一拖二,只是简单的进行简单的上网、办公等平面应用和小型游戏。
大内存的骄傲——用32G内存揭开《永恒之塔》千人要塞战环境中恐怖数据压力的面纱……
http://diybbs.zol.com.cn/3/316_21646.html
游戏中起着主导作用的设备是什么?我想有很多人认为是显卡,也有不少人认为CPU与显卡的匹配性,但我要说还与它凉的硬盘IO速度有关,这有点非主流了。来看看彻底解决硬盘IO 速度瓶颈之下的 HT超线程表现,使 CPU 使用率仅在最高 22% 范围以内,而且这还开了后台录相和其它任务,注意这是千人要塞战的实况录相,画面中我们可能同屏只看到几百人的对推,但是大局条件在那里摆着!
HT超线程执行效率,与超频CPU执行效率:
冯诺依曼型计算机的特点是执行效率不高。
在此体系作用下,CPU不可能 100% 被充分发挥出性能(资源监视器中 CPU 使用率并不代表主频的高低,也不完全代表执行效率的高低,它只是一个CPU执行活动的表现,与 CPU 执行效率的一定联系)
有人喜欢声称——I5K 超频 4.5G 完秒E3!
I5K超频后胜过 E3 的情况是有的,不过没有传说中那么邪乎。
比如对CPU主频依懒较高的软件,或是对线程调度并不敏感的环境,绝大部分单机游戏,甚至你觉得超到 4.5G 开机速度都不一样。
但是反之,在网络游戏中,角色超多的场景下,多开任务多开进程的情况下,I5K 不超到 4.5G 还真没办法和 E3 比……
问题来了,玩单机的一般很少开后台任务,玩网游的什么 QQ啦IS啦YY啦甚至还有战地记者录相啦,那就不是单机更能比的了。
我觉得这种话题得看你是什么环境。
I5K很刺激,E3 很淡定。但我肯定推荐 E3 ,因为超频只是提升主频,而不是线程并行效率的增大。
3G 的主频目前够用了,我们需要的是执行效率!
P4 3G 为什么现在没有人再提? C420 1.6G 的单核都能把它干趴下。
秒的解释是完全无压力,从开始的定性瞬间就从性能上形成绝对压制或成倍压制。
这与性能对比产生的优势说法有着天壤之别。
喜欢说I5超频秒E3的,都只是纯粹的数字爱好者。
——我要告诉你 E3 也可以超频 4G 呢?
这是我在多玩永恒之塔技术宅写的一篇关于 E3 超频的贴子:
有妖气:E3-1230 超频 4G 不是梦——再见 I5 !
http://bbs.duowan.com/thread-28365103-1-1.html
也许你认为,4G<4.5G ,不过你得明白一点:
E3 是开 HT 并且同时增大外频提升数据吞吐带宽超到 4G 的,而 I5 是四核裸奔上去的……
作者: AMD_BEST 时间: 2012-8-31 11:21
对于主流的四核处理器,构架原理基本一样,I5 与 E3 这样的对比,不论是默认频率还是超频对比,都不能形成绝对的大幅度跨代的性能优势。
对于同一构架的处理器选择上,应该考虑性能相对比较强,执行效率相对比较高的型号。
在 I5 超到 5G 之后,主频的大幅度提升,使执行效率带来同步增长,这是客观存在的。但是有多少人能超到这个程度?如果它在某种环境下的执行效率占总体运算能力的 70% ,在超频后的执行效率依然会保持这个水准。5G 下的 70% 性能,是远高于 3G 下的 80% 性能的。这只是一个假设,特别是在民用环境下,超线程技术就是要解决这个的。
E3 面对默频 I5 的性能优势是没有悬念的,I5 只有超频这一条路可走。
完秒这种说法是我一直反对的,也是超频者们最喜欢认真的。
这不是一个主频至上的时代了。如果真是那样的话,INTEL 和 AMD 的下一代处理器应该至少以 5G 为起步点。
我们现在看到的主流处理器停在 3G - 4G 范围之间的主频已经有十年了亲!!

http://diybbs.zol.com.cn/16/102_154411.html
再来看看 I7 开HT超到4G,与 I5 没有HT,超到 4.5G 的评测对比:
http://diybbs.zol.com.cn/51/231_501395.html
大家都默频, I5 基本上都处于下风。在超到 4.5G 后,I5 的分数在 3DMARK06中以两百多分的“优势”压过了I7,但其它项目依然全部落败,而且 I7 超频幅度还没有 I5 高。
从这方面也可以看出,主频并不是CPU性能的标杆,除非对主频特别敏感的软件环境,比如Super PI 这个单线程的软件,在以往的系统中,HT是一点办法也没有的,甚至会拖后腿。如今在7系统下用 I5/I7 默认频率跑单线程,则是看谁的睿频更拉轰。
在主频 I7 较弱的情况下,依然以效率击败了I5,在这个表格中,默认之间的性能差距是比较大的,这里面有睿频和超线程的同步作用。在超频后,则只看超线程。其实这个评测的作者如果加上关闭超线程,我想对比起来会更有意思。
面对上述评测结果的运算效率进行分类举例:
预设条件一、1G主频 =1000次运算(为方便计算,取一个小量值)
预设条件二、冯诺依曼体系计算效率为70%(100%的执行效率在这个平台上是一个空洞的臆想)
预设条件三、INTEL HT超线程技术平均提升效率为25%(最大30%的HT效率提升忽略不计)
I5 超到 5G 时,那么它的单位周期执行效率就是
5000 X4 X70%
=14000 次
I5 超到 4.5G 时,它的单位周期效率表现为
4500 X 4 X 70%
=12600 次
忽略睿频作用, E3-1230 V2 默频 3.3G 的单位周期执行效率(带有HT的 I7 超频可以依据此类计算):
3300 X 4 X 70%+3300 X 4 X 25%
= 9240(四线程 70%效率)+3300(超线程虚拟运算单元执行效率)
=12540 次
而传统 3.3G 默频的 I5 四核四线程处理器单位周期执行效率是:
3300 X 4 X 70%
=9240 次
I3 2120 3.4G 默频的单位周期执行效率是:
3200 X 2 X 70% + 3200 X 2 X 25%
= 4480 + 1600
=6080 次
通过上述统计我们可以看到,默频时,CPU最大 70% 是相对于原始默认频率而言,而超频不可能把这个执行效率达到 100% ,如果可以, INTEL 和 AMD 都会高薪骋用你去主导下一代 CPU的开发。因为你的超频神论已经把冯诺依曼计算机的公论给推翻鸟~~~
超频到 5G 也不过是 5G主频的 70% 作为有效效率。只不过 5G 主频的 70% > 3G 主频的 70% ,所以你的 CPU 速度就加快了,效率也有提升,但效率比完全一样。
CPU 的执行效率分为两大块:
一、片内的:
即CPU 的主频, CPU 的构架、流水线、缓存、执行机制,通常被综合认为单位周期的 CPU 数据吞吐带宽,数据读写量越大,CPU速度就越快。
二、片外的:
即 CPU的外频,CPU 的对外数据带宽,内存数据带宽。通常被综合认为是CPU的对外数据带宽与内存能提供的带宽相吻合,那么 CPU是可以吃饱的。
INTEL 开发 I7 之后,内存控制器与 PCI-E 控制器是集成在 CPU 内部的。这个优点就是 CPU 不需要从主板芯片组北桥绕道,而对这些设备进行了直接访问和控制。缺点就是外频不可能无休止的提高。因为显卡最大 PCI-E 频率只能承受 130MHZ ,默认 100MHZ,PCI 设备只能最大承受 48MHZ,默认承受 33MHZ 。(最大承受量为多年来上网看到的玩家超频结果)在 775 时代之前,有南北桥的主板芯片组上,由于内存和 PCI-E 等总线设备是受控于北桥的,只需要分频锁定就行了。
最终从根本上影响 CPU 执行效率的只有外频——因为 CPU 最大数据带宽与外频同步的。
为什么?请继续阅读——
数据吞吐带宽与 HT超线程的联系
通过SNB 处理器支持 1333 的条子可以看出,双通道默认带宽为 10.6X2=21.2G/S
通过 IVB 处理器支持 1600 的条子可以看出,双通道带宽为 12.8X2=25.6G/S
高频内存能救命?
内存等效频率 2133 ,核心频率=等效/8=266.6MHZ
那么DDR3-2133 的双通道带宽=266.625 X 128 X 8 = 273024 Mbyte / 8= 34128 MB/S=34.128G/S
I7 2600K 这种 SNB 的带宽是 21.2G/S ,正好与DDR3-1333 双通道数据带宽吻合。
I5 2500K 这种 SNB 的带宽也是 21.2G/S ,也正好与 DDR3-1333 双通道搞基。
I7 3770K 这种 IVB 的带宽是 25.6G/S,与 DDR3-1600 双通道数据带宽河蟹盛世。
IVB处理器 DDR3-1600 的默认规格是外频 X2 ;
SNB处理器 DDR3-1333 的默认规格是外频 X 1.6;
CPU 的双通道内存控制器就是这么识别的,它把这种外频相乘的倍数当作基准同步系数。
……
DDR3-2133 用于I7 这样的CPU进行倍频超频时,不过是 Z77 之类的芯片组依据100MHZ 外频,提供的异步超频频率,而双通道内存控制器作用下的 CPU 对外带宽并没有明显的实质性增长。如果真是这样,我们用一个 SNB 的处理器配合 1600 的条子就可以秒杀 IVB 了……亲,不管你信不信,我是不信的。
你就是把它的倍频调成 50 ,那么 100 X 50 =5G 的主频看上去很好很强大,CPU内部数据的带宽压力有多大呢?
有很多 I7 的超频者们会发现一个问题,在主频达到 4.8G-5G 之后,HT 超线程打开或关闭的影响很小。甚至有人认为采用 2133 CL=9 的NB 条子也不能改变 HT 无效的命运。
高规格内存条,只能对内存自身产生较大的数据带宽,它给 CPU的直接作用就是频率或延迟的大小,会左右内存条与 CPU 数据交换的速度。在CPU对外数据带宽不成瓶颈的前提下,高频内存条的确可以加快 CPU 对外部数据的访问速度。内存就相当于 CPU 的外部缓存。
作者: AMD_BEST 时间: 2012-8-31 11:21
P4 时代是前端外频FSB总线,I7 是 QPI 互联架构式总线,未来拓展性要高于FSB。而 QPI 最大的特色就是 CPU 与内存实现了直接的联接,理论最大峰值可达 96G/S (第一代 I7 三通道也不过最高 38.4G/S 的样子,具体数值大家可以百度),而最高依靠 DDR2-800 FSB 能有 13G/S 都算是祖上烧高香了(默认为 12.8G/S) 。为什么我认为当前的 HT 超线程技术要超过 P4 时代的效率,操作系统的原因自不必谈,主要是 P4 对外的数据带宽和处理器内部数据吞吐与现在的 I7 构架没办法比,因此 P4 时代的 HT 超线程实际延迟比现在要高很多。
P4 的带宽是 3.2G/S ,想当年挂靠在总线上的 PC-133 的内存条是无法满足的,之后是 850 芯片组提供的 RAMBUS 内存技术,不过坑爹的价格并不能普及性能的完美,再之后是 DDR-266 ,直到 865 之后双通道 DDR 内存才满足了 P4 的胃口。而从 915 开始,弹性不对称双通道内存组合技术才从根本上解决 P4 的数据压力,不过此时双核已经初绽头角。可以看出处理器的数据带宽与内存是挂勾的,而内存带宽计算公式:带宽=内存核心频率×内存总线位数×倍增系数。
超频到 4.8G 以上,以 I7 构架为例,只不过是在 100MHZ 固定外频下进行的倍频调节。外频不动,倍频提升主频,则 CPU 带宽有一定程度的异步增大(包括内存条在 Z77 上的超频都是异步设定的)。在相同外频下进行CPU 主频的区别对比中,数据带宽之间的差异很小。而外频上升,则 CPU 带宽同步增大,在内存条与外频真正同步吻合时,我们可以认为内存条的工作条件是最佳的。
那么在此时,100MHZ 固定外频,主频高至 4.8-5G 的 I7 ,在数据带宽方面并没有同步的大幅度增长。如果你有兴趣,可以把外频调到 105 ,或者内存核心频率调大,再把 CPU 超到 4.8-5G 试试开启HT 超线程,你会发现延迟效果会有降低,并且 HT 在更高外频下的表现也趋于理想。这是最近与本地几个朋友玩 E3 超频实践的结果。
当外频固定,主频超到 4.8G 至 5G 以上的 I7 处理器,如果你的 HT 超线程功能趋于无效状态,多半是你的处理器在100MHZ 对外数据吞吐带宽的幅度上,限制了 CPU 的主频性能和片内带宽,而使HT超线程喝茶了。
在SNB I7 内部每个核心对应的三级缓存带宽出口都是96GB/s,而四核心能达到384GB/s。
主频提升的再高,外频不做文章,不可能增大 CPU与内存之间的位宽匹配。
处理器的数据带宽在外频增大时才会有所增大,否则在一个固定死的外频上,当主频达到极致时,再高的条子也发挥不出来 CPU 的内存控制性能。
这个时候,三通道,甚至四通道内存才会最大程度上放开CPU的肚皮。
比如,你买了个法拉利跑车,上高速公路,但收费站一次只允许一辆车通过,你即使把法拉利改造成超音速战斗机的速度标准,但是在通过收费站时仍然要排队!你可以认为,在排队缓行时,法拉利=夏利……
而三通道、四通道内存,相当于高速公路原本只有一个收费窗口,但是现在所有人员都加班,开了好几个窗口,这样等待上高速的时间段就大大缩小!
在不动外频的情况下,要想解决数据带宽的匹配只有一个办法—— I7 只能通过多通道内存控制器来实现更大的片内带宽与内存带宽进行匹配,或者在双通道内存平台上关闭 HT 超线程。区别就是前面那种我们要换成 X79 ,要花小钱钱的,后者就是蛋疼的唯一出路,牺牲某些功能的。
I7 3690X 六核十二线程为什么不做成双通道内存控制器,就是这个道理!
——INTEL 比你我更了解带宽的真实压力。
INTEL 开发三通道的 X58和四通道 X79 的目的,就是为 HT 超线程和处理器对外带宽接口付出的努力。
在 I7 时代,超外频被认为是一种危险的行为,我却不以为然。因为外频的提升意味着CPU 带宽的增大,但超频以安全和稳定为前提。
下图是 I7 关闭和开启 HT 超线程后,对数据带宽的依懒表现(I7 并没有超频)。 100外频的 I7 在主频进行极限冲刺的同时,仅靠异步双通道内存的频率提升,也不会在数据带宽的加大方面有实质性的进展,数据带宽会实时影响CPU的性能,也会左右综合效率的发挥。因此某些同学把 I7 超到 4.8G-5G,并且关闭 HT 超线程,在目前不动外频的双通道内存平台上,是唯一可行的方式。
开启超线程和关闭超线程的带宽对比:
I7 构架的处理器地球人都知道不能超外频(最近看到不少 E3 党在玩小幅度外频超频,这个是可以有的,108以内是基本安全的,不过要看总线设备的体质,这个我可不敢给你打包票)。
下图是 E3-1230 V2 超到 4G ,外频提升为 108mhz 的截屏:
我为什么提到 E3 超外频把 I5 甩的更远?
默频 I5 玩不过 E3 ,超频在 4.5G 左右等效于 E3 默频,但是 E3 超外频,主频和对外数据位宽有双重的提升,可想而知——
I5 玩倍频超频——它只能让屌丝们精神高潮,实质上 I5 只算个P!
四核四线程的特性决定了 I5 的内部数据带宽与 I7 E3 根本不是一个级别的!
所以你可以认为关闭超线程后,倍频超频到 5G 的内存控制器仅有双通道的 I7 I5 在4线程工作环境下基本可以划上等号。
倍频超频 I5K、I7K 的玩家们往往有一个错觉:主频提升=带宽提升。
但是我要告诉大家,CPU不论是几通道内存控制器的,它对外数据吞吐带宽是与外频同步的!
如果说双通道X2,三通道X3,四通道X4 ,这样的情况下,CPU 的数据带宽才是增长的。
I5 谈密集运算和执行效率是扶不上墙的泥巴,I7 在开启 HT 后,并且主频提升,内部数据带宽是同步增大的,但是没有动外频,在 100MHZ 外频下,它始终是围绕着 21.2G/S 在工作的。
关闭超线程,处理器内部数据交换压力降低,因此在 100MHZ 外频下, I7 靠 4线程也就满足于双通道的匹配了。开八线程超频 5G ,在双通道DDR3 下面根本无法发挥 CPU 的执行效率。这也就是在 4.8G-5G 的高主频上,HT +双通道内存的实际作用很有限甚至很坑爹的原理。
在外频固定死的情况下,增大CPU更高的数据带宽,INTEL 已经给了我们成熟的答案——增加内存通道数。
并且对应的平台分为双通道 Z77 和 三通道 X58 以及 四通道的 X79……
小钱钱啊!!!尼玛!!!
作者: AMD_BEST 时间: 2012-8-31 11:21
主板只要一天没有与 CPU 同频,以倍数降频来实现异步同步,那么外频的作用会影响处理器的数据带宽。在外频不允许用户随意变更时代,I7 只能采用多通道内存搭配组合技术,来实现更大的数据带宽。用 INTEL 的话来讲,数据带宽左右着一切。
在 INTEL 之前的处理器中,通过不同前端外频(实质上也就是TMD换汤不换药的外频)用以区分产品的定位,比如 66/100/133/200 ,而现在则是通过内存控制器的通道组合数量来区别产品,比如双通道、三通道、四通道。
从产品的定位中我们就可以发现,超频并不在 INTEL 的考虑规划之内。而 K 系处理器虽然 I7 2600K 和 I5 2500K 是同步于2011年元月份发布的,但市场超频需求也不过是 I5 2500K 抗着不锁倍频的大旗孤单的进行着冲锋陷阵。I7 K 的实际 DIY 用户群体必尽比 I5 K 要少的可怜,I7 K 虽为高端,但并不是市场供求的绝对主力。
INTEL 默许 I7 K 和 I5 K 可以超频,也知道对于目前 CPU晶体设计和构架设计来说 5G 就是大限,但没想到超频 5G 放眼全球的 DIY 份子们就象纳.粹青年那么亢奋。也许 INTEL 根本不指望你会超的这么高,少数极品大雕只是身份的象征。在 INTEL 的普世价值观里,4.5G 的主频和 4.5G 的等效效率才更接近于 1155 双通道内存带宽平台上的超频效能,这个 4.5G 就是绝大部分 K 系用户都可以普遍达到的高度。真要超 4.8G 以上不如玩 X79 四通道去,INTEL 为什么就一个构架的处理器开这么多针脚平台、这么麻烦的多通道规划——是有原因的。它不可能给你一个主流平台上 CPU 无节制超频,带宽也同步跟上的机会。X79 卖到 1600 以上,不是没有道理的。
话说 X79 外频即使拉到 125 也相当风骚……
如何面对 INTEL 的 CPU产品?
老饭通过朋友得到一份今年1-7月内部销售统计中可见一斑,(当然与奔腾鸡或爱三相比,这些数字又显屌丝了),在这里只看 I7K和 I5K 的零售销量对比:
因具体销售数量的不便说明的原因,以下数据只保证销售比率完全属实
这忠实的表达出了INTEL在市场定位方面,与产品的技术等级和综合因素等策略作用下,超频产品中,I5 K 是 INTEL 允许玩家超频的重点,而 I7 K 则是打酱油的心态。因为 I7 K 四核八线程决定了它在极限超频时,最终在内存控制器的通道数量所能决定的真实带宽上有瓶颈。
INTEL 是知道的。所以四线程的 I5K 负面影响很小,所以 I5K 目前只卖一千多块。看上去能超频的 I5K 比 E3 划算,但我们知道了 HT 的作用和 7 系统的进程调度方式后,总感觉 I5K 似乎少了点什么。
追求性能的玩家们不这么认可。在冲刺到 4.5G 以上后,由于构架作用带来的数据带宽的限制,使得 I7 K 在进行极限超频时数据带宽形成瓶颈造成部分性能的缺失或者无效——转回头看看 6核12线程 的 3690X ,我们不难发现它不做成双通道 DDR3+1155产品,也它凉的是有原因的。
HT 超线程就是一张血盆大口,吞噬着处理器力所能及的最大数据带宽。
——回报给用户的就是多任务多线程执行效率的尽可能大的提升!
超线程的复兴,已经被 INTEL 玩弄于掌股之中!
正视 HT 超线程与主频并进的效率和作用:
速度可以影响效率,但并非等同于效率。这看上去有点哲学了,呵呵,开个玩笑。
I5 K超频幅度不大,在多线程应用中是不会对具备超线程的CPU形成压倒性优势的。这不是某种片面对E3的盲目乐观和盲目崇拜。
在 WINDOWS 系统上,能真正能发挥出CPU理想的执行效率,再同时寻求超频折腾的快感,理想的四核处理器应该是 I7 K,而不会是 I5 K。
至于极限超频需要关闭HT超线程来寻求稳定时,I7 K 也依然比 I5 K 风骚,三缓在那里摆着,这仿佛回归到了 INTEL 几十年来一向以CPU片内缓存的不同来划分产品高、中、低端定位的初始做法。
如果想省钱超频,I5 K 则是不二的选择。但是这种省钱,是体现在 I5 K 与 I7 K 的具体零售差价上,其它的东西主板、内存什么的两者折腾的平台代价都一样。
但如果认为超频幅度相同的I5与I7是划上等号的、天下无敌的,那就是真正的二了。I5 K 想全面压倒 I7 ,只能是频率需要超的更高。一旦软件对二、三缓的要求较大时,I5 就会露出原形。这不是一个主频至上的时代。
I5K的超频应该是建立在快乐的目的基础上,而不是非要证明我能虐谁的目标性基础上。
HT超线程的客观对待是建立在大家实用的环境中,而不是无脑跑分评测的具体数字大小上。
说完了超线程,表达下我个人对 E3 的态度:
想控制 E3 在民用平台的泛滥和对 I5 的正规零售市场份额的某种冲击,INTEL 绝对有技术、有能力致止,这是必须的。
但玩家们的争议和媒体的关注,这都是免费的代言;再加上天朝全球无敌的用户数量就是它最理想的广告平台。明确宣传表态的东西并不可怕,因为人们会自己反思它的合理性和必要性。而低调的,才是有实力、有威胁的,如同 Windows 7 与 VISTA 的上市区别也可以同悟。INTEL 和微软不是脑白金,它们对中国古代兵法的商业理解,往往要比国内企业要深的多。
至强长期以来只是用作赚大钱的主力产品,但低价的 E3 让我们看到了 INTEL 和微软不为人知的另一面……
这就是今天我要带着大家一起了解的第二代超线程的实际体验。本贴并非鼓吹 HT 的无敌论,只是给大家展示更多的思考方式!
下一代的 E3-1230 V3 版本,如果还卖1000-1400元的价位,那真不敢想象。这要取决于超线程技术的普及力度。但至强的主题不会让人这么舒服。
而E3-1230 去年的最初售价是 XXX 元(没错,是几百元),为了进入市场,后来推到 1450元(这不是X宝JS们炒的,而是 INTEL 的出货价决定)。
E3这个 CPU 给了大家用 I5 的价格去享受具备第二代超线程技术高端I7 的机会,而不是让大家来追究茴香豆的“茴”字有几种写法,吃豆我们关注的是味道如何。INTEL更想通过这款最具争议的 CPU 让大家尝鲜,不是让你去百度上复制粘贴专业术语来指责它的。
从第二线HT超线程的争议中,我们已经发现神话其实就在身边,所以新装机的用户和不会超频的小白、以及没有太多钱购机的穷屌丝们不要错过E3这趟班车……
多年以后,你最终不会再用E3,但它仍是你想来起时依然可以津津乐道的一款CPU,它不象十五年前的C300A 把超频当作亮点而成为经典,而是以默频、强劲、省钱六个字让你永远的记住了它。
E3是这个时代的传奇……
骨灰级超频者的最佳选择——
应该去考虑四通道内存技术的 X79平台,你能体会到冲刺CPU的高主频后,于密集运算环境下 HT超线程给你带来的各种刺激!
对网络游戏进行评测,如果不在高密度角色环境下展示对比,是没有任何说服力的,因为你只看到了类似于单机场景环境的游戏表现。网络游戏的千人场景帧感是在于计算机整体软硬件的极限配合,甚至有时很不错的实际流畅感也会产生图像画面FPS帧延迟。这在追求电脑最大综合性能方面有着举足轻重的意义!
对单机游戏进行评测,你的显卡性能就能最终决定着你的帧率,CPU成为辅助。不要说 I5如何如何,爱三或者老扣肉配个千元级显卡也能上得了台面的。而这正是小白们最喜闻乐见的!
作者: ppzhong 时间: 2012-8-31 11:44
I5 2500K 4.2G灭你的E3 1230V2,就这样,别放这么大的字!很牛吗,偷换概念的说法一堆,我读懒得看!
作者: dearwux 时间: 2012-8-31 11:47
本帖最后由 dearwux 于 2012-8-31 11:48 编辑
中关村攒机版系列帖子,拿着永恒之塔宣扬超线程至高论的
作者: R620 时间: 2012-8-31 12:00
支持一下这良个难兄难弟
作者: woaitff 时间: 2012-8-31 12:01
看到E3超频到4G就实在看不下去了。写这么多估计也没几个人真正看的懂,实际使用情况最能说明问题。没有软件和游戏的优化支持,超线程毫无用处。。
作者: percyxl 时间: 2012-8-31 12:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: licongok 时间: 2012-8-31 12:21
有ht总比没有好!
作者: licongok 时间: 2012-8-31 12:25
percyxl 发表于 2012-8-31 12:08 
我只想问一句E3v2怎么超频。。。。
超4g未试过,外频103是绝对可以的!要超干啥买e3?都上i7k吧
作者: inSeek 时间: 2012-8-31 12:25
这zol的老帖子 这次在GZ爆发了啊...
看了20% 实在看不下去了,越写越扯淡。
你倒是有本事来一个4线程的程序 分别在同频的I5和I7上跑测试试试啊,看看到底哪个高...
简单的,你用Linx给4线程试试就知道了(虽然这个测试对应的情况比较极端)
...
或者我给你跑个?
作者: inSeek 时间: 2012-8-31 12:27
licongok 发表于 2012-8-31 12:21 
有ht总比没有好!
但是这是要花钱的..........
作者: mmx266 时间: 2012-8-31 13:00
24寸显示器看得有点吃力~~~~先午睡了~睡醒了再看。
作者: jk1526 时间: 2012-8-31 13:24
I5 2500K很牛
作者: 真明镜止水 时间: 2012-8-31 13:24
敢不敢不用马甲发帖
作者: caoyuxin 时间: 2012-8-31 15:47
默频 I5 玩不过 E3 ,超频在 4.5G 左右等效于 E3 默频,但是 E3 超外频,主频和对外数据位宽有双重的提升,可想而知——
I5 玩倍频超频——它只能让屌丝们精神高潮,实质上 I5 只算个P!
四核四线程的特性决定了 I5 的内部数据带宽与 I7 E3 根本不是一个级别的!
整片文章的最大败笔,E3超外频,I5K 就不能超外频了?
作者: 浪雪千羽 时间: 2012-8-31 16:46
i5 没ht?
4通道对性能提升很大?
ht且不论 你把i5说的一文不值
但又发个表格 i5出货量这么大 不是打自己嘴巴吗
敢把i5出货量和e3出货量做个对比吗
我只相信市场数据
作者: 5050 时间: 2012-8-31 17:46
汗我居然看完了,不过大多数都忘记了
作者: 节瓜 时间: 2012-8-31 17:54
ppzhong 发表于 2012-8-31 11:44 
I5 2500K 4.2G灭你的E3 1230V2,就这样,别放这么大的字!很牛吗,偷换概念的说法一堆,我读懒得看!
用能超频的cpu去“灭”不能超频的就牛了么
作者: 节瓜 时间: 2012-8-31 17:55
浪雪千羽 发表于 2012-8-31 16:46 
i5 没ht?
4通道对性能提升很大?
i5真没ht吧,他说的四通道是指x79平台吧
作者: colo 时间: 2012-8-31 18:12
说超线程没用的,先让intel把你们聘为C什么O再说,不然intel吃撑的弄个带超线程的I7出来,价格还比I5高一大截,而且还有那么多人买?
作者: 节瓜 时间: 2012-8-31 18:17
说实在的不是任务管理器里面虚拟核心的曲线动了就说明用到了超线程么,这样的话很多时候都用到了超线程吧
作者: 暮江秋雨 时间: 2012-8-31 19:12
秒什么秒,用I7,I5E3 神马的都一边凉快去。
作者: NG6 时间: 2012-8-31 21:40
woaitff 发表于 2012-8-31 12:01 
看到E3超频到4G就实在看不下去了。写这么多估计也没几个人真正看的懂,实际使用情况最能说明问题。没有软件 ...
这和看得懂看不懂无关,只是在讲高贵的E3党的故事,文中提到的i7只是个陪衬
作者: NG6 时间: 2012-8-31 21:43
HT只有在某些情况下可以用到,就像LZ说的密集型运算,线程调度是个问题,而且LZ你觉得虚拟出来的核心能和物理核心比?????在晶体管数量差别不大的情况下,i7不会比i5强多少
作者: shenj520520 时间: 2012-9-1 09:24
太长了,看得头大,个人认为超线程有用,但只是在某些方面!
作者: acqwer 时间: 2012-9-1 11:59
2500K比E3贵,算上超频,投资要高好几百块,性能更强有什么奇怪的?
作者: i387dx 时间: 2012-9-2 03:35
专家级讲解,凌晨过来专门顶楼主……
作者: garou 时间: 2012-9-3 21:13
明年的ATOM也将是4核8线程了,lz解释一下那个HT有没有用?
作者: cool_mini 时间: 2012-9-13 16:21
学习了...
作者: wuxiaoyong 时间: 2012-9-15 14:42
神贴 留个爪
作者: 天帘之城 时间: 2012-9-21 14:20
提示: 作者被禁止或删除 内容自动屏蔽
作者: ilovechina 时间: 2012-9-21 14:43
现在单任务支持到4线程,所以很多评测都会发现e3、i7的超线程没用,所以那帮煞笔就开始大谈超线程无用论了。
殊不知,关闭超线程的i3,性能下降厉害。在多任务处理的情况下,超线程也都很有用。
还有个煞笔看销量来决定CPU好坏的,你知道什么叫做市场的有效性性么?如果人人消费都是理性的,那么i5销量比e3大才能得出i5比e3好的结论,而且你还得把不需要独立显卡只能买i5的销量剔除才能进行比较。所以啊,这帮煞笔的智商就是这么的低下,这也是为什么人与人之间的差距那么大的原因了。这帮人只能生活在社会的最底层。
作者: cool_exocrist 时间: 2012-9-22 09:50
shenj520520 发表于 2012-9-1 09:24 
太长了,看得头大,个人认为超线程有用,但只是在某些方面!
确实是长..,
作者: hee_ro 时间: 2012-9-22 12:33
花了我一顿午饭的时间 看完了 看到 e3是这个时代的传奇 这句 洒家喷了
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) |
Powered by Discuz! X3.4 |