POPPUR爱换

标题: 意识到酷睿缓存的差距了 [打印本页]

作者: sprewell8467    时间: 2007-10-12 23:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: delphi5-10    时间: 2007-10-12 23:22
PM 和酷睿的核心不是完全相同吧
作者: BrownGuo    时间: 2007-10-12 23:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: Elensar    时间: 2007-10-12 23:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-12 23:29
汗,其作用的关键不是缓存,而是Core2的128bit SSE单元……
作者: boxink    时间: 2007-10-12 23:37
架构才是真的:funk:
作者: _MyST_Spring    时间: 2007-10-12 23:38
PM1.6和T7300的架构都差了两代了。。
作者: Prescott    时间: 2007-10-12 23:49
:funk:

T7300是双核心2.0G,和PM 1.6比。。。。没快3倍真是让我失望。
作者: 晶晶守护神    时间: 2007-10-12 23:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-12 23:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: bk1018    时间: 2007-10-12 23:53
呵呵,不了人还认为扣肉是P3S的改良版。
作者: itany    时间: 2007-10-12 23:55
原帖由 晶晶守护神 于 2007-10-12 23:51 发表
其实你们都错了 一个是双核 一个是单核心  压片吗??  可以把片分为2部分  同时压 各分配个u  然后合起来  速度当然快1倍了哦 ..这是晕死我 了
这种实现很简单的 一般转换软件都能实现


如果是流媒体,要实时压缩,怎么办呢?
作者: 晶晶守护神    时间: 2007-10-12 23:58
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-13 00:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: chenxy    时间: 2007-10-13 00:03
原帖由 晶晶守护神 于 2007-10-12 23:51 发表
其实你们都错了 一个是双核 一个是单核心  压片吗??  可以把片分为2部分  同时压 各分配个u  然后合起来  速度当然快1倍了哦 ..这是晕死我 了
这种实现很简单的 一般转换软件都能实现


多线程的思路是对的,不过把片分为2部分的想法...呵呵
作者: 晶晶守护神    时间: 2007-10-13 00:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-13 00:05
原帖由 晶晶守护神 于 2007-10-13 00:01 发表
对于avi来说 一般是 收到许多单元 放内存缓冲 在转换输出  ..这里也可以分开 转 而且不用怎么合并都行  .流媒体本来就有掉包的现象


我觉得像CF那样把视频划分成棋盘处理,这样不管是帧内还是帧间都更容易一点吧……
一窍不通的人飘过……

:(
作者: 晶晶守护神    时间: 2007-10-13 00:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-13 00:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-13 00:11
Conroe是在P6诞生以来最大的一次改进,绝不只是单单Banias变成多核心那样简单
Conroe的意义不仅仅在于提高了性能,而且奠定了一个瓶颈较少的基本框架,在此之上,比如Penryn改进Shuffle和DIV单元,改进缓存,增加执行单元,改进分支和乱序的算法,还可以在一段时间内保持性能的持续提升。
而K8,也包括K10,没有这个能力
作者: itany    时间: 2007-10-13 00:15
原帖由 晶晶守护神 于 2007-10-13 00:09 发表

CF 是什么  完全不明白你的前半句话..:blink: 我也对媒体开发不懂 只是 了解些皮毛


CrossFire阿
你说的不同帧之间分配给不同的CPU更像是SLI的处理方案
但是在需要进行帧间预测,根据P帧和B帧和I帧来推定的时候,恐怕不同核心之间的依赖和通讯比较麻烦
作者: zxjike    时间: 2007-10-13 00:17
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-13 00:18
提示: 作者被禁止或删除 内容自动屏蔽
作者: lemonninja    时间: 2007-10-13 00:19
原帖由 Elensar 于 2007-10-12 23:27 发表
是完全不同

Core和Core2的区别


PM是CORE1的前代
作者: itany    时间: 2007-10-13 00:23
原帖由 lemonninja 于 2007-10-13 00:19 发表


PM是CORE1的前代


是啊
没记错的话,PM只有一个SSE单元,而Core(Yonah)有两个SSE单元,其间的差别是巨大的
PM的多媒体性能还是比较差的,到了Yonah的时候就已经比较好了

[ 本帖最后由 itany 于 2007-10-13 00:31 编辑 ]
作者: 晶晶守护神    时间: 2007-10-13 00:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: on_8848    时间: 2007-10-13 00:26
原帖由 晶晶守护神 于 2007-10-13 00:24 发表

我对sli不了解 .看测评实际效果并不好 ...还是期待ati的双核gpu ..我觉得对于渲染来说的话  ..分时域还不如分空域 ...
现在分辨率都那么高  双gpu的话  各自渲染一半就行了 ..但是对于 顶点渲染还是没什么好 ...

你lp叫晶晶?
作者: 晶晶守护神    时间: 2007-10-13 00:27
提示: 作者被禁止或删除 内容自动屏蔽
作者: lemonninja    时间: 2007-10-13 00:33
原帖由 Prescott 于 2007-10-12 23:49 发表
:funk:

T7300是双核心2.0G,和PM 1.6比。。。。没快3倍真是让我失望。



理论上应该是快3倍 不过实际可能会受到硬盘 内存速度的拖累
作者: ArisTidle    时间: 2007-10-13 00:35
这典型的标题党啊..
作者: 晶晶守护神    时间: 2007-10-13 00:36
提示: 作者被禁止或删除 内容自动屏蔽
作者: HeavenPR    时间: 2007-10-13 00:46
图像压缩一般都是分成 4x4/8x8/16x16 的小块单独进行的
作者: 晶晶守护神    时间: 2007-10-13 00:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: Elensar    时间: 2007-10-13 06:34
提示: 作者被禁止或删除 内容自动屏蔽
作者: 没啥    时间: 2007-10-13 07:33
core 2强
作者: itany    时间: 2007-10-13 11:03
原帖由 Elensar 于 2007-10-13 06:34 发表

是PM的SSE单元一次只能执行一个指令,到Core Duo已经能执行多个,不过我想这个进步也有双核心的功劳

再怎么样,PM和Core Solo的区别是非常有限的,就像Conroe和Penryu一样
也许我一开始应该说P6和Core的区 ...


没记错应该是Banias只在一个发射口上边挂了一个64位的SSE单元,Yonah是在两个发射口上各挂了一个64bit的SSE单元,而Conroe是在2个发射口上各挂了一个128位的SSE fp单元(SSE int则是3个发射口上都挂了)
这样应该是从Banias(Dothan)-> Yonah-> Conroe依次加倍的过程

Dothan PM 压片性能确实比Yonah CM 慢不少,这个有切身体会的
作者: 晶晶守护神    时间: 2007-10-13 11:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: awoo    时间: 2007-10-13 11:26
偶还在用Yonah,T2050 跟不上Conroe 2了
作者: DesertFlower    时间: 2007-10-13 11:41
这典型的标题党啊..
作者: kofboy    时间: 2007-10-13 11:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: kofboy    时间: 2007-10-13 11:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: amu    时间: 2007-10-13 12:20
呵呵,这也快太少了吧:lol:
作者: wxm    时间: 2007-10-13 12:53
压片是证明缓存不重要的好不好
数据都不会反复利用的
貌似3G e21x0和e6850鸦片速度几乎一样.
作者: Elensar    时间: 2007-10-13 16:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-13 16:14
原帖由 Elensar 于 2007-10-13 16:11 发表

还是单核心对双核心的差距咯?


:wacko:
我说的是每个核心的情况,双核心的Yonah还要加倍~
作者: 紫色    时间: 2007-10-13 16:52
狂晕啊~~改进Shuffle和DIV单元,改进缓存,增加执行单元,改进分支和乱序的算法 ,对所有的cpu都适用,甚至对非x86处理器也适用,不要吹成是core2的专利。core2是4发射体系,k10是3发射体系,两者的解码以及执行能力大致是4:3的比例,这就是amd要克服的主要困难。

[ 本帖最后由 紫色 于 2007-10-13 17:05 编辑 ]
作者: itany    时间: 2007-10-13 17:48
原帖由 紫色 于 2007-10-13 16:52 发表
狂晕啊~~改进Shuffle和DIV单元,改进缓存,增加执行单元,改进分支和乱序的算法 ,对所有的cpu都适用,甚至对非x86处理器也适用,不要吹成是core2的专利。core2是4发射体系,k10是3发射体系,两者的解码以及执行 ...


Yonah比K8执行单元少得多,解码能力也不如,照样能胜出
AMD从K7到K10,架构早就遭遇瓶颈了……
就是改成4发射又能怎样?
作者: spinup    时间: 2007-10-13 17:49
标题: 回复 #46 紫色 的帖子
.............还是不对.........
作者: lemonninja    时间: 2007-10-13 19:24
原帖由 itany 于 2007-10-13 17:48 发表


Yonah比K8执行单元少得多,解码能力也不如,照样能胜出
AMD从K7到K10,架构早就遭遇瓶颈了……
就是改成4发射又能怎样?


amd目前的架构的主要瓶颈在分支预测单元上面 就算是4发射也未必能提高很多 可惜现在AMD的技术没有能大幅提高分支预测单元的效率
作者: sprewell8467    时间: 2007-10-14 20:35
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-14 20:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: zhzpx    时间: 2007-10-14 21:10
core 2应该说是很不错的


今天在同学的机子上用过了    速度叫人眼红
作者: sprewell8467    时间: 2007-10-14 21:14
提示: 作者被禁止或删除 内容自动屏蔽
作者: RiYaYaDe    时间: 2007-10-14 21:24
是缓存吗。。
作者: 晶晶守护神    时间: 2007-10-14 21:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-14 21:33
原帖由 晶晶守护神 于 2007-10-14 21:29 发表

io  不是瓶颈 为何才50%?   都是一半的话 说明是2个cpu都在工作...明显是双核心 优势


单线程怎么占两个处理器核心阿……
开WinRAR去掉“多线程”选项就知道为什么会50%左右了
作者: 晶晶守护神    时间: 2007-10-14 21:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-14 21:40
原帖由 晶晶守护神 于 2007-10-14 21:37 发表

呵呵 我愚钝还是不知道为什么  麻烦你说清楚点嘛
i开玩笑吧:blink:  cpu密集型程序会是单线程?    ....
很可能你的程序 没为双核心优化 ....
(_( 把文件分为几部分 同时处理是可行的 也是必要合理的..肯定 ...


很可惜的是,这种密集应用没有多线程化还是很常见的
比如Ulead Video Studio 10里边MPEG2的编码器就是单线程,只能用到1核心;WMV就能用到双核心……
作者: katerren    时间: 2007-10-14 21:41
牛逼,这两个东西都比上了

无语中
作者: 晶晶守护神    时间: 2007-10-14 21:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-14 21:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: itany    时间: 2007-10-14 21:49
原帖由 晶晶守护神 于 2007-10-14 21:46 发表

只有多核用工作线程才有提高,   我所说的把文件分几部分  就是指多工作线程...显然 楼主的机器 提高了100%  是2核心 多线程的工行 ..你没有必要可惜,... ...


不知道您这显然从哪里出来的
……
作者: 晶晶守护神    时间: 2007-10-14 21:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-14 21:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: Cameraman    时间: 2007-10-14 22:03
Banias 1.6G的压片速度相当于P4 1.6A :lol:
作者: itany    时间: 2007-10-14 22:35
原帖由 晶晶守护神 于 2007-10-14 21:56 发表
:p 显然lz都说了 各占50%  ..不就是多线程吗 ...而且能提高100%哦~~!!~~
你叫lz关掉个核心试一下 还能不能提高100%



汗……
这个只是因为Windows随机的把工作线程分派到两个核心中的一个
任务管理器里边显示的是一段时间内处理器占用率的平均值罢了
实际上在一个时刻就是一个核心在忙,一个核心在闲着
作者: 晶晶守护神    时间: 2007-10-14 22:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: sprewell8467    时间: 2007-10-15 09:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: 晶晶守护神    时间: 2007-10-15 09:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: 121    时间: 2007-10-15 09:43
这就是一分钱一分货的道理
作者: shike_cuke    时间: 2007-10-15 10:13
跟SSE还是有关系的哦.............




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4