POPPUR爱换

标题: 进一步解析PS4的改变及未来!长文翻译! [打印本页]

作者: PS5    时间: 2013-4-30 20:02
标题: 进一步解析PS4的改变及未来!长文翻译!
本帖最后由 PS5 于 2013-4-30 20:03 编辑

转自TUBUS,感谢BUS翻译组,感谢!
原帖:http://bbs.tgbus.com/thread-4425231-1-1.html

这篇文章里面有一个亮点,就是Mark Cerny谈到了为什么PS4没有用eDRAM,而是用简单粗暴的8G DDR5内存!
译者:ark1800 感谢长篇技术文翻译
http://ps3.tgbus.com/zixun/redian/201304/20130428095323.shtml
【电玩巴士编译报道,转载请注明出处】PS4的首席设计师Mark Cerny在Gamasutr的访谈中,以开发者的视角深度解析了PS4。整个访谈将不涉及PS4的UI和OS部分,重点是PS4整个系统的能力,以及是什么样的思路让Cerny和他的团队选择了什么样的部件,这些部件又是怎么样协同工作  Cerny着手PS4的设计开始于2007年后期。“因为我们之前在分析PS3,人员来自SCE各个领域的一个大型团队在评估PS3的表现。”他们之后很自然地开始思考下一步应该怎么做,思考SCE的下一代主机应该是什么架构。Cerny花了感恩节假期去阅读X86架构的历史。他认识到X86架构不仅仅多年来实现了戏剧性的演进,在PS4发售之时,这个架构将足以满足索尼的需求。“它已经进化到让游戏行业中非常极端的程序员也能使用的程度。”出于对PS4项目的激情,感恩节后,Cerny找上了索尼的Phil Harrison和Masa Chatani,请求主导PS4开发。让Cerny非常惊喜的是,他们答应了。

PS4最重要的事情
  Cerny说明,PS4设计最重要的需求就是“硬件对于想要开发高质量游戏的程序员来说不能是一个麻烦的问题。”
  PS3性能强劲,但是特殊的CELL处理器难住了开发者。“尽管性能强大,但为了释放这些能力,你需要研究,学习怎么合理地使用硬件。”这种情况直接影响到了PS4的设计思路。PS4需要一个性能强大的架构,同时也要是一个各方面开发者都熟悉的架构。
  Cerny反复表达,“我们要确保硬件的易用性。于是我们使用了大家熟悉的CPU和GPU保证这一点。”在被问到索尼如何看待第三方为下一代XBOX开发游戏的时候,Cerny回答说“我说我们不想为开发者设置问题,这就意味着我们在跨平台领域也将有出色的表现。”
  易用性并不是唯一的目的。作为有31年从业经验的老将,Cerny知道即便在PS4走进坟墓之后,PC也将继续发展。“我们尝试在马上能使用的功能,以及保证系统能在数年内同游戏一起持续发展的功能中取得一个平衡。”强化版PC架构就是Cerny的团队使用的方案。这种架构将提供PC不能提供的重大优势,同时保证工程师们能有一个熟悉的技术环境。
  为了开发PS4,Cerny不仅仅是在做调查研究,或者分析PS3,他同样大量拜访了开发者团队,和中间件合作伙伴进行对话,以精确找到在下一代主机中开发者需要什么。
  强化意味着什么?
  乍眼看上去,PS4架构很面熟。SCE开发团队的工作极大拓展了它,其所能实现的远远超过它基本的能力。
  比如GPU。“这是一块Radeon GPU。看参数不能让我们清楚了解它的状况。我们使用了AMD最先进的技术,并做出了大量的修改。”要理解PS4,我们需要认识Cerny对其的预想(易用,长期保持性能领先),再结合团队的选择(在成熟的架构上进行修改)。这就是强化的意义。
  强化的部分,大部分来自于单个统一高速内存空间的使用。PS4有8GB GDDR5 RAM,CPU和GPU都能简单,完整地访问这个空间。PC的话,如果有8GB记忆体,CPU和GPU在现有框架上只能共享到1%的空间。这是PCIe速度造成的限制。PS4使用的统一架构带来了很实际的好处。这是开发者着手为这个系统编程就能感受到的好处。

CPU和GPU被整合在AMD的一块“非常巨大的单块自定义芯片”。8个Jaguar核心,GPU,以及大量其他单元都在一个die上。内存并不在芯片上,通过256位位宽的总线,核心和内存空间能以176GB/S的速度通信。
  Cerny表示,原本团队也可以将总线位宽缩水至128位,这样带宽就只有88GB/S,然后在芯片上集成eDRAM将性能提回去。一开始团队也考虑过这种更容易生产的做法。但由于这会增加开发者的复杂性,他们放弃了这种思路。不想为开发者社区造成麻烦,这就是坚持统一内存的原因。  Cerny表示,在拜访各个工作室询问对PS4的要求,最多的反馈就是要求统一内存。为了保证架构对开发者友好,他们放弃了内置TB/s级别带宽的RAM,这充分说明了他们对开发整体的思考。
  这种设计方法能给游戏机带来什么样的好处呢?Cerny的想法是:长寿。
  Cerny确信在接下来的几年中开发者使用GPU将不局限于提升画面,同时他相信自己采取了一个更具弹性和性能的解决方案。“GPU将同等地用于图像和通用计算,我们相信在PS4生命的中期,异步计算将成为游戏开发技术的重要组成部分。”
  届时将有众多程序同时运行在GPU上,同时进行物理运算,碰撞计算,和光线追踪。
  这种预期带来了一个重大的挑战。“如果我们预计异步运算这种技术将在PS4生命的中期大量运用,问题就是,我们怎么在设计硬件的时候就支持它。”传统的PC硬件环境是一个阻碍。CPU ,GPU和内存的通信是个问题。而PS4的架构设计就处理了这个问题。传统的PC GPU有两个总线。一个是GPU访问显存的,第二个是通过PCIe访问系统内存。无论使用哪个总线的时候,GPU的内部缓存都将成为CPU和GPU通信的障碍,当GPU要读取CPU写好的数据,或者当GPU要写入CPU能用的数据,GPU内部缓存的重写要耗费大量的时间。
  为了实现预想,索尼如何修改硬件
  索尼做出了3大修改。
  1.首先,SCE增添了一个总线,让GPU能绕过专属的L1L2缓存,直接读写系统内存。如果CPU和GPU之间传递的数据够小,开发者就不需要考虑将他们同步。 开发者可以用20GB/S的总线带宽传递它,这个数字大于大多数当前PC上的PCIe。
  2.其次,假设开发者想用GPU L2缓存同时进行图像和异步计算,SCE为缓存增加了一个标记用的位,这称之为volatile位。开发者可以有选择地标记计算使用的访问空间。当计算访问系统内存的时候,这些使用了的L2空间将不可用;当结果写回的时候,这些已经使用了的L2空间将可以写。这个创新解决了计算使用GPU L2时的请求操作对同时进行的图形操作造成冲击的问题。换句话说,就是减少了在GPU上同时进行图像处理和通用计算的开销。
  3.第三,原生的AMD GCN架构支持一个图像指令源和两个计算指令源。在PS4中,SCE将这个限制增加到了64个计算指令源。如果你想进行一些异步运算,你可以将指令放进64个指令的队列中,然后硬件的多级仲裁将决定哪个指令何时,如何运行。整个过程独立于系统的图像处理。

安排这么多计算工作资源并不只是因为游戏系统需要,中间件也需要计算。而中间件的计算工作请求将会和游戏的请求混合起来,最后同图像的请求一并,在整个运算流程中即时得到优化安排。
  这个理念源自索尼开发的,名为SPURS的软件。这个软件用来帮助程序员安排CELL里SPU的任务。在PS4里它会被集成在硬件中。
  Cerny称考虑设计这些功能的时间点是在2009,2010年,但是人们完整利用他们的时间点可能是在2015年。
  在混合计算和图像的处理上,SCE加上了大量的控制手段。让开发者们可以在进行大量异步运算的时候,能明确他们到底想使用哪一个。Cerny希望开发者在GPU上运行诸如物理运算之类的中间件。通过上述的系统,开发者能让两者都得到非常高效的运行。
  Cerny说明,“如果你着眼于当前GPU可以用来进行通用计算的部分,他会随时发生变化。比如opaque shadow map渲染就没有用到pixel shader,它完全是vertex shaders和光栅化硬件完成的。这样图像方面就用不上1.8T的浮点运算能力。
  首发和将来
  这些好处将在PS4的首发游戏中就得到体现。Cerny表示,在将来,这些优点将会通过更多的方式表现出来。PS4的首发阵容将比以往的PS硬件更强。这是因为开发者熟悉架构。但是到了2015年,PS4真正需要的就是那些定制的工作。因为竞争对手也将进行那些工作。
  届时,在开发者掌握PS4之后,他们可以在数周,而不是数月内将游戏引擎从PC导入PS4,并修改他们使用的技术,切切实实地获得益处。
  有许多的方法控制GPU资源在图像和计算之间的分配。一开始,正如大多数首发游戏那样,全部资源都会分配给图像。到了PS4生命的中期,将会有更多资源转向计算方面。
PS4的专用单元
  PS4开发团队通过将基础功能交给专有单元的方法,使PS4更有灵活性。开发者不需要去分配游戏运行的资源去解决那些需求。使用专用单元的原因是,游戏需要考虑的这方面开销将会非常少。这为开发者建立用户体验设置了一个基线。
  比如,通过系统的专用音频单元,开发者可以在不占用游戏资源的情况下支持语音聊天。同样的还有视频解码编码。音频单元同时还负责了游戏中大量MP3数据流的解码工作。
  在纽约的发布会上,Cerny提到了PlayGo这个让PS4在游戏时也能下载数字内容的系统。其设计理念就是,玩家只需要下载部分数据就可以开始游戏。剩下的数据将在游戏的时候后台下载。
  PlayGo是两个独立的,相互连接的系统。它的另外一部分是解决蓝光光驱相对于次世代游戏已经偏慢的问题。原理就是先访问蓝光碟上游戏数据,将其放在硬盘上。在空闲的时候,后台也在继续向硬盘中拷贝数据,在一两个小时之后,游戏实际上已经在硬盘里。玩家的读取将会变快。这个系统还加入了一个支持zlib解码的单元,开发者可以安心地压缩所有游戏数据,系统将即时解压这些数据。至少,游戏的媒体文件是zlib压缩的。

还有另外一款自定义芯片让系统可以在低功耗状态下进行后台下载。玩家可以关闭主机电源,PS4只有第二芯片,系统内存和I/O,硬盘和网络部分供电,从而实现超低功耗后台下载。此外,PS4还可以将除内存外的其他部分完全断电,这样只要一开机就能接着之前的进度继续游戏。
  瓶颈是?
  Cerny 对于可能遇到的瓶颈也没有掩饰。他相信自己的团队已经有效的处理了这个问题。“图像方面,第一个可能遇上的瓶颈就是内存带宽。下一代游戏中,一个物体有十多个纹理将是标准。很快系统就会到达瓶颈,一小部分的渲染过程就会达到记忆体界限,除了转为使用lower bit-per-texel textures,没有其他很好的办法。对此我们的策略很简单,就是用GDDR5作为系统内存,提供大量的带宽。
  如果记忆体不是瓶颈,如果游戏中的物件有细致的网格,就很可能在顶点数量上遇到瓶颈。开发者可以让艺术家让三角形更粗大,但是这很难掌控。这种情况在屏幕大量显示的三角形都只有一个像素大的时候,很容易就出现了。
  我们有大量不同的技术去减少顶点数量瓶颈。有的是硬件的增强,最有趣的的还是让compute作为图像的前端。
  这项技术混合了硬件,GPU里的固件和编译器技术。当开发者使用vertex shader的时候,将会编译两次,一次以compute shader的形式,一次以vertex shader的形式。这样可以即时的减少顶点数量。在硬件内部,两个shader是非常紧密结合在一次的。
  Cerny还保证,索尼正在开发一个为PS4优化的性能分析工具Razor。

开发的窍门
  Cerny了解开发者对硬件需求还有一个窍门。“当我2007年末开始负责架构设计的时候,我知道我将主要去负责硬件,偶尔继续做一点软件方面的工作。接下来一段时间我专注于硬件的工作。”但这种软硬分离的状况没有持续很长时间。SCE多年的负责人Akira Sato强烈Cerny建议不要放弃软件方面。“不要放弃软件,要是你在开发一款游戏,无论你是做硬件设计,开发者环境,或者工具链,你对整个进程的价值都要高出许多。”这就是Cerny的PS4游戏《Knack》诞生的经过。这就是Cerny了解开发者实际问题的独特方式。

作者: fakler    时间: 2013-4-30 20:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: qsxyz    时间: 2013-4-30 21:47
好长。。。有summary吗。。。
作者: asdfjkl    时间: 2013-4-30 21:59
本帖最后由 asdfjkl 于 2013-4-30 22:06 编辑

首先这个说法不靠谱的:
传统的PC GPU有两个总线。一个是GPU访问显存的,第二个是通过PCIe访问系统内存。无论使用哪个总线的时候,GPU的内部缓存都将成为CPU和GPU通信的障碍,当GPU要读取CPU写好的数据,或者当GPU要写入CPU能用的数据,GPU内部缓存的重写要耗费大量的时间。


按照这么说,CPU访问内存应该直接访问,搞缓存和Cache设计,是浪费时间,增加延迟么?  太搞笑了!!! 为啥有缓存这种东西的存在,就是为了解决两边的工作频率的差别和显存/内存的读写延迟而专门设计的!
看来Sony这次找了个半吊子搞PS4的设计,为啥不能去intel 挖点系统设计的人才呢?

作者: westlee    时间: 2013-4-30 22:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: 妲己控    时间: 2013-4-30 22:09
提示: 作者被禁止或删除 内容自动屏蔽
作者: asdfjkl    时间: 2013-4-30 22:10
CPU和GPU的进化是可怕而又不可阻挡的。。。  给你一个QQ的发动机,随便你去优化,去改良,都跑不过一般的跑车!
PS这种游戏机的思路,还是固守第一代PS游戏主机,可以买十几年的想法;一方面通过雁过拔毛 -- 每一个游戏销售上抽份子钱;另一个指望硬件的成本降低,主机硬件盈利。
现在看来,都不靠谱了~~~
作者: westlee    时间: 2013-4-30 22:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: BDFMK2    时间: 2013-4-30 22:30
本帖最后由 BDFMK2 于 2013-4-30 22:30 编辑
westlee 发表于 2013-4-30 22:06
Cerny说明,“如果你着眼于当前GPU可以用来进行通用计算的部分,他会随时发生变化。比如opaque shadow map渲 ...

当然有区别了。从硬件执行上VS是1D~3D操作,PS是3D~4D操作。后端处理VS指令用到ROP,那么Shader ALU和TMU就用不到了
作者: fakler    时间: 2013-4-30 22:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: fakler    时间: 2013-4-30 22:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2013-4-30 22:54
提示: 作者被禁止或删除 内容自动屏蔽
作者: Elwin    时间: 2013-4-30 23:24
我能说ps4会比ps3还不济吗,很长一段时间内ps4极限盒子还要被360,wii等老货持续打压,同时还要受到移动终端的挤压。pc什么情况,游戏机也跑不了。
作者: kangtian    时间: 2013-4-30 23:43
PS4的硬件架构极有可能影响未来PC乃至整个计算机硬件体系的发展。
作者: 妲己控    时间: 2013-4-30 23:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: 妲己控    时间: 2013-5-1 00:03
提示: 作者被禁止或删除 内容自动屏蔽
作者: iamw2d    时间: 2013-5-1 00:16
westlee 发表于 2013-4-30 22:06
Cerny说明,“如果你着眼于当前GPU可以用来进行通用计算的部分,他会随时发生变化。比如opaque shadow map渲 ...

当然有区别 vs相对于ps来说 线程仲裁器和线程排序器都要少得多 amd的我没记错的话大约是1:20的样子 少到了甚至连sp都只用的到一半的程度[attach]2244198[/attach][attach]2244197[/attach]
作者: fakler    时间: 2013-5-1 00:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2013-5-1 07:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: R620    时间: 2013-5-1 09:03
kangtian 发表于 2013-4-30 23:43
PS4的硬件架构极有可能影响未来PC乃至整个计算机硬件体系的发展。

应该说是影响未来游戏的发展吧!
作者: iamw2d    时间: 2013-5-1 09:53
westlee 发表于 2013-5-1 07:25
两代以前的架构,就不能上个gcn的测试么?

也就是说,在nv的架构上开发,至少gf100以后(其实 ...

b3d最新的测试就是这篇了 没办法
这个实际并不是可以跑满就代表vs与ps就没有差距了 上面那组数据nv的也有一定的效率下降 而这还只是吞吐率测试的最低复杂度情况 实际情况中如果要优化的很好 无论an都需要考虑这种东西 不止vs和ps. hull shader,domain shader,geometry shader都有这种问题
dx10之后是说ps vs可以任意比例的使用 但是实际使用上vs的量还是远远少于ps的 所以硬件厂商也就能省点晶体管就省点了
作者: 妲己控    时间: 2013-5-1 11:29
提示: 作者被禁止或删除 内容自动屏蔽
作者: NG6    时间: 2013-5-1 13:27
果然还是GPU是瓶颈吗,影响未来是必定的,统一寻址是必然的发展
作者: 妲己控    时间: 2013-5-1 15:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: BDFMK2    时间: 2013-5-1 15:49
妲己控 发表于 2013-5-1 15:30
GPU怎么可能会是瓶颈,很明显在这种架构中CPU的内存控制器才让人拙计好不好

PS4的GDDR5 MC怎么了?
作者: celine2199    时间: 2013-5-2 12:10
就次世代主机那屎一样的硬件配置,就知道游戏主机快要消亡了,还影响整个计算机硬件体系发展,笑死个人...
作者: xiaxin222a    时间: 2013-5-2 14:35
celine2199 发表于 2013-5-2 12:10
就次世代主机那屎一样的硬件配置,就知道游戏主机快要消亡了,还影响整个计算机硬件体系发展,笑死个人...

次世代主机哪一代比起同时代的高端PC,不都是屎一样的硬件配置。要消亡早消亡了。
作者: 妲己控    时间: 2013-5-2 15:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: xiaxin222a    时间: 2013-5-2 15:29
妲己控 发表于 2013-5-2 15:10
PS3还可以PS2好像超过了
任天堂那个悲剧的什么游戏机来着,也应该过了

PS3用G70,同代被G80打成渣。
PS2那个EE性能更烂。
作者: xiaxin222a    时间: 2013-5-2 15:33
妲己控 发表于 2013-5-2 15:10
PS3还可以PS2好像超过了
任天堂那个悲剧的什么游戏机来着,也应该过了

PC游戏的问题不光是盗版,当代3A游戏就跟好莱坞大片一样,一次投资失败就可能导致开发方万劫不复。
作者: itany    时间: 2013-5-2 17:40
fakler 发表于 2013-4-30 22:30
还是我大N粉厉害,一篇文章就有2~3个N粉跳出来斩PS4首席架构师於下[titter>。

搞笑了,批评三鹿的话,还要自己产奶能力超过牛么?
作者: itany    时间: 2013-5-2 17:40
fakler 发表于 2013-4-30 22:30
还是我大N粉厉害,一篇文章就有2~3个N粉跳出来斩PS4首席架构师於下[titter>。

搞笑了,批评三鹿的话,还要自己产奶能力超过牛么?
作者: fakler    时间: 2013-5-2 18:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2013-5-2 18:19
提示: 作者被禁止或删除 内容自动屏蔽
作者: 深谷白云    时间: 2013-5-2 18:35
itany 发表于 2013-5-2 17:40
搞笑了,批评三鹿的话,还要自己产奶能力超过牛么?

可惜确实有些人认为自己能设计得更好
作者: itany    时间: 2013-5-2 20:08
fakler 发表于 2013-5-2 18:12
让我想到一段话[happy>
---
逻辑思维不够清晰,类比不当,偷换了概念。假鸡蛋和三聚氰胺奶说是假冒伪劣 ...

我的意思是,尽管大多数人没能力设计CPU或者GPU或者板卡系统,但是还是有些人有能力看得懂框图,懂的体系结构组成原理等知识,看得懂框图,踢得爆胡扯。
作者: fakler    时间: 2013-5-2 20:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: iamw2d    时间: 2013-5-2 22:57
westlee 发表于 2013-5-2 18:19
在nv和amd现代的gpu上,不管指令是ps还是vs,底层都是同样的运算单元,这位主设计说的vs,也是gcn那1.8t的 ...

这里我估计是翻译有问题 应该是说不能完全利用到1.8t的运算力 shadow map一般都是瓶颈在z rop和rasterizer上面吧 具体的我不太懂 大概是这样的
作者: efficient3d    时间: 2013-5-3 08:43
妲己控 发表于 2013-5-2 15:10
PS3还可以PS2好像超过了
任天堂那个悲剧的什么游戏机来着,也应该过了

PS2当年是被Sony吹爆才让人觉得性能强大,其实际性能也就比DC好点。但是PS2有一点在当时来说做对了:DVD载体。
作者: complexmind    时间: 2013-5-3 21:30
asdfjkl 发表于 2013-4-30 21:59
首先这个说法不靠谱的:
传统的PC GPU有两个总线。一个是GPU访问显存的,第二个是通过PCIe访问系统内存。无 ...

你把CPU 和GPU 两者特性忽视了, CPU的缓存之所以有效是因为CPU处理的数据有很大的几率是反复出现集中在某一个内存地址段上的,也就是说多次IO 操作都是针对同一个内存地址,或者其相关地址,那么通过多级缓存块读取会很大程度上降低延迟,当对同一个数据第二次读取的时候直接从快速缓存上读取就好了。
而GPU 恰恰相反,处理过的数据基本上不会再一次去访问是流动性的,假如使用多级缓存块读取那么数据会先到缓存然后再被访问,这样多一个步骤当然会增加延迟,而缓存内的数据又不会被反复使用而是需要被更新,那么自然效率就低了。
作者: complexmind    时间: 2013-5-3 21:33
kangtian 发表于 2013-4-30 23:43
PS4的硬件架构极有可能影响未来PC乃至整个计算机硬件体系的发展。

同意,PS4是AMD实验新技术的产物。
作者: complexmind    时间: 2013-5-3 21:37
BDFMK2 发表于 2013-4-30 22:30
当然有区别了。从硬件执行上VS是1D~3D操作,PS是3D~4D操作。后端处理VS指令用到ROP,那么Shader ALU和TMU ...

后端处理的差异我明白了,但是在硬件上NV自从G80,AMD自从GCN后不是把所有的多维操作全部拆成了一维的么?
作者: asd04122661    时间: 2013-5-3 23:25
complexmind 发表于 2013-5-3 21:30
你把CPU 和GPU 两者特性忽视了, CPU的缓存之所以有效是因为CPU处理的数据有很大的几率是反复出现集中在某 ...

gpu的缓存不就是为了适应微软dx10开始提出的类似cpu的相关性通用计算的吗,如果真如你所说基本用不到那gpu的缓存根本没必要存在。
至于ps4再增加一条gpu总线绕过缓存这种做法也许算是在处理简单画面时多一种选择,但硬件简单了软件开发就会更复杂,本来我只需考虑用到缓存这一种情况虽然在处理简单画面时损失了些效率但在处理复杂特效计算时就会表现好很多。而现在我开发时还要考虑什么时候绕过缓存什么时候去使用缓存,基本上我认为除非ps4机能开始过时逼迫程序员花费大量时间去优化的情况发生,否则这条多出的总线我实在不认为会有多大作用。
作者: complexmind    时间: 2013-5-4 03:07
asd04122661 发表于 2013-5-3 23:25
gpu的缓存不就是为了适应微软dx10开始提出的类似cpu的相关性通用计算的吗,如果真如你所说基本用不到那gp ...

我没有说GPU的缓存基本用不到,我是指GPU在处理图形任务的时候用处并不是很大,对性能的影响并非像对CPU那样。GPU这么晚引入缓存机制,也是因为其任务特性而决定的,现在引入缓存也正式为了能处理类型更加宽泛的任务另外现在的shader也是比原来复杂多了。
另外GPU缓存机制和结构和CPU也并不完全一样,所占晶体管比例相差太多,两者并非有可比性。
更进一步对于GPU,它真正的“内存”是显存,新增加的这条总线是为了和CPU交换数据。
所以我的结论是这条新总线和前面网友所提的CPU访问内存的结构体系不具备可比性。它可以加快CPU和GPU交互的确会更快,对游戏开发有利。
对于总线的运用我觉得文章当中并无提及需要开发者控制,我认为这条总线对开发者是透明的,读取系统内存以及和CPU交互的API并不会发生改变,但是API的实现会有变化,开发者不需要考虑这些。
作者: asd04122661    时间: 2013-5-4 13:25
complexmind 发表于 2013-5-4 03:07
我没有说GPU的缓存基本用不到,我是指GPU在处理图形任务的时候用处并不是很大,对性能的影响并非像对CPU那 ...
SCE增添了一个总线,让GPU能绕过专属的L1L2缓存,直接读写系统内存

按文章中说法那个总线的作用就是绕过缓存直接访问内存,而那条256bit总线则是传统的gpu-缓存-内存。而且为了突出所谓优势把缓存的作用直接概括成了"GPU内部缓存的重写要耗费大量的时间"至于为什么要耗费时间重写缓存及这样做的好处决口不提。
另外我是不知道这总线是不是透明,不过按sony和amd的风格,绝口不提的你往坏处想绝对更靠谱点
作者: NG6    时间: 2013-5-4 16:21
妲己控 发表于 2013-5-1 15:30
GPU怎么可能会是瓶颈,很明显在这种架构中CPU的内存控制器才让人拙计好不好

GPU怎么不是瓶颈????!未来的异构计算会把大量的计算转移到GPU上,这也是SONY所希望的,而本来处理大量图形内容时就已经捉襟见肘。虽说MC确实也是个问题,但是要相信SONY和AMD
作者: complexmind    时间: 2013-5-5 04:10
asd04122661 发表于 2013-5-4 13:25
按文章中说法那个总线的作用就是绕过缓存直接访问内存,而那条256bit总线则是传统的gpu-缓存-内存。而且 ...

你说的有道理,传统GPU-缓存-内存的结构为何在和CPU交互的时候存在效率问题原文并无分析,我更感兴趣是这种问题在PC上是否也存在。
SONY逼得PS2的开发者使用汇编来开发游戏的某些部分的确不值得信赖,AMD应该在软件方面还不错,OpenCL等等通用计算的SDK和API还是做的很上心的。当然我不是开发者,也只能推测下了。
作者: westlee    时间: 2013-5-5 09:59
提示: 作者被禁止或删除 内容自动屏蔽
作者: airr27    时间: 2015-9-13 23:55
Elwin 发表于 2013-4-30 23:24
我能说ps4会比ps3还不济吗,很长一段时间内ps4极限盒子还要被360,wii等老货持续打压,同时还要受到移动终 ...

=V=2015年了PS 4正值壮年!然而PC平台要等到明年才会见到HSA异构计算架构。

这点上来看PS 4的实际理念至少领先了PC平台三年,而类似PS 4解决VPU&GPU、APU&CPU沟通的GMI总线今年才被曝光。




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4