POPPUR爱换
标题: AMD Mantle优化实际演示:渲染脚本提升一倍 [打印本页]
作者: boltblade 时间: 2013-12-20 17:11
标题: AMD Mantle优化实际演示:渲染脚本提升一倍
AMD推出Mantle API已经有段时间了,Mantle到底有什么好处呢?从实际演示来看,不支持Mantle的系统只能处理5万个脚本,有了mantle之后可以处理10万个,提升了一倍。
AMD推出Mantle API已经有段时间了,从GPU 14大会到上个月的APU 13大会,AMD不断拉拢游戏厂商进入Mantle阵营,也在不遗余力宣传Mantle的好处——减少开发难度,降低CPU间接成本,提高性能等等。这些都是纸面上的,Mantle到底有什么好处呢?不妨来看看实际的视频展示。

AMD宣称有了mantle的支持,FX-8350性能可以匹敌Core i7-4770K
AMD的官方Youtube频道发布了上个月APU 13大会的演讲视频,演讲者来自Oxide Games,他们开发的Nitrous(液氮)游戏引擎原生支持64位及多核处理器,当然还有重中之重的Mantle API。
这个视频主要介绍了Nitrous引擎的设计和优点,时长42分钟,太大了也不好搬运。前面的理论介绍可以略过,可以从26分钟开始看起,这是一段demo展示,没有名字,应该是Notrous引擎的渲染场景。

26分钟后的视频截图
据介绍,如果不支持Mantle,显卡受CPU限制通常只能处理5万个脚本(batches),有了Mantle之后可以处理10万个,提高了一倍,2015年的时候则可以提高到30万个。未来新一代硬件发布后,再加上Mantle的持续优化,届时可以处理100万个脚本。
这个视频也算是Mantle API效果的实战了,不过这个引擎还得看游戏支持,倒是DICE许诺这个月底会发布Mantle版的战地4,这个近在眼前了,到时才能真正显示出Mantle到底是不是虚招了。
http://v.youku.com/v_show/id_XNjUwMTE5NjY4.html
作者: westlee 时间: 2013-12-20 17:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: NG6 时间: 2013-12-20 19:49
这东西看看就行了
作者: wzglwoc 时间: 2013-12-20 20:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: AlcatrazX 时间: 2013-12-20 21:41
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee 时间: 2013-12-20 22:16
提示: 作者被禁止或删除 内容自动屏蔽
作者: hero.yj 时间: 2013-12-21 11:56
最主要是看现实应用,如果AMD这个应用在商业软件特别是专业领域,或者游戏领域
那如果能发展壮大就行,如果只是停在科学实验那对于用户就没有什么用了
作者: G70 时间: 2013-12-21 14:01
提示: 作者被禁止或删除 内容自动屏蔽
作者: cloudol 时间: 2013-12-21 20:32
不是已经月底了 馒头呢?
作者: iamw2d 时间: 2013-12-21 21:29
westlee 发表于 2013-12-20 17:39 
信不信nv用cuda代码混合在dx里面也能做到同样效果?
不信 首先cuda根本就管不了图形管线
作者: iamw2d 时间: 2013-12-22 12:59
westlee 发表于 2013-12-20 22:16 
某种意义上,nv靠驱动已经达到了同样的效果。
gtx590,4.5g的2600k和x6 1100t差距22%
你确定这是靠驱动换来的优势? 老a卡驱动的jit编译器需要做vliw打包 nv的需要么? gcn的需要么?
作者: goodayoo 时间: 2013-12-22 21:44
对手不支持的话,估计也很难成功,就像physx,支持的游戏都不多。
作者: cloudol 时间: 2013-12-23 09:07
physx gpu加速 这个事情上 nv就是当消费者是傻子 看看刺客信条的演示 纯粹是搞笑
作者: westlee 时间: 2013-12-23 10:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: iamw2d 时间: 2013-12-23 10:48
westlee 发表于 2013-12-23 10:24 
cuda不可以调用显卡的所有资源么?
图形运算本质上就是数学运算的一种,有啥调用不了的?
cuda调用个rasterizer给我看看? 调用个rop给我看看?
cuda和传统的图形运算本身走的就不是同一个路径
就算抛开能不能使用全部资源这点 cuda也不可能插到中间去 可以的一般也就做点延迟渲染
作者: boltblade 时间: 2013-12-24 11:46
goodayoo 发表于 2013-12-22 21:44 
对手不支持的话,估计也很难成功,就像physx,支持的游戏都不多。
主机阵营全线支持还不够吊的?
作者: goldman948 时间: 2013-12-24 12:32
等了好久,果然bf4 Mantle延期新闻不会转
作者: westlee 时间: 2013-12-24 13:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: 结果 时间: 2013-12-24 13:51
westlee 发表于 2013-12-24 13:24 
你是在说physx么?
http://news.mydrivers.com/1/278/278852.htm
硬件架构是AMD的,开发次时代游戏本身就自然而然被导入AMD的硬件架构,领不领证的区别
作者: 66666 时间: 2013-12-24 14:57
本帖最后由 66666 于 2013-12-24 14:57 编辑
结果 发表于 2013-12-24 13:51 
硬件架构是AMD的,开发次时代游戏本身就自然而然被导入AMD的硬件架构,领不领证的区别
游戏机软件开发商只会接触到微软和SONY提供的软件高阶API,根本接触不到硬件底层部分
你的说法根本就是胡说八道。
作者: 结果 时间: 2013-12-24 15:30
66666 发表于 2013-12-24 14:57 
游戏机软件开发商只会接触到微软和SONY提供的软件高阶API,根本接触不到硬件底层部分
你的说法根本就是 ...
http://news.mydrivers.com/1/278/278852.htm
作者: westlee 时间: 2013-12-24 15:39
提示: 作者被禁止或删除 内容自动屏蔽
作者: boltblade 时间: 2013-12-24 15:47
westlee 发表于 2013-12-24 13:24 
你是在说physx么?
http://news.mydrivers.com/1/278/278852.htm
主机是类似馒头但是更底层的,说到底和馒头一样是高度基于硬件特性的,也就是AMD会有绝大优势的。
作者: 66666 时间: 2013-12-24 15:55
本帖最后由 66666 于 2013-12-24 15:56 编辑
你还看懂人家说的是什么意思了吗?现在任何一个游戏软件开发在程序上都是跑在高阶API之上,游戏机也是如此,开发商根本不能直接调用底层硬件。微软和SONY只是在API优化上可以针对当前硬件做优化,对游戏软件开发商来说他只是面对微软和SONY提供的一整套开发套件,而不是农企的硬件。
当其移植到PC上一样也是如此,软件只会调用DX11接口,为DX11接口优化的从微软和SONY变成了NV和农企,现在的显卡驱动就是干这个事。其实你们自己看看同样的3D游戏在window、MAC oc和liunx下性能区别就能看的出,以为硬件相似就能直接另存为真是蠢到家了。
农企搞个玩意的如意算盘就是在DX11之外专门给游戏公司提供一个私有API,但从3D游戏发展可以知道,任何一个游戏公司以前,现在,将来也不可能为一种硬件构架专门写一套渲染程序。
作者: 66666 时间: 2013-12-24 15:58
boltblade 发表于 2013-12-24 15:47 
主机是类似馒头但是更底层的,说到底和馒头一样是高度基于硬件特性的,也就是AMD会有绝大优势的。
有优势的前提是要用这个私有API,我看不出除了农企赛够到一定钱之外,还会有哪家会用。
作者: 结果 时间: 2013-12-24 16:02
66666 发表于 2013-12-24 15:55 
你还看懂人家说的是什么意思了吗?现在任何一个游戏软件开发在程序上都是跑在高阶API之上,游戏机也是如此 ...
先朗读以下段落
“Xbox One、PS4都采用了GCN GPU,必然会针对这种架构进行底层优化,AMD Mantle恰恰又是针对GCN进行底层操作、优化的API。从这一点上讲,新主机尽管不支持Mantle,但原则上大家干的都是一回事儿,只不过AMD把主机上的工作带到了PC上”
意思就是PC化为主机,但AMD要不是主机全包就不可能有Mantle,就算有也没人理
作者: 66666 时间: 2013-12-24 16:10
结果 发表于 2013-12-24 16:02 
先朗读以下段落
“Xbox One、PS4都采用了GCN GPU,必然会针对这种架构进行底层优化,AMD Mantle恰恰又是 ...
人家说的没错啊,为GCN优化的是游戏机和Mantle API。
PC上面的DX11 API可不是如此,你认为农企不赛足够钱,哪家会在DX11直接再加上Mantle API?
作者: 66666 时间: 2013-12-24 16:13
我现在真发现很多人脑子还活在10年以前,是不是还认为游戏机上的游戏都是汇编做的?
作者: 结果 时间: 2013-12-24 16:21
66666 发表于 2013-12-24 16:10 
人家说的没错啊,为GCN优化的是游戏机和Mantle API。
PC上面的DX11 API可不是如此,你认为农企不赛足够 ...
就是一定程度上绕开微软的DX实现更好的游戏效果,通过特定的架构,弱化虚拟层,以达到直接控制GPU
作者: 66666 时间: 2013-12-24 16:34
结果 发表于 2013-12-24 16:21 
就是一定程度上绕开微软的DX实现更好的游戏效果,通过特定的架构,弱化虚拟层,以达到直接控制GPU
结论好下,问题是怎么做?
第一,开发费用提升谁买单?
第二,使用Mantle API后和intel以及NV出现的兼容性问题谁买单?要知道不管是APU还是GPU农企在PC上总体份额都远比前两者少。
第三,也是最重要的,就是你这个结论还没有一款成功的商业游戏来验证,BF4的补丁一跳再跳,我觉得你还是等实际评测出来之后再说。
作者: 结果 时间: 2013-12-24 16:48
66666 发表于 2013-12-24 16:34 
结论好下,问题是怎么做?
第一,开发费用提升谁买单?
PC的游戏开发商肯定希望自己的游戏画面好,但画面好配置要求必然很高,很多人跑不畅快就不会买。假如能降低硬件要求,适应更多人的PC配置自然卖得更好。
战地4网战BUG很多,忙不过来也是正常的
作者: xiaxin222a 时间: 2013-12-24 17:55
本帖最后由 xiaxin222a 于 2013-12-24 18:01 编辑
66666 发表于 2013-12-24 14:57 
游戏机软件开发商只会接触到微软和SONY提供的软件高阶API,根本接触不到硬件底层部分
你的说法根本就是 ...
CAPCOM表示白瞎我写了个汇编的引擎自己用,官方API达不到性能要求有什么办法?
作者: xiaxin222a 时间: 2013-12-24 17:58
66666 发表于 2013-12-24 16:13 
我现在真发现很多人脑子还活在10年以前,是不是还认为游戏机上的游戏都是汇编做的?
要深度发掘游戏机性能,你还真没说错,靠官方API?做梦吧。
作者: iamw2d 时间: 2013-12-24 18:51
westlee 发表于 2013-12-24 15:39 
rop这种纯暴力运算单元也要找游戏厂商优化?amd自己的驱动还搞不定?
首先rop可不是什么纯暴力运算单元 而且是为特殊算法而固化的单元
第二mantle是用来做什么的 你都没有搞清楚
mantle的最基本的作用是减少来自api和驱动的overhead
提供了更接近底层的api与驱动
但是并没有绕过驱动
优化对象你要先搞清楚
作者: westlee 时间: 2013-12-24 21:31
提示: 作者被禁止或删除 内容自动屏蔽
作者: G70 时间: 2013-12-24 22:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: AlcatrazX 时间: 2013-12-24 22:21
提示: 作者被禁止或删除 内容自动屏蔽
作者: iamw2d 时间: 2013-12-24 22:50
westlee 发表于 2013-12-24 21:31 
1,mantle能提升rop性能么?对于这位经常满负荷运转的苦工,mantle能帮啥忙?如果能,为啥amd宣传mantle的 ...
我也懒得说了 自己连个profile都没做过 跑来说什么rop经常满载 drawcall没用
AMD claims that Mantle can generate up to 9 times more draw calls per second than comparable APIs by reducing CPU overhead.[3]
More fine control over the hardware.[3]
All hardware capabilities are exposed through the API.[3]
New rendering techniques possible.
Direct GPU memory access.
Multithreaded parallel CPU rendering support for at least 8 cores.[4]
No game developer reliance on existing AMD driver support release schedules (potentially no or fewer bugs on release, much faster patching for GFX related errors).
Due to bypassing of error-prone and inefficient abstraction, common technical difficulties like FPS drops, micro stuttering and texture corruption can be significantly less frequent or nonexistent.
Performance increase over higher-level APIs such as DirectX and OpenGL.
随手复制一段
作者: 66666 时间: 2013-12-25 08:54
xiaxin222a 发表于 2013-12-24 17:55 
CAPCOM表示白瞎我写了个汇编的引擎自己用,官方API达不到性能要求有什么办法?
MT Framework哪里用汇编了?CAPCOM那么多跨平台游戏,用汇编简直就是脑子进水
PS3/XO固件更新那么多次,API的性能也在不停提升,你以为现在开发商还在用05/06年的开发套件来做PS3/XO游戏吗?
作者: xiaxin222a 时间: 2013-12-25 11:32
本帖最后由 xiaxin222a 于 2013-12-25 11:34 编辑
66666 发表于 2013-12-25 08:54 
MT Framework哪里用汇编了?CAPCOM那么多跨平台游戏,用汇编简直就是脑子进水
PS3/XO固件更新那么多次 ...
“除了日本,欧洲偏远地区的几家墙头草式游戏公司不太重视硬件性能,世界范围内游戏开发者们普遍对Xbox360、PS3甚至远远不如2005年、2006年同时期的奔4、Athlon 64搭配7900GT,X1900pro的主流PC性能感到很不满意,这大大加剧了程序编写难度,想让实际图形性能很低的这两台游戏机表现出看得过去的画质和帧率异常劳神,就像《生化危机%》的MT Framework一样不得不再次像挖PS2似的大规模动用低级汇编语言花去整整4年研发时间,又因为PPE、Shader Core最终伏在成都过高,带来游戏机芯片温度异常、电气性能不稳定、游戏过程易死机等诸多硬件问题。”
大软某篇文看的。
至于API...XB和PS3这几年官方API真的没长进多少。看看UE3引擎这么多年在主机上毫无进步就知道了。
作者: 66666 时间: 2013-12-25 13:57
本帖最后由 66666 于 2013-12-25 13:58 编辑
xiaxin222a 发表于 2013-12-25 11:32 
“除了日本,欧洲偏远地区的几家墙头草式游戏公司不太重视硬件性能,世界范围内游戏开发者们普遍对Xbox36 ...
这段话大软脑补的真是太2了,MT Framework从一开始就是面对XO/PS3以及win系操作系统研发,首款MT Framework游戏06年就发售了,按大软这文所说那就是从02年就开始搞MT Framework开发,可是那时候XO/PS3连最基础的原型机都没有,他怎么用汇编来写我倒是很奇怪。
作者: xiaxin222a 时间: 2013-12-26 00:01
本帖最后由 xiaxin222a 于 2013-12-27 23:00 编辑
66666 发表于 2013-12-25 13:57 
这段话大软脑补的真是太2了,MT Framework从一开始就是面对XO/PS3以及win系操作系统研发,首款MT Framewo ...
1. This MT engine work started in Sept. 2004 and they had something up and running by January 2005. It's based on the Onimusha 3 engine. The project started with just one engineer, then ramped up to 3, and now they have 5 people maintaining and upgrading the code. They added 4 people now just for the PS3 port which started in Oct. 2005. The MT engine is currently used for Dead Rising and Lost Planet, but future cross-platform next-gen games will also use it.
基于鬼武者3引擎开发..谁跟你说原生PC的。
另外每一代作品的MTframework编号都不一样,从这个角度来说4年也差不多。
作者: 66666 时间: 2013-12-26 08:40
xiaxin222a 发表于 2013-12-26 00:01 
1. This MT engine work started in Sept. 2004 and they had something up and running by January 2005 ...
那就更搞笑了,鬼武者3是个PS2游戏,为PS2写的汇编你告诉我怎么用到PS3/XO上?
作者: xiaxin222a 时间: 2013-12-26 09:07
本帖最后由 xiaxin222a 于 2013-12-27 23:01 编辑
66666 发表于 2013-12-26 08:40 
那就更搞笑了,鬼武者3是个PS2游戏,为PS2写的汇编你告诉我怎么用到PS3/XO上?
linx系统怎么移植到MIPS和Powerpc上,就怎么做呗。
作者: westlee 时间: 2013-12-26 13:52
提示: 作者被禁止或删除 内容自动屏蔽
作者: gtx5 时间: 2013-12-26 14:12
westlee 发表于 2013-12-26 13:52 
http://www.ali213.net/news/html/2013-10/87712.html
在大多数现代游戏中,同屏幕只能出现少量的独特的 ...
据介绍,如果不支持Mantle,显卡受CPU限制通常只能处理5万个脚本(batches),有了Mantle之后可以处理10万个,提高了一倍,2015年的时候则可以提高到30万个。未来新一代硬件发布后,再加上Mantle的持续优化,届时可以处理100万个脚本。
http://www.expreview.com/30012.html
作者: 66666 时间: 2013-12-27 08:50
本帖最后由 66666 于 2013-12-27 08:58 编辑
xiaxin222a 发表于 2013-12-26 09:07 
重新编译,调整RAMMAP呗,常用汇编指令就那么多条,难道换了CPU,MOV就不是做的写入寄存器操作?
PS2和PS3连最基础的指令集都不一样,更别说PS2的EE和PS3的CELL这些奇葩独立矢量计算单元,重新编译汇编跟重新写一个新引擎有啥区别
所谓基于鬼武者3基础开发这话根本就不靠谱。
作者: xiaxin222a 时间: 2013-12-27 10:49
本帖最后由 xiaxin222a 于 2013-12-27 23:02 编辑
66666 发表于 2013-12-27 08:50 
PS2和PS3连最基础的指令集都不一样,更别说PS2的EE和PS3的CELL这些奇葩独立矢量计算单元,重新编译汇编跟 ...
来源是西川善司对CAPCOM开发人员采访稿。
http://game.watch.impress.co.jp/docs/20070131/3dlp.htm
MT Framework针对不同主机有不同的图像处理方案。
作者: 深谷白云 时间: 2013-12-27 15:53
本帖最后由 深谷白云 于 2013-12-27 15:57 编辑
我是没开发过游戏啦,所以有没有用汇编真不懂,不过汇编仅仅是机器语言的助记符而已,需要编译器吗?另外指令集当然是汇编需要关心的事情,比如有些指令集第二个操作数可以是放在存储器的,但有些则不可以,不同指令集连寄存器用的助记符都不一样,还有寄存器的长度也未必一样,这些都是需要使用汇编时必须考虑的
作者: xiaxin222a 时间: 2013-12-27 18:50
本帖最后由 xiaxin222a 于 2013-12-27 18:57 编辑
深谷白云 发表于 2013-12-27 15:53 
我是没开发过游戏啦,所以有没有用汇编真不懂,不过汇编仅仅是机器语言的助记符而已,需要编译器吗?另 ...
MOV AND这些指令要翻译成0100101之类的机器语言,这就要靠编译器做。家用机的CPU也没什么SSE类的高级指令集,都是RISC的,总共才多少条指令..
作者: 深谷白云 时间: 2013-12-27 19:45
本帖最后由 深谷白云 于 2013-12-27 19:48 编辑
xiaxin222a 发表于 2013-12-27 18:50 
MOV AND这些指令要翻译成0100101之类的机器语言,这就要靠编译器做。家用机的CPU也没什么SSE类的高级指令 ...
编译器是高级语言的专利,这只能算是转换,就算没sse,但所使用的助记符很多都不一样,比如寄存器的名字,x86和mips就完全不同,另外不同的架构寄存器的数量也未必一样,寄存器又分为专用寄存器和通用寄存器,哪怕是通用寄存器往往很多都有自己特殊的功能,比如x86的,另外有些架构的算术运算指令是允许源操作数是存储器的,比如我们常用的x86,但很多是不允许的,比如MIPS,再加上寄存器的位宽可能不同,所以不同架构的汇编代码想直接套用问题说多少就有多少,大量代码重写是必须的了,甚至全部都得重写,别说汇编这种低级语言了,哪怕是C和C++如果之前写代码没注意代码的portable,不同平台之间移植往往都是噩梦
作者: xiaxin222a 时间: 2013-12-27 21:39
本帖最后由 xiaxin222a 于 2013-12-27 23:04 编辑
深谷白云 发表于 2013-12-27 19:45 
编译器是高级语言的专利,这只能算是转换,就算没sse,但所使用的助记符很多都不一样,比如寄存器的名字 ...
编辑
作者: 深谷白云 时间: 2013-12-27 21:45
xiaxin222a 发表于 2013-12-27 21:39 
汇编编译器 - 使用
在汇编语言中,用助记符(Mnemonic)代替操作码,用地址符号(Symbol)或标号(Label)代替 ...
请问你复制的这些和我说的有什么联系?
作者: xiaxin222a 时间: 2013-12-27 21:48
本帖最后由 xiaxin222a 于 2013-12-27 23:04 编辑
深谷白云 发表于 2013-12-27 21:45 
请问你复制的这些和我说的有什么联系?
编辑
作者: 深谷白云 时间: 2013-12-27 22:01
xiaxin222a 发表于 2013-12-27 21:48 
只是说编译器并非是高级语言的专利,一个叫法而已。
难道你不知汇编转换成机器语言和高级语言编译成汇编或者机器语言有本质上的区别?
作者: xiaxin222a 时间: 2013-12-27 22:03
本帖最后由 xiaxin222a 于 2013-12-27 23:05 编辑
深谷白云 发表于 2013-12-27 22:01 
难道你不知汇编转换成机器语言和高级语言编译成汇编或者机器语言有本质上的区别?
编辑
作者: 深谷白云 时间: 2013-12-27 22:24
本帖最后由 深谷白云 于 2013-12-27 22:35 编辑
xiaxin222a 发表于 2013-12-27 22:03 
编译[1]是从源代码(通常为高级语言)到能直接被计算机或虚拟机执行的目标代码(通常为低级语言或机器语言 ...
我就手打给你David A.Patterson和John L.Hennessy写的《 Computer Organization and Design The Hardware/Software Interface》里对编译器的解释吧,如果你认为MIPS编译器的领导者都不知编译器是什么,那我也无话可说了。
compiler A program that translates high-level language statements into assembly language statements.
至于所谓的汇编变成2进制代码
assembler A program that translates a symbolic version of instructions into the binary version.
作者: xiaxin222a 时间: 2013-12-27 22:59
重新去放狗搜了会,大软的意思应该是MT Framework大规模动用汇编挖潜,但不是从汇编最低层开始编写,类似操作系统向各平台进行移植。我的理解有误。
作者: westlee 时间: 2014-1-6 21:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: 结果 时间: 2014-1-6 22:01
还以为PS4的HD7850和山猫跑战地4能让一些人清醒
作者: westlee 时间: 2014-1-30 18:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: koppie 时间: 2014-2-1 02:21
xiaxin222a 发表于 2013-12-27 18:50 
MOV AND这些指令要翻译成0100101之类的机器语言,这就要靠编译器做。家用机的CPU也没什么SSE类的高级指令 ...
做这个的是assembler,很trivial的工作
和compiler不一样
作者: westlee 时间: 2014-2-2 18:37
提示: 作者被禁止或删除 内容自动屏蔽
作者: cenxuebin 时间: 2014-2-2 18:49
westlee 发表于 2014-2-2 18:37 
跑mantle,270x 秒杀780ti,跑dx,770秒杀amd全家。
这是CPU游戏吧
怎么280X和290X差不多
而且770和780TI差距也不正常
PS;馒头其实是优化CPU的吧
欢迎光临 POPPUR爱换 (https://we.poppur.com/) |
Powered by Discuz! X3.4 |