POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5031|回复: 23
打印 上一主题 下一主题

[转帖]NVIDIA更加保守?细数Tegra 4的几大失望之处

  [复制链接]
跳转到指定楼层
1#
发表于 2013-1-11 17:06 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 loverlong 于 2013-1-11 17:21 编辑

转帖机不转,我来转了吧。NV肿么办?老黄你就乖乖的卖切糕去吧。


Tegra 4基本情况:四核Cortex-A15架构、频率最高1.9GHz
  NVIDIA的Tegra 4是世界首款四核Cortex-A15架构ARM处理器,目前的Cortex-A15处理器还是三星的Exynos 5 Dual双核,Nexus 10上使用的正是1.7GHz频率的Exynos 5250,因此在四核架构方面Tegra 4还是比较领先的,不过三星今年将推出big.LITTLE架构的八核处理器,内有4个Coretex-A15和Cortex-A7核心,华为据说也在开发Cortex-A15架构的K3V3处理器,Tegra 4还要加速上市速度才行。
       Tegra 4使用的是TSMC的28nm HPL HKMG工艺,相比HPM工艺它主要优化了漏电流和峰值频率,比Tegra 3使用的40nm LPG工艺优秀得多,所以Tgera 4的最高频率达到了1.9GHz,核心面积约为80mm2,低于苹果A6X的124mm2,基本维持在了Tegra 3的80mm2量级,只不过晶体管规模肯定更高,具体数值未知。。  
       此外,Tgera 4依然沿用了Tegra 3的4-Plus-1设计,也就是说实际上有5个核心,另外一个隐藏核心也是Cortex-A15架构的,不过频率、电压以及功耗要低得多,主要用来应付一些不需要高性能的应用,这样可以降低功耗,延长续航时间。
       这个隐藏/伴生核心在系统里也是不可见的,而且它也不是三星那样的big.LITTLE架构,工作原理应该跟Tegra 3里的隐藏核心类似。  
       内存方面,Tegra 4终于一改Tegra 3只支持单通道内存的不足了,开始支持双通道LP-DDR3/DDR3L/LPDDR2,不过内存频率还没有准确数据,三星Exynos 5的DDR3频率达到了800MHz,Tegra 4至少也该有这个水平。

续航与功耗:功耗减少45%,TDP大约8W  
       新工艺的直接好处就是降低了处理器功耗,Tegra 4的功耗号称比Tegra 3减少了45%,视频播放续航时间为14小时。
  芯片的TDP参数未知,不过Heise从Project Shield游戏机中估算了一下,它配备的是38Wh电池,续航时间是5-10小时(在掌机中这个续航算是很低了),因此功耗大约是3.8-7.6W左右,如果算上内存、WiFi之类的消耗,那么实际功耗在5W左右。
  这个功耗是什么概念呢?结合之前Anandtech做过的芯片级功耗测试来看,三星的Exynos 5250处理器的典型功耗在4W左右,最大功耗约为8W,因此四核的Tegra 4控制的还算不错,只不过这个“不错”的前提只适用于配备大容量电池的平板上。
  我们把Project Shield游戏机看作一个5英寸720P、38Wh电池的手机,其游戏续航时间是5-10个小时,我们以小米2手机为参照对象,其电池容量为2000mAH,电压3.7V,电池容量是7.4Wh,在我们的测试中GLBenchmark放电时间是3小时27分,那么使用小米2手机同样容量电池的Tegra 4手机游戏续航时间恐怕只有1-2个小时,只有小米2手机的一半左右,而且这还没考虑手机里各种信号芯片的消耗。
       当然,这个换算是比较粗放的,手机/平板的真实续航时间还要看屏幕以及厂商的优化,但是从NVIDIA官方给出的数据换算来看Tegra 4用在手机上恐怕需要在续航上作出一些妥协。

GPU:非统一渲染架构,核心源于NV4x架构 
    Tegra 4的CPU架构部分是基于Cortex-A15指令集的,32位ARM架构上NVIDIA还不会开发自己的指令,Project Denver计划的产品倒是有可能跟高通一样自主开发ARM兼容架构,所以Tegra 4的CPU架构不做介绍了,GPU部分是NVIDIA自己开发的,这个才是重点。
  先说Tegra 4问世之前的一个小插曲。NVIDIA今年推出的Kepler架构功效非常高,一改Fermi时代的高发热高功耗旧貌,黄仁勋在公司内部邮件中表示Kepler架构如此高效甚至可以用到移动处理器上,而许多人确实很期待Tegra 3之后的产品会升级到统一渲染架构。
  等Tegra 4露面了,统一渲染架构的设想已经被证实不可能了,Tegra 4的显卡有72个单元,市场总监Nick Stam已经证实Tegra 4由48个PS像素单元和24个VS定点单元组成,延续了Tegra 2/3使用的GeForce ULP核心,其中Tegra 3上的PS:VS是8:4,Tegra 4的规模是Tgera 3的6倍,当然还有一些渲染管线以及缓存容量的调整,不过纹理单元规模没有提及。
  GeForce ULP架构源于GeForce 6/7时代的NV4X架构,是2004年的产品了,PS3中使用的RSX架构其实就是GeForce 7800 GTX的NV47核心的改款。
       在统一渲染架构支持方面走的比较靠前的是PowerVR,SGX 5系列开始就已经支持统一渲染架构了,这都是几年前的事了,新一代SGX 6系列还会继续提升。不过NVIDIA市场营销总监Nick Stam认为苹果的处理器中图形核心占据了太多面积,而实际游戏“并不是那么让人着迷”,而NVIDIA的长处不是堆硬件,而是软件和驱动优化,通过与游戏开发商的合作与优化是可以打败iPad的
       不管哪种种架构,具体的性能上NVIDIA宣传的都是6倍提升,具体的游戏测试中应该能达到3-4倍性能提升(NVIDIA语)。从昨天曝光的性能测试来看,GLBenchmark 2.5中现在的Tegra 4跑分已经达到Tegra 3的2.5倍左右,相当于A6X的62%,优化之后得分应该还会有所提升。

API规范:不支持OpenCL也没有CUDA,甚至不支持OpenGL 3.0
  GPU架构的硬件设计先不去管它,再来看Tegra 4最为人诟病的地方——那就是作为新一代的移动处理器,它竟然不支持现有的技术规范,GPU计算方面完全不支持OpenCL,NVIDIA自家的CUDA也不支持,图形规范上也不支持OPenGL ES 3.0(NVIDIA的宣传中都没提这一点,Heise上说的是不支持,应该还是停留在Tegra 3的ES 2.0规范上),微软的DX10/DX11.1也不要指望了。
       BSN对这个问题很在意,特地询问了NVIDIA官方,后者在回复中表示“现在的移动应用中根本无法利用OpenCL、CUDA以及更高级的OpenGL规范的优势,Tegra 4的GPU性能非常强劲,我们的目标是致力于提高终端用户的真实体验。
  NVIDIA没说出口的深层原因也许是Tegra 4的GPU架构实在太老了,还是GeForce 6/7时代的,那时候OpenCL以及自家的CUDA恐怕还在酝酿阶段,所以干脆不提这些技术规范了,这一举动也让BSN大加吐槽,这跟NVIDIA在桌面及HPC领域中推崇GPU计算的表现完全不符啊。
  BSN还举例称不支持OpenCL这样的规范已经对NVIDIA的Tegra造成了影响,在BWM新一代硬件竞争中NVIDIA就败给了飞思卡尔,后者使用的Vivante图形核心支持最新的OpenGL ES 3.0以及OepnCL规范,而NVIDIA的不行,这就是他们出局的原因。
  另外,不支持这些规范对NVIDIA未来的市场竞争也很不利,Futuremark即将推出新一代跨平台测试软件,Rightware的Basemark X也会如此,他们都要求更高的API规范支持。实际上从CES展会上的现场测试来看也是如此,对OpenCL、OpenGL ES 3.0支持较好的高通APQ8064处理器手机以及iPad得分都比较靠前,而Tegra 3处理器就非常靠后
  还有Windows RT设备上的,高通的APQ8064、ARM的Mali-T600系列已经支持DX11/DX10规范,据说高通没能入选Surface RT平板处理器是因为当时他们没搞定驱动,所以微软才选了Tegra 3,而且有消息表示下一代Surface RT平板将使用高通、AMD以及Intel的芯片,毕竟这三家的移动GPU核心对DX11规范支持的更好。

结语
  在Tegra 4没公开之前,传闻中的各种规格确实让人很兴奋,四核Cortex-A15核心,统一渲染架构,72个图形单元,支持DX11、OpenCL、OpenGL 4.x以及CUDA规范,但是最终有些规程变成现实了,不过API规范方面与大家的预期相比是一落千丈,虽然NVIDIA嘴硬说这些规范没什么意义,他们更关注用户体验,但是作为新一代的移动处理器,Tegra 4至少也要在市场上撑两年,别人已经支持的规范你却不支持,这在宣传上已经吃亏了。
  还有就是Tegra 4处理器的功耗和续航,作为一个四核Cortex-A15架构的处理器来说,4-8W的功耗跟现在的三星Exynos 5双核差不多,看起来已经很不错了,不过三星的双核Cortex-A15处理器目前只用在了平板中,依然没能进入手机市场。目前使用Tegra 4处理器的设备也主要是平板,用在智能手机上恐怕还得优化一下功耗管理,该降频就得降频。
  最后就是上市时间了,这个问题甚至要比规格性能高低的影响还要大,目前能提供28nm四核处理器的主要是高通一家(其实国内的瑞芯也推出了28nm工艺的四核Cortex-A9处理器了),无论是平板还是手机,现在不用APQ8064都不好意思说自己是旗舰了。
  NVIDIA如果能在未来两三个月内将大批Tegra 4设备推向市场,那么跟高通还有的一拼,如果要拖到年中或者下半年了,那么三星的28nm HKMG工艺的四核Cortex-A15处理器、高通的骁龙600/800处理器也要问世了,到时候竞争烈度就会更高,Tegra 4的优势还有多少呢?

2#
发表于 2013-1-11 17:11 | 只看该作者
注意排版
回复 支持 反对

使用道具 举报

3#
发表于 2013-1-11 17:14 | 只看该作者
伴核的功能完全可以通过关闭三个核心,降低最后一个核心的频率和电压实现,不知道单独搞一个出来有什么意义
回复 支持 反对

使用道具 举报

4#
发表于 2013-1-11 17:14 | 只看该作者
续航时间是5-10小时(在掌机中这个续航算是很低了)

哈哈哈哈,我敢说这个编辑根本就没玩过掌机。
回复 支持 反对

使用道具 举报

5#
发表于 2013-1-11 17:17 | 只看该作者
很好奇,目前乃至几个月后,“可以应用在手机”上的多核A15处理器是不是暂时只有Wayne?如果Exynos 5250确定无法进入这个市场的话?
回复 支持 反对

使用道具 举报

6#
发表于 2013-1-11 17:26 | 只看该作者
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??
回复 支持 反对

使用道具 举报

7#
发表于 2013-1-11 17:27 | 只看该作者
http://www.brightsideofnews.com/ ... defensive-mode.aspx

加上原文吧,里面还有很多东西可以自己去看看。

其实整个tegra系的构筑理念从一代就能看出来,NV在手持平台上更倾向用固定功能单元而不是所谓通用计算,tegra4的HDR功能甚至根本就不会对第三方软件厂商开放。从根本来说手机GPU搞通用计算用处有多少没人能说的清,就以目前GPU内部ALU设计方式只能做些图形渲染、视频特效之类对精度和分支预测性能要求极低的功能(其实桌面GPU也好不了多少),实际游戏别说是DirectCompute这样高端技术,即使是简单的Parallax Mapping也没有多少游戏和测试用上。更别提FP16源生贴图都不支持这样的远古HDR技术。

在这样的环境下谈GPGPU的重要性真是有点搞笑
回复 支持 反对

使用道具 举报

8#
发表于 2013-1-11 17:31 | 只看该作者
darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心,降低最后一个核心的频率和电压实现,不知道单独搞一个出来有什么意义

伴星的供电是独立的,设计上也有区别。桌面I3你再怎么降低电压频率也达不到笔记本低电压I5的能耗
回复 支持 反对

使用道具 举报

9#
发表于 2013-1-11 17:33 | 只看该作者
goldman948 发表于 2013-1-11 17:26
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

就Wayne流片的时间看,Kepler架构根本来不及……
回复 支持 反对

使用道具 举报

10#
发表于 2013-1-11 18:42 | 只看该作者
darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心,降低最后一个核心的频率和电压实现,不知道单独搞一个出来有什么意义

虽然不懂但是我觉得你比NV的架构师要厉害哈。
回复 支持 反对

使用道具 举报

11#
发表于 2013-1-11 18:45 | 只看该作者
goldman948 发表于 2013-1-11 17:26
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

估计kepler的功耗不适合用在移动平台上,估计要简化调power什么的,时间点上也来不及吧,我估计下一代可能会用。
回复 支持 反对

使用道具 举报

12#
发表于 2013-1-11 18:50 | 只看该作者
goldman948 发表于 2013-1-11 17:26
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

NV还没有确保在移动CPU市场的主流地位,所以不敢贸然加入可能带来风险的CUDA架构进入Tegra。
回复 支持 反对

使用道具 举报

13#
发表于 2013-1-11 19:23 | 只看该作者
darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心,降低最后一个核心的频率和电压实现,不知道单独搞一个出来有什么意义

这显然没有4个采用高性能工艺生产的主核全关,剩下一个用低功耗工艺来生产的伴核省电……
回复 支持 反对

使用道具 举报

14#
发表于 2013-1-11 20:01 | 只看该作者
我也想不明白OPENCL、CUDA拿到手机上干什么?
回复 支持 反对

使用道具 举报

15#
发表于 2013-1-11 20:18 | 只看该作者
不支持DX11,真失望
回复 支持 反对

使用道具 举报

头像被屏蔽
16#
发表于 2013-1-11 20:32 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

17#
发表于 2013-1-11 22:59 | 只看该作者
作为粉丝,有倾向实属正常,但是不能总是谎言一说到底吧:
还有Windows RT设备上的,高通的APQ8064、ARM的Mali-T600系列已经支持DX11/DX10规范
APQ8064支持DX10???  现在哪家已经量产的SoC中的GPU支持DX11的???
如果谈还在开发中,那我说NV也有支持DX11的Tegra产品,信么?

做芯片,看三个指标:perf, perf/W, perf/mm。作于极为看重功耗的SoC,前两个更为重要。高通的GPU,perf/W极差,所以基本上无法做到Tegra4级别的性能。
回复 支持 反对

使用道具 举报

18#
发表于 2013-1-12 01:34 | 只看该作者
本帖最后由 sim0831 于 2013-1-12 01:35 编辑

對Tegra4極其失望
GPU架構還是使用2004年的NV43 (Geforce 6)
感覺Tegra團隊沒有用心在GPU上

別家買IP就比你強了
回复 支持 反对

使用道具 举报

19#
发表于 2013-1-12 12:23 | 只看该作者
必然是NV的统一架构比现有的NV43更耗电,否则没有理由不加
回复 支持 反对

使用道具 举报

头像被屏蔽
20#
发表于 2013-1-12 12:34 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-1-23 07:13

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表