[转帖]NVIDIA更加保守？细数Tegra 4的几大失望之处

loverlong · 发表于 2013-1-11 17:06

本帖最后由 loverlong 于 2013-1-11 17:21 编辑

转帖机不转，我来转了吧。NV肿么办？老黄你就乖乖的卖切糕去吧。

Tegra 4基本情况：四核Cortex-A15架构、频率最高1.9GHz

　　NVIDIA的Tegra 4是世界首款四核Cortex-A15架构ARM处理器，目前的Cortex-A15处理器还是三星的Exynos 5 Dual双核，Nexus 10上使用的正是1.7GHz频率的Exynos 5250，因此在四核架构方面Tegra 4还是比较领先的，不过三星今年将推出big.LITTLE架构的八核处理器，内有4个Coretex-A15和Cortex-A7核心，华为据说也在开发Cortex-A15架构的K3V3处理器，Tegra 4还要加速上市速度才行。

Tegra 4使用的是TSMC的28nm HPL HKMG工艺，相比HPM工艺它主要优化了漏电流和峰值频率，比Tegra 3使用的40nm LPG工艺优秀得多，所以Tgera 4的最高频率达到了1.9GHz，核心面积约为80mm2，低于苹果A6X的124mm2，基本维持在了Tegra 3的80mm2量级，只不过晶体管规模肯定更高，具体数值未知。。　　

此外，Tgera 4依然沿用了Tegra 3的4-Plus-1设计，也就是说实际上有5个核心，另外一个隐藏核心也是Cortex-A15架构的，不过频率、电压以及功耗要低得多，主要用来应付一些不需要高性能的应用，这样可以降低功耗，延长续航时间。

这个隐藏/伴生核心在系统里也是不可见的，而且它也不是三星那样的big.LITTLE架构，工作原理应该跟Tegra 3里的隐藏核心类似。　　

内存方面，Tegra 4终于一改Tegra 3只支持单通道内存的不足了，开始支持双通道LP-DDR3/DDR3L/LPDDR2，不过内存频率还没有准确数据，三星Exynos 5的DDR3频率达到了800MHz，Tegra 4至少也该有这个水平。

续航与功耗：功耗减少45%，TDP大约8W　　

新工艺的直接好处就是降低了处理器功耗，Tegra 4的功耗号称比Tegra 3减少了45%，视频播放续航时间为14小时。

　　芯片的TDP参数未知，不过Heise从Project Shield游戏机中估算了一下，它配备的是38Wh电池，续航时间是5-10小时（在掌机中这个续航算是很低了），因此功耗大约是3.8-7.6W左右，如果算上内存、WiFi之类的消耗，那么实际功耗在5W左右。

　　这个功耗是什么概念呢？结合之前Anandtech做过的芯片级功耗测试来看，三星的Exynos 5250处理器的典型功耗在4W左右，最大功耗约为8W，因此四核的Tegra 4控制的还算不错，只不过这个“不错”的前提只适用于配备大容量电池的平板上。

　　我们把Project Shield游戏机看作一个5英寸720P、38Wh电池的手机，其游戏续航时间是5-10个小时，我们以小米2手机为参照对象，其电池容量为2000mAH，电压3.7V，电池容量是7.4Wh，在我们的测试中GLBenchmark放电时间是3小时27分，那么使用小米2手机同样容量电池的Tegra 4手机游戏续航时间恐怕只有1-2个小时，只有小米2手机的一半左右，而且这还没考虑手机里各种信号芯片的消耗。

当然，这个换算是比较粗放的，手机/平板的真实续航时间还要看屏幕以及厂商的优化，但是从NVIDIA官方给出的数据换算来看Tegra 4用在手机上恐怕需要在续航上作出一些妥协。

GPU：非统一渲染架构，核心源于NV4x架构　

　 Tegra 4的CPU架构部分是基于Cortex-A15指令集的，32位ARM架构上NVIDIA还不会开发自己的指令，Project Denver计划的产品倒是有可能跟高通一样自主开发ARM兼容架构，所以Tegra 4的CPU架构不做介绍了，GPU部分是NVIDIA自己开发的，这个才是重点。

　　先说Tegra 4问世之前的一个小插曲。NVIDIA今年推出的Kepler架构功效非常高，一改Fermi时代的高发热高功耗旧貌，黄仁勋在公司内部邮件中表示Kepler架构如此高效甚至可以用到移动处理器上，而许多人确实很期待Tegra 3之后的产品会升级到统一渲染架构。

　　等Tegra 4露面了，统一渲染架构的设想已经被证实不可能了，Tegra 4的显卡有72个单元，市场总监Nick Stam已经证实Tegra 4由48个PS像素单元和24个VS定点单元组成，延续了Tegra 2/3使用的GeForce ULP核心，其中Tegra 3上的PS：VS是8：4，Tegra 4的规模是Tgera 3的6倍，当然还有一些渲染管线以及缓存容量的调整，不过纹理单元规模没有提及。

　　GeForce ULP架构源于GeForce 6/7时代的NV4X架构，是2004年的产品了，PS3中使用的RSX架构其实就是GeForce 7800 GTX的NV47核心的改款。

在统一渲染架构支持方面走的比较靠前的是PowerVR，SGX 5系列开始就已经支持统一渲染架构了，这都是几年前的事了，新一代SGX 6系列还会继续提升。不过NVIDIA市场营销总监Nick Stam认为苹果的处理器中图形核心占据了太多面积，而实际游戏“并不是那么让人着迷”，而NVIDIA的长处不是堆硬件，而是软件和驱动优化，通过与游戏开发商的合作与优化是可以打败iPad的。

不管哪种种架构，具体的性能上NVIDIA宣传的都是6倍提升，具体的游戏测试中应该能达到3-4倍性能提升（NVIDIA语）。从昨天曝光的性能测试来看，GLBenchmark 2.5中现在的Tegra 4跑分已经达到Tegra 3的2.5倍左右，相当于A6X的62%，优化之后得分应该还会有所提升。

API规范：不支持OpenCL也没有CUDA，甚至不支持OpenGL 3.0

　　GPU架构的硬件设计先不去管它，再来看Tegra 4最为人诟病的地方——那就是作为新一代的移动处理器，它竟然不支持现有的技术规范，GPU计算方面完全不支持OpenCL，NVIDIA自家的CUDA也不支持，图形规范上也不支持OPenGL ES 3.0（NVIDIA的宣传中都没提这一点，Heise上说的是不支持，应该还是停留在Tegra 3的ES 2.0规范上），微软的DX10/DX11.1也不要指望了。

BSN对这个问题很在意，特地询问了NVIDIA官方，后者在回复中表示“现在的移动应用中根本无法利用OpenCL、CUDA以及更高级的OpenGL规范的优势，Tegra 4的GPU性能非常强劲，我们的目标是致力于提高终端用户的真实体验。”

　　NVIDIA没说出口的深层原因也许是Tegra 4的GPU架构实在太老了，还是GeForce 6/7时代的，那时候OpenCL以及自家的CUDA恐怕还在酝酿阶段，所以干脆不提这些技术规范了，这一举动也让BSN大加吐槽，这跟NVIDIA在桌面及HPC领域中推崇GPU计算的表现完全不符啊。

　　BSN还举例称不支持OpenCL这样的规范已经对NVIDIA的Tegra造成了影响，在BWM新一代硬件竞争中NVIDIA就败给了飞思卡尔，后者使用的Vivante图形核心支持最新的OpenGL ES 3.0以及OepnCL规范，而NVIDIA的不行，这就是他们出局的原因。

　　另外，不支持这些规范对NVIDIA未来的市场竞争也很不利，Futuremark即将推出新一代跨平台测试软件，Rightware的Basemark X也会如此，他们都要求更高的API规范支持。实际上从CES展会上的现场测试来看也是如此，对OpenCL、OpenGL ES 3.0支持较好的高通APQ8064处理器手机以及iPad得分都比较靠前，而Tegra 3处理器就非常靠后。

　　还有Windows RT设备上的，高通的APQ8064、ARM的Mali-T600系列已经支持DX11/DX10规范，据说高通没能入选Surface RT平板处理器是因为当时他们没搞定驱动，所以微软才选了Tegra 3，而且有消息表示下一代Surface RT平板将使用高通、AMD以及Intel的芯片，毕竟这三家的移动GPU核心对DX11规范支持的更好。

结语

　　在Tegra 4没公开之前，传闻中的各种规格确实让人很兴奋，四核Cortex-A15核心，统一渲染架构，72个图形单元，支持DX11、OpenCL、OpenGL 4.x以及CUDA规范，但是最终有些规程变成现实了，不过API规范方面与大家的预期相比是一落千丈，虽然NVIDIA嘴硬说这些规范没什么意义，他们更关注用户体验，但是作为新一代的移动处理器，Tegra 4至少也要在市场上撑两年，别人已经支持的规范你却不支持，这在宣传上已经吃亏了。

　　还有就是Tegra 4处理器的功耗和续航，作为一个四核Cortex-A15架构的处理器来说，4-8W的功耗跟现在的三星Exynos 5双核差不多，看起来已经很不错了，不过三星的双核Cortex-A15处理器目前只用在了平板中，依然没能进入手机市场。目前使用Tegra 4处理器的设备也主要是平板，用在智能手机上恐怕还得优化一下功耗管理，该降频就得降频。

　　最后就是上市时间了，这个问题甚至要比规格性能高低的影响还要大，目前能提供28nm四核处理器的主要是高通一家（其实国内的瑞芯也推出了28nm工艺的四核Cortex-A9处理器了），无论是平板还是手机，现在不用APQ8064都不好意思说自己是旗舰了。

　　NVIDIA如果能在未来两三个月内将大批Tegra 4设备推向市场，那么跟高通还有的一拼，如果要拖到年中或者下半年了，那么三星的28nm HKMG工艺的四核Cortex-A15处理器、高通的骁龙600/800处理器也要问世了，到时候竞争烈度就会更高，Tegra 4的优势还有多少呢？

NG6 · 发表于 2013-1-19 14:48

66666 发表于 2013-1-11 17:14
续航时间是5-10小时（在掌机中这个续航算是很低了）

哈哈哈哈，我敢说这个编辑根本就没玩过掌机。

编辑估计是任饭，NDS，GBA玩多了

lik · 发表于 2013-1-19 08:48

樟树发表于 2013-1-13 11:53
最后一个核工艺不同，关到最后一个核以后可以换成伴核省电。

那是T3. T4里面工艺都是一样的, 只是用的晶体管类型不一样而已.

miuler · 发表于 2013-1-18 22:28

老黄就会吹。结果做cpu做成这个贵阳。

樟树 · 发表于 2013-1-13 11:53

darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心，降低最后一个核心的频率和电压实现，不知道单独搞一个出来有什么意义

最后一个核工艺不同，关到最后一个核以后可以换成伴核省电。

Nv-fans · 发表于 2013-1-12 12:34

提示: 作者被禁止或删除内容自动屏蔽

ifu · 发表于 2013-1-12 12:23

必然是NV的统一架构比现有的NV43更耗电，否则没有理由不加

sim0831 · 发表于 2013-1-12 01:34

本帖最后由 sim0831 于 2013-1-12 01:35 编辑

對Tegra4極其失望
GPU架構還是使用2004年的NV43 (Geforce 6)
感覺Tegra團隊沒有用心在GPU上

別家買IP就比你強了

asdfjkl · 发表于 2013-1-11 22:59

作为粉丝，有倾向实属正常，但是不能总是谎言一说到底吧：
还有Windows RT设备上的，高通的APQ8064、ARM的Mali-T600系列已经支持DX11/DX10规范
APQ8064支持DX10？？？现在哪家已经量产的SoC中的GPU支持DX11的？？？
如果谈还在开发中，那我说NV也有支持DX11的Tegra产品，信么？

做芯片，看三个指标：perf, perf/W, perf/mm。作于极为看重功耗的SoC，前两个更为重要。高通的GPU，perf/W极差，所以基本上无法做到Tegra4级别的性能。

Nv-fans · 发表于 2013-1-11 20:32

提示: 作者被禁止或删除内容自动屏蔽

Windyson · 发表于 2013-1-11 20:18

不支持DX11，真失望

qwased · 发表于 2013-1-11 20:01

我也想不明白OPENCL、CUDA拿到手机上干什么？

Xenomorph · 发表于 2013-1-11 19:23

darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心，降低最后一个核心的频率和电压实现，不知道单独搞一个出来有什么意义

这显然没有4个采用高性能工艺生产的主核全关，剩下一个用低功耗工艺来生产的伴核省电……

nom8393 · 发表于 2013-1-11 18:50

goldman948 发表于 2013-1-11 17:26
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

NV还没有确保在移动CPU市场的主流地位，所以不敢贸然加入可能带来风险的CUDA架构进入Tegra。

closeyou · 发表于 2013-1-11 18:45

goldman948 发表于 2013-1-11 17:26
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

估计kepler的功耗不适合用在移动平台上，估计要简化调power什么的，时间点上也来不及吧，我估计下一代可能会用。

closeyou · 发表于 2013-1-11 18:42

darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心，降低最后一个核心的频率和电压实现，不知道单独搞一个出来有什么意义

虽然不懂但是我觉得你比NV的架构师要厉害哈。

Xenomorph · 发表于 2013-1-11 17:33

goldman948 发表于 2013-1-11 17:26
tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

就Wayne流片的时间看，Kepler架构根本来不及……

66666 · 发表于 2013-1-11 17:31

darkangel308 发表于 2013-1-11 17:14
伴核的功能完全可以通过关闭三个核心，降低最后一个核心的频率和电压实现，不知道单独搞一个出来有什么意义

伴星的供电是独立的，设计上也有区别。桌面I3你再怎么降低电压频率也达不到笔记本低电压I5的能耗

66666 · 发表于 2013-1-11 17:27

http://www.brightsideofnews.com/ ... defensive-mode.aspx

加上原文吧，里面还有很多东西可以自己去看看。

其实整个tegra系的构筑理念从一代就能看出来，NV在手持平台上更倾向用固定功能单元而不是所谓通用计算，tegra4的HDR功能甚至根本就不会对第三方软件厂商开放。从根本来说手机GPU搞通用计算用处有多少没人能说的清，就以目前GPU内部ALU设计方式只能做些图形渲染、视频特效之类对精度和分支预测性能要求极低的功能（其实桌面GPU也好不了多少），实际游戏别说是DirectCompute这样高端技术，即使是简单的Parallax Mapping也没有多少游戏和测试用上。更别提FP16源生贴图都不支持这样的远古HDR技术。

在这样的环境下谈GPGPU的重要性真是有点搞笑

goldman948 · 发表于 2013-1-11 17:26

tegra的团队和geforce的团队是否存在竞争关係?
不然为何不用kepler??

Xenomorph · 发表于 2013-1-11 17:17

很好奇，目前乃至几个月后，“可以应用在手机”上的多核A15处理器是不是暂时只有Wayne？如果Exynos 5250确定无法进入这个市场的话？

帐号		自动登录	找回密码
密码			注册

Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽	19^# 发表于 2013-1-12 12:34 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽	15^# 发表于 2013-1-11 20:32 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
Nv-fans Nv-fans 当前离线积分 9 IP卡狗仔卡头像被屏蔽
	回复支持反对使用道具举报显身卡

[转帖]NVIDIA更加保守？细数Tegra 4的几大失望之处

相关帖子

浏览过的版块