POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 5030|回复: 24
打印 上一主题 下一主题

转:tegra2设计以及功耗分析

[复制链接]
跳转到指定楼层
1#
发表于 2010-6-5 09:10 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
如果大家看過前兩篇ARM應用處理器的概述,應該會對ARM核心的基本架構與應用有了相當程度的認知。而本系列文章也將前進到另外一個階段,從本週開始,筆者將從實際產品著手,介紹在手機產品中著名的應用處理器架構,當然,如果大家有興趣知道其他應用架構,或有其它問題,歡迎留言指教,筆者會在之後的專欄中為各位解答。


講到NVIDIA,大家對其最印象深刻的就是顯示晶片了,這十年來,NVIDIA的顯示晶片以超越摩爾定律的速度持續進化著,應用範圍也超越3D顯示,不僅挑戰傳統CPU的領域,如今,NVIDIA的招牌也開始出現在手機等各種嵌入式應用產品裡,也就是Tegra產品線。

本篇將會詳細介紹Tegra的基本結構,讓大家瞭解這款應用處理器究竟包含什麼特異功能、以及NVIDIA獨家的特色。

Tegra家族

目前Tegra包含了兩大產品線,也就是大家熟知的APX2500/2600與CSX600/650,APX是針對手機市場設計,至於CSX則是針對高階車用娛樂與導航、MID、netbook等較大型的設備而來。除了時脈與支援周邊的數量不同,其他都大同小異,1080p解碼已經是必備能力,高階3D繪圖效能更是NVIDIA引以為傲的特色。

一般來說,高效能其實等同於高功耗,這個情況過去在半導體產業屢見不鮮,系統商往往在省電和效能之間難以抉擇,即便是NVIDIA的顯示卡也避免不了。Tegra的解決方式很聰明,就是把各個功能處理單元的功耗設計完全切割開來,當需要個別處理能力時(比如說音訊處理、視訊解碼),就把其他用不到的部分關掉。不過它的細節並不簡單,我們稍後再述。

Tegra就像一般應用處理器一般,包含了CPU、繪圖、多媒體、IO、儲存控制等必備的基本能力。1代Tegra具有7個核心,2代則是因為導入雙核Cortex-A9,所以多了1個變成8個。當然,這樣的核心區分與定義,有時是為了宣傳方便(NV:你們看,我們家的Tegra隨隨便便也有7、8個核心,Intel的4核心算什麼?Atom的HyperThreading閃邊喘啦!),然而事實上,所有應用處理器的處理單元設計都大同小異,只是要看整合能力的多寡來取捨而已。我們以Tegra 一、二代為主線進行解說。

CPU核心:
這是一款應用處理器核心部分,Tegra一代是採用ARM11核心,二代則是改採雙核Cortex-A9,除了AMR11跟Cortex-A9以外,另外整合了1個ARM7,這個ARM7的功用非常特殊,與高通的MSM 7xxx中的次要ARM9核心有著完全不同的功能取向。

顯示核心:
這顆核心是NVIDIA最自豪的特色之一,Tegra一代架構上基於Geforce 6,具有兩個pixel shader units、兩個vertex shader units 以及兩個texture mapping units (TMUs),最高咦鲿r脈為130MHz,每秒可以產生高達4000萬以上的多邊形與6億個pixel。當然,這是顆特別打造的GeForce 6,跟以前的市售產品差很多,整體速度大約是GeForce 6100(一個vertex shader、三個pixel shader,時脈425MHz)的一半。即便如此,也已經是Snapdragon繪圖核心速度的兩倍有餘了,也相當於Imagination前陣子所推出的PowerVR SGX545(時脈200MHz)。

Tegra二代中的繪圖核心與一代同樣是基於GeForce 6,不過速度比一代提高了兩到三倍以上,基本上這是透過時脈與記憶體頻寬增加而得來的,架構並沒有改變。即便如此,也已經可以在FWVGA解析度上流暢的執行Unreal 3(Tegra一代為Quake 3)遊戲。不過,對於高階遊戲玩家,Tegra一/二代都可以另外附加包含GeForce 9功能以及部分CUDA能力的次晶片(sub die),達成更恐怖的計算能力。

搞不懂為何要另外增加這個晶片?想像一下,整合Tegra 2的NDS HD遊戲機,隨身攜帶時,可以只啟動內建的GeForce 6核心,在FWVGA解析度下遊戲時間可以長達2、30個小時,如果接上基座(內建光儲存媒體的dock station),連接到電視螢幕上,就可以啟動GeForce 9晶片,加上CUDA的平行計算能力,變身成為Wii HD,享受超越PS3的3D效果。當然,這只是合理推論,不準不要罵我…:P

圖形處理核心:
這個部分是負責執行2D圖形顯示以及照相機的功能,連接外部顯示器時,可以提供超過SXGA的解析度,照相機功能最高可支援達1200萬畫素。

HD影像編碼核心:
一代Tegra中,給手機使用的APX 2500/2600並沒有包含這個核心,而是在高階的CSX650才有,在Tegra二代產品線目前還不明瞭。不過目前看來,應該是全線都會支援這個編碼核心。一代中CSX650僅支援到720p影像的即時編碼,Tegra 2的HD影像編碼核心則是提供了1080p H.264的即時編碼能力,不過不清楚可以支援到什麼profile。

HD影像解碼核心:
這個核心在所有的Tegra產品線上都有,不過能力不一,比如說APX2500/2600、CSX600就被限制在720p,CSX650和Tegra二代都能夠達到1080p的解碼能力。值得一提的是,NVIDIA結合了部分硬體線路設計,而不是像高通採用DSP來解碼,因此不僅效率高,佔用晶片面積小,而且更為省電!硬體線路是執行解碼時負擔最重的部分,並且只內建最熱門的幾種編解碼標準(比如說可被H.264、MPEG-4共用的解碼邏輯,WMV及VC1可共用的解碼邏輯),讓CPU負擔減到最輕。當然,碰到他不支援的編解碼標準,還是只能用CPU硬上了。

音效解碼核心:
NVIDIA在2007年的時候,用3.5億美元收購了PortalPlayer公司。要知道,蘋果鼎鼎大名的iPod一到五代,整個音效子系統用的都是PortalPlayer的晶片,基本上,這個音效解碼核心,是把過去PortalPlayer的音效處理晶片,剝離ARM的部分獨立而成。跟影像編解碼部分情況類似,大多數工作也是透過硬體線路處理。由於音效編解碼的處理負載小,且各種編解碼模式相當類似,因此即便支援主流音效格式,核心依然能夠維持的非常精緻,且效率非常高。加入預設的幾個預先定義的後處理(post-process)特效與EQ之後,就構成了完整的音效處理核心。

深入研究省電設計

前面提到,ARM7在Tegra之中扮演著非常特殊的角色,它主要負責網路通訊的負載、基本系統工作以及隨時監控系統正在執行什麼應用,並且根據目前載入的應用類型動態關閉用不到的核心。基本上,如果ARM11/Coretx-A9是大腦,那這個ARM7就相當於小腦,而且必要時還能接任大腦的工作。

比如說聽MP3時,ARM7就會接手負責音樂播放列表控制、部分內部儲存IO控制,從小腦變成大腦,並關閉除了音效解碼核心、音效IO(IO部分其實也可定義成為一個子系統,也可根據系統需求,動態開啟或關閉特定的IO回路,但是NVIDIA並沒有特別強調,因為沒人會關心IO在做什麼)以外的其他核心,此時的工作狀態,就有如完全沒有螢幕的iPod shuffle,加上預計有一、兩千mAh容量的電池助陣,想達到上百小時的音樂播放,可以說輕鬆之至!

依此類推,播放影片時,ARM7會則視影片複雜度決定自己上或由主CPU核心(ARM11或Cortex-A9)接手,同時開啟HD影像處理核心、音效核心、影像、音效輸出IO,在這樣的狀態下可以達到十幾個小時的連續播放時間。

最後,玩3D遊戲時,不需要的編解碼核心就可以全部關掉,由於處理器負載高,因此開啟最大咚阈?埽瑏K且開啟顯示核心與音效核心,ARM7則是在背景定時偵測咚銧顟B,如果遊戲咚阌锌障叮?热缯f遊戲暫停,就立刻忙裡偷閒,關閉目前空閒的部分,藉此延長開機時間。

結論

藉由高靈活度的核心設計與功耗調度控制,Tegra1/2達到了空前的效能與功耗表現,包括TI、高通在內的傳統DSP架構沒有人是對手。目前也成功導入包括MP3、汽車導航等多種嵌入式應用!NVIDIA在繪圖架構上還有許多發揮空間,比如說未來一定會把CUDA計算能力整合到Tegra中,進一步提高應用處理器的應用能力。不過,沒有整合3G模組,使得Tegra平台的成本與BOM cost在手機產品上沒辦法與高通競爭(高通:我…我的整合性還是最高啦!效能再高也沒用!能賣贏我再說吧!)不過在高階嵌入式應用市場,Tegra的應用延展性就明顯勝過高通了。
2#
 楼主| 发表于 2010-6-5 09:16 | 只看该作者
此文能看出几点

1. NV在功耗优先领域还是使用DX9性能晶体管效率最高的GF6构架

2. 与桌面显卡注重通用计算不同,tegra完全是专用模块化结构,每一个模块都对应一个应用,没有像高通德仪那样使用多用途DSP。

3. 除了GPU之外每个独立模块都可以独立运行只需要ARM7核心配合,其他模块在运行时可以关闭。


从这些可以看出NV为了低功耗采用的设计真的很独特
回复 支持 反对

使用道具 举报

3#
发表于 2010-6-5 09:24 | 只看该作者
本帖最后由 gz_easy 于 2010-6-5 09:28 编辑

基于Tegra2+Android和Tegra2+WinCE6.0的平板都值得期待。
回复 支持 反对

使用道具 举报

4#
发表于 2010-6-5 11:26 | 只看该作者
此文能看出几点

1. NV在功耗优先领域还是使用DX9性能晶体管效率最高的GF6构架

2. 与桌面显卡注重通用 ...
66666 发表于 2010-6-5 09:16

DX9性能晶体管效率最高的应该是GF7架构,不过对手持设备上来说,GF6已经满足其性能要求,而且要重新设计图形核心花费的时间比较长,因此NVIDIA还是继续用GF6核心再稍稍提升频率。
回复 支持 反对

使用道具 举报

5#
发表于 2010-6-5 11:39 | 只看该作者
它的前途决定于ipad 2代会不会使用它。
回复 支持 反对

使用道具 举报

6#
 楼主| 发表于 2010-6-5 11:50 | 只看该作者
它的前途决定于ipad 2代会不会使用它。
goodayoo 发表于 2010-6-5 11:39



   
苹果以后主机只会是自己设计的芯片,所有第三方的东西都不可能用

平板机这市场很大,苹果料想也没办法一口吞下
回复 支持 反对

使用道具 举报

7#
发表于 2010-6-5 11:52 | 只看该作者
这叫分析?一点数据都没有。

手机大佬们玩的arm都是以毫瓦计功耗的。几Wh的电池要维持几天的待机。tegra是多少?
其实tegra就是借用nv的gpu功力提升显示性能而已。手机大佬们是不舍得往芯片里塞高性能高功耗的gpu。只是现在遇到了平板机时代,显示屏的功耗大大增加,tegra增加的功耗不再起眼......恰逢其时尔。
回复 支持 反对

使用道具 举报

8#
发表于 2010-6-5 11:54 | 只看该作者
回复 7# spinup
还是很要命的,平板电脑,也要12小时的待机比较好,否则不如sub-note了。
回复 支持 反对

使用道具 举报

9#
 楼主| 发表于 2010-6-5 12:02 | 只看该作者
这叫分析?一点数据都没有。

手机大佬们玩的arm都是以毫瓦计功耗的。几Wh的电池要维持几天的待机。tegra ...
spinup 发表于 2010-6-5 11:52



   
手机待机功耗更看基带芯片好不好,tegra功耗如果达不到手机要求微软还用来做手机?,要知道微软系统移植到TI和高通上可一点难度都没有

文中对于tegra在手机上为什么几乎没什么人用的最主要原因已经说很清楚,没有手机基带芯片专利的intel也会遇到同样的问题

高通和TI舍不得在里面加上高性能GPU跟他们能不能设计出高性能GPU是两码事,靠PowerVR?
回复 支持 反对

使用道具 举报

10#
发表于 2010-6-5 12:05 | 只看该作者
作者很无知,楼主也一样
回复 支持 反对

使用道具 举报

11#
发表于 2010-6-5 12:10 | 只看该作者
手机待机功耗更看基带芯片好不好,tegra功耗如果达不到手机要求微软还用来做手机?,要知道微软 ...
66666 发表于 2010-6-5 12:02

微软能用谁的芯片做自己的手机?

问手机大佬们“给我你们最好的芯片,我也要做手机来揍你们了"?
回复 支持 反对

使用道具 举报

12#
 楼主| 发表于 2010-6-5 12:17 | 只看该作者
作者很无知,楼主也一样
elisha 发表于 2010-6-5 12:05



   
你说的话很符合无知这个词的概念,无知且无聊无料
回复 支持 反对

使用道具 举报

13#
 楼主| 发表于 2010-6-5 12:20 | 只看该作者
微软能用谁的芯片做自己的手机?

问手机大佬们“给我你们最好的芯片,我也要做手机来揍你们了 ...
spinup 发表于 2010-6-5 12:10



   
。。。。。敢问那么多用WM的手机都是用的什么平台?

微软那款手机也是夏普代工的,tegra功耗达不到要求微软换芯毫无难度
回复 支持 反对

使用道具 举报

14#
发表于 2010-6-5 12:40 | 只看该作者
Tegra 集成的 GPU 和桌面的系列完全不一样,不要瞎猜了。

说到耗电,ipad 只能维持 10 小时的视频播放,而基于 Nvidia Tegra 250 的 Adam 可以做到 16 小时,10.1 英寸屏幕,重量不过 650 克,这还是 WIFI + 3G 的版本(ipad wifi 是 680 克,WIFI +3G 是 730 克)。

回复 支持 反对

使用道具 举报

15#
发表于 2010-6-5 12:44 | 只看该作者
过去的WM手机不是微软自有品牌,这回的KIN是,影响是不同的。
不过我认为高通德仪又不生产手机,也应该无所谓才对,三星什么的倒是可能不给。
tegra1的典型功耗是500mw,并不算好,里面有专用电路的缘故听MP3什么的还比较耐用就是了。
回复 支持 反对

使用道具 举报

16#
发表于 2010-6-5 12:54 | 只看该作者
回复 15# AFXIF
MS自己品牌的硬件产品,除了X360,恐怕还没有很成功的先例。
MS 自己的品牌也是两头怕,市场太好了,会把客户推向竞争者。
回复 支持 反对

使用道具 举报

17#
发表于 2010-6-5 12:54 | 只看该作者
我只说一句,这玩意儿现在就是高达,无法正常工作
回复 支持 反对

使用道具 举报

18#
发表于 2010-6-5 13:06 | 只看该作者
繁体字与其说是分析,不如说是猜测+YY。
回复 支持 反对

使用道具 举报

19#
发表于 2010-6-5 13:20 | 只看该作者
搞不懂為何要另外增加這個晶片?想像一下,整合Tegra 2的NDS HD遊戲機,隨身攜帶時,可以只啟動內建的GeForce 6核心,在FWVGA解析度下遊戲時間可以長達2、30個小時,如果接上基座(內建光儲存媒體的dock station),連接到電視螢幕上,就可以啟動GeForce 9晶片,加上CUDA的平行計算能力,變身成為Wii HD,享受超越PS3的3D效果。當然,這只是合理推論,不準不要罵我…:P

.........................
这人缺乏基本常识
回复 支持 反对

使用道具 举报

20#
发表于 2010-6-5 13:21 | 只看该作者
此文能看出几点

1. NV在功耗优先领域还是使用DX9性能晶体管效率最高的GF6构架

2. 与桌面显卡注重通用 ...
66666 发表于 2010-6-5 09:16


作者基本在扯谈,你拿这个当论据是不行的
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2024-9-21 05:28

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表