手機(jī)
手機(jī) 手機(jī)資訊 手機(jī)評(píng)測(cè) 技術(shù)分析第2期:四核處理器Tegra3詳介紹
01月 20

技術(shù)分析第2期:四核處理器Tegra3詳介紹

編輯:登徒浪子 來源:pconline
放大 縮小 打印 郵件 收藏本頁 游吧論壇

曾經(jīng)以為諸如手機(jī)這樣的移動(dòng)設(shè)備,單核處理器已經(jīng)足夠搞定它們了,哪怕不夠提高一點(diǎn)頻率肯定是沒問題的,曾經(jīng)以為雙核只是PC上的神器,手機(jī)無論如何也很難與其沾邊;然而,很多我們?cè)?jīng)以為的東西在一轉(zhuǎn)眼間之間都變成了現(xiàn)實(shí),單核處理器不再完全滿足手機(jī)需要,出現(xiàn)在PC上的雙核處理器也同樣出現(xiàn)在了手機(jī)上,并且大有加速趕超的意思。

年初Tegra 2處理器率先揭開了雙核手機(jī)大幕,于是在今年一年的時(shí)間里我們看到了大批雙核手機(jī)登場(chǎng),可以說2011年定義為雙核手機(jī)元年一點(diǎn)也不過分;現(xiàn)如今,作為雙核手機(jī)元年的2011尚還有一段時(shí)間才正式結(jié)束,但是我們已經(jīng)能嗅到四核手機(jī)的味道了,來自于NVIDIA的Tegra 3處理器已經(jīng)蓄勢(shì)待發(fā)。


尋求性能與功耗的平衡

Tegra 3處理器最明顯的特征是它擁有比Tegra 2更多的核心,也是目前首個(gè)基于移動(dòng)設(shè)備設(shè)計(jì)的四核處理器,或者更準(zhǔn)確的說應(yīng)該是4+1核處理器,因此它在四顆主核心的基礎(chǔ)上加入了一顆協(xié)處理器,以達(dá)到降低功耗和保持續(xù)航的目的。4+1處理器?聽起來似乎有些噱頭,這樣的設(shè)計(jì)理念和思路是什么?它和Tegra 2處理器相比能帶來哪些改變和提升?它能保持性能和功耗的平衡點(diǎn)嗎?帶著這一連串的疑問,我們不妨來深入了解一下全球首款四核移動(dòng)處理器Tegra 3。

4顆主核心+1顆協(xié)核心尋求性能功耗平衡點(diǎn)

待機(jī)、續(xù)航時(shí)間短一直是智能手機(jī)用戶比較發(fā)愁的一件事,特別是在大屏橫行的當(dāng)下更是如此,在雙核處理器面世之初就有不少人擔(dān)心它的功耗和續(xù)航問題,如今Tegra 3的處理核心更多了,功耗和續(xù)航問題再次成為人們關(guān)注的重點(diǎn),Tegra 3如何保持性能功耗平衡點(diǎn),下面我們來了解一下Tegra 3的架構(gòu)圖以及設(shè)計(jì)思路和方案。


Tegra 3處理器核心圖

Tegra 3處理器采用“Kal-El”作為核心代號(hào),從上面的核心圖中可以看到Tegra 3一共有五顆處理核心,單獨(dú)位于最上端的處理器就是4+1處理器中的1,也就是前面提到的協(xié)處理器,而就是NVIDIA專門為保持功耗和性能的平衡所采用的可變對(duì)稱多重處理(vSMP)技術(shù)。


4+1核心設(shè)計(jì)

可變對(duì)稱多重處理(vSMP)技術(shù)是指第五顆協(xié)核心利用專門的低功耗硅工藝制造而成,能夠以低頻率運(yùn)行活動(dòng)待機(jī)模式下的任務(wù)、音樂播放乃至視頻播放;四顆主要芯片以標(biāo)準(zhǔn)的硅工藝制造而成,可以達(dá)到更高的頻率,同時(shí)在運(yùn)行諸多任務(wù)時(shí)比雙核解決方案功耗更低。這五顆CPU核心均采用ARM Cortex A9架構(gòu),它們可以根據(jù)工作負(fù)荷而單獨(dú)地啟動(dòng)和關(guān)閉。協(xié)核心對(duì)于操作系統(tǒng)是透明的,這與當(dāng)前的異步SMP架構(gòu)不同,這意味著操作系統(tǒng)和應(yīng)用程序均不知道這個(gè)核心的存在,然而卻能夠自動(dòng)利用。


根據(jù)負(fù)載打開不同的處理器

情況一,當(dāng)機(jī)器處于待機(jī)、音頻播放、視頻播放等簡(jiǎn)單應(yīng)用時(shí),系統(tǒng)將只調(diào)用協(xié)處理器,主頻從0到500Mhz;

情況二,當(dāng)機(jī)器處于簡(jiǎn)單網(wǎng)頁瀏覽、簡(jiǎn)單2D游戲時(shí),系統(tǒng)將調(diào)用一顆標(biāo)準(zhǔn)核心,其他核心休眠;主頻從0到1.4GHz;

情況三,當(dāng)機(jī)器處于Flash網(wǎng)頁瀏覽以及多任務(wù)處理以及視頻聊天等,系統(tǒng)將調(diào)用兩顆標(biāo)準(zhǔn)核心,其他核心休眠,主頻從0到1.3GHz;

情況四,當(dāng)機(jī)器處于全負(fù)荷的情況下,四個(gè)標(biāo)準(zhǔn)核心全部啟動(dòng),主頻從0到1.3GHz。

●低功耗協(xié)核心

協(xié)核心是利用低功耗工藝技術(shù)設(shè)計(jì)而成的,卻擁有和Cortex A9 CPU相同的內(nèi)部架構(gòu),因?yàn)樗玫凸墓に嚰夹g(shù)制造,以低頻率模式運(yùn)行,所以功耗低于采用高速工藝技術(shù)制造的主CPU核心,協(xié)核心在500MHz以下工作時(shí)可實(shí)現(xiàn)高于主核心的每瓦特性能,因此協(xié)核心的最高工作頻率不高于500MHz。


移動(dòng)CPU功耗——性能曲線圖

協(xié)核心主要用于移動(dòng)設(shè)備處于活動(dòng)待機(jī)狀態(tài)及執(zhí)行后臺(tái)任務(wù),同時(shí)它還用于不需要強(qiáng)勁CPU處理能力的應(yīng)用程序;與協(xié)核心不同,CPU主核心需要極高頻以保證高性能,因此它采用高工藝技術(shù)制造而成,這種技術(shù)讓主核心能夠在較低的工作電壓下將頻率提升至比較高的水平,因此主核心能夠在不大幅增加動(dòng)態(tài)功耗的情況先實(shí)現(xiàn)高性能。

●操作系統(tǒng)透明化

Android 3.x (Honeycomb) 操作系統(tǒng)內(nèi)置了針對(duì)多重處理的支持,而且能夠利用多個(gè)CPU核心的性能。 然而,該操作系統(tǒng)會(huì)假定所有可用的CPU核心均能夠?qū)崿F(xiàn)相同的性能,并且根據(jù)這一假設(shè)來為可用的核心調(diào)度任務(wù)。 因此,為了讓操作系統(tǒng)隨時(shí)掌握協(xié)核心和主核心的管理過程,Kal-El 處理器針對(duì)協(xié)核心和主要的四個(gè)CPU核心既采用了基于硬件的管理,又采用了基于低級(jí)軟件的管理。


功耗曲線

專利的硬件與軟件CPU管理邏輯單元不斷監(jiān)控CPU的工作負(fù)荷,以便自動(dòng)而動(dòng)態(tài)地啟用和禁用CPU協(xié)核心和主核心。 打開和關(guān)閉協(xié)核心以及主核心的決定完全取決于當(dāng)前的CPU工作負(fù)荷水平以及CPU頻率控制子系統(tǒng)所得出的CPU工作頻率推薦值。該子系統(tǒng)嵌入在操作系統(tǒng)內(nèi)核之中。 該項(xiàng)技術(shù)不需要對(duì)應(yīng)用程序或操作系統(tǒng)進(jìn)行任何改動(dòng)。

Tegra 3帶來更好的用戶使用體驗(yàn)

前面介紹了Tegra 3處理器在架構(gòu)上的優(yōu)化改進(jìn)及優(yōu)勢(shì),這些對(duì)于我們普通消費(fèi)者來說可能并不直觀,下面我們就通過數(shù)據(jù)對(duì)比的方式來給大家展示四核Tegra 3得應(yīng)用優(yōu)勢(shì)。

更快地網(wǎng)頁載入速度

目前不少瀏覽器采用了多線程技術(shù),能夠產(chǎn)生多個(gè)并發(fā)進(jìn)程,這樣瀏覽器中的每個(gè)標(biāo)簽頁均為一個(gè)單獨(dú)的進(jìn)程,每個(gè)進(jìn)程又管理著各自的多個(gè)線程,因此標(biāo)簽式瀏覽器會(huì)占用比較大的CPU資源,下面我們通過幾組數(shù)據(jù)來了解在網(wǎng)絡(luò)瀏覽時(shí)CPU的使用情況,以及四核對(duì)比雙核處理器的優(yōu)勢(shì)所在。


CPU網(wǎng)絡(luò)瀏覽時(shí)四核CPU系統(tǒng)中的 CPU 使用情況

從圖中可以看到,瀏覽器使用了四核CPU的全部四個(gè)核心,而這種并行處理的效果是,與采用雙核CPU的移動(dòng)設(shè)備相比,網(wǎng)絡(luò)瀏覽體驗(yàn)快多了。 對(duì)于這些支持標(biāo)簽式瀏覽的瀏覽器,四核CPU還能夠發(fā)揮出更高的性能。


標(biāo)簽式網(wǎng)絡(luò)瀏覽期間四核CPU的使用情況


Moonbat JavaScript 基準(zhǔn)測(cè)試程序上的四核性能優(yōu)勢(shì)

圖中顯示了當(dāng)網(wǎng)絡(luò)瀏覽器打開多個(gè)標(biāo)簽頁時(shí),四個(gè)CPU核心的使用情況。 事實(shí)上,標(biāo)簽式瀏覽形式會(huì)占用相當(dāng)大的CPU處理能力,而且如圖所示,這種瀏覽可能會(huì)占用四核CPU的全部四個(gè)核心。

更好地滿足高性能應(yīng)用需求

多核處理器的一個(gè)重要優(yōu)勢(shì)是能夠?yàn)楦咭髴?yīng)用以及使用場(chǎng)合提供更強(qiáng)的性能,例如照片編輯、視頻轉(zhuǎn)碼、網(wǎng)絡(luò)瀏覽以及多線程游戲。下面通過兩組數(shù)據(jù)來了解一下四核Tegra 3在這方面的優(yōu)勢(shì)。


Coremark多核 CPU基準(zhǔn)測(cè)試結(jié)果

Coremark 是一款流行的移動(dòng)CPU基準(zhǔn)測(cè)試程序,該程序的測(cè)試結(jié)果體現(xiàn)了運(yùn)行多媒體應(yīng)用時(shí)的性能情況,Coremark 顯示,四核CPU的性能幾乎是雙核CPU移動(dòng)處理器的 2 倍、幾乎是單核CPU的4倍。


Photaf 3D Panorama照片處理應(yīng)用程序上的性能提升

Photaf 3D Panorama是一款評(píng)價(jià)很高的Android應(yīng)用程序,該程序讓用戶能夠自動(dòng)拍攝3D全景照片并將捕捉到的圖像拼接起來以備即時(shí)查看。在檢測(cè)邊緣以及拼接圖像的過程中會(huì)涉及大量圖像處理,從性能測(cè)試結(jié)果顯示,該處理器在處理和顯示所捕捉的全景圖像方面幾乎比雙核CPU移動(dòng)設(shè)備快2倍。


多線程 Linpack CPU基準(zhǔn)測(cè)試程序上的性能提升

Linpack是一款使用比較廣泛的CPU基準(zhǔn)測(cè)試程序,當(dāng)處理器運(yùn)行媒體處理等極耗CPU資源的任務(wù)時(shí),該程序可以很好地測(cè)量處理器性能。多線程Linpack基準(zhǔn)測(cè)試程序的測(cè)試結(jié)果顯示,四核處理器的性能幾乎比同等雙核處理器高出60%,而專為四核處理器而優(yōu)化的實(shí)際應(yīng)用程序在四核處理器上能夠?qū)崿F(xiàn)更大的性能提升。

更強(qiáng)大的多任務(wù)處理能力

移動(dòng)設(shè)備用戶一般會(huì)同時(shí)運(yùn)行多個(gè)應(yīng)用程序,在這種任務(wù)量繁重的多任務(wù)處理情況下,單核CPU不僅被多個(gè)任務(wù)耗盡了處理能力,而且還必須以峰值頻率工作才能應(yīng)付繁重的工作負(fù)荷,而在基于四核CPU的移動(dòng)設(shè)備上,操作系統(tǒng)能夠根據(jù)當(dāng)前的CPU負(fù)荷以及任務(wù)/活動(dòng)的優(yōu)先級(jí),將工作負(fù)荷動(dòng)態(tài)分配給合適的CPU核心。當(dāng)同時(shí)運(yùn)行多個(gè)任務(wù)時(shí),如果有多個(gè)核心能夠用來執(zhí)行這些任務(wù)中排隊(duì)的請(qǐng)求,那么便可以更快地完成這些請(qǐng)求的執(zhí)行。

4+1核心架構(gòu)的優(yōu)勢(shì)所在

高速緩存一致性: 因?yàn)?vSMP 技術(shù)不允許協(xié)核心與主核心同時(shí)啟用,所以在這些以不同頻率運(yùn)行的核心之間不涉及高速緩存同步的補(bǔ)償問題。 協(xié)核心與主核心共享同一個(gè)二級(jí)高速緩存,我們通過對(duì)該高速緩存進(jìn)行編程,使其以相同的速度為協(xié)核心和主核心返回?cái)?shù)據(jù)。

操作系統(tǒng)效率Android 操作系統(tǒng)假定所有可用的CPU核心均相同,能夠?qū)崿F(xiàn)相近的性能,操作系統(tǒng)按照這一假定的情形來為這些核心調(diào)度工作負(fù)荷。 當(dāng)多個(gè)CPU核心中的每一個(gè)都以不同的異步頻率運(yùn)行時(shí),就會(huì)導(dǎo)致這些核心能夠?qū)崿F(xiàn)不同的性能。 這樣會(huì)造成操作系統(tǒng)在任務(wù)調(diào)度上效率不高。 與之相比,vSMP 技術(shù)則始終讓所有活動(dòng)的核心均保持相近的同步工作頻率,從而實(shí)現(xiàn)優(yōu)化的操作系統(tǒng)任務(wù)調(diào)度。 即便當(dāng) vSMP 從協(xié)核心切換至另一個(gè)或多個(gè)主核心時(shí),CPU管理邏輯單元也會(huì)確保無縫的過渡,最終用戶完全覺察不到這種過渡,而且這種過渡也不會(huì)造成操作系統(tǒng)的調(diào)度補(bǔ)償。

功耗優(yōu)化:在基于異步時(shí)鐘的CPU架構(gòu)中,每個(gè)核心一般均處于不同的電源層上,以便根據(jù)工作頻率來調(diào)整每個(gè)核心的電壓。 這會(huì)導(dǎo)致整個(gè)電壓層的信號(hào)線以及電源線噪聲增大,會(huì)對(duì)性能造成負(fù)面影響。 因?yàn)槊總€(gè)電壓層均可能需要自己的穩(wěn)壓器,所以這些架構(gòu)并不像增加CPU核心數(shù)量那樣易于擴(kuò)展。 增加穩(wěn)壓器會(huì)提高材料單 (BOM) 成本以及功耗。 如果所有核心均使用同一個(gè)電壓軌,那么每個(gè)核心將以最快核心所需的電壓運(yùn)行,如此一來,便失去了可降低功耗的“電壓平方”效應(yīng)優(yōu)勢(shì)

比雙核更低的功耗、更高的功耗性能比

在我們的印象中多核處理器因?yàn)楹诵臄?shù)量的增加,相應(yīng)地在功耗上也要比單核處理器更大,不過對(duì)功耗管理來說,核心數(shù)量多勝過核心數(shù)量少。 例如,四核 CPU 在所有性能水平上均比雙核 CPU 的功耗低。之所以會(huì)出現(xiàn)這種結(jié)果是因?yàn)?,四個(gè)核心能夠以更低的頻率運(yùn)行,因此與雙核 CPU 相比,在處理同樣的任務(wù)量時(shí),四核的電壓更低。 因?yàn)楣呐c電壓的平方成比例,所以 CPU 整體功耗可實(shí)現(xiàn)大幅下降,然而卻依然能夠完成相同的任務(wù)量。

即便在全部四個(gè) CPU 核心均以1GHz 頻率運(yùn)行時(shí),Kal-El 處理器也比雙核處理器競(jìng)爭(zhēng)產(chǎn)品的功耗更低。因?yàn)?Kal-El 中的高性能 CPU 核心采用高速工藝技術(shù),所以這四個(gè)核心在工作電壓比競(jìng)爭(zhēng)處理器更低的情況下,依然能夠以更高的頻率工作。因?yàn)閯?dòng)態(tài)功耗與工作電壓的平方成比例,所以Kal-El處理器即便在以更高的頻率工作時(shí),也能夠大幅節(jié)省電力。

游戲性能更出色:GPU核心8顆提升至12顆

圖形處理可謂是NVIDIA的老本行了,因此GPU對(duì)于NVIDIA來說可謂是駕輕就熟,Tegra 2內(nèi)置的GPU具備8個(gè)處理核心,這次Tegra 3內(nèi)置的GPU處理核心由之前的8顆升級(jí)到了12顆,由此帶來了圖形性能的成倍增長(zhǎng),并且NVIDIA將很多在桌面顯卡上的技術(shù)應(yīng)用到了這里。


GPU中擁有12個(gè)核心


Tegra 3將支持3D技術(shù)

3倍到底是個(gè)什么概念?我們用實(shí)際例子展現(xiàn)新型GPU帶來的變化。如下面兩張圖所示,倘若使用搭載Tegra 3處理器的產(chǎn)品進(jìn)行游戲娛樂,游戲中的水波紋、物理特效、陰影效果都會(huì)更加突出、明顯,用戶會(huì)身處一個(gè)更加逼真的使用環(huán)境中。


游戲效果更加出色


游戲效果更加出色

從另一個(gè)大家熟悉的游戲幀數(shù)方面來對(duì)比,Tegra 3的優(yōu)勢(shì)同樣十分明顯。


高級(jí)游戲從四核移動(dòng)處理器中獲得的性能效益

游戲體驗(yàn)越來越出色,隨之而來需要下載的內(nèi)容肯定也是與日俱增,過大的下載量肯定會(huì)讓很多潛在用戶選擇放棄。為此,Tegra 3提供實(shí)時(shí)動(dòng)態(tài)紋理生成技術(shù),該技術(shù)允許游戲開發(fā)者編寫游戲代碼,以使游戲中所需的紋理根據(jù)游戲的情節(jié)和狀態(tài)實(shí)時(shí)創(chuàng)建。由于是即時(shí)生成紋理的,因此不必在購(gòu)買時(shí)提供。通過這項(xiàng)技術(shù),游戲開發(fā)者可以將游戲文件的大小減小幾個(gè)數(shù)量級(jí)。這個(gè)實(shí)時(shí)動(dòng)態(tài)紋理生成對(duì)性能要求非常高,要求具備多核CPU的性能,這一點(diǎn),Tegra 3的四核優(yōu)勢(shì)就不用多說了。


游戲中的場(chǎng)景變化全部動(dòng)態(tài)生成

基于四核CPU移動(dòng)設(shè)備的推出,或許會(huì)成為移動(dòng)游戲的一個(gè)拐點(diǎn),更加逼真的體驗(yàn)效果將會(huì)樹立移動(dòng)游戲體驗(yàn)的新標(biāo)竿,而這一切新標(biāo)竿都由Tegra 3設(shè)定。

online評(píng)測(cè)室總結(jié)

關(guān)于Tegra 3處理器我想可以總結(jié)為三點(diǎn):一是更多的處理核心,更優(yōu)化的設(shè)計(jì)方案;二是更好的功耗控制;三是更好更快的使用體驗(yàn)。對(duì)于移動(dòng)處理器來說,功耗待機(jī)是一個(gè)非常重要的問題,Tegra 3在增加處理器核心的基礎(chǔ)上采用協(xié)處理器這種4+1的設(shè)計(jì)方案,既保持了處理器對(duì)于高性能的需求,同時(shí)協(xié)處理器的出現(xiàn)也平衡了在低負(fù)載時(shí)候手機(jī)的耗電。


Tegra 3的優(yōu)勢(shì)所在

五倍于Tegra 2的性能更低的處理器功耗,三倍的GPU處理器速度,立體3D顯示技術(shù)這些都是Tegra 3所具備的優(yōu)勢(shì)。


更低的功耗更長(zhǎng)的續(xù)航

Tegra 3在整體續(xù)航時(shí)間方面相比Tegra 2都有提升,不過從上面的功耗圖中可以看到在視頻播放方面Tegra 3的續(xù)航要比Tegra 2高出61%,可以連續(xù)播放12個(gè)小時(shí)的視頻。

前面我們?cè)谖恼绿岬絋egra 3的4顆主核心和協(xié)核心是不能同時(shí)打開的,并且主核心只能以單核、雙核和四核得方式打開,看起來非常智能的Tegra 3似乎還可以更加智能一些,如果主核心和協(xié)核心能夠同時(shí)打開,并且根據(jù)需要實(shí)現(xiàn)任意組合搭配,這樣的設(shè)計(jì)方案是否更節(jié)能呢?當(dāng)然,這只是筆者的想法而已。


多核移動(dòng)處理器還在繼續(xù)

從NVIDIA未來產(chǎn)品規(guī)劃圖中可以看到,NVIDIA對(duì)于未來移動(dòng)處理器已經(jīng)規(guī)劃到了2014年,從目前Tegra 3擁有多達(dá)四顆處理核心來看,未來移動(dòng)設(shè)備處理器似乎大有趕超PC處理器的趨勢(shì)。

  • 技術(shù)分析第2期:四核處理器Tegra3詳介紹
打印 郵件 收藏本頁 幫肋
推薦閱讀
相關(guān)閱讀