手機
手機 手機資訊 手機評測 技術(shù)分析第2期:四核處理器Tegra3詳介紹
01月 20

技術(shù)分析第2期:四核處理器Tegra3詳介紹

編輯:登徒浪子 來源:pconline
放大 縮小 打印 郵件 收藏本頁 游吧論壇

曾經(jīng)以為諸如手機這樣的移動設(shè)備,單核處理器已經(jīng)足夠搞定它們了,哪怕不夠提高一點頻率肯定是沒問題的,曾經(jīng)以為雙核只是PC上的神器,手機無論如何也很難與其沾邊;然而,很多我們曾經(jīng)以為的東西在一轉(zhuǎn)眼間之間都變成了現(xiàn)實,單核處理器不再完全滿足手機需要,出現(xiàn)在PC上的雙核處理器也同樣出現(xiàn)在了手機上,并且大有加速趕超的意思。

年初Tegra 2處理器率先揭開了雙核手機大幕,于是在今年一年的時間里我們看到了大批雙核手機登場,可以說2011年定義為雙核手機元年一點也不過分;現(xiàn)如今,作為雙核手機元年的2011尚還有一段時間才正式結(jié)束,但是我們已經(jīng)能嗅到四核手機的味道了,來自于NVIDIA的Tegra 3處理器已經(jīng)蓄勢待發(fā)。


尋求性能與功耗的平衡

Tegra 3處理器最明顯的特征是它擁有比Tegra 2更多的核心,也是目前首個基于移動設(shè)備設(shè)計的四核處理器,或者更準(zhǔn)確的說應(yīng)該是4+1核處理器,因此它在四顆主核心的基礎(chǔ)上加入了一顆協(xié)處理器,以達到降低功耗和保持續(xù)航的目的。4+1處理器?聽起來似乎有些噱頭,這樣的設(shè)計理念和思路是什么?它和Tegra 2處理器相比能帶來哪些改變和提升?它能保持性能和功耗的平衡點嗎?帶著這一連串的疑問,我們不妨來深入了解一下全球首款四核移動處理器Tegra 3。

4顆主核心+1顆協(xié)核心尋求性能功耗平衡點

待機、續(xù)航時間短一直是智能手機用戶比較發(fā)愁的一件事,特別是在大屏橫行的當(dāng)下更是如此,在雙核處理器面世之初就有不少人擔(dān)心它的功耗和續(xù)航問題,如今Tegra 3的處理核心更多了,功耗和續(xù)航問題再次成為人們關(guān)注的重點,Tegra 3如何保持性能功耗平衡點,下面我們來了解一下Tegra 3的架構(gòu)圖以及設(shè)計思路和方案。


Tegra 3處理器核心圖

Tegra 3處理器采用“Kal-El”作為核心代號,從上面的核心圖中可以看到Tegra 3一共有五顆處理核心,單獨位于最上端的處理器就是4+1處理器中的1,也就是前面提到的協(xié)處理器,而就是NVIDIA專門為保持功耗和性能的平衡所采用的可變對稱多重處理(vSMP)技術(shù)。


4+1核心設(shè)計

可變對稱多重處理(vSMP)技術(shù)是指第五顆協(xié)核心利用專門的低功耗硅工藝制造而成,能夠以低頻率運行活動待機模式下的任務(wù)、音樂播放乃至視頻播放;四顆主要芯片以標(biāo)準(zhǔn)的硅工藝制造而成,可以達到更高的頻率,同時在運行諸多任務(wù)時比雙核解決方案功耗更低。這五顆CPU核心均采用ARM Cortex A9架構(gòu),它們可以根據(jù)工作負(fù)荷而單獨地啟動和關(guān)閉。協(xié)核心對于操作系統(tǒng)是透明的,這與當(dāng)前的異步SMP架構(gòu)不同,這意味著操作系統(tǒng)和應(yīng)用程序均不知道這個核心的存在,然而卻能夠自動利用。


根據(jù)負(fù)載打開不同的處理器

情況一,當(dāng)機器處于待機、音頻播放、視頻播放等簡單應(yīng)用時,系統(tǒng)將只調(diào)用協(xié)處理器,主頻從0到500Mhz;

情況二,當(dāng)機器處于簡單網(wǎng)頁瀏覽、簡單2D游戲時,系統(tǒng)將調(diào)用一顆標(biāo)準(zhǔn)核心,其他核心休眠;主頻從0到1.4GHz;

情況三,當(dāng)機器處于Flash網(wǎng)頁瀏覽以及多任務(wù)處理以及視頻聊天等,系統(tǒng)將調(diào)用兩顆標(biāo)準(zhǔn)核心,其他核心休眠,主頻從0到1.3GHz;

情況四,當(dāng)機器處于全負(fù)荷的情況下,四個標(biāo)準(zhǔn)核心全部啟動,主頻從0到1.3GHz。

●低功耗協(xié)核心

協(xié)核心是利用低功耗工藝技術(shù)設(shè)計而成的,卻擁有和Cortex A9 CPU相同的內(nèi)部架構(gòu),因為他利用低功耗工藝技術(shù)制造,以低頻率模式運行,所以功耗低于采用高速工藝技術(shù)制造的主CPU核心,協(xié)核心在500MHz以下工作時可實現(xiàn)高于主核心的每瓦特性能,因此協(xié)核心的最高工作頻率不高于500MHz。


移動CPU功耗——性能曲線圖

協(xié)核心主要用于移動設(shè)備處于活動待機狀態(tài)及執(zhí)行后臺任務(wù),同時它還用于不需要強勁CPU處理能力的應(yīng)用程序;與協(xié)核心不同,CPU主核心需要極高頻以保證高性能,因此它采用高工藝技術(shù)制造而成,這種技術(shù)讓主核心能夠在較低的工作電壓下將頻率提升至比較高的水平,因此主核心能夠在不大幅增加動態(tài)功耗的情況先實現(xiàn)高性能。

●操作系統(tǒng)透明化

Android 3.x (Honeycomb) 操作系統(tǒng)內(nèi)置了針對多重處理的支持,而且能夠利用多個CPU核心的性能。 然而,該操作系統(tǒng)會假定所有可用的CPU核心均能夠?qū)崿F(xiàn)相同的性能,并且根據(jù)這一假設(shè)來為可用的核心調(diào)度任務(wù)。 因此,為了讓操作系統(tǒng)隨時掌握協(xié)核心和主核心的管理過程,Kal-El 處理器針對協(xié)核心和主要的四個CPU核心既采用了基于硬件的管理,又采用了基于低級軟件的管理。


功耗曲線

專利的硬件與軟件CPU管理邏輯單元不斷監(jiān)控CPU的工作負(fù)荷,以便自動而動態(tài)地啟用和禁用CPU協(xié)核心和主核心。 打開和關(guān)閉協(xié)核心以及主核心的決定完全取決于當(dāng)前的CPU工作負(fù)荷水平以及CPU頻率控制子系統(tǒng)所得出的CPU工作頻率推薦值。該子系統(tǒng)嵌入在操作系統(tǒng)內(nèi)核之中。 該項技術(shù)不需要對應(yīng)用程序或操作系統(tǒng)進行任何改動。

Tegra 3帶來更好的用戶使用體驗

前面介紹了Tegra 3處理器在架構(gòu)上的優(yōu)化改進及優(yōu)勢,這些對于我們普通消費者來說可能并不直觀,下面我們就通過數(shù)據(jù)對比的方式來給大家展示四核Tegra 3得應(yīng)用優(yōu)勢。

更快地網(wǎng)頁載入速度

目前不少瀏覽器采用了多線程技術(shù),能夠產(chǎn)生多個并發(fā)進程,這樣瀏覽器中的每個標(biāo)簽頁均為一個單獨的進程,每個進程又管理著各自的多個線程,因此標(biāo)簽式瀏覽器會占用比較大的CPU資源,下面我們通過幾組數(shù)據(jù)來了解在網(wǎng)絡(luò)瀏覽時CPU的使用情況,以及四核對比雙核處理器的優(yōu)勢所在。


CPU網(wǎng)絡(luò)瀏覽時四核CPU系統(tǒng)中的 CPU 使用情況

從圖中可以看到,瀏覽器使用了四核CPU的全部四個核心,而這種并行處理的效果是,與采用雙核CPU的移動設(shè)備相比,網(wǎng)絡(luò)瀏覽體驗快多了。 對于這些支持標(biāo)簽式瀏覽的瀏覽器,四核CPU還能夠發(fā)揮出更高的性能。


標(biāo)簽式網(wǎng)絡(luò)瀏覽期間四核CPU的使用情況


Moonbat JavaScript 基準(zhǔn)測試程序上的四核性能優(yōu)勢

圖中顯示了當(dāng)網(wǎng)絡(luò)瀏覽器打開多個標(biāo)簽頁時,四個CPU核心的使用情況。 事實上,標(biāo)簽式瀏覽形式會占用相當(dāng)大的CPU處理能力,而且如圖所示,這種瀏覽可能會占用四核CPU的全部四個核心。

更好地滿足高性能應(yīng)用需求

多核處理器的一個重要優(yōu)勢是能夠為高要求應(yīng)用以及使用場合提供更強的性能,例如照片編輯、視頻轉(zhuǎn)碼、網(wǎng)絡(luò)瀏覽以及多線程游戲。下面通過兩組數(shù)據(jù)來了解一下四核Tegra 3在這方面的優(yōu)勢。


Coremark多核 CPU基準(zhǔn)測試結(jié)果

Coremark 是一款流行的移動CPU基準(zhǔn)測試程序,該程序的測試結(jié)果體現(xiàn)了運行多媒體應(yīng)用時的性能情況,Coremark 顯示,四核CPU的性能幾乎是雙核CPU移動處理器的 2 倍、幾乎是單核CPU的4倍。


Photaf 3D Panorama照片處理應(yīng)用程序上的性能提升

Photaf 3D Panorama是一款評價很高的Android應(yīng)用程序,該程序讓用戶能夠自動拍攝3D全景照片并將捕捉到的圖像拼接起來以備即時查看。在檢測邊緣以及拼接圖像的過程中會涉及大量圖像處理,從性能測試結(jié)果顯示,該處理器在處理和顯示所捕捉的全景圖像方面幾乎比雙核CPU移動設(shè)備快2倍。


多線程 Linpack CPU基準(zhǔn)測試程序上的性能提升

Linpack是一款使用比較廣泛的CPU基準(zhǔn)測試程序,當(dāng)處理器運行媒體處理等極耗CPU資源的任務(wù)時,該程序可以很好地測量處理器性能。多線程Linpack基準(zhǔn)測試程序的測試結(jié)果顯示,四核處理器的性能幾乎比同等雙核處理器高出60%,而專為四核處理器而優(yōu)化的實際應(yīng)用程序在四核處理器上能夠?qū)崿F(xiàn)更大的性能提升。

更強大的多任務(wù)處理能力

移動設(shè)備用戶一般會同時運行多個應(yīng)用程序,在這種任務(wù)量繁重的多任務(wù)處理情況下,單核CPU不僅被多個任務(wù)耗盡了處理能力,而且還必須以峰值頻率工作才能應(yīng)付繁重的工作負(fù)荷,而在基于四核CPU的移動設(shè)備上,操作系統(tǒng)能夠根據(jù)當(dāng)前的CPU負(fù)荷以及任務(wù)/活動的優(yōu)先級,將工作負(fù)荷動態(tài)分配給合適的CPU核心。當(dāng)同時運行多個任務(wù)時,如果有多個核心能夠用來執(zhí)行這些任務(wù)中排隊的請求,那么便可以更快地完成這些請求的執(zhí)行。

4+1核心架構(gòu)的優(yōu)勢所在

高速緩存一致性: 因為 vSMP 技術(shù)不允許協(xié)核心與主核心同時啟用,所以在這些以不同頻率運行的核心之間不涉及高速緩存同步的補償問題。 協(xié)核心與主核心共享同一個二級高速緩存,我們通過對該高速緩存進行編程,使其以相同的速度為協(xié)核心和主核心返回數(shù)據(jù)。

操作系統(tǒng)效率Android 操作系統(tǒng)假定所有可用的CPU核心均相同,能夠?qū)崿F(xiàn)相近的性能,操作系統(tǒng)按照這一假定的情形來為這些核心調(diào)度工作負(fù)荷。 當(dāng)多個CPU核心中的每一個都以不同的異步頻率運行時,就會導(dǎo)致這些核心能夠?qū)崿F(xiàn)不同的性能。 這樣會造成操作系統(tǒng)在任務(wù)調(diào)度上效率不高。 與之相比,vSMP 技術(shù)則始終讓所有活動的核心均保持相近的同步工作頻率,從而實現(xiàn)優(yōu)化的操作系統(tǒng)任務(wù)調(diào)度。 即便當(dāng) vSMP 從協(xié)核心切換至另一個或多個主核心時,CPU管理邏輯單元也會確保無縫的過渡,最終用戶完全覺察不到這種過渡,而且這種過渡也不會造成操作系統(tǒng)的調(diào)度補償。

功耗優(yōu)化:在基于異步時鐘的CPU架構(gòu)中,每個核心一般均處于不同的電源層上,以便根據(jù)工作頻率來調(diào)整每個核心的電壓。 這會導(dǎo)致整個電壓層的信號線以及電源線噪聲增大,會對性能造成負(fù)面影響。 因為每個電壓層均可能需要自己的穩(wěn)壓器,所以這些架構(gòu)并不像增加CPU核心數(shù)量那樣易于擴展。 增加穩(wěn)壓器會提高材料單 (BOM) 成本以及功耗。 如果所有核心均使用同一個電壓軌,那么每個核心將以最快核心所需的電壓運行,如此一來,便失去了可降低功耗的“電壓平方”效應(yīng)優(yōu)勢

比雙核更低的功耗、更高的功耗性能比

在我們的印象中多核處理器因為核心數(shù)量的增加,相應(yīng)地在功耗上也要比單核處理器更大,不過對功耗管理來說,核心數(shù)量多勝過核心數(shù)量少。 例如,四核 CPU 在所有性能水平上均比雙核 CPU 的功耗低。之所以會出現(xiàn)這種結(jié)果是因為,四個核心能夠以更低的頻率運行,因此與雙核 CPU 相比,在處理同樣的任務(wù)量時,四核的電壓更低。 因為功耗與電壓的平方成比例,所以 CPU 整體功耗可實現(xiàn)大幅下降,然而卻依然能夠完成相同的任務(wù)量。

即便在全部四個 CPU 核心均以1GHz 頻率運行時,Kal-El 處理器也比雙核處理器競爭產(chǎn)品的功耗更低。因為 Kal-El 中的高性能 CPU 核心采用高速工藝技術(shù),所以這四個核心在工作電壓比競爭處理器更低的情況下,依然能夠以更高的頻率工作。因為動態(tài)功耗與工作電壓的平方成比例,所以Kal-El處理器即便在以更高的頻率工作時,也能夠大幅節(jié)省電力。

游戲性能更出色:GPU核心8顆提升至12顆

圖形處理可謂是NVIDIA的老本行了,因此GPU對于NVIDIA來說可謂是駕輕就熟,Tegra 2內(nèi)置的GPU具備8個處理核心,這次Tegra 3內(nèi)置的GPU處理核心由之前的8顆升級到了12顆,由此帶來了圖形性能的成倍增長,并且NVIDIA將很多在桌面顯卡上的技術(shù)應(yīng)用到了這里。


GPU中擁有12個核心


Tegra 3將支持3D技術(shù)

3倍到底是個什么概念?我們用實際例子展現(xiàn)新型GPU帶來的變化。如下面兩張圖所示,倘若使用搭載Tegra 3處理器的產(chǎn)品進行游戲娛樂,游戲中的水波紋、物理特效、陰影效果都會更加突出、明顯,用戶會身處一個更加逼真的使用環(huán)境中。


游戲效果更加出色


游戲效果更加出色

從另一個大家熟悉的游戲幀數(shù)方面來對比,Tegra 3的優(yōu)勢同樣十分明顯。


高級游戲從四核移動處理器中獲得的性能效益

游戲體驗越來越出色,隨之而來需要下載的內(nèi)容肯定也是與日俱增,過大的下載量肯定會讓很多潛在用戶選擇放棄。為此,Tegra 3提供實時動態(tài)紋理生成技術(shù),該技術(shù)允許游戲開發(fā)者編寫游戲代碼,以使游戲中所需的紋理根據(jù)游戲的情節(jié)和狀態(tài)實時創(chuàng)建。由于是即時生成紋理的,因此不必在購買時提供。通過這項技術(shù),游戲開發(fā)者可以將游戲文件的大小減小幾個數(shù)量級。這個實時動態(tài)紋理生成對性能要求非常高,要求具備多核CPU的性能,這一點,Tegra 3的四核優(yōu)勢就不用多說了。


游戲中的場景變化全部動態(tài)生成

基于四核CPU移動設(shè)備的推出,或許會成為移動游戲的一個拐點,更加逼真的體驗效果將會樹立移動游戲體驗的新標(biāo)竿,而這一切新標(biāo)竿都由Tegra 3設(shè)定。

online評測室總結(jié)

關(guān)于Tegra 3處理器我想可以總結(jié)為三點:一是更多的處理核心,更優(yōu)化的設(shè)計方案;二是更好的功耗控制;三是更好更快的使用體驗。對于移動處理器來說,功耗待機是一個非常重要的問題,Tegra 3在增加處理器核心的基礎(chǔ)上采用協(xié)處理器這種4+1的設(shè)計方案,既保持了處理器對于高性能的需求,同時協(xié)處理器的出現(xiàn)也平衡了在低負(fù)載時候手機的耗電。


Tegra 3的優(yōu)勢所在

五倍于Tegra 2的性能更低的處理器功耗,三倍的GPU處理器速度,立體3D顯示技術(shù)這些都是Tegra 3所具備的優(yōu)勢。


更低的功耗更長的續(xù)航

Tegra 3在整體續(xù)航時間方面相比Tegra 2都有提升,不過從上面的功耗圖中可以看到在視頻播放方面Tegra 3的續(xù)航要比Tegra 2高出61%,可以連續(xù)播放12個小時的視頻。

前面我們在文章提到Tegra 3的4顆主核心和協(xié)核心是不能同時打開的,并且主核心只能以單核、雙核和四核得方式打開,看起來非常智能的Tegra 3似乎還可以更加智能一些,如果主核心和協(xié)核心能夠同時打開,并且根據(jù)需要實現(xiàn)任意組合搭配,這樣的設(shè)計方案是否更節(jié)能呢?當(dāng)然,這只是筆者的想法而已。


多核移動處理器還在繼續(xù)

從NVIDIA未來產(chǎn)品規(guī)劃圖中可以看到,NVIDIA對于未來移動處理器已經(jīng)規(guī)劃到了2014年,從目前Tegra 3擁有多達四顆處理核心來看,未來移動設(shè)備處理器似乎大有趕超PC處理器的趨勢。

  • 技術(shù)分析第2期:四核處理器Tegra3詳介紹
打印 郵件 收藏本頁 幫肋
推薦閱讀
相關(guān)閱讀