覆蓋面采樣抗鋸齒
鋸齒是出現(xiàn)在圖像上的鋸齒狀邊緣,而這些區(qū)域本應(yīng)顯示為流暢的線條或邊緣;抗鋸齒 (AA)技術(shù)在計(jì)算機(jī)圖形中用于讓這些鋸齒線條更加平滑。當(dāng)高清晰度圖像在較低分辨率的 顯示器 上顯示時(shí),或者當(dāng)較高分辨率的圖像轉(zhuǎn)換為較低分辨率的圖像時(shí)便會出現(xiàn)鋸齒效果。
通常,GPU使用多重采樣抗鋸齒(MSAA)和超級采樣抗鋸齒(SSAA)技術(shù)減少鋸齒效果。在之前的抗鋸齒技術(shù)中,覆蓋面始終與“實(shí)際”采樣類型相關(guān)聯(lián),而覆蓋面采樣與此不同。在SSAA中,每個(gè)實(shí)際采樣都有其獨(dú)特的顏色和Z值,并且在4xAA的情況下,著色器程序會運(yùn)行四次,并獲取四個(gè)紋理 ‐ 每個(gè)樣本一個(gè)紋理(或者在多紋理的情況會更多)。采用4xAA時(shí),幀緩沖區(qū)要比未使用抗鋸齒時(shí)大四倍,并且會經(jīng)過向下過濾,以創(chuàng)建最終像素顏色。
CSAA可以將簡單的覆蓋面采樣從顏色/z/模板/覆蓋面采樣中解耦出來,進(jìn)一步優(yōu)化抗鋸齒流程,從而較 MSAA和SSAA減少帶寬和存儲成本。CSAA 使用更多覆蓋面樣本來計(jì)算指定像素區(qū)域中的多邊形的覆蓋面水平,從而實(shí)現(xiàn)更高質(zhì)量的抗鋸齒效果,而不會由于處理額外的實(shí)際顏色和Z樣本而產(chǎn)生內(nèi)存和功耗成本。
高級各向異性過濾
各向異性過濾是一種用于提高表面上處于斜視角的紋理的圖像質(zhì)量的技術(shù)。 通常,屏幕上的每個(gè)像素都需要從內(nèi)存的紋理貼圖中獲取多個(gè)紋理元素,經(jīng)過過濾并應(yīng)用于像素以改變其顏色。從正面看表面時(shí)(垂直于鏡頭或觀眾),通常會使用方形采樣模式為每個(gè)像素采樣同等數(shù)量的紋理元素。但是,在極端視角下(即屏幕上的圖像從一個(gè)軸延伸至另一軸),從紋理貼圖中為每個(gè)軸提取相同數(shù)量的樣本會導(dǎo)致紋理沿延伸至水平方向的軸出現(xiàn)模糊。
通過各向異性過濾得到改善的紋理質(zhì)量
可以看到接近地平線處的跑道部分的紋理細(xì)節(jié)出現(xiàn)了模糊。 各向異性過濾技術(shù)可以智能地沿該延伸軸采集更多的紋理樣本,并保留沿該軸的紋理細(xì)節(jié)。GeForce支持高達(dá)16倍各向異性過濾。它采用自適應(yīng)過濾算法和高效紋理緩存管理技術(shù)來提供高紋理質(zhì)量,同時(shí)不會顯著增加內(nèi)存操作。
優(yōu)化的內(nèi)存控制器
Tegra 2)處理器包括經(jīng)過全新設(shè)計(jì)的GPU和內(nèi)存控制器(MC)內(nèi)核,GPU內(nèi)核的性能極度依賴于MC交付帶寬的效率以及圖形處理延遲要求。由于GPU和MC均采用了內(nèi)部開發(fā),因此MC針對GeForce的特定需求進(jìn)行了高度調(diào)優(yōu),同時(shí)還增強(qiáng)了GPU性能和降低了功耗。
MC控制器設(shè)計(jì)的一些關(guān)鍵優(yōu)化包括:
動(dòng)態(tài)時(shí)鐘速度控制(DCSC): DCSC支持內(nèi)存控制器迅速提高工作頻率以響應(yīng)來自GPU內(nèi)核的高級指標(biāo)便于系統(tǒng)內(nèi)存訪問,以及在 GPU 完成其內(nèi)存訪問后將工作頻率迅速降低至節(jié)能水平。由于采用了嚴(yán)密的內(nèi)部設(shè)計(jì)流程,因此MC可以直接接入GPU內(nèi)核硬件,主動(dòng)預(yù)測GPU需求和管理其工作水平,以滿足GPU需求。
以GPU為中心的內(nèi)存仲裁: 系統(tǒng)內(nèi)存是移動(dòng)處理器中最寶貴的資源之一。CPU、GPU、視頻和音頻等各種內(nèi)核都需要能夠以高帶寬、高度響應(yīng)性的形式訪問系統(tǒng)內(nèi)存。MC實(shí)現(xiàn)了高級仲裁機(jī)制,可有效確保多個(gè)客戶端訪問系統(tǒng)內(nèi)存。
MC內(nèi)核具有關(guān)于來自GPU客戶端的內(nèi)存訪問請求的類型和緊急性的深入信息,并且實(shí)現(xiàn)了一種高度優(yōu)化的仲裁機(jī)制,可滿足呈現(xiàn)器和幾何請求對帶寬的苛刻要求,以及滿足對服務(wù)高優(yōu)級級延遲敏感的顯示和CPU請求在低延遲方面的苛刻要求。MC還掌握GPU內(nèi)核生成的各請求的優(yōu)先級的信息,并且可進(jìn)一步優(yōu)化其性能以滿足這些請求的需求。
GPU請求分組: 片外系統(tǒng)內(nèi)存設(shè)備在任何特定時(shí)間都只能打開特定數(shù)量的內(nèi)存條。當(dāng)內(nèi)存的請求訪問區(qū)不包含在當(dāng)前打開的內(nèi)存條中時(shí),MC需要關(guān)閉當(dāng)前打開的內(nèi)存條,然后激活包含所需內(nèi)存單元或區(qū)域的新內(nèi)存條。這一過程不僅會影響延遲和帶寬,同時(shí)對功耗的需要也較高。
GeForce掌握當(dāng)前的系統(tǒng)配置,并且會對訪問模式進(jìn)行優(yōu)化,而不會發(fā)起多個(gè)不同的訪問內(nèi)存子系統(tǒng)的不同部分中的隨機(jī)內(nèi)存條的內(nèi)存請求。GPU可以將訪問相同內(nèi)存條的內(nèi)存請求組合在一起。MC控制器還可以根據(jù)內(nèi)存條訪問模式對獨(dú)立內(nèi)存請求進(jìn)行重新排序。這些功能可以提供更加高效的內(nèi)存訪問,并通過限制頻繁的內(nèi)存條切換來降低功耗。