无码av一区二区三区无码,在线观看老湿视频福利,日韩经典三级片,成 人色 网 站 欧美大片在线观看

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

NVIDIA Ada Lovelace 架構(gòu) 淺入閑談(中)- 著色器執(zhí)行重排序

2023-03-05 13:07 作者:B1ueMicr0  | 我要投稿

上篇文章簡單聊了下?NVIDIA RTX 架構(gòu),這回接著更新。重點主要放在?Shader Execution Reordering 這項新技術(shù)上來。

這里首先就要回到 GPU 的本質(zhì)上了。GPU 是一種并行度極其高的硬件,并發(fā)處理相似任務(wù)的效率非常高。

這里不得不提到一個概念,內(nèi)存的局部性原理:

時間局部性內(nèi)存位置被引用了一次在未來可能再次被引用。

空間局部性內(nèi)存位置被引用了一次,那么程序很可能在未來會引用其附近的一個內(nèi)存位置。

對 GPU 這樣的硬件來說,相鄰光線之間內(nèi)存局部性越好,執(zhí)行效率越高。這一點 NVIDIA 早在十多年前就做出了行動,F(xiàn)ermi 架構(gòu)正是通過對內(nèi)存子系統(tǒng)的 L1 進(jìn)行改進(jìn),提高了內(nèi)存局部性,從而提高了光追效率。

以路徑跟蹤 (Path-tracing) 為例(目前使用廣泛的一種光線追蹤形式),存在著一個叫“著色器分歧 (shader divergence) ”的限制,尤其是光線多次反彈以及用了很多種著色器的場景下體現(xiàn)得尤為明顯。

擊中物體并反彈以后,衍生光線擊中的其它表面可能使用了多種和原先截然不同的著色器。著色器分歧導(dǎo)致數(shù)據(jù)的相關(guān)性,局部性差。在這里著色器分歧主要體現(xiàn)在線程的任務(wù)執(zhí)行分歧,光線反彈以后,擊中使用不同著色器的表面,不同線程之間執(zhí)行著完全不同的著色器代碼,代碼路徑亂,相關(guān)性差,對 GPU 來說難以合并地高效執(zhí)行。

怎么辦呢?

在業(yè)內(nèi)最常見的做法就是直接在場景里使用簡化的著色器,這個是從根源上把問題給優(yōu)化了(不是解決?。阅茈m得到優(yōu)化,但從另一方面來講,簡化后的著色器肯定不如原來的。

而這次 NVIDIA 在 Ada 架構(gòu)上引入了一種叫 著色器執(zhí)行重排序 (Shader Execution Reordering, SER)?的技術(shù),不解決前面的著色器本身復(fù)雜度的問題,而是直接把后面相似度非常差的任務(wù)們進(jìn)行?相關(guān)性排序 (coherency sort),從而提升并行計算的效率。這里回到之前的局部性概念,SER 正是通過優(yōu)化數(shù)據(jù)的局部性,最大化利用了 GPU 的特性。

對著色器任務(wù)進(jìn)行相關(guān)性排序之后,對 GPU 來說達(dá)成了一個非常理想的任務(wù)狀態(tài),效率大幅提高。

該技術(shù)讓高分歧場景 (路徑跟蹤就是其中一類) 下 光追著色器 的執(zhí)行效率提升了高達(dá) 100% 以上,?即便體現(xiàn)在一些混合光追游戲里,也有大幅度提升。NV 描述的 2077 的 RT: Overdrive 模式的 路徑跟蹤全局光照,因?SER 得到了游戲總體?44% 的幀率提升。


今天就先到這里吧 = ̄ω ̄=


NVIDIA Ada Lovelace 架構(gòu) 淺入閑談(中)- 著色器執(zhí)行重排序的評論 (共 條)

分享到微博請遵守國家法律
同德县| 玛多县| 南乐县| 漠河县| 马公市| 澄江县| 晴隆县| 鄯善县| 永安市| 永福县| 望城县| 吉安市| 临夏县| 平顺县| 永康市| 山东省| 遂溪县| 兴化市| 天长市| 栾川县| 龙江县| 灵璧县| 肥西县| 东丰县| 五大连池市| 龙口市| 资溪县| 高青县| 舒城县| 陈巴尔虎旗| 靖宇县| 南开区| 甘泉县| 杭州市| 东光县| 西宁市| 隆德县| 广东省| 维西| 德阳市| 万荣县|