NVIDIA憑藉其最新一代的圖形卡邁出了又一步,朝著Ki Rendering邁出了又一步,儘管它在術語中恰當地爭論了什麼含義,這並不奇怪。
完整的公告更令人驚訝,得益於人工智能或DLSS和框架一代的新發展的性能。
自然,製造商在這裡提供了最好的數字。因此,必須顯示在實踐中仍然存在的內容。啟動新模型的測試出現:
但是,我們已經可以闡明的是Nvidia希望如何實現這種巨大的表現。
魔術詞是多框架的一代
好的,有三個單詞劃分的莫伊!如果您無法做任何事情,這裡可以簡要說明簡單的框架生成是什麼。
基本上,該技術只是在傳統上在圖形卡上計算出的兩個圖像之間的額外圖像。此中間圖像計算通過AI進行。
這樣,一個這樣的稱呼光流加速器
(OFA)確定像素從一個框架到另一幀的方向和速度。然後,這些數據流入神經網絡,最終創建了其他圖像。
框架生成的優勢
對於GPU和CPU的計算工作,圖像速率將加倍。因為經典的著色器計算核並不戴上其他計算負載,而是由專門研究AI和剛剛提到的OFA的張量核心。
框架生成的缺點
可以創建降低表示質量的圖像工件和幽靈圖像。同時,系統延遲(延遲)增加,因為兩個整個幀被緩衝而不是輸出。
在60 fps(每張照片16.7毫秒)時,大約為33毫秒。但是,這種效果再次被NVIDIA的反射技術彌補。
簡單而簡單:在視頻遊戲中創建圖片時,Reflex可以優化CPU和GPU之間的通信。因此,它保存在其他地方。
什麼是多框架一代?
顧名思義,MFG不僅創建了額外的圖片,而且還創建了幾幅。最多三個。
但是,這不再是通過OFA發生的。這個專用的硬件組件是Ki-Modell(AI光流)由張量芯完全計算的替換。
根據圖片,AI可以在一個通道中從渲染框架中產生三個額外的一代 - 但它可能使用兩個渲染幀。
多幀發電的優勢
通常,像前身一樣,幀速率通常不需要CPU和GPU上的經典計算能力。
此外,應使用所謂的翻轉計量器來改進框架起搏(應盡可能什至應盡可能什至應進行的圖像輸出之間的時間,以防止圖像打印。
這就是DLSS 4和多幀生成在實踐中的外觀和比較:
鏈接到YouTube內容
多框架生成的缺點
多幀生成的工作原理可以通過獨立測試來闡明圖像質量。
基本上,通過更改DLSS 4(以及框架生成),NVIDIA承諾從卷積神經網絡(CNN)到變壓器模型,更少的文物和幽靈圖像更大的細節。
如何根據延遲創建中間圖像也特別有趣。如果AI模型僅使用來自圖像而不是兩個的移動數據,就像一個簡單的框架生成一樣,則必須省略至少一部分額外的延遲。
但是,可能使用了兩個幀,兩者都進行了緩衝,並從中計算出最大三個中間圖像。
此外,通過創建另外三個框架本身來延遲。這些不是傳統上渲染的,這意味著玩家實際上僅影響序列的第一張圖像(最多五個中的第一個圖像),因此他們的輸入。但是,NVIDIA希望用Reflex 2來彌補這一點。
我們準確地說明了以下文章的工作方式。但是您可以在RTX 5000上觀看我們的視頻演講。反射2在其中解釋了。
RTX 5000:這是我們的專家對NVIDIA的新圖形卡的看法
新的張量芯
為了與簡單的框架生成相比,要能夠生成更多的圖片,需要新的張量芯的功能。
他們應該變得更加強大。根據Nvidia的說法第五代(RTX 5000)緊身胸衣的最多是其直接前任(RTX 4000)的兩倍半。
在這一點上,Nvidia的新術語來了你有上衣
發揮作用。該單元表示張量芯的計算能力。
因子2.5來自NVIDIA的信息,該信息將RTX 5090與RTX 4090的3,352 AI頂部進行比較,其中1,321 AI頂部-3,352 / 1,312 = 2.5。
但是,這裡需要一些謹慎。因為尚不清楚兩個值中使用的準確性(使用滑動逗號操作;值越高,精度和計算能力越高)。
Nvidia本身寫道與使用FP16的RTX 4090相比,使用FP4的RTX 5090上的生成AI應用中的圖像生成要快兩次。在遊戲中的外觀以及是否使用相同的精度仍然必須澄清。
還要考慮:RTX 5090具有680張量核,RTX 4090僅有的
超過512。
DLSS 4不僅僅是USPCALing
特別重要:多框架生成是DLSS 4的一部分。
為了以良好的顯示質量實現高性能增長,NVIDIA向我們展示,幾個DLSS功能必須互鎖。
除了多幀的生成外,放大(超級分辨率),射線重建(如果涉及射線縮放或路徑跟踪)和邊緣平滑DLAA。
在顯示的YouTube視頻的情況下,首先以較低的分辨率呈現框架(或兩個幀)。然後將其縮放到DLSS超級分辨率(升級)的所需更高分辨率。
如果先前使用了射線佐劑或路徑跟踪,則將射線重建破壞。 DLAA平滑邊緣。
只有這樣,多框架生成開始並從一張圖片(或兩張圖片)產生多達三張圖片。