生活

NVIDIA 發表 GeForce RTX 40 系列 GPU 旗艦級顯卡 GeForce RTX 4090 亮相

【記者柯宗鑫報導】NVIDIA 今(21)宣布推出 GeForce RTX 40 系列 GPU,此系列的全新旗艦級產品 RTX 4090 GPU 的效能是前一代產品的四倍,為遊戲玩家及創作者帶來革命性的表現。RTX 40 系列是全球首款採用全新 NVIDIA Ada Lovelace 架構的 GPU 產品,運算效能及效率較前一代產品具顯著提升,揭示即時光線追蹤與運用人工智慧 (AI) 產生像素的神經渲染進入全新時代。

NVIDIA 創辦人暨執行長黃仁勳在 GTC 大會的 GeForce Beyond 特別直播中表示:「RTX 光線追蹤與神經渲染的時代正如火如荼地展開,全新 Ada Lovelace 架構進一步提升光線追蹤與神經渲染的表現。遊戲玩家們可以感受到 Ada 架構飛躍性的效能提升,並為創作者奠定打造完全模擬世界的基礎。Ada 架構的效能是前一代產品的四倍,為 GPU 產業樹立全新標準。」

黃仁勳亦宣布推出 NVIDIA DLSS 3 ─ NVIDIA 針對遊戲和創意應用程式推出的深度學習超高取樣神經繪圖技術的新革命。這項 AI 技術可產生完整的畫格,大幅加快遊戲的執行速度。DLSS 3 讓 GPU 獨立產生完整畫格,克服 CPU 在遊戲中的效能瓶頸。

Unity 及 Unreal Engine 等全球最熱門的遊戲引擎都將採用這項技術,眾多重量級遊戲開發商亦鼎力支持,有超過 35 款支援 DLSS 3 的遊戲和應用程式即將推出。

此外,RTX 40 系列 GPU 具多項技術創新,包括:
1、串流多處理器 (Streaming Multiprocessor) 當中的著色器運算效能達 83 teraflops,是前一代產品的兩倍多。
2、第三代 RT 核心的有效光線追蹤運算效能達 191 teraflops,是前一代產品的 2.8 倍。
3、第四代 Tensor 核心運算效能達 1.32 Tensor petaflops,在使用 FP8 加速的情況下為前一代產品的五倍。
4、著色器執行重新排序 (Shader Execution Reordering;SER) 藉重新安排著色作業負載以善加利用 GPU 資源,提高執行效率。SER 是跟 CPU 的非依序執行一樣重要的創新技術,能提升光線追蹤的效能達三倍,遊戲中的畫格率可提高達 25%。
5、Ada 光流加速器 (Ada Optical Flow Accelerator) 具兩倍快的效能,使 DLSS 3 能夠預測場景中的運動,神經網路便能在維持影像畫質的情況下提高畫格率。
6、架構改善與客製化的台積電 4N 製程技術密切配合,提升電源效率達兩倍。
7、雙 NVIDIA 編碼器 (NVENC) 將匯出時間減半並支援 AV1。OBS、Blackmagic Design DaVinci Resolve、Discord 等皆採用 NVENC AV1 編碼。

數十年來,即時以符合物理原則的準確打光來渲染光線追蹤場景一直被視為繪圖領域的終極目標。同時,隨著 3D 遊戲和繪圖不斷力求以最精準的方式來呈現現實世界,當中的環境與物體的幾何複雜度也日漸提升。

想製作出符合物理原則的精準繪圖需仰賴龐大的運算力。如同《電馭叛客 2077 (Cyberpunk 2077)》的現代光線追蹤遊戲,光是要判斷打光,每個像素就要進行超過 600 次的光線追蹤運算,較四年前推出的第一批光線追蹤遊戲增加了 16 倍之多。

全新的第三代 RT 核心變得更加強大,在進行光線三角點交點集測試 (ray-triangle intersection) 時,速度是過去的兩倍,其中亦加入兩個重要的全新硬體單元。Opacity Micromap Engine 將 alpha 測試幾何的光線追蹤速度提升 2 倍,而 Micro-Mesh Engine 則是動態產生微網格,以產生額外的幾何。Micro-Mesh Engine 提供增加幾何複雜性的優點,而不會有在過去產生複雜幾何形狀所需的傳統效能和儲存成本。

RTX 40 系列 GPU 與 DLSS 3 為 NVIDIA Studio 的創作者提供發展機會。3D 藝術家可以使用精準符合物理原則又逼真的材料渲染出全光線追蹤的環境,在無需使用代理的情況下,便能即時查看各項調整後的變化。

藉提升 GPU 效能及加入兩個全新第八代 AV1 編碼器,影片編輯與直播的表現變得更突出。NVIDIA Broadcast 軟體開發套件的三項更新內容已供合作夥伴取得,包括臉部表情判斷 (Face Expression Estimation)、眼神接觸 (Eye Contact) 及提升虛擬背景的畫質。

包含在 NVIDIA Studio 套裝軟體中的 NVIDIA Omniverse,即將加入模組製作平台 NVIDIA RTX Remix,以運用 RTX 技術復刻經典遊戲。遊戲模組創作者可使用 RTX Remix 輕鬆取得遊戲素材,利用強大的 AI 工具自動增強材質,並透過光線追蹤和 DLSS 快速啟用 RTX。

NVIDIA Lightspeed Studios 利用 Remix RTX 重新打造 Valve 的遊戲代表作《傳送門 (Portal)》。

NVIDIA Lightspeed Studios 利用 RTX Remix 重新打造 Valve 的遊戲代表作《傳送門 (Portal)》,此遊戲被視為史上最佳遊戲之一。全光線追蹤和 DLSS 3 等先進的繪圖功能,替《傳送門》加入搶眼的全新外觀和氛圍。搭載 RTX 的《傳送門》可於 11 月在 Valve 官方網站免費下載,該時間點恰逢《傳送門》推出 15 週年。

RTX 4090 是世界上最快的遊戲 GPU,它具備驚人的功率、噪音控制及溫度特性。在全光線追蹤遊戲中,搭載 DLSS 3 的 RTX 4090 運算速度比上一代採用 DLSS 2 的 RTX 3090 Ti 快上四倍;而在保持同樣的 450W 功耗時,處理當今的各款遊戲速度亦提升達兩倍。RTX 4090 具有 760 億個電晶體、16,384 個 CUDA 核心和 24GB 高速美光 (Micron) GDDR6X 記憶體,可持續以超過每秒 100 畫格的速度執行 4K 解析度的遊戲。RTX 4090 將於 10 月 12 日上市,售價為新台幣 56,990 元起。

NVIDIA 亦宣佈推出 RTX 4080,有兩款配置可供選擇。RTX 4080 16GB 擁有 9,728 個 CUDA 核心及 16GB 高速美光 GDDR6X 記憶體,運用 DLSS 3 執行當前的各款遊戲速度是 GeForce RTX 3080 Ti 的兩倍,以更低功率提供比 GeForce RTX 3090 Ti 更優異的運算表現。RTX 4080 12GB 有 7,680 個 CUDA 核心和 12GB 美光 GDDR6X 記憶體,運用 DLSS 3 較前一代旗艦級 GPU RTX 3090 Ti 的運算速度更快。RTX 4080 的兩款配置將於 11 月上市,RTX 4080 16GB 售價為新台幣 42,990 元起,RTX 4080 12GB 則為新台幣 31,990 元起。

相關文章