苹果发布 29 分钟视频:详解 A17 Pro 和 M3 系列芯片的 GPU 技术细节
11 月 10 日消息,蘋果公司近日發布了將近半小時的開發者視頻,詳細介紹了蘋果 M3 系列芯片和 A17 Pro 芯片中的諸多技術細節,并通過基礎術語解釋了改進原理等。
視頻中表示開發者使用 Metal API 構建應用程序過程中,不需要更改現有應用程序代碼,就能看到 M3 和 A17 Pro 的性能提升。這些芯片組利用動態緩存(Dynamic Caching)、硬件加速光線追蹤和硬件加速網格映射等,大幅提高了 GPU 表現。在此附上視頻如下:
動態緩存
蘋果在 M3 和 A17 Pro 中引入了下一代著色器核心,應用調用 GPU 核心時,這些著色器可以更加高效運行,大大提高輸出性能。
通常,GPU 只能根據執行操作期間執行操作中的最高帶寬進程分配寄存器內存。因此,如果操作的某一部分需要比其他部分多得多的寄存器內存,則該操作將為給定進程使用更多的寄存器內存。
動態緩存允許 GPU 為其執行的每個操作分配恰到好處的寄存器內存量,釋放以前不可用的寄存器內存,允許并行執行更多著色器任務。
靈活的片上存儲器
以前,片上存儲器(on-chip memory)會為寄存器、線程組和帶有緩沖區緩存的切片存儲器分配固定的內存。這意味著,如果一個操作使用一種類型的內存比另一種類型的內存更多,那么大部分內存就會被閑置。
蘋果調整讓所有片上存儲器都可以用于存儲器類型的緩存。嚴重依賴線程組內存的操作可以利用片上內存的整個跨度,甚至可以將操作溢出到主內存中。
著色器內核可動態調整片上內存占用率,以最大限度地提高性能,這意味著減少開發者的應用優化時間。
著色器核心的高性能 ALU 管線
蘋果建議開發人員在其程序中執行 FP16 數學運算,但高性能 ALU 并行執行整數、FP32 和 FP16 的不同組合。
指令在并行執行的不同操作中執行,這意味著 ALU 利用率會隨著占用率的提高而提高。
如果不同的操作包含相同的 FP32 或 FP16 指令,這些指令將在不同的時間點執行,則可以重疊執行以增加并行性。
硬件加速圖形管道
硬件加速大幅加快光線追蹤過程,重要的交叉計算從 GPU 功能中移除。由于硬件負責部分計算,因此允許并行展開更多操作,從而加快硬件組件的光線追蹤速度。
硬件加速網格著色使用類似的方法。它采用幾何計算管道的中間,并將其傳遞給專用單元,從而允許更多并行操作。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的苹果发布 29 分钟视频:详解 A17 Pro 和 M3 系列芯片的 GPU 技术细节的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小脑萎缩中医调理效果显著吗
- 下一篇: 明师点道 愿觉法师