當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CUDA Study ---- Hardware Architecture

發布時間：2025/3/15 编程问答 17 豆豆

生活随笔收集整理的這篇文章主要介紹了 CUDA Study ---- Hardware Architecture 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

標簽： cuda擴展工作存儲產品io 2010-01-04 10:53 692人閱讀評論(0) 收藏舉報

CUDA硬件架構：

? NVIDIA顯卡構成：顯存顆粒，供應電路，PCI-E接口，NVIO芯片，MIO接口，GPU芯片；

? ?顯卡上實現極強的計算能力和極高的存儲器以及IO帶寬，需要有可靠的電源和有效的散熱手段；

?? 顯卡的骨架式PCB（Printed Circuit Board，印刷電路板），NVIDIA在發布顯卡的同時會發布PCB設計，以及GPU和顯存的建議工作頻率，稱為公版；

?? 部分廠商會各自開發顯卡設計，稱為非公版；

?? PCB層數越多，電路的兼容性和穩定性容易做到一個比較理想的水平，造價也會急劇上升；

PCI-E總線：主機與顯卡間的通信通過PCI-E總線進行；

?發展路線：PCI和ISA總線：與網卡、聲卡等其他擴展卡相同；

?????????? AGP規范：（Accelerated Graphics Port）一種接口方式，Intel公司提出；顯卡專用擴展接口；規格最高的達到2.1GB/s；

?????????? PCI-E總線：采用點對點串行連接，每個設備都有自己的專用連接，不需要像整個總線請求帶寬；在一個周期中可以同時進行上下行數據傳輸；可以達到10.0GB/s常見通道數量為*1,*4,*8,*16;

?????????? 購置顯卡的時候應該注意使得主板的PCI-E插槽與設備匹配，否則較低通道數量的PCI-E卡安裝在高通道數量的插槽上只能獲得較少的通道速度；

顯存：顯卡需要實現較高的像素填充率，因此顯存必須能夠遠大于內存的帶寬；

???? 發展路線：SGRAM；ＧＤＤＲ　ＳＤＲＡＭ（目前獨顯采用的主要采用）；ＧＤＤＲ２，ＧＤＤＲ３；ＧＤＤＲ４，ＧＤＤＲ５；

ＤＤＲ與傳統ＳＤＲＡＭ區別：ＤＤＲ每個外部時鐘周期的上升沿和下降沿都能夠傳輸數據，ＳＤＥＡＭ只能在外部時鐘周期的上升沿傳輸數據；即，ＤＤＲ可以達到ＳＤＲＡＭ帶寬的兩倍；

ＤＤＲ２：外部ＩＯ時鐘的頻率是內核時鐘的兩倍，則在每個時鐘周期可以進行四次數據傳輸；ＧＤＤＲ２，ＧＤＤＲ３采用該技術；

ＧＤＤＲ５的ＩＯ頻率在ＧＤＤＲ３的基礎上再次翻番；
GPU芯片：GPU的中心處理器；

NVIDIA GT200核心：集成14億個晶體管；

GTX295：單卡爽GPU產品；

AMD/ATI: RV770,側重于減小功耗和芯片面積；

GPU多核與CPU多核通信：

CPU多個核心通信可以通過CPU緩存進行數據一致性；

GPU多核之間緩存只讀，不存在數據一致性問題，多個GPU之間很難實現高帶寬低延遲的通信，通過PCI-E總線和系統內存交換數據，開銷非常高昂；

NVIO系列芯片負責輸出視頻信號；

MIO接口：可以用于與視頻采集設備等通信，也可以用來安裝SL1（速力）連接橋，使多塊顯卡并行工作；

以上是生活随笔為你收集整理的CUDA Study ---- Hardware Architecture的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。