CUDA Study ---- Hardware Architecture
CUDA Study ---- Hardware Architecture
標簽: cuda擴展工作存儲產品io 2010-01-04 10:53 692人閱讀 評論(0) 收藏 舉報版權聲明:本文為博主原創文章,未經博主允許不得轉載。
CUDA硬件架構:
? NVIDIA顯卡構成:顯存顆粒,供應電路,PCI-E接口,NVIO芯片,MIO接口,GPU芯片;
? ?顯卡上實現極強的計算能力和極高的存儲器以及IO帶寬,需要有可靠的電源和有效的散熱手段;
?? 顯卡的骨架式PCB(Printed Circuit Board,印刷電路板),NVIDIA在發布顯卡的同時會發布PCB設計,以及GPU和顯存的建議工作頻率,稱為公版;
?? 部分廠商會各自開發顯卡設計,稱為非公版;
?? PCB層數越多,電路的兼容性和穩定性容易做到一個比較理想的水平,造價也會急劇上升;
??
PCI-E總線:主機與顯卡間的通信通過PCI-E總線進行;
?發展路線:PCI和ISA總線:與網卡、聲卡等其他擴展卡相同;
?????????? AGP規范:(Accelerated Graphics Port)一種接口方式,Intel公司提出;顯卡專用擴展接口;規格最高的達到2.1GB/s;
?????????? PCI-E總線:采用點對點串行連接,每個設備都有自己的專用連接,不需要像整個總線請求帶寬;在一個周期中可以同時進行上下行數據傳輸;可以達到10.0GB/s常見通道數量為*1,*4,*8,*16;
?????????? 購置顯卡的時候應該注意使得主板的PCI-E插槽與設備匹配,否則較低通道數量的PCI-E卡安裝在高通道數量的插槽上只能獲得較少的通道速度;
顯存:顯卡需要實現較高的像素填充率,因此顯存必須能夠遠大于內存的帶寬;
???? 發展路線:SGRAM;GDDR SDRAM(目前獨顯采用的主要采用);GDDR2,GDDR3;GDDR4,GDDR5;
DDR與傳統SDRAM區別:DDR每個外部時鐘周期的上升沿和下降沿都能夠傳輸數據,SDEAM只能在外部時鐘周期的上升沿傳輸數據;即,DDR可以達到SDRAM帶寬的兩倍;
DDR2:外部IO時鐘的頻率是內核時鐘的兩倍,則在每個時鐘周期可以進行四次數據傳輸;GDDR2,GDDR3采用該技術;
GDDR5的IO頻率在GDDR3的基礎上再次翻番;
GPU芯片:GPU的中心處理器;
NVIDIA GT200核心:集成14億個晶體管;
GTX295:單卡爽GPU產品;
AMD/ATI: RV770,側重于減小功耗和芯片面積;
GPU多核與CPU多核通信:
CPU多個核心通信可以通過CPU緩存進行數據一致性;
GPU多核之間緩存只讀,不存在數據一致性問題,多個GPU之間很難實現高帶寬低延遲的通信,通過PCI-E總線和系統內存交換數據,開銷非常高昂;
NVIO系列芯片負責輸出視頻信號;
MIO接口:可以用于與視頻采集設備等通信,也可以用來安裝SL1(速力)連接橋,使多塊顯卡并行工作;
總結
以上是生活随笔為你收集整理的CUDA Study ---- Hardware Architecture的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在线进行 PCoA 分析和相关统计检验
- 下一篇: CUDA学习笔记之程序优化