V100服务器和T4服务器的性能指标
多維度對比V100服務器和T4服務器的性能指標及各自有缺點
- V100是定位在絕對的性能要求比較高的場景,比如對訓練端、學習端,對計算速度有絕對的要求,或是推理端,對推理有絕對的速度要求,再或者以單精度或雙精度為主的絕對計算都有要求,這是V100的定位;
- T4定位主要面向推理端,剛才我們看到有一個很好的性能提升,在75W功耗下,T4在計算性能上有兩倍多的提升并且能耗不變,所以T4可以很好的用在其他場景做一些推理或入門級的訓練,單精度要求的一些場景,或是渲染VDI都有不錯的表現。
NVIDIA Tesla GPU系列P4、T4、P40以及V100
NVIDIA Tesla系列GPUP4、T4、P40以及V100性能規格參數對比表。
提供基于NVIDIA Tesla GPU的計算型GPU云服務器,GPU實例規格包括GN6/GN6S/GN7/GN8/GN10X
| 單精度性能 (FP32) | 8.1 TFLOPS | 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) | 5.5 TFLOPS | 12 TFLOPS |
| 半精度性能 (FP16) | 65 TFLOPS | 112 TFLOPS (PCIe) 125 TFLOPS (SXM2) | — | — |
| 整數運算能力 (INT8) | 130 TOPS | — | 22 TOPS* | 47 TOPS* |
| 整數運算能力 (INT4) | 260 TOPS | — | — | — |
| GPU 顯存 | 16GB | 32/16GB HBM2 | 8GB | 24GB |
| 顯存帶寬 | 320GB/秒 | 900GB/秒 | 192GB/秒 | 346GB/秒 |
| 系統接口/外形規格 | PCI Express 半高外形 | PCI Express 雙插槽全高外形 SXM2/NVLink | PCI Express 半高外形 | PCI Express 雙插槽全高外形 |
| 功率 | 70 W | 250 W (PCIe) 300 W (SXM2) | 50 W/75 W | 250 W |
| 硬件加速視頻引擎 | 1 個解碼引擎,2 個編碼引擎 | — | 1 個解碼引擎,2 個編碼引擎 | 1 個解碼引擎,2 個編碼引擎 |
NVIDIA TESLA V100
NVIDIA Tesla V100采用NVIDIA Volta架構,非常適合為要求極為苛刻的雙精度計算工作流程提供加速,并且還是從P100升級的理想路徑。該GPU的渲染性能比Tesla P100提升了高達80%,借此可縮短設計周期和上市時間。
Tesla V100的每個GPU均可提供125 teraflops的推理性能,配有8塊Tesla V100的單個服務器可實現1 petaflop的計算性能。
NVIDIA TESLA P40
The Tesla P40能夠提供高達2倍的專業圖形性能。Tesla P40能夠對組織中每個vGPU虛擬化加速圖形和計算(NVIDIA CUDA? 和 OpenCL)工作負載。支持多種行業標準的2U服務器。
Tesla P40可提供出色的推理性能、INT8精度和24GB板載內存。
NVIDIA TESLA T4
NVIDIA Tesla T4的幀緩存高達P4的2倍,性能高達M60的2倍,對于利用NVIDIA Quadro vDWS軟件開啟高端3D設計和工程工作流程的用戶而言,不失為一種理想的解決方案。憑借單插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪稱為每個服務器節點實現最大GPU密度的絕佳之選。
NVIDIA TESLA P4
Tesla P4可加快任何外擴型服務器的運行速度,能效高達CPU的60倍。
?
總結
以上是生活随笔為你收集整理的V100服务器和T4服务器的性能指标的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 防火墙技术指标---并发连接数/吞吐量
- 下一篇: elasticsearch 启动、停止及