cuda编程性能 分析工具 nvprof的使用
生活随笔
收集整理的這篇文章主要介紹了
cuda编程性能 分析工具 nvprof的使用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
ubuntu環境上,安裝cuda,會自動安裝一些工具nvcc ,nvprof nvcc-gdb....
1.編譯生成可執行文件
2.nvprof ./test
可以把性能分析數據輸出到文件中
nvprof ./test -o test.nvvp
可以把在nvidia visual profiler現實更加直觀
?
一些常用的配置參數:
achieved_occupancy參數:每個sm在每個cycle能夠達到的最大activewarp 占總warp的比例。
nvprof --metrics achieved_occupancy ./a.outgld_throughput: global load throughput (查看memory 的throughput)
nvprof --metrics gld_throughput ./a.outgld_efficiency: global memory loadefficiency: device memory bandwidth的使用率
nvprof –metrics gld_efficiency ./a.out查看運行時候的信息:IPC(instruction per cycle)
nvprof --metrics ipc ./a.out查看所有的以上信息:
nvprof --metrics all ./a.out總結
以上是生活随笔為你收集整理的cuda编程性能 分析工具 nvprof的使用的全部內容,希望文章能夠幫你解決所遇到的問題。