累加计算的并行与串行效率比较
生活随笔
收集整理的這篇文章主要介紹了
累加计算的并行与串行效率比较
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
計算一幅圖像的像素值的平均值
測試環境:
CPU:?Intel(R)_Core(TM)_i7-7700_CPU_@_3.60GHz?x 8
GPU: NVIDIA GeForce GTX 1050
?
1,在cuda GPU上計算累加和,先分段計算,在進行規約,分段計算里面其實也是規約,然后除以總的像素個數。
2,在cpu上串行計算累加和,再除以總的像素個數。
3,在cpu上使用omp進行并行化。
對于1024x1024大小的圖像數據,在保證結果正確一致的前提下,比較計算耗時,結果如下:
?
可以看出,最快的是cuda GPU,其次是omp并行化之后的程序,最慢的是串行計算。
代碼可參考:https://gitee.com/yt2014/cuda-programs/tree/master/sum_mean
總結
以上是生活随笔為你收集整理的累加计算的并行与串行效率比较的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三种存储方式的区别
- 下一篇: 必读,一文普及MES系统知识