openMP的简单使用
安裝,參考:https://blog.csdn.net/augusdi/article/details/8808226
如圖所示,右鍵工程名->屬性->C/C+±>語言,找到OpenMP支持,更改設置即可。
代碼編程,參考:https://blog.csdn.net/zhongkejingwang/article/details/40350027
在C/C++中使用OpenMP優(yōu)化代碼方便又簡單,代碼中需要并行處理的往往是一些比較耗時的for循環(huán),所以下面介紹一下OpenMP中for循環(huán)的應用。
###1. 首先,如何使一段代碼并行處理呢?
omp中使用parallel制導指令標識代碼中的并行段,形式為:
我們編寫如下的代碼:
#include <iostream> #include "omp.h" using namespace std; int main(int argc, char **argv) {//設置線程數(shù),一般設置的線程數(shù)不超過CPU核心數(shù),這里開4個線程執(zhí)行并行代碼段omp_set_num_threads(4);#pragma omp parallel{cout << "Hello" << ", I am Thread " << omp_get_thread_num() << endl;} }上面的代碼輸出結果為:
Hello,Thread Hello,Thread 21 Hello,Thread 3 Hello,Thread 0可以看到四個線程各自獨立的輸出了cout后面的內容。如果去掉omp_set_num_threads(4)語句,我們的電腦CPU的每個核都會獨立執(zhí)行,我的CPU有8個核,就會執(zhí)行8次大括號內的語句。
###2.帶有for的制導指令:
使用形式為:
或者
#pragma omp parallel { //注意:大括號必須要另起一行#pragma omp forfor() }第一種形式作用域只是緊跟著的那個for循環(huán),而第二種形式在整個并行塊中可以出現(xiàn)多個for制導指令。
... #include "omp.h" ... int main() {omp_set_num_threads(4);#pragma omp parallel forfor (int i = 0; i < 6; i++){printf("i = %d,Hello,Thread:%d\n", i, omp_get_thread_num());}return 0; }輸出結果如下:
i = 0,Hello,Thread:0 i = 1,Hello,Thread:0 i = 2,Hello,Thread:1 i = 3,Hello,Thread:1 i = 5,Hello,Thread:3 i = 4,Hello,Thread:2我們可以看到輸出6次printf的任務被分給了CPU的4個核。
###3.數(shù)據(jù)同步問題
期望的正確結果是100000,但是這樣寫是錯誤的。看代碼,由于默認情況下sum變量是每個線程共享的,所以多個線程同時對sum操作時就會因為數(shù)據(jù)同步問題導致結果不對,顯然,輸出結果每次都不同,這是無法預知的,下面是輸出結果,但是每個線程不會共享for循環(huán)中的變量,包括i值。所以如果線程要調用for循環(huán)外的變量,要加critical語句,下面有介紹。
//多次輸出結果 58504 45203 35716 ...#####解決方法1:方法一:對操作共享變量的代碼段做同步標識
int main() {int n = 100000;int sum = 0;omp_set_num_threads(4);#pragma omp parallel forfor (int i = 0; i < n; i++){#pragma omp critical{sum++;}}cout << sum << endl;return 0; }critical制導語句標識的下一行代碼,也可以是跟著一個大括號括起來的代碼段做了同步處理。
輸出結果100000。
總結
以上是生活随笔為你收集整理的openMP的简单使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PyTorch框架学习十四——学习率调整
- 下一篇: VS2017安装openGL