當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

c语言中循环结构的作用,C语言中对于循环结构优化的一些入门级方法简介

發(fā)布時間：2024/9/27 编程问答 30 豆豆

生活随笔收集整理的這篇文章主要介紹了 c语言中循环结构的作用,C语言中对于循环结构优化的一些入门级方法简介小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一.代碼移動

將在循環(huán)里面多次計算，但是結果不會改變的計算，移到循環(huán)外面去。

例子：

優(yōu)化前：

void lower1(char *s){

int i;

for(i=0;i

if(s[i]>='A'&&s[i]<='Z')

s[i]-=('A'-'a');

}

優(yōu)化后：

void lower2(char *s){

int i;

int len=strlen(s);

for(int i=0;i

if(s[i]>='A'&&s[i]<='Z')

s[i]-=('A'-'a');

}

優(yōu)化前的版本，由于每次循環(huán)都要調用strlen計算s的長度，實際上的復雜度成了O(n2)了，而優(yōu)化后的版本只需計算一次s的長度，因此性能上比優(yōu)化前版本要好。

二.減少函數(shù)調用

例子：

優(yōu)化前：

void sum1(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

*dest=0;

for(i=0;i

data_t val;

get_vec_element(v,i,&val);

*dest+=val;

}

優(yōu)化后：

data_t get_vec_start(vec_ptr v){

return v->data;

}

void sum2(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

data_t *data=get_vec_start(v);

*dest=0;

for(i=0;i

*dest+=data[i];

}

優(yōu)化前的版本在每次循環(huán)中都要調用一次get_vec_element獲得相應的項，而優(yōu)化后的版本只需在循環(huán)外調用一次get_vec_start獲得開始的內存地址，循環(huán)內直接訪問內存，無需調用函數(shù)。

三.減少內存訪問

例子：

優(yōu)化前：

void sum2(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

data_t *data=get_vec_start(v);

*dest=0;

for(i=0;i

*dest+=data[i];

}

優(yōu)化后：

void sum3(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

data_t *data=get_vec_start(v);

data_t acc=0;

for(i=0;i

acc+=data[i];

*dest=acc;

}

優(yōu)化前的版本每次迭代都要從dest讀出值再加上data[i]，再將結果寫回dest。這樣的讀寫很浪費，因此每次迭代開始從dest讀出的值就是上次迭代寫回dest的指。優(yōu)化后的版本通過加入acc臨時變量，它循環(huán)中累積計算出的結果，循環(huán)結束后再寫回。

這里給出兩個版本相應的匯編結果就可以很清楚看出區(qū)別：

優(yōu)化前：

第二行和第四行分別對dest進行了讀寫。

優(yōu)化后：

從匯編結果可以看出編譯器將acc直接放在了寄存器里，循環(huán)中無需對內存進行讀寫。

四.循環(huán)展開

循環(huán)展開可以減少循環(huán)的次數(shù)，對程序的性能帶了兩方面的提高。一是減少了對循環(huán)沒有直接貢獻的計算，比如循環(huán)計數(shù)變量的計算，分支跳轉指令的執(zhí)行等。二是提供了進一步利用機器特性進行的優(yōu)化的機會。

例子：

優(yōu)化前的代碼見前一篇博客里的sum3.

優(yōu)化后：

void sum4(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

int limit=len-3;

data_t *data=get_vec_start(v);

data_t acc=0;

for(i=0;i

acc=acc+data[i]+data[i+1];

acc=acc+data[i+2]+data[i+3];

}

for(;i

acc+=data[i];

*dest=acc;

}

通過循環(huán)展開，每次迭代將累加4個元素，減少了循環(huán)次數(shù)，從而減少了總的執(zhí)行時間(單獨使用這種優(yōu)化方法，對浮點數(shù)累乘幾乎沒有提高，但是整數(shù)累乘得益于編譯器的重關聯(lián)代碼變化會有大幅度提高)。

這種優(yōu)化可以直接利用編譯器完成，將優(yōu)化level設定到較高，編譯器會自動進行循環(huán)展開。使用gcc，可以顯式使用-funroll-loops選項。

五.提高并行性

現(xiàn)代處理器大多采用了流水線、超標量等技術，可以實現(xiàn)指令級并行。我們可以利用這個特性對代碼做進一步的優(yōu)化。

2.1使用多個累積變量

優(yōu)化代碼示例

void sum5(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

int limit=len-1;

data_t *data=get_vec_start(v);

data_t acc0=0;

data_t acc1=0;

for(i=0;i

acc0+=data[i];

acc1+=data[i+1];

}

for(;i

acc0+=data[i];

*dest=acc0+acc1;

}

這里同時使用了循環(huán)展開和使用多個累加變量，一方面減少了循環(huán)次數(shù)，另一方面指令級并行的特性使得每次迭代的兩次加法可以并行執(zhí)行。基于這兩點可以顯著減少程序執(zhí)行的時間。通過增加展開的次數(shù)和累加變量的個數(shù)，可以進一步提高程序的性能，直到機器指令執(zhí)行的吞吐量的極限。

2.2重結合變換

除了使用多個累積變量顯式利用機器的指令級并行特性外，還可以對運算重新結合變換，打破順序相關性來享受指令級并行帶來的好處。

在sum4中，acc=acc+data[i]+data[i+1]的結合順序是acc=(acc+data[i])+data[i+1];

我們將之變成acc=acc+(data[i]+data[i+1])；

代碼如下：

void sum6(vec_ptr v,data_t *dest){

int i;

int len=vec_length(v);

int limit=len-3;

data_t *data=get_vec_start(v);

data_t acc=0;

for(i=0;i

acc=acc+(data[i]+data[i+1]);

acc=acc+(data[i+2]+data[i+3]);

}

for(;i

acc+=data[i];

*dest=acc;

}

進一步增加循環(huán)展開的次數(shù)，可以進一步提高程序性能，最終也可以達到機器指令執(zhí)行的吞吐量的極限。(在循環(huán)展示提到的整數(shù)乘法的性能提高就在于編譯器隱式采取了這種變換，但是由于浮點數(shù)不具備結合性，所以編譯器沒有采用，但是程序員在保證程序結果正確性的情況下，可以顯式使用這一點)。

總結

以上是生活随笔為你收集整理的c语言中循环结构的作用,C语言中对于循环结构优化的一些入门级方法简介的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： android mtk 按键,Andro
下一篇： ip模拟工具_HTTP代理和IP代理有什