欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

C++性能剖析教程之循環(huán)展開

什么是循環(huán)展開?

成都創(chuàng)新互聯(lián)公司主營武鄉(xiāng)網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營網(wǎng)站建設(shè)方案,成都App制作,武鄉(xiāng)h5小程序定制開發(fā)搭建,武鄉(xiāng)網(wǎng)站營銷推廣歡迎武鄉(xiāng)等地區(qū)企業(yè)咨詢

循環(huán)展開,英文中稱Loop unwinding或loop unrolling,是一種犧牲程序的尺寸來加快程序的執(zhí)行速度的優(yōu)化方法。可以由程序員完成,也可由編譯器自動優(yōu)化完成。循環(huán)展開最常用來降低循環(huán)開銷,為具有多個功能單元的處理器提供指令級并行。也有利于指令流水線的調(diào)度。

循環(huán)展開能從兩方面改進(jìn)程序的性能:

  • 減少了不直接有助于程序結(jié)果的操作的數(shù)量,例如循環(huán)索引計算和分支條件。
  • 提供了一些方法,可以進(jìn)一步變化代碼,減少整個計算中關(guān)鍵路徑上的操作數(shù)量。

循環(huán)展開對程序性能的影響

我們直接以實際代碼向大家展示循環(huán)展開的作用,首先看未經(jīng)過循環(huán)展開優(yōu)化的代碼:

#include <iostream>
#include <chrono>

int main(){
 auto start = std::chrono::system_clock::now();
 int sum = 0;
 int count = 10000;
 //循環(huán)10000次累加
 for(int i = 0;i < count;i++){ 
 sum += i;
 }
 auto end = std::chrono::system_clock::now();
 std::chrono::duration<double> dura = end - start;
 std::cout <<"共耗時:"<< dura.count() << "s" << std::endl;
 return 0;
}

類似于上面的這段代碼是我們平常工作中經(jīng)常見到的,函數(shù)目的就是求得1+2+……+9998+9999的累加和,每次循環(huán)把i累加到sum變量上,循環(huán)次數(shù)一共10000次。代碼運行結(jié)果如下:

C++性能剖析教程之循環(huán)展開

可以看出代碼運行耗時0.0000279秒。

下面我們將循環(huán)展開一次,即把上述代碼中的循環(huán)改為如下代碼:

for(int i = 0;i < count;i += 2){
 sum += i;
 sum += i+1;
}

即每次循環(huán)將i和i+1一起累加到sum變量上,這樣可以把循環(huán)次數(shù)從10000次降低到5000次,由于CPU的高度流水線化,連續(xù)兩個加法指令增加耗時很低,所以此版本代碼可以一定程度上提高程序運行速度,運行結(jié)果如下:

C++性能剖析教程之循環(huán)展開

代碼運行耗時0.0000159秒,相較于未優(yōu)化代碼速度快了將近一倍。

當(dāng)然,我們可以繼續(xù)增加循環(huán)展開次數(shù)以進(jìn)一步提高程序運行速度,但是這個增加循環(huán)展開次數(shù)也是有限度的,當(dāng)達(dá)到了CPU的最高吞吐量之后,繼續(xù)增加循環(huán)展開次數(shù)是沒有意義的。

上述循環(huán)展開后的代碼依然有進(jìn)一步優(yōu)化的空間,那就是消除連續(xù)指令的相關(guān)性,以達(dá)到指令級并行,我們可以看到循環(huán)展開后的代碼,循環(huán)體中有兩條語句:sum += i 和 sum += i+1,第二條語句sum += i+1依賴于第一條命來sum += i的執(zhí)行結(jié)果,所以這兩條語句只能依次執(zhí)行,限制了CPU進(jìn)一步提高性能的可能。如果我們將循環(huán)體改為如下代碼:

int sum1=0,sum2=0;
for(int i=0;i < count;i+=2){
 sum1 += i;
 sum2 += i+1;
}
sum = sum1 + sum2;

我們新建了兩個變量sum1和sum2用于存儲循環(huán)展開時兩個累加語句的累加結(jié)果,最后在循環(huán)體外將兩部分結(jié)果相加得到最終結(jié)果。該代碼中兩個累加語句之間是互不相關(guān)的,所以CPU可以并行執(zhí)行這兩條指令,以達(dá)到性能的進(jìn)一步提高。下面是運行結(jié)果:

C++性能剖析教程之循環(huán)展開

代碼運行耗時0.0000073秒,相較于只進(jìn)行循環(huán)展開的代碼速度又快了將近一倍。

總結(jié)

由上面三段代碼的運行速度對比可以看出,循環(huán)展開對程序性能有著很重要的影響,可以減少分支預(yù)測錯誤次數(shù),增加取消數(shù)據(jù)相關(guān)進(jìn)一步利用并行執(zhí)行提高速度的機(jī)會。但是,并不建議大家進(jìn)行手動的循環(huán)展開,在代碼中進(jìn)行循環(huán)展開會導(dǎo)致程序的可讀性下降,代碼膨脹。為了直觀感受循環(huán)展開對性能的影響,上述代碼運行結(jié)果均是在不開編譯器優(yōu)化的情況下進(jìn)行的測試,其實在我們開啟了編譯器優(yōu)化的時候,編譯器會自動對我們的循環(huán)代碼進(jìn)行循環(huán)展開,讓我們可以在保持了代碼可讀性的同時,又能享受到循環(huán)展開對我們程序性能的提高。

好了,以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對創(chuàng)新互聯(lián)的支持。

當(dāng)前題目:C++性能剖析教程之循環(huán)展開
當(dāng)前地址:http://aaarwkj.com/article18/phojdp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、標(biāo)簽優(yōu)化、定制開發(fā)、網(wǎng)站導(dǎo)航、ChatGPT、移動網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)
国产熟女高潮一区二区| 日本精品a秘在线观看| 91麻豆精品一二三区在线| 日韩在线一区二区视频| 亚洲综合福利视频网站| 蜜臀人妻四季av一区二区不卡| 日本一区二区三区久久久| 在线播放亚洲一区二区三区| 久草尤物视频在线观看| 国产自拍免费在线观看视频| av色剧情在线免费观看| 国产原创av超爽剧情系列| 午夜激情视频在线网站| 国产一级二级三级在线电影| 一区二区三区熟妇人妻视频| 亚洲人成网站18禁止人| 国产亚洲一区二区高清| 巴西老熟女大奶子多毛逼| 亚洲午夜福利天堂社区| 亚洲午夜天堂在线a毛片| 久久精品国产亚洲av不卡| 99久久成人国产精品免费| 欧美成人精品欧美一级乱| 日韩精品女性三级视频| 日本亚洲一级中文字幕| 99国产精品欲av麻豆在线观看| 91九色国产原创在线观看| 欧美三级欧美一级视频看| 欧美日韩黄色在线观看| 亚洲午夜福利理论片在线| 成人黄色动漫在线播放| 欧美日韩在线不卡一区| 日韩黄av在线免费观看| 俩小伙探花专约老熟女| 韩国av网址在线观看| 欧美香蕉视频一区二区| 国产免费av一区二区在线观看 | 99精品午夜福利在线| 99热久久精品免费精品| 免费亚洲一区二区三区| 人妻少妇中文字幕在线播放|