欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

Linux中零拷貝技術(shù)是什么

這篇文章給大家分享的是有關(guān)Linux中零拷貝技術(shù)是什么的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

成都創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設(shè),金灣企業(yè)網(wǎng)站建設(shè),金灣品牌網(wǎng)站建設(shè),網(wǎng)站定制,金灣網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,金灣網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力。可充分滿足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。

引文

在寫一個服務(wù)端程序時(Web Server或者文件服務(wù)器),文件下載是一個基本功能。這時候服務(wù)端的任務(wù)是:將服務(wù)端主機磁盤中的文件不做修改地從已連接的socket發(fā)出去,我們通常用下面的代碼完成:

while((n = read(diskfd, buf, BUF_SIZE)) > 0)        write(sockfd, buf , n);

基本操作就是循環(huán)的從磁盤讀入文件內(nèi)容到緩沖區(qū),再將緩沖區(qū)的內(nèi)容發(fā)送到socket。但是由于Linux的I/O操作默認是緩沖I/O。這里面主要使用的也就是read和write兩個系統(tǒng)調(diào)用,我們并不知道操作系統(tǒng)在其中做了什么。實際上在以上I/O操作中,發(fā)生了多次的數(shù)據(jù)拷貝。

當應(yīng)用程序訪問某塊數(shù)據(jù)時,操作系統(tǒng)首先會檢查,是不是最近訪問過此文件,文件內(nèi)容是否緩存在內(nèi)核緩沖區(qū),如果是,操作系統(tǒng)則直接根據(jù)read系統(tǒng)調(diào)用提供的buf地址,將內(nèi)核緩沖區(qū)的內(nèi)容拷貝到buf所指定的用戶空間緩沖區(qū)中去。如果不是,操作系統(tǒng)則首先將磁盤上的數(shù)據(jù)拷貝的內(nèi)核緩沖區(qū),這一步目前主要依靠DMA來傳輸,然后再把內(nèi)核緩沖區(qū)上的內(nèi)容拷貝到用戶緩沖區(qū)中。

接下來,write系統(tǒng)調(diào)用再把用戶緩沖區(qū)的內(nèi)容拷貝到網(wǎng)絡(luò)堆棧相關(guān)的內(nèi)核緩沖區(qū)中,最后socket再把內(nèi)核緩沖區(qū)的內(nèi)容發(fā)送到網(wǎng)卡上。說了這么多,不如看圖清楚:

Linux中零拷貝技術(shù)是什么

數(shù)據(jù)拷貝

從上圖中可以看出,共產(chǎn)生了四次數(shù)據(jù)拷貝,即使使用了DMA來處理了與硬件的通訊,CPU仍然需要處理兩次數(shù)據(jù)拷貝,與此同時,在用戶態(tài)與內(nèi)核態(tài)也發(fā)生了多次上下文切換,無疑也加重了CPU負擔。

在此過程中,我們沒有對文件內(nèi)容做任何修改,那么在內(nèi)核空間和用戶空間來回拷貝數(shù)據(jù)無疑就是一種浪費,而零拷貝主要就是為了解決這種低效性。

什么是零拷貝技術(shù)(zero-copy)?

零拷貝主要的任務(wù)就是避免CPU將數(shù)據(jù)從一塊存儲拷貝到另外一塊存儲,主要就是利用各種零拷貝技術(shù),避免讓CPU做大量的數(shù)據(jù)拷貝任務(wù),減少不必要的拷貝,或者讓別的組件來做這一類簡單的數(shù)據(jù)傳輸任務(wù),讓CPU解脫出來專注于別的任務(wù)。這樣就可以讓系統(tǒng)資源的利用更加有效。

我們繼續(xù)回到引文中的例子,我們?nèi)绾螠p少數(shù)據(jù)拷貝的次數(shù)呢?一個很明顯的著力點就是減少數(shù)據(jù)在內(nèi)核空間和用戶空間來回拷貝,這也引入了零拷貝的一個類型:

讓數(shù)據(jù)傳輸不需要經(jīng)過 user space。

使用 mmap

我們減少拷貝次數(shù)的一種方法是調(diào)用mmap()來代替read調(diào)用:

buf = mmap(diskfd, len);   write(sockfd, buf, len);

應(yīng)用程序調(diào)用mmap(),磁盤上的數(shù)據(jù)會通過DMA被拷貝的內(nèi)核緩沖區(qū),接著操作系統(tǒng)會把這段內(nèi)核緩沖區(qū)與應(yīng)用程序共享,這樣就不需要把內(nèi)核緩沖區(qū)的內(nèi)容往用戶空間拷貝。應(yīng)用程序再調(diào)用write(),操作系統(tǒng)直接將內(nèi)核緩沖區(qū)的內(nèi)容拷貝到socket緩沖區(qū)中,這一切都發(fā)生在內(nèi)核態(tài),最后,socket緩沖區(qū)再把數(shù)據(jù)發(fā)到網(wǎng)卡去。同樣的,看圖很簡單:

Linux中零拷貝技術(shù)是什么

mmap

使用mmap替代read很明顯減少了一次拷貝,當拷貝數(shù)據(jù)量很大時,無疑提升了效率。但是使用mmap是有代價的。當你使用mmap時,你可能會遇到一些隱藏的陷阱。例如,當你的程序map了一個文件,但是當這個文件被另一個進程截斷(truncate)時, write系統(tǒng)調(diào)用會因為訪問非法地址而被SIGBUS信號終止。SIGBUS信號默認會殺死你的進程并產(chǎn)生一個coredump,如果你的服務(wù)器這樣被中止了,那會產(chǎn)生一筆損失。

通常我們使用以下解決方案避免這種問題:

1. 為SIGBUS信號建立信號處理程序

當遇到SIGBUS信號時,信號處理程序簡單地返回,write系統(tǒng)調(diào)用在被中斷之前會返回已經(jīng)寫入的字節(jié)數(shù),并且errno會被設(shè)置成success,但是這是一種糟糕的處理辦法,因為你并沒有解決問題的實質(zhì)核心。

2. 使用文件租借鎖

通常我們使用這種方法,在文件描述符上使用租借鎖,我們?yōu)槲募騼?nèi)核申請一個租借鎖,當其它進程想要截斷這個文件時,內(nèi)核會向我們發(fā)送一個實時的RTSIGNALLEASE信號,告訴我們內(nèi)核正在破壞你加持在文件上的讀寫鎖。這樣在程序訪問非法內(nèi)存并且被SIGBUS殺死之前,你的write系統(tǒng)調(diào)用會被中斷。write會返回已經(jīng)寫入的字節(jié)數(shù),并且置errno為success。

我們應(yīng)該在mmap文件之前加鎖,并且在操作完文件后解鎖: 

if(fcntl(diskfd, F_SETSIG, RT_SIGNAL_LEASE) == -1) {         perror("kernel lease set signal");     return -1;     }     /* l_type can be F_RDLCK F_WRLCK  加鎖*/     /* l_type can be  F_UNLCK 解鎖*/     if(fcntl(diskfd, F_SETLEASE, l_type)){         perror("kernel lease set type");     return -1;     }

使用sendfile

從2.1版內(nèi)核開始,Linux引入了sendfile來簡化操作:

#include<sys/sendfile.h>  ssize_t sendfile(int out_fd, int in_fd, off_t *offset, size_t count);

系統(tǒng)調(diào)用sendfile()在代表輸入文件的描述符infd和代表輸出文件的描述符outfd之間傳送文件內(nèi)容(字節(jié))。描述符outfd必須指向一個套接字,而infd指向的文件必須是可以mmap的。這些局限限制了sendfile的使用,使sendfile只能將數(shù)據(jù)從文件傳遞到套接字上,反之則不行。

使用sendfile不僅減少了數(shù)據(jù)拷貝的次數(shù),還減少了上下文切換,數(shù)據(jù)傳送始終只發(fā)生在kernel space。

Linux中零拷貝技術(shù)是什么

sendfile系統(tǒng)調(diào)用過程

在我們調(diào)用sendfile時,如果有其它進程截斷了文件會發(fā)生什么呢?假設(shè)我們沒有設(shè)置任何信號處理程序,sendfile調(diào)用僅僅返回它在被中斷之前已經(jīng)傳輸?shù)淖止?jié)數(shù),errno會被置為success。如果我們在調(diào)用sendfile之前給文件加了鎖,sendfile的行為仍然和之前相同,我們還會收到RTSIGNALLEASE的信號。

目前為止,我們已經(jīng)減少了數(shù)據(jù)拷貝的次數(shù)了,但是仍然存在一次拷貝,就是頁緩存到socket緩存的拷貝。那么能不能把這個拷貝也省略呢?

借助于硬件上的幫助,我們是可以辦到的。之前我們是把頁緩存的數(shù)據(jù)拷貝到socket緩存中,實際上,我們僅僅需要把緩沖區(qū)描述符傳到socket緩沖區(qū),再把數(shù)據(jù)長度傳過去,這樣DMA控制器直接將頁緩存中的數(shù)據(jù)打包發(fā)送到網(wǎng)絡(luò)中就可以了。

總結(jié)一下,sendfile系統(tǒng)調(diào)用利用DMA引擎將文件內(nèi)容拷貝到內(nèi)核緩沖區(qū)去,然后將帶有文件位置和長度信息的緩沖區(qū)描述符添加socket緩沖區(qū)去,這一步不會將內(nèi)核中的數(shù)據(jù)拷貝到socket緩沖區(qū)中,DMA引擎會將內(nèi)核緩沖區(qū)的數(shù)據(jù)拷貝到協(xié)議引擎中去,避免了最后一次拷貝。

Linux中零拷貝技術(shù)是什么

帶DMA的sendfile

不過這一種收集拷貝功能是需要硬件以及驅(qū)動程序支持的。

使用splice

sendfile只適用于將數(shù)據(jù)從文件拷貝到套接字上,限定了它的使用范圍。Linux在2.6.17版本引入splice系統(tǒng)調(diào)用,用于在兩個文件描述符中移動數(shù)據(jù): 

#define _GNU_SOURCE         /* See feature_test_macros(7) */     #include<fcntl.h>     ssize_t splice(int fd_in, loff_t *off_in, int fd_out, loff_t *off_out, size_t len, unsignedint flags);

splice調(diào)用在兩個文件描述符之間移動數(shù)據(jù),而不需要數(shù)據(jù)在內(nèi)核空間和用戶空間來回拷貝。他從fdin拷貝len長度的數(shù)據(jù)到fdout,但是有一方必須是管道設(shè)備,這也是目前splice的一些局限性。flags參數(shù)有以下幾種取值:

  •  SPLICEFMOVE:嘗試去移動數(shù)據(jù)而不是拷貝數(shù)據(jù)。這僅僅是對內(nèi)核的一個小提示:如果內(nèi)核不能從pipe移動數(shù)據(jù)或者pipe的緩存不是一個整頁面,仍然需要拷貝數(shù)據(jù)。Linux最初的實現(xiàn)有些問題,所以從2.6.21開始這個選項不起作用,后面的Linux版本應(yīng)該會實現(xiàn)。

  •  SPLICEFNONBLOCK:splice 操作不會被阻塞。然而,如果文件描述符沒有被設(shè)置為不可被阻塞方式的 I/O ,那么調(diào)用 splice 有可能仍然被阻塞。

  •  SPLICEFMORE:后面的splice調(diào)用會有更多的數(shù)據(jù)。

splice調(diào)用利用了Linux提出的管道緩沖區(qū)機制, 所以至少一個描述符要為管道。

以上幾種零拷貝技術(shù)都是減少數(shù)據(jù)在用戶空間和內(nèi)核空間拷貝技術(shù)實現(xiàn)的,但是有些時候,數(shù)據(jù)必須在用戶空間和內(nèi)核空間之間拷貝。這時候,我們只能針對數(shù)據(jù)在用戶空間和內(nèi)核空間拷貝的時機上下功夫了。Linux通常利用寫時復(fù)制(copy on write)來減少系統(tǒng)開銷,這個技術(shù)又時常稱作COW。

由于篇幅原因,本文不詳細介紹寫時復(fù)制。大概描述下就是:如果多個程序同時訪問同一塊數(shù)據(jù),那么每個程序都擁有指向這塊數(shù)據(jù)的指針,在每個程序看來,自己都是獨立擁有這塊數(shù)據(jù)的,只有當程序需要對數(shù)據(jù)內(nèi)容進行修改時,才會把數(shù)據(jù)內(nèi)容拷貝到程序自己的應(yīng)用空間里去,這時候,數(shù)據(jù)才成為該程序的私有數(shù)據(jù)。如果程序不需要對數(shù)據(jù)進行修改,那么永遠都不需要拷貝數(shù)據(jù)到自己的應(yīng)用空間里。這樣就減少了數(shù)據(jù)的拷貝。寫時復(fù)制的內(nèi)容可以再寫一篇文章了。。。

除此之外,還有一些零拷貝技術(shù),比如傳統(tǒng)的Linux I/O中加上O_DIRECT標記可以直接I/O,避免了自動緩存,還有尚未成熟的fbufs技術(shù),本文尚未覆蓋所有零拷貝技術(shù),只是介紹常見的一些,如有興趣,可以自行研究,一般成熟的服務(wù)端項目也會自己改造內(nèi)核中有關(guān)I/O的部分,提高自己的數(shù)據(jù)傳輸速率。

感謝各位的閱讀!關(guān)于“Linux中零拷貝技術(shù)是什么”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

文章名稱:Linux中零拷貝技術(shù)是什么
網(wǎng)頁路徑:http://aaarwkj.com/article10/igohgo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司面包屑導(dǎo)航、域名注冊、企業(yè)建站網(wǎng)頁設(shè)計公司、云服務(wù)器

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護公司
精品视频偷拍一区二区三区 | 国产精品麻豆色哟哟av| 日韩欧美在线一区二区| 欧美日韩精品视频在线| 国产精品呦呦国产精品尤物| 精品熟女少妇av免费观看| 国产特级黄片免费观看| 给我搜亚洲免费播放黄色大片| 天堂av一区二区在线播放| 亚洲精品天堂av免费看| 外国男人搞亚洲女人在线| 日本熟女中文字幕一区| 欧美日韩一级特黄大片| 中文日韩av在线免费播放| 丝袜美腿亚洲综合第一区| 日韩精品一区福利合集| 自偷自拍在线免费观看| 久久精品国产亚洲av蜜点| 老牛av一区二区三区| 开心激情欧美一区二区| 日本亚洲中文字幕无吗| 91伊人手机在线观看| 国产日韩亚洲欧美精品专区| 国产精品深夜在线观看| 国产综合中文字幕不卡| 亚洲欧美经典精品专区| 成人午夜黄色福利视频| 亚欧成人永久免费视频| 精品欧美一区二区精品| 国产精品亚洲国产精品| 亚洲成人高清在线播放| 欧美一区二区三在线| 免费毛片一区二区三区四区| 欧美日韩午夜久久免费| 中文字幕国产精品一二区| 91精品国产高清91久久久久久| 五月天丁香婷婷深爱| 欧美日韩久久久久久精品| 国产不卡的视频在线观看| 亚洲成人午夜激情在线| 亚洲人成免费在线观看|