這篇文章給大家分享的是有關linux如何去重統(tǒng)計的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。
目前創(chuàng)新互聯(lián)已為1000多家的企業(yè)提供了網(wǎng)站建設、域名、雅安服務器托管、網(wǎng)站托管、服務器租用、企業(yè)網(wǎng)站設計、西塞山網(wǎng)站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。linux命令行提供了非常強大的文本處理功能,組合利用linux命令能實現(xiàn)好多強大的功能。本文這里舉例說明如何利用Linux命令行進行文本按行去重并按重復次數(shù)排序。主要用到的命令有sort,uniq和cut。其中,sort主要功能是排序,uniq主要功能是實現(xiàn)相鄰文本行的去重,cut可以從文本行中提取相應的文本列(簡單地說,就是按列操作文本行)。
文本行去重并按重復次數(shù)排序
例:
首先,對文本行進行去重并統(tǒng)計重復次數(shù)(uniq命令加-c選項可以實現(xiàn)對重復次數(shù)進行統(tǒng)計)。
$ sort test.txt | uniq -c 2 Apple and Nokia. 4 Hello World. 1 I wanna buy an Apple device. 1 My name is Friendfish. 2 The Iphone of Apple company.
對文本行按重復次數(shù)進行排序。
sort -n可以識別每行開頭的數(shù)字,并按其大小對文本行進行排序。默認是按升序排列,如果想要按降序要加-r選項(sort -rn)。
$ sort test.txt | uniq -c | sort -rn 4 Hello World. 2 The Iphone of Apple company. 2 Apple and Nokia. 1 My name is Friendfish.
每行前面的刪除重復次數(shù)。
cut命令可以按列操作文本行。可以看出前面的重復次數(shù)占8個字符,因此,可以用命令cut -c 9- 取出每行第9個及其以后的字符。
$ sort test.txt | uniq -c | sort -rn | cut -c 9- Hello World. The Iphone of Apple company. Apple and Nokia. My name is Friendfish. I wanna buy an Apple device.
感謝各位的閱讀!關于linux如何去重統(tǒng)計就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
當前標題:linux如何去重統(tǒng)計-創(chuàng)新互聯(lián)
瀏覽路徑:http://aaarwkj.com/article0/dddjoo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、企業(yè)網(wǎng)站制作、網(wǎng)站策劃、標簽優(yōu)化、企業(yè)建站、響應式網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容