re.match()方法怎么在python中使用-創(chuàng)新互聯(lián)

re.match()方法怎么在python中使用？很多新手對(duì)此不是很清楚，為了幫助大家解決這個(gè)難題，下面小編將為大家詳細(xì)講解，有這方面需求的人可以來學(xué)習(xí)下，希望你能有所收獲。

創(chuàng)新互聯(lián)專注于企業(yè)全網(wǎng)整合營銷推廣、網(wǎng)站重做改版、綏寧網(wǎng)站定制設(shè)計(jì)、自適應(yīng)品牌網(wǎng)站建設(shè)、HTML5建站、商城網(wǎng)站開發(fā)、集團(tuán)公司官網(wǎng)建設(shè)、外貿(mào)網(wǎng)站制作、高端網(wǎng)站制作、響應(yīng)式網(wǎng)頁設(shè)計(jì)等建站業(yè)務(wù)，價(jià)格優(yōu)惠性價(jià)比高，為綏寧等各大城市提供網(wǎng)站開發(fā)制作服務(wù)。

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*)are(.*?).*',line)

if matchObj:
 print('matchObj.group():',matchObj.group())
 print('matchObj.group(1):', matchObj.group(1))
 print('matchObj.group(2):', matchObj.group(2))
else:
 print('No match!\n')

書上的期望輸出是：

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):smarter

但是我在電腦上跑了一遍得到的輸出卻是：

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):

于是開始想辦法徹底搞清楚這個(gè)差別的原因所在。

首先要讀懂這幾行代碼，而這一行代碼的關(guān)鍵在于這一句：

matchObj=re.match(r'(.*)are(.*?).*',line)

匹配的正則表達(dá)式是

(.*)are(.*?).*
前面的r表示的是匹配的字符不進(jìn)行轉(zhuǎn)義，而要匹配的字符串是line，也就是
Cats are smarter than dogs
后面使用group（num），個(gè)人理解是，按照正則表達(dá)式中的括號(hào)數(shù)可以捕獲得到對(duì)應(yīng)數(shù)量的捕獲組，而調(diào)用group（num）就可以得到對(duì)應(yīng)捕獲組的內(nèi)容，
其中g(shù)roup（0）表示的是匹配的整個(gè)表達(dá)式的字符串，在本例中就是‘Cats are smarter than dogs'。
參照網(wǎng)上可以搜到的符號(hào)的作用：
.匹配除換行符以外的任意字符
*重復(fù)之前的字符零次或更多次
？重復(fù)之前的字符零次或一次
那么第一個(gè)括號(hào)的內(nèi)容，應(yīng)當(dāng)就是匹配要匹配的字符串中are之前的所有字符（除換行符），
而第二個(gè)括號(hào)的內(nèi)容應(yīng)當(dāng)是匹配are之后的內(nèi)容，但具體想指代什么卻顯得有些不明確。
不明確的點(diǎn)就在于*和？這兩個(gè)符號(hào)的連用，根據(jù)優(yōu)先級(jí)這兩個(gè)符號(hào)是同一優(yōu)先級(jí)的，那么應(yīng)當(dāng)按照順序生效，那么如此翻譯的話，這一語句匹配的就是長度為0到無限大的任意字符串，為了探清此時(shí)
程序判斷的具體內(nèi)容，我們給匹配字符串末尾的.*也加上括號(hào)以提取其內(nèi)容，而后在輸出部分加上對(duì)應(yīng)語句：

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*)are(.*?)(.*)',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))
 print("matchObj.group(3):", matchObj.group(3))
else:
 print('No match!\n')

得到的結(jié)果是：

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2):
matchObj.group(3): smarter than dogs

可見第二個(gè)括號(hào)里的內(nèi)容被默認(rèn)為空了，然后刪去那個(gè)？，可以看到結(jié)果變成：

matchObj.group(): Cats are smarter than dogs
matchObj.group(1): Cats
matchObj.group(2): smarter than dogs
matchObj.group(3):

那么這是否就意味著？的默認(rèn)值很可能是0次，那？這個(gè)符號(hào)到底有什么用呢

仔細(xì)想來這個(gè)說法并不是很嚴(yán)謹(jǐn)。嘗試使用單獨(dú)的.?組合可以看到這個(gè)組合可以用于提取

單個(gè)不知道是否存在的字符，而如下代碼

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are(.*)?',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))

也能在組別2中正常提取到are之后的字符內(nèi)容，但稍微改動(dòng)一下將？放到第二個(gè)括號(hào)內(nèi)，

就什么也提取不到，同時(shí)導(dǎo)致group(0)中匹配的字符到Cats are就截止了（也就是第二個(gè)括號(hào)匹配失敗）。

令人感到奇怪的是，如果將上面的代碼改成

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are (.*)+',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))

也就是僅僅將？改為+，雖然能成功匹配整個(gè)line但group(2)中沒有內(nèi)容，

如果把+放到第二個(gè)括號(hào)中就會(huì)產(chǎn)生報(bào)錯(cuò)，匹配失敗。

那么是否可以認(rèn)為.*?這三個(gè)符號(hào)連用只是一個(gè)不規(guī)范的操作，但由于？的特殊性所以沒有報(bào)錯(cuò)反而匹配成功了呢？

具體的可能要研究代碼本身的機(jī)理了，暫且擱置。還有一個(gè)問題就是如何達(dá)到樣例本身想要的，用第二個(gè)括號(hào)提取單個(gè)單詞的目的。

如果單單考慮這個(gè)例子的話，把原本第二個(gè)括號(hào)中的?換成r就可以了，也就是如下代碼：

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are (.*r).*',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))
 #print("matchObj.group(3):", matchObj.group(3))
else:
 print('No match!\n')

為了泛用性嘗試了一下把r改成‘ '但是得到的結(jié)果是‘smarter than '。于是嘗試把.換成表示任意字母的

[a-zA-Z]，成功提取出了單個(gè)smarter，代碼如下：

import re

line='Cats are smarter than dogs'
matchObj=re.match(r'(.*) are ([a-zA-Z]* ).*',line)

if matchObj:
 print("matchObj.group():",matchObj.group())
 print("matchObj.group(1):", matchObj.group(1))
 print("matchObj.group(2):", matchObj.group(2))
 #print("matchObj.group(3):", matchObj.group(3))
else:
 print('No match!\n')

看完上述內(nèi)容是否對(duì)您有幫助呢？如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章，請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道，感謝您對(duì)創(chuàng)新互聯(lián)網(wǎng)站建設(shè)公司，的支持。

分享文章：re.match()方法怎么在python中使用-創(chuàng)新互聯(lián)
分享鏈接：http://aaarwkj.com/article2/cccdic.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供搜索引擎優(yōu)化、微信小程序、網(wǎng)站收錄、Google、網(wǎng)站策劃、定制開發(fā)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

re.match()方法怎么在python中使用-創(chuàng)新互聯(lián)