解決Python正則表達(dá)式匹配反斜杠''\''問題
在學(xué)習(xí)Python正則式的過程中,有一個問題一直困擾我,如何去匹配一個反斜杠(即“\”)?
一、引入
在學(xué)習(xí)了Python特殊字符和原始字符串之后,我覺得答案應(yīng)該是這樣的:
1)普通字符串:'\\'
2)原始字符串:r'\'
但事實(shí)上在提取諸如“3\8”反斜杠之前的數(shù)字時,我屢次碰壁,始終得不到結(jié)果。最終發(fā)現(xiàn)自己理解錯了,原來原始字符串和“正則轉(zhuǎn)義”沒有一點(diǎn)關(guān)系;下面詳細(xì)談一談。
二、字符串轉(zhuǎn)義
反斜杠,在Python中比較特殊,就是它可以用來構(gòu)成一些特殊字符,比如“\n”表示換行,“\t”表示制表符。下面是使用“\n”的一行代碼:
>>>print ('Hello\World\nPython' )
結(jié)果為:
“Hello\World
Python“
可以看到其中的“\n”已轉(zhuǎn)義為換行符,而“\W”沒有發(fā)生轉(zhuǎn)義,原因是“\W”在“字符串轉(zhuǎn)義”中并不對應(yīng)著特殊字符,沒有特殊含義。
如果現(xiàn)在要求變了,要求不對“\n”轉(zhuǎn)義為換行,而是原封不動輸出為“Hello\World\nPython”,該怎么辦呢?
1)可以這樣寫“Hello\World\\nPython”,這樣輸出的時候,“字符串轉(zhuǎn)義”會把“\\”轉(zhuǎn)義為“\”;
2)也可使用另一種方法:原始字符串;原始字符串(即r'...'):字符串中所有字符都直接按照字面意思來使用,不轉(zhuǎn)義特殊字符。
下面是使用原始字符串的代碼:
print r'Hello\World\nPython'
結(jié)果為:
“Hello\World\nPython”
可以清楚看到,在使用原始字符串之后,“\n”未被轉(zhuǎn)義為換行符,而是直接被輸出了。
三、正則轉(zhuǎn)義
好了,上面講的只是“字符串轉(zhuǎn)義”。同理,在正則表達(dá)式中也存在轉(zhuǎn)義,我們姑且先稱其為“正則轉(zhuǎn)義”,其與“字符串轉(zhuǎn)義”完全不同,比如“\d”代表數(shù)字,“\s”代表空白符。下面我們先編寫開頭的例子,然后再分析。
提取“3\8”反斜杠之前的數(shù)字:
import re string = '3\8' m = re.search('(\d+)\\\\', string) if m is not None: print m.group(1) # 結(jié)果為:3 n = re.search(r'(\d+)\\', string) if n is not None: print n.group(1) # 結(jié)果為:3
正則表達(dá)式字符串需要經(jīng)過兩次轉(zhuǎn)義,這兩次分別是上面的“字符串轉(zhuǎn)義”和“正則轉(zhuǎn)義”,個人認(rèn)為“字符串轉(zhuǎn)義”一定先于“正則轉(zhuǎn)義”。
1)'\\\\'的過程:
先進(jìn)行“字符串轉(zhuǎn)義”,前兩個反斜杠和后兩個反斜杠分別被轉(zhuǎn)義成了一個反斜杠;即“\\|\\”被轉(zhuǎn)成了“\|\”(“|”為方便看清,請自動忽略)。“字符串轉(zhuǎn)義”后馬上進(jìn)行“正則轉(zhuǎn)義”,“\\”被轉(zhuǎn)義為了“\”,表示該正則式需要匹配一個反斜杠。
2)r'\\'的過程:
由于原始字符串中所有字符直接按照字面意思來使用,不轉(zhuǎn)義特殊字符,故不做“字符串轉(zhuǎn)義”,直接進(jìn)入第二步“正則轉(zhuǎn)義”,在正則轉(zhuǎn)義中“\\”被轉(zhuǎn)義為了“\”,表示該正則式需要匹配一個反斜杠。
四、結(jié)論
也就是說原始字符串(即r'...')與“正則轉(zhuǎn)義”毫無關(guān)系,原始字符串僅在“字符串轉(zhuǎn)義”中起作用,使字符串免去一次轉(zhuǎn)義。
總結(jié)
以上所述是小編給大家介紹的解決Python正則表達(dá)式匹配反斜杠''\''問題,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對我們網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
欄 目:正則表達(dá)式
本文標(biāo)題:解決Python正則表達(dá)式匹配反斜杠''\''問題
本文地址:http://mengdiqiu.com.cn/a1/zhengzebiaodashi/11143.html
您可能感興趣的文章
- 01-11正則表達(dá)式實(shí)現(xiàn)添加、刪除、替換三種功能
- 01-11python 用正則表達(dá)式篩選文本信息的實(shí)例
- 01-11正則表達(dá)式之匹配數(shù)字范圍
- 01-11python爬蟲正則表達(dá)式之處理換行符
- 01-11正則表達(dá)式匹配路由的實(shí)現(xiàn)代碼
- 01-11正則表達(dá)式截取身份證號碼加密的方法
- 01-11js正則表達(dá)式 匹配兩個特定字符間的內(nèi)容示例
- 01-11MySQL使用正則表達(dá)式進(jìn)行查詢操作經(jīng)典實(shí)例總結(jié)
- 01-11python正則表達(dá)式之對號入座篇
- 01-11詳解正則表達(dá)式實(shí)現(xiàn)二代身份證號碼驗(yàn)證


閱讀排行
本欄相關(guān)
- 01-11正則表達(dá)式實(shí)現(xiàn)添加、刪除、替換三
- 01-11正則表達(dá)式之匹配數(shù)字范圍
- 01-11python 用正則表達(dá)式篩選文本信息的實(shí)
- 01-11正則表達(dá)式匹配路由的實(shí)現(xiàn)代碼
- 01-11python爬蟲正則表達(dá)式之處理換行符
- 01-11js正則表達(dá)式 匹配兩個特定字符間的
- 01-11正則表達(dá)式截取身份證號碼加密的方
- 01-11python正則表達(dá)式之對號入座篇
- 01-11MySQL使用正則表達(dá)式進(jìn)行查詢操作經(jīng)典
- 01-11詳解正則表達(dá)式實(shí)現(xiàn)二代身份證號碼
隨機(jī)閱讀
- 01-11ajax實(shí)現(xiàn)頁面的局部加載
- 04-02jquery與jsp,用jquery
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 01-10delphi制作wav文件的方法
- 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
- 01-10C#中split用法實(shí)例總結(jié)
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 08-05織夢dedecms什么時候用欄目交叉功能?