解決Python正則表達式匹配反斜杠''\''問題
在學習Python正則式的過程中,有一個問題一直困擾我,如何去匹配一個反斜杠(即“\”)?
一、引入
在學習了Python特殊字符和原始字符串之后,我覺得答案應該是這樣的:
1)普通字符串:'\\'
2)原始字符串:r'\'
但事實上在提取諸如“3\8”反斜杠之前的數(shù)字時,我屢次碰壁,始終得不到結果。最終發(fā)現(xiàn)自己理解錯了,原來原始字符串和“正則轉義”沒有一點關系;下面詳細談一談。
二、字符串轉義
反斜杠,在Python中比較特殊,就是它可以用來構成一些特殊字符,比如“\n”表示換行,“\t”表示制表符。下面是使用“\n”的一行代碼:
>>>print ('Hello\World\nPython' )
結果為:
“Hello\World
Python“
可以看到其中的“\n”已轉義為換行符,而“\W”沒有發(fā)生轉義,原因是“\W”在“字符串轉義”中并不對應著特殊字符,沒有特殊含義。
如果現(xiàn)在要求變了,要求不對“\n”轉義為換行,而是原封不動輸出為“Hello\World\nPython”,該怎么辦呢?
1)可以這樣寫“Hello\World\\nPython”,這樣輸出的時候,“字符串轉義”會把“\\”轉義為“\”;
2)也可使用另一種方法:原始字符串;原始字符串(即r'...'):字符串中所有字符都直接按照字面意思來使用,不轉義特殊字符。
下面是使用原始字符串的代碼:
print r'Hello\World\nPython'
結果為:
“Hello\World\nPython”
可以清楚看到,在使用原始字符串之后,“\n”未被轉義為換行符,而是直接被輸出了。
三、正則轉義
好了,上面講的只是“字符串轉義”。同理,在正則表達式中也存在轉義,我們姑且先稱其為“正則轉義”,其與“字符串轉義”完全不同,比如“\d”代表數(shù)字,“\s”代表空白符。下面我們先編寫開頭的例子,然后再分析。
提取“3\8”反斜杠之前的數(shù)字:
import re string = '3\8' m = re.search('(\d+)\\\\', string) if m is not None: print m.group(1) # 結果為:3 n = re.search(r'(\d+)\\', string) if n is not None: print n.group(1) # 結果為:3
正則表達式字符串需要經(jīng)過兩次轉義,這兩次分別是上面的“字符串轉義”和“正則轉義”,個人認為“字符串轉義”一定先于“正則轉義”。
1)'\\\\'的過程:
先進行“字符串轉義”,前兩個反斜杠和后兩個反斜杠分別被轉義成了一個反斜杠;即“\\|\\”被轉成了“\|\”(“|”為方便看清,請自動忽略)?!白址D義”后馬上進行“正則轉義”,“\\”被轉義為了“\”,表示該正則式需要匹配一個反斜杠。
2)r'\\'的過程:
由于原始字符串中所有字符直接按照字面意思來使用,不轉義特殊字符,故不做“字符串轉義”,直接進入第二步“正則轉義”,在正則轉義中“\\”被轉義為了“\”,表示該正則式需要匹配一個反斜杠。
四、結論
也就是說原始字符串(即r'...')與“正則轉義”毫無關系,原始字符串僅在“字符串轉義”中起作用,使字符串免去一次轉義。
總結
以上所述是小編給大家介紹的解決Python正則表達式匹配反斜杠''\''問題,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對我們網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!
上一篇:re模塊的正則匹配的表達式詳解
欄 目:正則表達式
下一篇:正則表達式匹配各種特殊字符
本文標題:解決Python正則表達式匹配反斜杠''\''問題
本文地址:http://mengdiqiu.com.cn/a1/zhengzebiaodashi/11143.html
您可能感興趣的文章
- 01-11正則表達式實現(xiàn)添加、刪除、替換三種功能
- 01-11python 用正則表達式篩選文本信息的實例
- 01-11正則表達式之匹配數(shù)字范圍
- 01-11python爬蟲正則表達式之處理換行符
- 01-11正則表達式匹配路由的實現(xiàn)代碼
- 01-11正則表達式截取身份證號碼加密的方法
- 01-11js正則表達式 匹配兩個特定字符間的內(nèi)容示例
- 01-11MySQL使用正則表達式進行查詢操作經(jīng)典實例總結
- 01-11python正則表達式之對號入座篇
- 01-11詳解正則表達式實現(xiàn)二代身份證號碼驗證


閱讀排行
本欄相關
- 01-11正則表達式實現(xiàn)添加、刪除、替換三
- 01-11正則表達式之匹配數(shù)字范圍
- 01-11python 用正則表達式篩選文本信息的實
- 01-11正則表達式匹配路由的實現(xiàn)代碼
- 01-11python爬蟲正則表達式之處理換行符
- 01-11js正則表達式 匹配兩個特定字符間的
- 01-11正則表達式截取身份證號碼加密的方
- 01-11python正則表達式之對號入座篇
- 01-11MySQL使用正則表達式進行查詢操作經(jīng)典
- 01-11詳解正則表達式實現(xiàn)二代身份證號碼
隨機閱讀
- 01-11ajax實現(xiàn)頁面的局部加載
- 04-02jquery與jsp,用jquery
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-10SublimeText編譯C開發(fā)環(huán)境設置
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 01-10delphi制作wav文件的方法
- 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
- 01-10C#中split用法實例總結
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 08-05織夢dedecms什么時候用欄目交叉功能?