python正則表達式之對號入座篇
一、定義
正則表達式是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。如果找到了符合這樣一種規(guī)則的字符串,我們就說匹配上了,否則匹配失敗。
二、匹配規(guī)則
1.語法規(guī)則
2.相關注解
a.反斜杠問題
假如你需要匹配文本中的字符"\",那么使用編程語言表示的正則表達式里將需要4個反斜杠"\\\\":前兩個和后兩個分別用于在編程語言里轉義成反斜杠,轉換成兩個反斜杠后再在正則表達式里轉義成一個反斜杠。其匹配過程如下:
字符 | 匹配過程 |
\\\\abc | 為字符串實值取消反斜杠轉義 |
\\abc | 為re.compile()取消反斜杠轉義 |
\abc | 欲匹配的目標字符串 |
為了解決輸入四個“\”的麻煩,我們可以使用python里的原生字符串(raw string),即在字符串前面加上r。如下:
import re print(re.search(r"\\abc","123\\abc"))
從上面可知,使用原生字符串就省去了從字符串實值到re編譯器的字符串轉義過程,而編譯器編譯的時候仍然要轉義。
b.貪婪匹配與非貪婪匹配
貪婪匹配:正則表達式一般趨向于最大長度匹配,也就是所謂的貪婪匹配。如:
import re print(re.match("ab.*c","abcdfghc"))
匹配的結果為整個字符串。而非貪婪匹配就是匹配到結果就好,最少地匹配字符。python默認是貪婪模式;在量詞后面直接加上一個問號?就是非貪婪模式。
import re print(re.match("ab.*?c","abcdfghc"))
這樣匹配的結果就是“abc”。
三、模塊和函數(shù)
re模塊
compile()編譯語法規(guī)則
match() 從字符串開頭位置開始匹配
search() 從字符串任意位置匹配到第一個符合規(guī)則的字符串
findall 以列表形式返回所有匹配到的字符串
finditer 以迭代器形式返回所有匹配到的字符串
split() 拆分字符串
group() 獲取匹配到的字符串的分組信息
四、特殊構造的規(guī)則
總結
以上所述是小編給大家介紹的python正則表達式之對號入座篇,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對我們網(wǎng)站的支持!
您可能感興趣的文章
- 01-11正則表達式實現(xiàn)添加、刪除、替換三種功能
- 01-11python 用正則表達式篩選文本信息的實例
- 01-11正則表達式之匹配數(shù)字范圍
- 01-11python爬蟲正則表達式之處理換行符
- 01-11正則表達式匹配路由的實現(xiàn)代碼
- 01-11正則表達式截取身份證號碼加密的方法
- 01-11js正則表達式 匹配兩個特定字符間的內容示例
- 01-11MySQL使用正則表達式進行查詢操作經典實例總結
- 01-11詳解正則表達式實現(xiàn)二代身份證號碼驗證
- 01-11Python爬蟲之正則表達式基本用法實例分析


閱讀排行
本欄相關
- 01-11正則表達式實現(xiàn)添加、刪除、替換三
- 01-11正則表達式之匹配數(shù)字范圍
- 01-11python 用正則表達式篩選文本信息的實
- 01-11正則表達式匹配路由的實現(xiàn)代碼
- 01-11python爬蟲正則表達式之處理換行符
- 01-11js正則表達式 匹配兩個特定字符間的
- 01-11正則表達式截取身份證號碼加密的方
- 01-11python正則表達式之對號入座篇
- 01-11MySQL使用正則表達式進行查詢操作經典
- 01-11詳解正則表達式實現(xiàn)二代身份證號碼
隨機閱讀
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 01-11ajax實現(xiàn)頁面的局部加載
- 01-10C#中split用法實例總結
- 04-02jquery與jsp,用jquery
- 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
- 01-10delphi制作wav文件的方法
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 08-05織夢dedecms什么時候用欄目交叉功能?
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 01-10SublimeText編譯C開發(fā)環(huán)境設置