C#中正則表達(dá)式的3種匹配模式
在C#中,我們一般使用Regex類來(lái)表示一個(gè)正則表達(dá)式。一般正則表達(dá)式引擎支持以下3種匹配模式:?jiǎn)涡心J?Singleline)、多行模式(Multiline)與忽略大小寫(xiě)(IgnoreCase)。
1. 單行模式(Singleline)
MSDN定義:更改點(diǎn) (.) 的含義,使它與每一個(gè)字符匹配(而不是與除 \n 之外的每個(gè)字符匹配)。
使用單行模式的典型場(chǎng)景是獲取網(wǎng)頁(yè)源碼中的信息。
示例:
我們使用WebBrowser控件,從http://www.xxx.com/1.htm上獲取了如下HTML源碼,它存儲(chǔ)在變量str中:
<html>
<body>
<div>
Line 1
Line 2
</div>
</body>
</html>
我們想把div標(biāo)簽以及其中的內(nèi)容提取出來(lái),編寫(xiě)代碼如下:
string pattern = @"<div>.*</div>"; Regex regex = new Regex(pattern); if (regex.IsMatch(str)) Console.WriteLine(regex.Match(str).Value); else Console.WriteLine("Mismatch!");
//結(jié)果為:Mismatch!
錯(cuò)誤分析:
一般認(rèn)為點(diǎn)符號(hào)(.)是匹配任意單個(gè)字符的,而(.*)就是匹配任意多個(gè)字符。但實(shí)際上點(diǎn)符號(hào)不能匹配換行符。在Windows中與它等效的表達(dá)式為[^\r\n]。
而我們從網(wǎng)站上獲取的HTML源碼,極少有不換行的。這時(shí)候單行模式派上用場(chǎng)了,它可以改變點(diǎn)符號(hào)的意義。修改regex實(shí)例的構(gòu)造函數(shù),用RegexOptions.Singleline來(lái)聲明使用單行模式:
string pattern = @"<div>.*</div>"; Regex regex = new Regex(pattern, RegexOptions.Singleline); if (regex.IsMatch(str)) Console.WriteLine(regex.Match(str).Value); else Console.WriteLine("Mismatch!");
/*
結(jié)果為:
<div>
Line 1
Line 2
</div>
*/
單行模式的嵌入修飾符:
我們可以直接在正則表達(dá)式中嵌入單行模式:
(?s)<div>.*</div>
(?s)修飾符說(shuō)明,其后面的表達(dá)式采用單行模式。所以使用時(shí)請(qǐng)不要將它放在末尾。另外可以使用(?-s)關(guān)閉單行模式。
注意:嵌入模式的優(yōu)先級(jí)要高于Regex類的RegexOptions設(shè)置,所以使用了(?s)后,無(wú)論是否使用RegexOptions.Singleline,均按照單行模式解析。
2. 多行模式(Multiline)
MSDN定義:更改 ^ 和 $ 的含義,使它們分別在任意一行的行首和行尾匹配,而不僅僅在整個(gè)字符串的開(kāi)頭和結(jié)尾匹配。
示例:
有一個(gè)文本文件,它的每一行是一個(gè)用戶名,將文件讀入變量str中進(jìn)行處理。其內(nèi)容如下:
二十四畫(huà)生
TerryLee
莫相會(huì)
Dflying Chen
Rainy
借用博客園各位前輩的大名:)
我們想找出一個(gè)使用英文字母開(kāi)頭的用戶名,編寫(xiě)代碼如下:
string pattern = @"^[A-Za-z]+.*"; Regex regex = new Regex(pattern); if (regex.IsMatch(str)) Console.WriteLine(regex.Match(str).Value); else Console.WriteLine("Mismatch!");
//結(jié)果為:Mismatch!
錯(cuò)誤分析:
(^)是字符串的起始錨定,str的第一個(gè)字符是一個(gè)中文字,所以匹配不上。我們就可以使用多行模式來(lái)改變(^)的含義,使它匹配每一行的起始,而不是整個(gè)字符串的起始。
更改代碼如下:
string pattern = @"^[A-Za-z]+.*"; Regex regex = new Regex(pattern, RegexOptions.Multiline); if (regex.IsMatch(str)) Console.WriteLine(regex.Match(str).Value); else Console.WriteLine("Mismatch!");
//結(jié)果為:TerryLee
同時(shí),多行模式也會(huì)改變($)的含義,使它匹配每一行的結(jié)尾,而不是整個(gè)字符串的結(jié)尾。
與(^)和($)不同的是,(\A)和(\Z)并不受多行模式的影響,永遠(yuǎn)匹配整個(gè)字符串的起始和結(jié)尾。
多行模式的嵌入修飾符:(?m)與(?-m)
3. 忽略大小寫(xiě)(IgnoreCase)
MSDN定義:指定不區(qū)分大小寫(xiě)的匹配。
這個(gè)模式很容易理解,它認(rèn)為大小寫(xiě)字符是相同的。我們?nèi)砸陨侠齺?lái)說(shuō)明。
示例:
string pattern = @"^[a-z]+.*"; Regex regex = new Regex(pattern, RegexOptions.Multiline | RegexOptions.IgnoreCase); if (regex.IsMatch(str)) Console.WriteLine(regex.Match(str).Value); else Console.WriteLine("Mismatch!");
//結(jié)果為:TerryLee
分析:請(qǐng)注意這次使用的正則表達(dá)式,我們并沒(méi)有寫(xiě)入大寫(xiě)字母,但卻匹配了以大寫(xiě)字母開(kāi)頭的名字,這就是忽略大小寫(xiě)的效果。
忽略大小寫(xiě)的嵌入修飾符:(?i)與(?-i)
總結(jié):
最后我們用一個(gè)表格來(lái)總結(jié)一下這三個(gè)模式
定義 | 影響的表達(dá)式 | RegexOptions枚舉 | 嵌入標(biāo)識(shí)符 |
---|---|---|---|
單行模式 | 更改點(diǎn) (.) 的含義,使它與每一個(gè)字符匹配(而不是與除 \n 之外的每個(gè)字符匹配)。 | Singleline | (?s) |
多行模式 | 更改 ^ 和 $ 的含義,使它們分別在任意一行的行首和行尾匹配,而不僅僅在整個(gè)字符串的開(kāi)頭和結(jié)尾匹配。 | Multiline | (?m) |
忽略大小寫(xiě) | 指定不區(qū)分大小寫(xiě)的匹配。 | IgnoreCase | (?i) |
上一篇:VS中模仿WPF模板創(chuàng)建最簡(jiǎn)單的WPF程序
欄 目:C#教程
下一篇:C# 判斷字符為空的6種方法的效率實(shí)測(cè)對(duì)比
本文標(biāo)題:C#中正則表達(dá)式的3種匹配模式
本文地址:http://mengdiqiu.com.cn/a1/C_jiaocheng/6547.html
您可能感興趣的文章
- 01-10C#通過(guò)反射獲取當(dāng)前工程中所有窗體并打開(kāi)的方法
- 01-10C#實(shí)現(xiàn)Winform中打開(kāi)網(wǎng)頁(yè)頁(yè)面的方法
- 01-10C#實(shí)現(xiàn)由四周向中心縮小的窗體退出特效
- 01-10Extjs4如何處理后臺(tái)json數(shù)據(jù)中日期和時(shí)間
- 01-10C#中DataGridView常用操作實(shí)例小結(jié)
- 01-10C#編程獲取資源文件中圖片的方法
- 01-10asp.net中XML如何做增刪改查操作
- 01-10C#利用反射技術(shù)實(shí)現(xiàn)去掉按鈕選中時(shí)的邊框效果
- 01-10C#中查找Dictionary中的重復(fù)值的方法
- 01-10C#中TreeView實(shí)現(xiàn)適合兩級(jí)節(jié)點(diǎn)的選中節(jié)點(diǎn)方法


閱讀排行
- 1C語(yǔ)言 while語(yǔ)句的用法詳解
- 2java 實(shí)現(xiàn)簡(jiǎn)單圣誕樹(shù)的示例代碼(圣誕
- 3利用C語(yǔ)言實(shí)現(xiàn)“百馬百擔(dān)”問(wèn)題方法
- 4C語(yǔ)言中計(jì)算正弦的相關(guān)函數(shù)總結(jié)
- 5c語(yǔ)言計(jì)算三角形面積代碼
- 6什么是 WSH(腳本宿主)的詳細(xì)解釋
- 7C++ 中隨機(jī)函數(shù)random函數(shù)的使用方法
- 8正則表達(dá)式匹配各種特殊字符
- 9C語(yǔ)言十進(jìn)制轉(zhuǎn)二進(jìn)制代碼實(shí)例
- 10C語(yǔ)言查找數(shù)組里數(shù)字重復(fù)次數(shù)的方法
本欄相關(guān)
- 01-10C#通過(guò)反射獲取當(dāng)前工程中所有窗體并
- 01-10關(guān)于ASP網(wǎng)頁(yè)無(wú)法打開(kāi)的解決方案
- 01-10WinForm限制窗體不能移到屏幕外的方法
- 01-10WinForm繪制圓角的方法
- 01-10C#實(shí)現(xiàn)txt定位指定行完整實(shí)例
- 01-10WinForm實(shí)現(xiàn)仿視頻 器左下角滾動(dòng)新
- 01-10C#停止線程的方法
- 01-10C#實(shí)現(xiàn)清空回收站的方法
- 01-10C#通過(guò)重寫(xiě)Panel改變邊框顏色與寬度的
- 01-10C#實(shí)現(xiàn)讀取注冊(cè)表監(jiān)控當(dāng)前操作系統(tǒng)已
隨機(jī)閱讀
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 01-10SublimeText編譯C開(kāi)發(fā)環(huán)境設(shè)置
- 04-02jquery與jsp,用jquery
- 01-11Mac OSX 打開(kāi)原生自帶讀寫(xiě)NTFS功能(圖文
- 01-10使用C語(yǔ)言求解撲克牌的順子及n個(gè)骰子
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改
- 01-11ajax實(shí)現(xiàn)頁(yè)面的局部加載
- 01-10delphi制作wav文件的方法
- 01-10C#中split用法實(shí)例總結(jié)