欧美大屁股bbbbxxxx,狼人大香伊蕉国产www亚洲,男ji大巴进入女人的视频小说,男人把ji大巴放进女人免费视频,免费情侣作爱视频

歡迎來(lái)到入門(mén)教程網(wǎng)!

C#教程

當(dāng)前位置:主頁(yè) > 軟件編程 > C#教程 >

淺談C#中正則表達(dá)式的使用

來(lái)源:本站原創(chuàng)|時(shí)間:2020-01-10|欄目:C#教程|點(diǎn)擊: 次

目前為止,許多編程語(yǔ)言和工具都包含對(duì)正則表達(dá)式的支持,C#也不例外,C#基礎(chǔ)類(lèi)庫(kù)中包含有一個(gè)命名空間(System.Text.RegularExpressions)和一系列可以充分發(fā)揮規(guī)則表達(dá)式威力的類(lèi)(Regex、Match、Group等)。那么,什么是正則表達(dá)式,怎么定義正則表達(dá)式呢?

一、正則表達(dá)式基礎(chǔ)

什么是正則表達(dá)式

在編寫(xiě)字符串的處理程序時(shí),經(jīng)常會(huì)有查找符合某些復(fù)雜規(guī)則的字符串的需要。正則表達(dá)式就是用于描述這些規(guī)則的工具。換句話(huà)說(shuō),正則表達(dá)式就是記錄文本規(guī)則的代碼。

通常,我們?cè)谑褂肳INDOWS查找文件時(shí),會(huì)使用通配符(*和?)。如果你想查找某個(gè)目錄下的所有Word文檔時(shí),你就可以使用*.doc進(jìn)行查找,在這里,*就被解釋為任意字符串。和通配符類(lèi)似,正則表達(dá)式也是用來(lái)進(jìn)行文本匹配的工具,只不過(guò)比起通配符,它能更精確地描述你的需求——當(dāng)然,代價(jià)就是更復(fù)雜。

一個(gè)簡(jiǎn)單的例子——驗(yàn)證電話(huà)號(hào)碼

學(xué)習(xí)正則表達(dá)式的最好方法是從例子開(kāi)始,下面我們從驗(yàn)證電話(huà)號(hào)碼開(kāi)始,一步一步的了解正則表達(dá)式。

在我們國(guó)家,電話(huà)號(hào)碼(如:0379-65624150)通常包含3到4為以0開(kāi)頭的區(qū)號(hào)和一個(gè)7或8為的號(hào)碼,中間通常以連字符'-'隔開(kāi)。在這個(gè)例子中,首先我們要介紹一個(gè)元字符\d,它用來(lái)匹配一個(gè)0到9的數(shù)字。這個(gè)正則表達(dá)式可以寫(xiě)成:^0\d{2,3}-\d{7,8}$

我們來(lái)對(duì)他進(jìn)行分析,0匹配數(shù)字“0”,\d匹配一個(gè)數(shù)字,{2,3}表示重復(fù)2到3次,-只匹配”-”自身,接下來(lái)的\d同樣匹配一個(gè)數(shù)字,而 {7,8}則表示重復(fù)7到8次。當(dāng)然,電話(huà)號(hào)碼還可以寫(xiě)成 (0379)65624150,這里就交給讀者完成。

元字符

在上面的例子中,我們接觸到了一個(gè)元字符\d,正如你所想的,正則表達(dá)式還有很多像\d一樣的元字符,下表列出了一些常用的元字符:

元字符

說(shuō)明

.

匹配除換行符以外的任意字符

\b

匹配單詞的開(kāi)始或結(jié)束

\d

匹配數(shù)字

\s

匹配任意的空白符

\w

匹配字母或數(shù)字或下劃線(xiàn)或漢字

^

匹配字符串的開(kāi)始

$

匹配字符串的結(jié)束

表1、常用的元字符

 轉(zhuǎn)義字符

如果你想查找元字符本身的話(huà),比如你查找.,或者*,就出現(xiàn)了問(wèn)題:你沒(méi)辦法指定它們,因?yàn)樗鼈儠?huì)被解釋成別的意思。這時(shí)你就得使用\來(lái)取消這些字符的特殊意義。因此,你應(yīng)該使用\.和\*。當(dāng)然,要查找\本身,你也得用\\.

例如:unibetter\.com匹配unibetter.com,C:\\Windows匹配C:\Windows。

限定符

限定符又叫重復(fù)描述字符,表示一個(gè)字符要出現(xiàn)的次數(shù)。比如我們?cè)谄ヅ潆娫?huà)號(hào)碼時(shí)使用的{3,4}就表示出現(xiàn)3到4次。常用的限定符有:

限定符

說(shuō)明

*

重復(fù)零次或更多次

+

重復(fù)一次或更多次

?

重復(fù)零次或一次

{n}

重復(fù)n次

{n,}

重復(fù)n次或更多次

{n,m}

重復(fù)n到m次

                                               表2、常用的限定符

二、.NET中正則表達(dá)式的支持

System.Text.RegularExpressions 命名空間包含一些類(lèi),這些類(lèi)提供對(duì) .NET Framework 正則表達(dá)式引擎的訪(fǎng)問(wèn)。該命名空間提供正則表達(dá)式功能,可以從運(yùn)行在 Microsoft .NET Framework 內(nèi)的任何平臺(tái)或語(yǔ)言中使用該功能。

1、在C#中使用正則表達(dá)式

在了解了C#中支持正則表達(dá)式的類(lèi)后,我們一起來(lái)將上面提到的驗(yàn)證電話(huà)號(hào)碼的正則表達(dá)式寫(xiě)入C#代碼中,實(shí)現(xiàn)電話(huà)號(hào)碼的驗(yàn)證。

第一步,建立一個(gè)名為SimpleCheckPhoneNumber的Windows項(xiàng)目。

第二步,引入System.Text.RegularExpressions命名空間。

第三步,寫(xiě)出正則表達(dá)式。這里的正則表達(dá)式就是上面的驗(yàn)證號(hào)碼的字符串。由于上面的字符串只能驗(yàn)證用連字符連接區(qū)號(hào)和號(hào)碼的方式的電話(huà)號(hào)碼,所以我們做了一些修改:0\d{2,3}-\d{7,8}|\(0\d{2,3}\)\d{7,8}。在這個(gè)表達(dá)式中,| 號(hào)面的一部分是我們上面提到過(guò)的,后面一部分是用來(lái)驗(yàn)證(0379)65624150這種電話(huà)號(hào)碼寫(xiě)法的。由于 (  和  ) 也是元字符,所以要用轉(zhuǎn)義字符。| 表示分支匹配,要么匹配前面的一部分,要么匹配后面的一部分。

第四步,正則表達(dá)式構(gòu)造一個(gè)Regex類(lèi)。

第五步,使用Regex類(lèi)的IsMatch方法驗(yàn)證匹配。Regex類(lèi)的IsMatch()方法返回一個(gè)bool值,如果有匹配項(xiàng),返回true,否則返回false。

 三、正則表達(dá)式進(jìn)階

分組

在匹配電話(huà)號(hào)碼的時(shí)候,我們已經(jīng)用到過(guò)重復(fù)單個(gè)字符。下面我們來(lái)了解如何使用分組來(lái)匹配一個(gè)IP地址。

眾所周知,IP地址是四段點(diǎn)分十進(jìn)制的字符串表示的。所以,我們可以通過(guò)地址的分組,來(lái)進(jìn)行匹配。首先,我們來(lái)匹配第一段:2[0-4]\d|25[0-5]|[01]?\d\d? 這段正則表達(dá)式可以匹配IP地址的一段數(shù)字。2[0-4]\d 匹配以2開(kāi)頭,十位為0到4,個(gè)位為任何數(shù)字的三位字段,25[0-5] 匹配以25 開(kāi)頭,個(gè)位為0到5 的三位字段,[01]?\d\d? 匹配任何以1者0頭,個(gè)位和十位為任何數(shù)子的字段。? 表示出現(xiàn)零次或一次。所以, [01] 和 最后一個(gè) \d 都可以不出現(xiàn),如果我們?cè)傧蜻@個(gè)字符串后面添加一個(gè) \. 來(lái)匹配 . 就可以劃分一個(gè)段了。現(xiàn)在,我們把 2[0-4]\d|25[0-5]|[01]?\d\d?\. 當(dāng)做一個(gè)分組,就可以寫(xiě)成 (2[0-4]\d|25[0-5]|[01]?\d\d?\.) 。接下來(lái)我們就來(lái)使用這個(gè)分組。將這個(gè)分組重復(fù)兩次,然后,再使用 2[0-4]\d|25[0-5]|[01]?\d\d? 就可以了。完整的正則表達(dá)式為: (2[0-4]\d|25[0-5]|[01]?\d\d?\.){3}2[0-4]\d|25[0-5]|[01]?\d\d?

 后向引用

在我們了解分組以后,我們就可以使用后向引用了。所謂后向引用,就是使用前面捕獲的結(jié)果,對(duì)后面的字符進(jìn)行匹配。多用于匹配重復(fù)字符。比如匹配 go go 這樣的重復(fù)字符。我們就可以使用 (go) \1來(lái)進(jìn)行匹配。

默認(rèn)情況下,每個(gè)分組會(huì)自動(dòng)擁有一個(gè)組號(hào),規(guī)則是:從左向右,以分組的左括號(hào)為標(biāo)志,第一個(gè)出現(xiàn)的分組的組號(hào)為1,第二個(gè)為2,以此類(lèi)推。當(dāng)然,你也可以自己指定子表達(dá)式的組名。要指定一個(gè)子表達(dá)式的組名,請(qǐng)使用這樣的語(yǔ)法:(?<Word>\w+)(或者把尖括號(hào)換成'也行:(?'Word'\w+)),這樣就把\w+的組名指定為Word了。要反向引用這個(gè)分組捕獲的內(nèi)容,你可以使用\k<Word>,所以上一個(gè)例子也可以寫(xiě)成這樣:\b(?<Word>\w+)\b\s+\k<Word>\b。

自定義組名還有另外一個(gè)好處,在我們的C#程序中,如果需要得到分組的值,我們就可以很明確的使用我們定義的分組的名字來(lái)得到,而不必使用下標(biāo)。

當(dāng)我們并不想使用后向引用時(shí),是不需要捕獲組記憶任何東西的,這種情況下就可以利用(?:nocapture)語(yǔ)法來(lái)主動(dòng)地告訴正則表達(dá)式引擎,不要把圓括號(hào)的內(nèi)容當(dāng)作捕獲組,以便提高效率。

 零寬斷言

在前面的元字符介紹中,我們已經(jīng)知道了有這樣一類(lèi)字符,可以匹配一句話(huà)的開(kāi)始、結(jié)束(^ $)或者匹配一個(gè)單詞的開(kāi)始、結(jié)束(\b)。這些元字符只匹配一個(gè)位置,指定這個(gè)位置滿(mǎn)足一定的條件,而不是匹配某些字符,因此,它們被成為 零寬斷言。所謂零寬,指的是它們不與任何字符相匹配,而匹配一個(gè)位置;所謂斷言,指的是一個(gè)判斷。正則表達(dá)式中只有當(dāng)斷言為真時(shí)才會(huì)繼續(xù)進(jìn)行匹配。

在有些時(shí)候,我們精確的匹配一個(gè)位置,而不僅僅是句子或者單詞,這就需要我們自己寫(xiě)出斷言來(lái)進(jìn)行匹配。下面是斷言的語(yǔ)法:

斷言語(yǔ)法

說(shuō)明

(?=pattern)

前向肯定斷言,匹配pattern前面的位置

(?!pattern)

前向否定斷言,匹配后面不是pattern的位置

(?<=pattern)

后向肯定斷言,匹配pattern后面的位置

(?<!pattern)

后向否定斷言,匹配前面不是pattern的位置

表3、斷言的語(yǔ)法及說(shuō)明

很難理解嗎?我們來(lái)看一個(gè)例子。

有一個(gè)標(biāo)簽:<book>,我們想要得到標(biāo)簽<book>的標(biāo)簽名(book),這個(gè)時(shí)候,我們就可以使用斷言來(lái)處理??聪旅孢@個(gè)表達(dá)式:(?<=\<)(?<tag>\w*)(?=\>) ,使用這個(gè)表達(dá)式,可以匹配< 和 >之間的字符,也就是這里的book。使用斷言還還可以寫(xiě)出更加復(fù)雜的表達(dá)式,這里就不再舉例了。

還有一點(diǎn)非常重要,就是斷言語(yǔ)法所使用的圓括號(hào)并不作為捕獲組,所以不能使用編號(hào)或命名來(lái)對(duì)它進(jìn)行引用。

 貪婪與懶惰

當(dāng)正則表達(dá)式中包含能接受重復(fù)的限定符時(shí),通常的行為是(在使整個(gè)表達(dá)式能得到匹配的前提下)匹配盡可能多的字符。來(lái)看一下這個(gè)表達(dá)式:a\w*b ,用它來(lái)匹配字符串 aabab 時(shí),得到的匹配結(jié)果是 aabab 。這種匹配被稱(chēng)為貪婪匹配。

有些時(shí)候,我們希望讓它盡可能的少重復(fù),即用上面的例子得到的匹配結(jié)果是 aab,這時(shí)我們就要使用懶惰匹配。懶惰匹配需要在重復(fù)限定符的后面添加一個(gè) ? 符號(hào),上面的表達(dá)式就可以寫(xiě)成:a\w*?b 我們?cè)賮?lái)匹配字符串 aabab時(shí),得到的匹配結(jié)果是 aab 和 ab 。

也許這個(gè)時(shí)候你要問(wèn),ab 比aab重復(fù)次數(shù)更少,為什么不先匹配ab呢?其實(shí)在正則表達(dá)式中還有比貪婪/懶惰優(yōu)先級(jí)更高的規(guī)則:最先開(kāi)始的匹配擁有最高的優(yōu)先權(quán)——The match that begins earliest wins。

 注釋

語(yǔ)法:(?#comment)

   例如:2[0-4]\d(?#200-249)|25[0-5](?#250-255)|[01]?\d\d?(?#0-199)

   注意:如果使用注釋?zhuān)瑒t需要格外注意不要在注釋的小括號(hào)前面出現(xiàn)空格、換行符等一些字符,如果可以忽略這些字符,則最好使用“忽略模式里的空白符”選項(xiàng),即C#中RegexOptions枚舉的IgnorePatternWhitespace選項(xiàng)(C#中的RegexOptions枚舉下面將會(huì)提到)。

 C#中的處理選項(xiàng)

在C#中,可以使用RegexOptions 枚舉來(lái)選擇C#對(duì)正則表達(dá)式的處理方式。下面是MSDN中RegexOptions 枚舉的成員介紹:

 C#中Capture類(lèi)、Group類(lèi)、Match類(lèi)

Capture類(lèi):表示單個(gè)子表達(dá)式捕獲中的結(jié)果。Capture類(lèi)表示單個(gè)成功捕獲中的一個(gè)子字符串。該類(lèi)沒(méi)有公共構(gòu)造函數(shù),可以從Group類(lèi)或者M(jìn)atch類(lèi)中得到一個(gè)Capture類(lèi)的對(duì)象集合。Capture類(lèi)有三個(gè)常用屬性,分別是Index、Length和Value。Index表示捕獲的子字符串的第一個(gè)字符的位置。Length表示捕獲的子字符串的長(zhǎng)度,Value表示捕獲的子字符串。

Group類(lèi):表示正則表達(dá)式中分組的信息。該類(lèi)提供了對(duì)分組匹配的正則表達(dá)式的支持。該類(lèi)沒(méi)有公共構(gòu)造函數(shù)??梢詮腗atch類(lèi)中得到一個(gè)Group類(lèi)的集合。如果正則表達(dá)式中的分組已命名,則可以使用名字對(duì)其進(jìn)行訪(fǎng)問(wèn),如果沒(méi)有命名,則可以采用下標(biāo)訪(fǎng)問(wèn)。注意:每一個(gè)Match的Groups集合中的第0個(gè)元素(Groups[0])都是這個(gè)Match捕獲的字符串,也是Capture的Value。

Match類(lèi):表示單個(gè)正則表達(dá)式匹配的結(jié)果。該類(lèi)同樣沒(méi)有公共構(gòu)造函數(shù),可以從Regex類(lèi)的Match()方法得到該類(lèi)的一個(gè)實(shí)例,也可以使用Regex類(lèi)的Matches()方法得到給類(lèi)的一個(gè)集合。

這三個(gè)類(lèi)都能表示單個(gè)正則表達(dá)式匹配的結(jié)果,但Match類(lèi)得到的更為詳細(xì),包含捕獲和分組信息。所以,Match類(lèi)在這個(gè)三個(gè)類(lèi)中是最常用的。

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持我們。

上一篇:詳解C#批量插入數(shù)據(jù)到Sqlserver中的四種方式

欄    目:C#教程

下一篇:詳解C# Socket異步通信實(shí)例

本文標(biāo)題:淺談C#中正則表達(dá)式的使用

本文地址:http://mengdiqiu.com.cn/a1/C_jiaocheng/6099.html

網(wǎng)頁(yè)制作CMS教程網(wǎng)絡(luò)編程軟件編程腳本語(yǔ)言數(shù)據(jù)庫(kù)服務(wù)器

如果侵犯了您的權(quán)利,請(qǐng)與我們聯(lián)系,我們將在24小時(shí)內(nèi)進(jìn)行處理、任何非本站因素導(dǎo)致的法律后果,本站均不負(fù)任何責(zé)任。

聯(lián)系QQ:835971066 | 郵箱:835971066#qq.com(#換成@)

Copyright © 2002-2020 腳本教程網(wǎng) 版權(quán)所有