shell高級學習之正則表達式
正則表達式概述
正則表達式是一種定義的規(guī)則,Linux工具可以用它來過濾文本。
基礎正則表達式
純文本
[root@node1 ~]# echo "this is a cat" | sed -n '/cat/p' this is a cat [root@node1 ~]# echo "this is a cat" | gawk '/cat/{print $0}' this is a cat
正則表達式的匹配非常挑剔,尤其需要記住,正則表達式區(qū)分大小寫。
特殊字符
正則表達式識別的特殊字符包括:
.*[]^${}\+?|()
如果要使用某個特殊字符作為文本字符,就必須轉(zhuǎn)義,一般用(\)來轉(zhuǎn)義。
[root@node1 ~]# echo "this is a $" | sed -n '/\$/p' this is a $
錨字符
有兩個特殊字符可以用來將模式鎖定在數(shù)據(jù)流的行首或行尾
脫字符(^)定義從數(shù)據(jù)流中文本行的行首開始的模式。
美元符($)定義了行尾錨點。
[root@node1 ~]# echo "this is a cat" | sed -n '/^this/p' this is a cat [root@node1 ~]# echo "this is a cat" | sed -n '/cat$/p' this is a cat
在一些情況下可以組合使用這兩個命令
1.比如查找只含有特定文本的行
[root@node1 ljy]# more test.txt this is a dog what how this is a cat is a dog [root@node1 ljy]# sed -n '/^is a dog$/p' test.txt is a dog [root@node
2.兩個錨點組合起來,可以直接過濾空白行
[root@node1 ljy]# more test.txt this is a dog what how this is a cat is a dog [root@node1 ljy]# sed '/^$/d' test.txt this is a dog what how this is a cat is a dog
點號字符
點號用來匹配除換行符外的任意單個字符,他必須匹配一個字符。
[root@node1 ljy]# more test.txt this is a dog what how this is a cat is a dog at [root@node1 ljy]# sed -n '/.at/p' test.txt what this is a cat
字符組
限定待匹配的具體字符,使用字符組。使用方括號來定義一個字符組。
[root@node1 ljy]# more test.txt this is a dog this is a Dog this is a DoG this is a cat [root@node1 ljy]# sed -n '/[dD]og/p' test.txt this is a dog this is a Dog [root@node1 ljy]# sed -n '/[dD]o[gG]/p' test.txt this is a dog this is a Dog this is a DoG
排除型字符組
要排除某些特定的元素,要在字符組前面加個脫字符。
[root@node1 ljy]# sed -n '/[dD]o[gG]/p' test.txt this is a dog this is a Dog this is a DoG [root@node1 ljy]# sed -n '/[^D]og/p' test.txt this is a dog
區(qū)間
正則表達式會包括此區(qū)間內(nèi)的任意字符。
[root@node1 ljy]# more test.txt 123123 1231 121222222 412345341613 vsdvs qwer12344123 12345 34211 444444 [root@node1 ljy]# sed -n '/^[0-9][0-9][0-9][0-9][0-9]$/p' test.txt 12345 34211
拓展正則表達式
問號
問號表明前面的字符出現(xiàn)0次或者1次,僅限于此。
[root@node1 ljy]# echo "bat" | gawk '/ba?t/{print $0}' bat [root@node1 ljy]# echo "baat" | gawk '/ba?t/{print $0}' [root@node1 ljy]# echo "bt" | gawk '/ba?t/{print $0}' bt
可以將問號和字符組一起使用
[root@node1 ljy]# echo "bt" | gawk '/b[ae]?t/{print $0}' bt [root@node1 ljy]# echo "bat" | gawk '/b[ae]?t/{print $0}' bat [root@node1 ljy]# echo "bet" | gawk '/b[ae]?t/{print $0}' bet [root@node1 ljy]# echo "baat" | gawk '/b[ae]?t/{print $0}'
加號
加號表明前面的字符可以出現(xiàn)一次或多次,但至少是1次。
[root@node1 ljy]# echo "baat" | gawk '/b[ae]+t/{print $0}' baat [root@node1 ljy]# echo "bt" | gawk '/b[ae]+t/{print $0}' [root@node1 ljy]# echo "bt" | gawk '/ba+t/{print $0}' [root@node1 ljy]# echo "bat" | gawk '/ba+t/{print $0}' bat [root@node1 ljy]# echo "baat" | gawk '/ba+t/{print $0}' baat
花括號
ERE中的花括號允許你為可重復的正則表達式規(guī)定上下限。
m,n最少出現(xiàn)m此,最多出現(xiàn)n次。
[root@node1 ljy]# echo "baat" | gawk '/b[ae]{1,2}t/{print $0}' baat [root@node1 ljy]# echo "baaat" | gawk '/b[ae]{1,2}t/{print $0}'
管道符號
用邏輯or的方式指定正則表達式規(guī)則,其中一個條件符合要就即可。
表達式分組
正則表達式分組也可以用圓括號進行分組。
[root@node1 ljy]# echo "bat" | gawk '/b(a|e)t/{print $0}' bat [root@node1 ljy]# echo "baat" | gawk '/b(a|e)t/{print $0}' [root@node1 ljy]# echo "bet" | gawk '/b(a|e)t/{print $0}' bet
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對我們的支持。
欄 目:正則表達式
下一篇:Python面向?qū)ο罂偨Y(jié)及類與正則表達式詳解
本文標題:shell高級學習之正則表達式
本文地址:http://mengdiqiu.com.cn/a1/zhengzebiaodashi/11168.html
您可能感興趣的文章


閱讀排行
本欄相關(guān)
- 01-11正則表達式實現(xiàn)添加、刪除、替換三
- 01-11正則表達式之匹配數(shù)字范圍
- 01-11python 用正則表達式篩選文本信息的實
- 01-11正則表達式匹配路由的實現(xiàn)代碼
- 01-11python爬蟲正則表達式之處理換行符
- 01-11js正則表達式 匹配兩個特定字符間的
- 01-11正則表達式截取身份證號碼加密的方
- 01-11python正則表達式之對號入座篇
- 01-11MySQL使用正則表達式進行查詢操作經(jīng)典
- 01-11詳解正則表達式實現(xiàn)二代身份證號碼
隨機閱讀
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 01-11ajax實現(xiàn)頁面的局部加載
- 08-05織夢dedecms什么時候用欄目交叉功能?
- 01-10SublimeText編譯C開發(fā)環(huán)境設置
- 01-10C#中split用法實例總結(jié)
- 01-10delphi制作wav文件的方法
- 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
- 04-02jquery與jsp,用jquery