遮天辰东小说笔趣阁,盗墓笔记小说全集

主頁 > 知識庫 > shell模糊匹配與正則詳解

shell模糊匹配與正則詳解

前言：

正則可以實現(xiàn)一些簡單的功能，并用在腳本中，如檢測ip地址是否符合規(guī)范，檢測文件名是否符合規(guī)范等等。

正則表達式

正則表達式主要是用來描述一個句法規(guī)則的模式。其實說的通俗一點，就是利用字符和元字符的組合，對一些符合既定句法的模式進行模糊匹配。它的主要功能是文本查詢和字符串操作。

正則表達式的基本元素包括普通字符和元字符，在Linux shell里面，常用的正則表達式元字符集為：S={* . ^ $ [] \&; \\> \{\} \{n,\} \{n,m\} },每一個元字符都有自己在正則表達式中的含義，下面來介紹一下：

“ * ”符號：表示匹配前面一個普通字符0次或多次。注意這里是一個普通字符，即如果是JO*B的話，那么*就匹配字符“O”任意次，而不是匹配“JO”串。

“ . ”符號：表示匹配任意一個字符。字符“ . "就表示一個字符，這個字符可以是任意字符。例如字符串 ...73 就表示前面3個字符為任意字符(包括空格)，第4個和第5個字符分別是7和3。

“ ^ ”符號：表示匹配行首。例如：^cloud就表示匹配以cloud字符串開頭的所有行。與上面匹配一個字符不一樣，這里匹配的是后面跟著的整個字符串。

” $ "符號：表示匹配行尾。例如：cloud$ 就表示匹配以cloud字符串結(jié)尾的所有行。結(jié)合上面的匹配行首，^$表示匹配空行。

“ [] "符號：表示匹配方括號里面的字符集中的一個。例如：數(shù)字0-9中的任意一個數(shù)字都滿足[0-9]這個表達式。值得注意的是，當^放在[]里面的時候，^就不再表示行首，而是表示取反。如：[^7-9]則表示非7-9中的任意一個數(shù)字才滿足這個表達式。

” \ “符號：是轉(zhuǎn)義字符。如果你寫的正則表達式里面包括元字符，而你又想將它當做普通字符用的話，就要在前面加上轉(zhuǎn)義符號" \ "了。例如：\$就表示一個普通字符”$"。

“\\>"符號：表示精確匹配>內(nèi)的字符，” \ “是用來轉(zhuǎn)義>這兩個字符的。例如：\the\&;表示匹配包含”the“的行，由于精確匹配，所以，”them“，”theory“這些單詞所在的行并不會被匹配到。

”\{\}"符號：與" * "類似，表示匹配前面的一個字符任意多次。但是“\{\}”可以指定重復(fù)的次數(shù)，如\{3\}則表示重復(fù)前面的字符3次；\{3,\}表示重復(fù)前面的字符至少3次；\{3,5\}表示重復(fù)3到5次。例如：JO\{3\}B則表示重復(fù)字符O三次，即JOOOB；JO\{3,\}B則表示至少重復(fù)O三次，即JOOOB，JOOOOB等都符合；\{3,5\}則匹配JOOOB，JOOOOB，JOOOOOB這幾個字符串。

通配符

初學的時候?qū)τ谡齽t表達式和通配符的理解很模糊，兩個都是可以進行模糊匹配的，到底什么時候用才是正則表達式，什么時候用是通配符呢？其實，我們登錄系統(tǒng)之后，系統(tǒng)的bash shell并不支持正則表達式的，也就是說，我們?nèi)绻褂胋ash shell的某些命令時使用正則表達式，shell可能會認不出來，只有當我們使用類似grep，sed，awk等工具的時候才有效。所以，我們在使用bash shell的時候也想達到模糊匹配的目的的話，就要使用通配符了。

通配符是使用正則表達式的一些元字符來的，常用的元字符集：E={? * [] {} ^ }。不過，這個通配符的元字符意義跟正則表達式里面的不太一樣。例如：

“ * "字符不再表示匹配前面一個字符任意多次，而是表示任意位置的任意字符。例如：phi*ip，則可以匹配philip，phillip，philsaip等開始三個是phi和結(jié)尾兩位是ip的任意字符。例如ls -l *.awk表示匹配以.awk結(jié)尾的所有文件，*表示任意長度任意字符組合。

" ? ”字符才表示任意一個字符。同正則表達式元字符的" . "

" {} “字符不需要轉(zhuǎn)義。在{}表示的是表達式集合。如：ls -l {[a-h]*.awk,0?.pem}則表示列出所有以a-h字符開頭的.awk文件的和以0開頭，后面接一個任意字符的.pem文件

" ^ "字符也不是表示行首，而是代表取反。

正則表達式和通配的應(yīng)用環(huán)境上有些不一樣，但是都能夠達到模糊匹配的效果。在后面介紹到的使用grep，sed和awk等工具對于文件的查找以及各種操作中，正則表達式的匹配作用更加明顯。

范例：

檢測文件名是否符合規(guī)范：

#!/bin/bash

RED='\033[31m'
GREEN='\033[32m'

awk '{printf("%s",$0)}' $1 | egrep "^#[[:digit:]]*-(docs|unittest|pseudocode|msg-[^ ].*)$" > /dev/null 2>1

if [ $? -ne 0 ];then
 echo -e "message check ${RED}fail${NORMAL}"
 exit 1
fi
 echo -e "message check ${GREEN}success${NORMAL}"
exit 0

當然，也可以使用if，如：

if [[ $1 =~ ^[0-9]+$ ]]; then
  echo "Is Number."
else
  echo "No Number."
fi

檢測ip地址是否符合規(guī)范：

構(gòu)造測試文件 ip.txt

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
999.0.0.1
1.0.0.500
a.0.0.0
0.b.0.0
1.1.1
2.2
1
0.0.0.0

基本思路就是要每個點之間的元素為整數(shù)，最多為3位整數(shù)[0-9]\{1,3\}，然后用 . 拼接起來，加上^和$更精確的限制匹配對象

cat ip.txt |grep '^[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}$'

結(jié)果為

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255
999.0.0.1
1.0.0.500
0.0.0.0

這里精度不夠，需要嚴格限制整數(shù)為1-255（第一個元素不能為0，后面的可以為0），即0-9 10-99 100-199 200-249 250-255

$[1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]$ 注意|和()轉(zhuǎn)義，另外|分割的元素要用（）括住,若帶-E參數(shù)指定為擴展正則的形式則不需用\轉(zhuǎn)義

然后后面3個元素只要稍改下范圍到0-255，簡單的拼接起來

復(fù)制代碼代碼如下:

cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\.\([0-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)$'

結(jié)果如下

10.1.1.1
192.168.0.1
192.168.0.101
255.255.255.255

當然更簡潔的寫法,記得.后面的元要()括起來

復(fù)制代碼代碼如下:

cat ip.txt |grep '^\([1-9]\|[1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\(\.\([0-9]\|([1-9][0-9]\|1[0-9][0-9]\|2[0-4][0-9]\|25[0-5]\)\)\{3\}$'

到此這篇關(guān)于shell模糊匹配與正則詳解的文章就介紹到這了,更多相關(guān)shell模糊匹配與正則內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

shell通過正則匹配ip地址實例代碼
Shell腳本中通過正則表達式匹配IP地址
shell腳本正則匹配文件中的Email并寫入到文件中代碼分享

標簽：黔南河北河池隴南常州淮南黔南通遼

巨人網(wǎng)絡(luò)通訊聲明：本文標題《shell模糊匹配與正則詳解》，本文關(guān)鍵詞 shell,模糊,匹配,與,正則,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。