言情小说君子以泽,我吃西红柿,女强穿越玄幻完结小说

淺談?wù)齽t速記法的技巧

給你一篇文章，如何挑選出你想要的字符串呢？你可以從左到右從上到下，一個(gè)一個(gè)字符讀取出來(lái)，寫一大堆if做判斷。這樣太麻煩了，正則就是將以上過(guò)程抽象出來(lái)，用一些特定符號(hào)就能表示出大部分規(guī)則

對(duì)大部分人來(lái)說(shuō)，正則主要是難記，其實(shí)只要對(duì)正則符號(hào)分類記憶，就會(huì)發(fā)現(xiàn)核心概念其實(shí)特別簡(jiǎn)單

注：本文會(huì)假設(shè)你至少看過(guò)一遍正則的文檔，如果沒(méi)看過(guò)，可以看mdn（有中文翻譯），如果覺(jué)得mdn排版亂，推薦去https://devdocs.io/javascript/global_objects/regexp學(xué)習(xí)。本文所使用語(yǔ)言為javascript

元字符

/a/中的a就是一個(gè)元字符，一個(gè)元字符匹配一個(gè)實(shí)體字符，這里的“a”沒(méi)有特殊含義，就匹配一個(gè)英文a

像/\d/就匹配0到9的所有數(shù)字，如果兩個(gè)連寫/\d\d/就可以匹配10到99的所有數(shù)字

/./可以匹配任何字符

集合

假如有一串字符串'0123456789'，我只想匹配其中的'3','6','9'，這時(shí)可以放在集合中/[369]/

執(zhí)行后會(huì)發(fā)現(xiàn)只有3被匹配到，是因?yàn)榧现胁还軐懚嗌贃|西都代表一個(gè)元字符，集合也是一種元字符
你可能見過(guò)這樣都集合/[0-9a-zA-Z_]/它代表匹配所有數(shù)字，字母和下劃線，它與元字符/\w/的效果是一樣的，集合更靈活\w更方便

排除型集合

/[^0-9]/除了數(shù)字都匹配（我喜歡叫它否定集合）

或（多選）

假設(shè)我有一大堆書單，我希望從中匹配出naroto和one piece，那么可以這樣寫/naroto|one pice/ 豎線代表或，a或b，你也可以寫多個(gè)a|b|c|d，你當(dāng)然可以寫出0|1|2...|9來(lái)匹配所有數(shù)字。但要注意和集合的區(qū)別，集合是一個(gè)元字符，不能匹配單詞，|兩邊可以是多個(gè)元字符

分組

我現(xiàn)在有一堆文件，我希望匹配出后綴是.css和.less的文件，你可以很自然的寫出/.css|.less/這樣的代碼。其實(shí)還有一個(gè)簡(jiǎn)便寫法/.(c|le)ss/，分組可以將若干個(gè)元字符放在同一個(gè)作用域中做處理，通過(guò)分組我們可以寫出更簡(jiǎn)練的代碼

分組還有一個(gè)特殊的用法，思考如何匹配'asd_asd_asd_asd_asd'這種字符串?

答案是/(asd)(_\1)+/，\1是個(gè)非常特殊的元字符，代表重復(fù)使用第一個(gè)分組的匹配結(jié)果，\2就代表第二個(gè)，以此類推，+加號(hào)表示重復(fù)一到多次（這個(gè)后面會(huì)講），需要注意的是計(jì)數(shù)從1開始，\0代表另外的意思（請(qǐng)看文檔）

量詞

一長(zhǎng)串字符中我只想匹配連續(xù)的數(shù)字，但/\d/只會(huì)匹配一個(gè)，這時(shí)候可以使用量詞/\d{n,}/，n寫幾就是幾到多，比如{1,}就是1到多。{n}這種寫法表示n個(gè)相連，匹配2333可以寫成/23{3}/

還有幾個(gè)簡(jiǎn)寫的量詞

+代表1到多，等于{1,}
*代表0到多，等于{0,}
?代表0或1個(gè)，等于{0,1}

貪婪模式和非貪婪模式

量詞有個(gè)尷尬的地方，比如用/.*a/去匹配 '123a123a'，本來(lái)希望得到'123a'，實(shí)際卻得到'123a123a'。這是因?yàn)槿魏巫址紳M足/./加上量詞會(huì)導(dǎo)致從頭匹配到尾，但因?yàn)槲覀冞€有其他元字符，所以這時(shí)正則引擎會(huì)回溯，將已經(jīng)匹配的結(jié)果從后往前一個(gè)個(gè)拿出來(lái)，與剩下的元字符相匹配。
這種模式叫貪婪模式，它可能會(huì)產(chǎn)生預(yù)期之外的結(jié)果和不必要的性能浪費(fèi)

解決方案是使用非貪婪模式，在量詞后面加?問(wèn)號(hào)可以得到最小結(jié)果，現(xiàn)在使用/.*?a/去匹配就可以得到'123a'了。任何量詞后都可以使用非貪婪模式

環(huán)視

x(?=y)這個(gè)功能有很多種翻譯，比如零寬斷言，我個(gè)人感覺(jué)比較準(zhǔn)確的是“正向肯定環(huán)視”
x(?!y)正向否定環(huán)視

x代表元字符，y也代表元字符，x(?=y)的意思是緊接著y的x，比如 '-1a--2b-'，使用/\d(?=a)/去匹配，會(huì)得到1;/\d(?!a)/去匹配，會(huì)得到2。

這功能怎么用？舉個(gè)例子，有一段字符串'a(123)b'，我只想要括號(hào)內(nèi)的內(nèi)容，但不想要括號(hào)
我需要匹配到右括號(hào)左邊的位置，那么我可以寫成/(?=\))/(注意括號(hào)需要轉(zhuǎn)義)，我不想要左括號(hào)/[^(]/，我不關(guān)心括號(hào)內(nèi)的內(nèi)容/.*/，這時(shí)組合三個(gè)正則就變成了/[^(].*(?=\))/

實(shí)際上這個(gè)功能匹配的是位置，從匹配到的位置開始找元字符，所以你如果在環(huán)視后面加量詞是沒(méi)用的

其他

^和$也是匹配位置的元字符，分別是匹配開頭和結(jié)尾，比如我們想匹配文件結(jié)尾是.js的文件可以寫成/.js$/。匹配http開頭的鏈接可以寫成/^http:\/\//

還有一些特殊的\u[\b]\0等，需要你自己看文檔

標(biāo)識(shí)符

g：一個(gè)正則只會(huì)匹配一次，如果加上g標(biāo)識(shí)符就會(huì)全局匹配， /\d/g，這個(gè)正則是不管兩個(gè)數(shù)字之間隔了什么，都會(huì)將所有數(shù)字匹配出來(lái)

i：不區(qū)分大小寫/^http:\/\//i就會(huì)匹配http://和HTTP://

核心概念就這么多，其他內(nèi)容請(qǐng)?jiān)敿?xì)查看文檔

你以為這就結(jié)束了？其實(shí)還有后續(xù)噠！

我要繼續(xù)說(shuō)環(huán)視

還有個(gè)神奇的逆向環(huán)視沒(méi)有講x(?=y) ，因?yàn)檫@是18年才進(jìn)正式標(biāo)準(zhǔn)的功能，雖然它可能比js年齡大，但js就是不支持你怕不怕！

前面那個(gè)/[^(].*(?=\))/可以改成/(?=y).*(?=\))/

正則最大但坑就是，讓新手產(chǎn)生正則無(wú)所不能的想法，一個(gè)復(fù)雜字符串處理總以為可以通過(guò)一個(gè)神奇的正則來(lái)搞定。

正則不是萬(wàn)能的！

還是之前的例子，給字符串'a(1\(2(3)'讓你取括號(hào)內(nèi)的內(nèi)容請(qǐng)問(wèn)你怎么?。渴紫葢?yīng)該弄清需求，如果正則過(guò)于難寫，可以用js的字符串處理函數(shù)輔助正則，分部操作。另外正則的性能并不高，不是說(shuō)很復(fù)雜的操作寫成一行正則性能就比其他方式快了，沒(méi)有測(cè)試就沒(méi)有發(fā)言權(quán)

正則理論上是有極限的，舉個(gè)例子，有字符串1xxxyyyy2讓你取{n}個(gè)x和{m}個(gè)y，n和m是不確定個(gè)數(shù)，寫成x{1,}y{1,}是沒(méi)問(wèn)題的，但如果要求是x{n}y{n}就不行了，比如一個(gè)字符串有3個(gè)x，你就要取3個(gè)y，有4個(gè)x，你就要取4個(gè)y，單靠正則就無(wú)法完成了。

正則難，難在門檻高，門檻高在難記，之所以難記，其實(shí)還是因?yàn)榉慈祟惖姆?hào)讓你下意識(shí)的排斥它。熟悉正則，正式正則，學(xué)會(huì)正則，會(huì)給你帶來(lái)超乎想象的便利！

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

通俗解釋JavaScript正則表達(dá)式快速記憶

標(biāo)簽：哈密大興安嶺常州湖州涼山本溪泰安

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《淺談?wù)齽t速記法的技巧》，本文關(guān)鍵詞淺談,正則,速記法,的,技巧,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。