濮阳杆衣贸易有限公司

主頁(yè) > 知識(shí)庫(kù) > js 正則學(xué)習(xí)小記之匹配字符串字面量?jī)?yōu)化篇

js 正則學(xué)習(xí)小記之匹配字符串字面量?jī)?yōu)化篇

熱門(mén)標(biāo)簽:怎么在高德地圖標(biāo)注行走軌跡 施工地圖標(biāo)注怎么做 深圳400電話(huà)辦理那家好 襄陽(yáng)房產(chǎn)電銷(xiāo)機(jī)器人招商 百度地圖標(biāo)注飯店位置怎么 個(gè)性化地圖標(biāo)注在線(xiàn) 安徽移動(dòng)外呼系統(tǒng) 百度地圖標(biāo)注名編輯 清遠(yuǎn)陽(yáng)山400電話(huà)號(hào)碼如何申請(qǐng)

昨天在《js 正則學(xué)習(xí)小記之匹配字符串字面量》談到 /"(?:\\.|[^"])*"/ 是個(gè)不錯(cuò)的表達(dá)式,因?yàn)榭梢詽M(mǎn)足我們的要求,所以這個(gè)表達(dá)式可用,但不一定是最好的。
從性能上來(lái)說(shuō),他非常糟糕,為什么這么說(shuō)呢,因?yàn)?傳統(tǒng)型NFA引擎 遇到分支是從左往右匹配的,
所以它會(huì)用 \\. 去匹配每一個(gè)字符,發(fā)現(xiàn)不對(duì)后才用 [^"] 去匹配。
比如這樣一個(gè)字符串: "123456\'78"90"
16 個(gè)字符,除了第一個(gè) " 直接匹配成功,還剩余 15 個(gè),只有 2 個(gè)轉(zhuǎn)義(4 個(gè)字符),所以 \. 會(huì)失敗 10 次,只有 2 次成功。
10 次匹配失敗,需要回溯后用 [^"] 才能匹配成功,當(dāng)然最后一個(gè) " 會(huì)直接匹配成功。

很明顯,正常的字符串不可能全是轉(zhuǎn)義,正常的字符串才是主流,當(dāng)然不排除有人故意全轉(zhuǎn)義的情況。
所以這個(gè)正則需要10次回溯后才能匹配完成,如果字符串增長(zhǎng)到 1K 1M 腫么破呢?
所以我們要修改下這個(gè)正則,前后換下位置么?
難道是 /"(?:[^"]|\.)*"/ ? 呵呵,好像不太對(duì),這樣的話(huà)轉(zhuǎn)義就不能被匹配了。

所以還要修改下 /"(?:[^"\\]|\.)*"/ 這樣就OK了,遇到 \ 轉(zhuǎn)義就會(huì)用 \\. 去嘗試匹配。

可是還是有問(wèn)題,因?yàn)槲覀冊(cè)?[^"\\] 過(guò)濾掉了 n 所以沒(méi)法匹配多行字符的情況。

js 中 字符串用 折行是允許的,但是修改后的 正則 沒(méi)法匹配這樣的字符串了,所以我們還得繼續(xù)修復(fù)。

因?yàn)?. 沒(méi)法匹配換行,所以我們要用其他方式表達(dá)。
. 是用于匹配除換行符之外的所有字符,難道我們要 [.\n] 來(lái)表示么?
這樣是不對(duì)的,因?yàn)?[] 字符集中的 . 不再表示除換行符之外的所有字符,而是字符 . 也就是他本身一個(gè)字符而已。
那怎么辦呢?
其實(shí)換個(gè)思路,
d 表示 0-9
D 表示 [^0-9]
那么 [\d\D] 就表示所有了,不是么。(新人朋友不知道能不能消化這個(gè)知識(shí)點(diǎn)。)
同理 [\s\S] [\w\W] 同樣可以。
所以 /"(?:[^"\\]|\[\d\D])*"/ 這樣就滿(mǎn)足我們的要求了。

效果不錯(cuò)。
回頭過(guò)來(lái)分分析下他現(xiàn)在的性能吧。
還是這個(gè)字符串: "123456'78\"90" , 正則 /"(?:[^"\\]|\\[\d\D])*"/

16 個(gè)字符,除了第一個(gè) " 直接匹配成功,還剩余 15 個(gè),有 2 個(gè)轉(zhuǎn)義(4 個(gè)字符),[^"\\] 能匹配成功 10 個(gè)字符,只有 2 次失敗。
為什么不是 4 次失敗呢,明明有4個(gè)字符啊。\\ 雖然是2個(gè)字符,但是讀到第一個(gè) \ 就匹配失敗,然后用 \\[\d\D] 匹配成功,
占用掉了兩個(gè)字符 \\ 下次用下一個(gè)o開(kāi)始匹配,所以只有2次回溯。

只有 2 次需要回溯,然后用 \\[\d\D] 匹配成功。當(dāng)然最后一個(gè) " 還是會(huì)直接匹配成功。
所以從 10 次回溯,減少到了 2 次,雖然正則比昨天臃腫了很多,但至少性能提升了不止一個(gè)等級(jí)。

OK,今天的分享完畢,明天見(jiàn)。

您可能感興趣的文章:
  • js 正則表達(dá)式學(xué)習(xí)筆記之匹配字符串
  • 正則匹配密碼只能是數(shù)字和字母組合字符串功能【php與js實(shí)現(xiàn)】
  • String字符串匹配javascript 正則表達(dá)式
  • js正則學(xué)習(xí)小記之匹配字符串字面量
  • JavaScript正則表達(dá)式匹配字符串字面量
  • 一個(gè)關(guān)于JS正則匹配的踩坑記錄

標(biāo)簽:延邊 中衛(wèi) 黑河 阜陽(yáng) 臨夏 駐馬店 南昌 欽州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《js 正則學(xué)習(xí)小記之匹配字符串字面量?jī)?yōu)化篇》,本文關(guān)鍵詞  正則,學(xué)習(xí),小記,之,匹配,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《js 正則學(xué)習(xí)小記之匹配字符串字面量?jī)?yōu)化篇》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于js 正則學(xué)習(xí)小記之匹配字符串字面量?jī)?yōu)化篇的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    新丰县| 保康县| 卓尼县| 黑龙江省| 红原县| 浏阳市| 潜山县| 石楼县| 玛纳斯县| 隆化县| 红原县| 溧水县| 多伦县| 汝南县| 吴桥县| 乌苏市| 鄂托克旗| 龙州县| 岗巴县| 札达县| 吴桥县| 上高县| 红安县| 赫章县| 泽普县| 翁牛特旗| 梨树县| 沁水县| 徐水县| 鄯善县| 肥西县| 福建省| 都昌县| 襄汾县| 新蔡县| 黔东| 贵溪市| 古交市| 阜宁县| 德安县| 全南县|