濮阳杆衣贸易有限公司

主頁 > 知識庫 > 正則表達式常見的4種匹配模式小結(jié)

正則表達式常見的4種匹配模式小結(jié)

熱門標簽:怎么在高德地圖標注行走軌跡 百度地圖標注飯店位置怎么 深圳400電話辦理那家好 襄陽房產(chǎn)電銷機器人招商 清遠陽山400電話號碼如何申請 百度地圖標注名編輯 個性化地圖標注在線 施工地圖標注怎么做 安徽移動外呼系統(tǒng)

0.寫在前面

今天一起來學(xué)習(xí)下正則中的匹配模式,所謂的匹配模式,就是指正則中的一些 改變元字符匹配行為 的方式,比如匹配時不區(qū)分英文字母的大小寫。

還記得我們在第二篇文章中學(xué)過的貪婪模式、非貪婪模式和獨占模式嗎,這些模式會改變正則中量詞的匹配行為,今天來看一些和量詞無關(guān)的匹配模式,一共有4種,分別是不區(qū)分大小寫模式、點號通配模式、多行匹配模式、注釋模式。

1.不區(qū)分大小寫模式

顧名思義,不區(qū)分大小寫模式就是我想要匹配目標字符串中的Cat,我不關(guān)心是大貓CAT,還是小貓cat,只要給我匹配上就可以了。

模式修飾符是通過 (?模式標識) 的方式來表示的,我們只需要把模式修飾符放在對應(yīng)的正則前面,就可以使用指定的模式了,

不區(qū)分大小寫的英文是 Case-Insensitive,模式標識用首字母的小寫來表示就是 (?i),上面提到的栗子正則可以這么寫 (?i)cat,看下:

上一篇文章中,我們學(xué)習(xí)了分組與引用,如果匹配兩個貓就是 (?i)(cat) \1

對應(yīng)的 Python 代碼如下:

import re

result = re.findall(r"(?i)(cat) (\1)", "cat cat CAT Cat")
print(result)

輸出:[('cat', 'cat'), ('CAT', 'Cat')]

可以看到,前后兩個cat大小寫不一致,也可以匹配上,如果我們想要匹配前后大小寫一致的貓該怎么辦呢,可以在外面加上一層括號 ((?i)cat) \1,看下:

測試鏈接:https://regex101.com/r/tPXuGX/1

注意:在 Python 語言中,使用 re 庫調(diào)用上面的正則會報下面的異常,換成 regex 庫就可以,但是不能準確的匹配兩個大小寫一致的 cat。

DeprecationWarning: Flags not at the start of the expression

import regex

result = regex.findall(r"((?i)cat) (\1)", "cat cat CAT Cat")
print(result)

輸出:[('cat', 'cat'), ('CAT', 'Cat')]

2.點號通配模式

在第一篇文章中,我們學(xué)習(xí)了元字符的相關(guān)知識,還記的英文的點 . 代表什么含義嗎,它可以匹配任意字符,但是不能匹配換行。當我們需要匹配真正的任意字符時,可以使用 [\s\S] 或 [\d\D] 或 [\w\W] 等來表示。

但是這樣寫不夠優(yōu)雅,所以正則提供了一種模式,讓英文的 . 能夠匹配上換行在內(nèi)的所有字符,這種模式就叫做點號通配模式。

點號通配模式,在很多地方被稱為單行模式,英文表示為 Single Line,取其首字母,所以單行模式對應(yīng)的修飾符是 (?s),舉個栗子:

3.多行匹配模式

在正則中 ^ 用于匹配整個目標字符串的開頭,$ 用戶匹配整個目標字符串的結(jié)尾:

如果我們想要讓表達式匹配上每行的開頭和結(jié)尾呢,多行匹配模式就上場了,多行的英文是 Multiline,所以多行模式對應(yīng)的修飾符是 (?m),看下效果:

4.注釋模式

當我們寫了一大長串的表達式之后,當時可能只有你和上帝知道它什么意思,過了半年,就只有上帝知道它什么意思了。

注釋的英文是 Comment,所以注釋模式對應(yīng)的修飾符是 (?#comment),注意沒有用首字母,還多了一個 # 號,拿我們之前寫的 IPv4 地址匹配正則舉個例:

復(fù)制代碼 代碼如下:

^(?:[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])(?#comment IP地址第一個值)(?:\.(?:0|[1-9][0-9]?|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}(?#comment IP地址后三個值)$

在很多編程語言中也提供了 x 模式來書寫正則,也可以起到注釋的作用,以 Python 為例:

import re

regex = r'''(?mx)  # 使用多行模式和x模式
^          # 開頭
(\d{4})    # 年
(\d{2})    # 月
$          # 結(jié)尾
'''

result = re.findall(regex, '202006\n202106')
print(result)

輸出:[('2020', '06'), ('2021', '06')]

在 x 模式下,所有的換行和空格都會被忽略,如果要匹配的話,可以把換行和空格轉(zhuǎn)義,或者放在字符組中:

import re

regex = r'''(?mx)  # 使用多行模式和x模式
^          # 開頭
(\d{4})    # 年
[ ]        # 空格
(\d{2})    # 月
$          # 結(jié)尾
'''

result = re.findall(regex, '2020 06\n2021 06')
print(result)

輸出:[('2020', '06'), ('2021', '06')]

5.寫在最后

最后在總結(jié)下上面講到的內(nèi)容:

正則表達式在線校驗工具:https://regex101.com/

到此這篇關(guān)于正則表達式常見的4種匹配模式小結(jié)的文章就介紹到這了,更多相關(guān)正則表達式 匹配模式內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • 十分鐘上手正則表達式 上篇
  • 正則表達式分組與引用的使用
  • 正則表達式量詞與貪婪的使用詳解
  • 正則表達式那些讓人頭暈的元字符
  • 正則表達式之分組的回溯引用問題
  • 十分鐘上手正則表達式 下篇

標簽:黑河 中衛(wèi) 南昌 駐馬店 臨夏 阜陽 延邊 欽州

巨人網(wǎng)絡(luò)通訊聲明:本文標題《正則表達式常見的4種匹配模式小結(jié)》,本文關(guān)鍵詞  正則,表達式,常見,的,4種,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《正則表達式常見的4種匹配模式小結(jié)》相關(guān)的同類信息!
  • 本頁收集關(guān)于正則表達式常見的4種匹配模式小結(jié)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    手机| 吉安县| 扬中市| 兴山县| 嘉峪关市| 天峻县| 奎屯市| 钟山县| 绥滨县| 红原县| 成都市| 伽师县| 崇明县| 和平县| 和顺县| 苍南县| 钟祥市| 井研县| 香格里拉县| 吉安市| 大余县| 梁河县| 达孜县| 仲巴县| 江安县| 连州市| 平利县| 玛多县| 罗山县| 康定县| 石狮市| 德惠市| 朔州市| 陆丰市| 和平区| 东源县| 古交市| 孟津县| 万山特区| 高碑店市| 平阳县|