濮阳杆衣贸易有限公司

主頁 > 知識庫 > 正則用(?>…)實現(xiàn)固化分組提高效率

正則用(?>…)實現(xiàn)固化分組提高效率

熱門標簽:地圖標注店鋪地圖標注酒店 自己做的電銷機器人 浙江營銷外呼系統(tǒng)有哪些 惠安地圖標注 哈爾濱公司外呼系統(tǒng)代理 遼寧秒客來電話機器人 上海銷售電銷機器人軟件 淄博市張店區(qū)地圖標注 山東外呼系統(tǒng)聯(lián)系方式
具體來說,使用「(?>…)」的匹配與正常的匹配并無差別,但是如果匹配進行到此結(jié)構(gòu)之后(也就是,進行到閉括號之后),那么此結(jié)構(gòu)體中的所有備用狀態(tài)都會被放棄(不能被回溯)。
  也就是說,在固化分組匹配結(jié)束時,它已經(jīng)匹配的文本已經(jīng)固化為一個單元,只能作為整體而保留或放棄。括號內(nèi)的子表達式中未嘗試過的備用狀態(tài)都不復存在了,所以回溯永遠也不能選擇其中的狀態(tài)(至少是,當此結(jié)構(gòu)匹配完成時,“鎖定(locked in)”在其中的狀態(tài))。
例子:
  比如要處理一批數(shù)據(jù),原來格式為123.456,后來因為浮點數(shù)顯示問題,部分數(shù)據(jù)格式變?yōu)?23.456000000789這種,,要求做到只保留小數(shù)點后面2-3位,但是,最后一位不能為0,這個正則如何寫呢?(下面直接考慮小數(shù)點后面的數(shù)字),寫出正則之后,我們還要用這個正則去匹配數(shù)據(jù),把原來的數(shù)據(jù)替換成匹配的結(jié)果。

正則一、
復制代碼 代碼如下:

$str = preg_replace('\.(\d\d[1-9]?)\d*','\\1',$str);
//匹配結(jié)果的group1進行反向引用

很明顯,這種寫法,對于部分數(shù)據(jù)格式為123.456的這種格式,白白的處理了一遍,為了提高效率,我們還要對這個正則進行處理。從123.456這個字符串跟其他的比較一下,我們發(fā)現(xiàn),是疑問123.456這個數(shù)據(jù)后面沒數(shù)字了,所以,白白處理一遍。那好辦,我們對這個正則改造一下,把后面的量詞*改成+,這樣對于123.45 小數(shù)點后面1,2位數(shù)字的,不會去白白處理,而且,對三位以上數(shù)字的,處理正常。其PHP代碼為

正則二、
復制代碼 代碼如下:

$str = preg_replace('\.(\d\d[1-9]?)\d+','\\1',$str);

好了,這個正則真的沒問題嗎??下面,我們也分析一下這個正則的匹配過程吧。
  字符串"123.456",正則表達式為【\.(\d\d[1-9]?)\d+】,我們來看下

  首先(小數(shù)點前123不說了),
  【\.】匹配".",匹配成功,把控制權(quán)給下一個【\d】,【\d】匹配“4”成功,把控制權(quán)給第二個【\d】,這個【\d】匹配“5”成功,然后,把控制權(quán)給了【[1-9]?】,由于量詞是【?】,正則表達式遵循“量詞優(yōu)先匹配”,而且,此處是【?】,還會留下一個回溯點。然后匹配"6"成功,然后把控制權(quán)給【\d+】,【\d+】發(fā)現(xiàn)后面沒字符了,最遵循“后進先出”規(guī)則,回到上一個回溯點,進行匹配,這時,【[1-9]?】會交還出其匹配的字符“6”,【[1-9]?】匹配“6”成功。匹配完成了。大家發(fā)現(xiàn)【(\d\d[1-9]?)】匹配的結(jié)果確是"45",并不是我們想要的“456”,“6”被【\d+】匹配去了。那么,我們該如何辦呢? 能否讓【[1-9]?】匹配一旦成功,不進行回溯呢?這就用到了我們上面說的"固化分組", PHP(preg_replace函數(shù))中使用的正則引擎支持固化分組,我們根據(jù)固化分組的寫法,可以把代碼改成如下方式

正則三、
復制代碼 代碼如下:

$str = preg_replace('\.(\d\d(?>[1-9]?))\d+','\\1',$str);

改成這樣的話,那字符串“123.456“是不符合要求,不會被匹配的。那我們就可以實現(xiàn)我們的要求了。

  所以,讓我們來看(\.\d\d(?>[1-9]?))\d+。
  在固化分組內(nèi),量詞能夠正常工作,所以如果[1-9]不能匹配,正則表達式會返回? 留下的備用狀態(tài)。然后匹配脫離固化分組,繼續(xù)前進到「\d+」。在這種情況下,當控制權(quán)離開固化分組時,沒有備用狀態(tài)需要放棄(因為在固化分組中沒有創(chuàng)建任何備用狀態(tài))。
  如果[1-9] 能夠匹配,匹配脫離固化分組之后,「? 」保存的備用狀態(tài)仍然存在。但是,因為它屬于已經(jīng)結(jié)束的固化分組,所以會被拋棄。
  匹配‘.625'或者‘.625000'時就會發(fā)生這種情況。在后一種情況下,放棄那些狀態(tài)不會帶來任何麻煩,因為「\d+」匹配的是‘.625000',到這里正則表達式已經(jīng)完成匹配。但是對于‘.625'來說,因為「\d+」無法匹配,正則引擎需要回溯,但回溯又無法進行,因為備用狀態(tài)已經(jīng)不存在了。既然沒有能夠回溯的備用狀態(tài),整體匹配也就失敗,‘.625'不需要處理,而這正是我們期望的。
您可能感興趣的文章:
  • 深入理解JS正則表達式---分組
  • javascript正則表達式中分組詳解
  • javascript正則表達式之分組概念與用法實例
  • 正則表達式、分組、子匹配(子模式)、非捕獲子匹配(子模式)
  • 詳解JavaScript正則表達式之分組匹配及反向引用
  • JavaScript正則表達式的分組匹配詳解
  • 淺談JavaScript正則表達式分組匹配
  • JS正則表達式獲取分組內(nèi)容的方法詳解
  • python正則分組的應(yīng)用
  • PHP正則表達式的效率 回溯與固化分組
  • JavaScript中使用正則匹配多條,且獲取每條中的分組數(shù)據(jù)
  • 正則表達式分組實例詳解

標簽:西安 重慶 銅川 長沙 綿陽 無錫 宣城 泰州

巨人網(wǎng)絡(luò)通訊聲明:本文標題《正則用(?>…)實現(xiàn)固化分組提高效率》,本文關(guān)鍵詞  正,則用,amp,實現(xiàn),固化,分組,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《正則用(?>…)實現(xiàn)固化分組提高效率》相關(guān)的同類信息!
  • 本頁收集關(guān)于正則用(?>…)實現(xiàn)固化分組提高效率的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    扶沟县| 淮阳县| 平度市| 武功县| 进贤县| 崇信县| 塘沽区| 滦南县| 汕头市| 陈巴尔虎旗| 济宁市| 西和县| 岳阳市| 南和县| 陇川县| 房山区| 集安市| 甘泉县| 南汇区| 中方县| 饶平县| 淳安县| 丁青县| 汉阴县| 凌云县| 安西县| 读书| 闽清县| 苍溪县| 西华县| 嵊州市| 全椒县| 浮梁县| 嫩江县| 隆子县| 高青县| 黎城县| 普安县| 芮城县| 信丰县| 永昌县|