正則表達(dá)式可以: •測試字符串的某個(gè)模式。例如,可以對一個(gè)輸入字符串進(jìn)行測試,看在該字符串是否存在一個(gè)電話號碼模式或一個(gè)信用卡號碼模式。這稱為數(shù)據(jù)有效性驗(yàn)證 •替換文本??梢栽谖臋n中使用一個(gè)正則表達(dá)式來標(biāo)識特定文字,然后可以全部將其刪除,或者替換為別的文字 •根據(jù)模式匹配從字符串中提取一個(gè)子字符串??梢杂脕碓谖谋净蜉斎胱侄沃胁檎姨囟ㄎ淖? 正則表達(dá)式語法 一個(gè)正則表達(dá)式就是由普通字符(例如字符 a 到 z)以及特殊字符(稱為元字符)組成的文字模式。該模式描述在查找文字主體時(shí)待匹配的一個(gè)或多個(gè)字符串。正則表達(dá)式作為一個(gè)模板,將某個(gè)字符模式與所搜索的字符串進(jìn)行匹配。 創(chuàng)建正則表達(dá)式 Js代碼 復(fù)制代碼 代碼如下:
var re = new RegExp();//RegExp是一個(gè)對象,和Aarray一樣 //但這樣沒有任何效果,需要將正則表達(dá)式的內(nèi)容作為字符串傳遞進(jìn)去 re =new RegExp("a");//最簡單的正則表達(dá)式,將匹配字母a re=new RegExp("a","i");//第二個(gè)參數(shù),表示匹配時(shí)不分大小寫
RegExp構(gòu)造函數(shù)第一個(gè)參數(shù)為正則表達(dá)式的文本內(nèi)容,而第一個(gè)參數(shù)則為可選項(xiàng)標(biāo)志.標(biāo)志可以組合使用 •g (全文查找) •i (忽略大小寫) •m (多行查找) Js代碼 復(fù)制代碼 代碼如下:
var re = new RegExp("a","gi");//匹配所有的a或A
正則表達(dá)式還有另一種正則表達(dá)式字面量的聲明方式 Js代碼 復(fù)制代碼 代碼如下:
var re = /a/gi;
和正則表達(dá)式相關(guān)的方法和屬性 正則表達(dá)式對象的方法 •test,返回一個(gè) Boolean 值,它指出在被查找的字符串中是否存在模式。如果存在則返回 true,否則就返回 false。 •exec,用正則表達(dá)式模式在字符串中運(yùn)行查找,并返回包script type="text/javascript" src="http://www.javaeye.com/javascripts/tinymce/themes/advanced/langs/zh.js">/script>script type="text/javascript" src="http://www.javaeye.com/javascripts/tinymce/plugins/javaeye/langs/zh.js">/script>含該查找結(jié)果的一個(gè)數(shù)組。 •compile,把正則表達(dá)式編譯為內(nèi)部格式,從而執(zhí)行得更快。 正則表達(dá)式對象的屬性 •source,返回正則表達(dá)式模式的文本的復(fù)本。只讀。 •lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的開始位置。 •$1...$9,返回九個(gè)在模式匹配期間找到的、最近保存的部分。只讀。 •input ($_),返回執(zhí)行規(guī)范表述查找的字符串。只讀。 •lastMatch ($),返回任何正則表達(dá)式搜索過程中的最后匹配的字符。只讀。 •lastParen ($+),如果有的話,返回任何正則表達(dá)式查找過程中最后括的子匹配。只讀。 •leftContext ($`),返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符。只讀。 •rightContext ($'),返回被搜索的字符串中從最后一個(gè)匹配位置開始到字符串結(jié)尾之間的字符。只讀。 String對象一些和正則表達(dá)式相關(guān)的方法 •match,找到一個(gè)或多個(gè)正則表達(dá)式的匹配。 •replace,替換與正則表達(dá)式匹配的子串。 •search,檢索與正則表達(dá)式相匹配的值。 •split,把字符串分割為字符串?dāng)?shù)組。 測試正則表達(dá)式是如何工作的! 復(fù)制代碼 代碼如下:
//test方法,測試字符串,符合模式時(shí)返回true,否則返回false var re = /he/;//最簡單的正則表達(dá)式,將匹配he這個(gè)單詞 var str = "he"; alert(re.test(str));//true str = "we"; alert(re.test(str));//false str = "HE"; alert(re.test(str));//false,大寫,如果要大小寫都匹配可以指定i標(biāo)志(i是ignoreCase或case-insensitive的表示) re = /he/i; alert(re.test(str));//true str = "Certainly!He loves her!"; alert(re.test(str));//true,只要包含he(HE)就符合,如果要只是he或HE,不能有其它字符,則可使用^和$ re = /^he/i;//脫字符(^)代表字符開始位置 alert(re.test(str));//false,因?yàn)閔e不在str最開始 str = "He is a good boy!"; alert(re.test(str));//true,He是字符開始位置,還需要使用$ re = /^he$/i;//$表示字符結(jié)束位置 alert(re.test(str));//false str = "He"; alert(re.test(str));//true //當(dāng)然,這樣不能發(fā)現(xiàn)正則表達(dá)式有多強(qiáng)大,因?yàn)槲覀兺耆梢栽谏厦娴睦又惺褂?=或indexOf re = /\s/;// \s匹配任何空白字符,包括空格、制表符、換頁符等等 str= "user Name";//用戶名包含空格 alert(re.test(str));//true str = "user Name";//用戶名包含制表符 alert(re.test(str));//true re=/^[a-z]/i;//[]匹配指定范圍內(nèi)的任意字符,這里將匹配英文字母,不區(qū)分大小寫 str="variableName";//變量名必須以字母開頭 alert(re.test(str));//true str="123abc"; alert(re.test(str));//false
當(dāng)然,僅僅知道了字符串是否匹配模式還不夠,我們還需要知道哪些字符匹配了模式 復(fù)制代碼 代碼如下:
var osVersion = "Ubuntu 8";//其中的8表示系統(tǒng)主版本號 var re = /^[a-z]+\s+\d+$/i; //+號表示字符至少要出現(xiàn)1次,\s表示空白字符,\d表示一個(gè)數(shù)字 alert(re.test(osVersion));//true,但我們想知道主版本號 //另一個(gè)方法exec,返回一個(gè)數(shù)組,數(shù)組的第一個(gè)元素為完整的匹配內(nèi)容 re=/^[a-z]+\s+\d+$/i; arr = re.exec(osVersion); alert(arr[0]);//將osVersion完整輸出,因?yàn)檎麄€(gè)字符串剛好匹配re //我只需要取出數(shù)字 re=/\d+/; var arr = re.exec(osVersion); alert(arr[0]);//8
更復(fù)雜的用法,使用子匹配 復(fù)制代碼 代碼如下:
//exec返回的數(shù)組第1到n元素中包含的是匹配中出現(xiàn)的任意一個(gè)子匹配 re=/^[a-z]+\s+(\d+)$/i;//用()來創(chuàng)建子匹配 arr =re.exec(osVersion); alert(arr[0]);//整個(gè)osVersion,也就是正則表達(dá)式的完整匹配 alert(arr[1]);//8,第一個(gè)子匹配,事實(shí)也可以這樣取出主版本號 alert(arr.length);//2 osVersion = "Ubuntu 8.10";//取出主版本號和次版本號 re = /^[a-z]+\s+(\d+)\.(\d+)$/i;//.是正則表達(dá)式元字符之一,若要用它的字面意義須轉(zhuǎn)義 arr = re.exec(osVersion); alert(arr[0]);//完整的osVersion alert(arr[1]);//8 alert(arr[2]);//10
注意,當(dāng)字符串不匹配re時(shí),exec方法將返回null String對象的一些和正則表達(dá)式有關(guān)的方法 [Ctrl+A 全選 注:引入外部Js需再刷新一下頁面才能執(zhí)行]
注意,當(dāng)search方法沒有找到匹配時(shí),將返回-1 類似于exec方法,String對象的match方法也用于將字符串與正則表達(dá)式進(jìn)行匹配并返回結(jié)果數(shù)組 復(fù)制代碼 代碼如下:
var str = "My name is CJ.Hello everyone!"; var re = /[A-Z]/;//匹配所有大寫字母 var arr = str.match(re);//返回?cái)?shù)組 alert(arr);//數(shù)組中只會包含一個(gè)M,因?yàn)槲覀儧]有使用全局匹配 re = /[A-Z]/g; arr = str.match(re); alert(arr);//M,C,J,H //從字符串中抽取單詞 re = /\b[a-z]\b/i;//\b表示單詞邊界 str = "one two three four"; alert(str.match(re));//one,two,three,four
RegExp對象實(shí)例的一些屬性 Js代碼 復(fù)制代碼 代碼如下:
var re = /[a-z]/i; alert(re.source);//將[a-z]字符串輸出 //請注意,直接alert(re)會將正則表達(dá)式連同前向斜線與標(biāo)志輸出,這是re.toString方法定義的
每個(gè)RegExp對象的實(shí)例具有l(wèi)astIndex屬性,它是被查找字符串中下一次成功匹配的開始位置,默認(rèn)值是-1。 lastIndex 屬性被 RegExp 對象的 exec 和 test 方法修改.并且它是可寫的. 復(fù)制代碼 代碼如下:
var re = /[A-Z]/; //exec方法執(zhí)行后,修改了re的lastIndex屬性, var str = "Hello,World!!!"; var arr = re.exec(str); alert(re.lastIndex);//0,因?yàn)闆]有設(shè)置全局標(biāo)志 re = /[A-Z]/g; arr = re.exec(str); alert(re.lastIndex);//1 arr = re.exec(str); alert(re.lastIndex);//7
當(dāng)匹配失?。ê竺鏇]有匹配),或lastIndex值大于字符串長度時(shí),再執(zhí)行exec等方法會將lastIndex設(shè)為0(開始位置) 復(fù)制代碼 代碼如下:
var re = /[A-Z]/; var str = "Hello,World!!!"; re.lastIndex = 120; var arr = re.exec(str); alert(re.lastIndex);//0
RegExp對象的靜態(tài)屬性 復(fù)制代碼 代碼如下:
//input 最后用于匹配的字符串(傳遞給test,exec方法的字符串) var re = /[A-Z]/; var str = "Hello,World!!!"; var arr = re.exec(str); alert(RegExp.input);//Hello,World!!! re.exec("tempstr"); alert(RegExp.input);//仍然是Hello,World!!!,因?yàn)閠empstr不匹配 //lastMatch 最后匹配的字符 re = /[a-z]/g; str = "hi"; re.test(str); alert(RegExp.lastMatch);//h re.test(str); alert(RegExp["$"]);//i ,$是lastMatch的短名字,但由于它不是合法變量名,所以要。。 //lastParen 最后匹配的分組 re = /[a-z](\d+)/gi; str = "Class1 Class2 Class3"; re.test(str); alert(RegExp.lastParen);//1 re.test(str); alert(RegExp["$+"]);//2 //leftContext 返回被查找的字符串中從字符串開始位置到最后匹配之前的位置之間的字符 //rigthContext 返回被搜索的字符串中從最后一個(gè)匹配位置開始到字符串結(jié)尾之間的字符 re = /[A-Z]/g; str = "123ABC456"; re.test(str); alert(RegExp.leftContext);//123 alert(RegExp.rightContext);//BC456 re.test(str); alert(RegExp["$`"]);//123A alert(RegExp["$'"]);//C456
multiline屬性返回正則表達(dá)式是否使用多行模式,這個(gè)屬性不針對某個(gè)正則表達(dá)式實(shí)例,而是針對所有正則表達(dá)式,并且這個(gè)屬性可寫.(IE與Opera不支持這個(gè)屬性) 復(fù)制代碼 代碼如下:
alert(RegExp.multiline); //因?yàn)镮E,Opera不支持這個(gè)屬性,所以最好還是單獨(dú)指定 var re = /\w+/m; alert(re.multiline); alert(RegExp["$*"]);//RegExp對象的靜態(tài)屬性不會因?yàn)榻oRegExp某個(gè)對象實(shí)例指定了m標(biāo)志而改變 RegExp.multiline = true;//這將打開所有正則表達(dá)式實(shí)例的多行匹配模式 alert(RegExp.multiline);
使用元字符注意事項(xiàng):元字符是正則表達(dá)式的一部分,當(dāng)我們要匹配正則表達(dá)式本身時(shí),必須對這些元字符轉(zhuǎn)義.下面是正則表達(dá)式用到的所有元字符 ( [ { \ ^ $ | ) ? * + . 復(fù)制代碼 代碼如下:
var str = "?"; var re = /?/; alert(re.test(str));//出錯(cuò),因?yàn)??是元字符,必須轉(zhuǎn)義 re = /\?/; alert(re.test(str));//true
使用RegExp構(gòu)造函數(shù)與使用正則表達(dá)式字面量創(chuàng)建正則表達(dá)式注意點(diǎn) 復(fù)制代碼 代碼如下:
var str = "\?"; alert(str);//只會輸出? var re = /\?/;//將匹配? alert(re.test(str));//true re = new RegExp("\?");//出錯(cuò),因?yàn)檫@相當(dāng)于re = /\?/ re = new RegExp("\\?");//正確,將匹配? alert(re.test(str));//true
既然雙重轉(zhuǎn)義這么不友好,所以還是用正則表達(dá)式字面量的聲明方式 如何在正則表達(dá)式中使用特殊字符? 復(fù)制代碼 代碼如下:
//ASCII方式用十六進(jìn)制數(shù)來表示特殊字符 var re = /^\x43\x4A$/;//將匹配CJ alert(re.test("CJ"));//true //也可使用八進(jìn)制方式 re = /^\103\112$/;//將匹配CJ alert(re.test("CJ"));//true //還可以使用Unicode編碼 re =/^\u0043\u004A$/;//使用 Unicode,必須使用u開頭,接著是字符編碼的四位16進(jìn)制表現(xiàn)形式 alert(re.test("CJ"));
另處,還有一些其它的預(yù)定義特殊字符,如下表所示: 字符 描述 \n 換行符 \r 回車符 \t 制表符 \f 換頁符(Tab) \cX 與X對應(yīng)的控制字符 \b 退格符(BackSpace) \v 垂直制表符 \0 空字符("") 字符類 ---〉簡單類,反向類,范圍類,組合類,預(yù)定義類 復(fù)制代碼 代碼如下:
//簡單類 var re = /[abc123]/;//將匹配abc123這6個(gè)字符中一個(gè) //負(fù)向類 re = /[^abc]/;//將匹配除abc之外的一個(gè)字符 //范圍類 re = /[a-b]/;//將匹配小寫a-b 26個(gè)字母 re = /[^0-9]/;//將匹配除0-9 10個(gè)字符之處的一個(gè)字符 //組合類 re = /[a-b0-9A-Z_]/;//將匹配字母,數(shù)字和下劃線
下面是正則表達(dá)式中的預(yù)定義類 代碼 等同于 匹配 . IE下[^\n],其它[^\n\r] 匹配除換行符之外的任何一個(gè)字符 \d [0-9] 匹配數(shù)字 \D [^0-9] 匹配非數(shù)字字符 \s [ \n\r\t\f\x0B] 匹配一個(gè)空白字符 \S [^ \n\r\t\f\x0B] 匹配一個(gè)非空白字符 \w [a-zA-Z0-9_] 匹配字母數(shù)字和下劃線 \W [^a-zA-Z0-9_] 匹配除字母數(shù)字下劃線之外的字符 量詞(下表量詞單個(gè)出現(xiàn)時(shí)皆是貪婪量詞) 代碼 描述 * 匹配前面的子表達(dá)式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價(jià)于{0,}。 + 匹配前面的子表達(dá)式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價(jià)于 {1,}。 ? 匹配前面的子表達(dá)式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價(jià)于 {0,1}。 {n} n 是一個(gè)非負(fù)整數(shù)。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個(gè) o。 {n,} n 是一個(gè)非負(fù)整數(shù)。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價(jià)于 'o+'。'o{0,}' 則等價(jià)于 'o*'。 {n,m} m 和 n 均為非負(fù)整數(shù),其中n = m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個(gè) o。'o{0,1}' 等價(jià)于 'o?'。請注意在逗號和兩個(gè)數(shù)之間不能有空格。 貪婪量詞與惰性量詞 •用貪婪量詞進(jìn)行匹配時(shí),它首先會將整會字符串當(dāng)成一個(gè)匹配,如果匹配的話就退出,如果不匹配,就截去最后一個(gè)字符進(jìn)行匹配,如果不匹配,繼續(xù)將最后一個(gè)字符截去進(jìn)行匹配,直到有匹配為止。直到現(xiàn)在我們遇到的量詞都是貪婪量詞 •用貪婪量詞進(jìn)行匹配時(shí),它首先將第一個(gè)字符當(dāng)成一個(gè)匹配,如果成功則退出,如果失敗,則測試前兩個(gè)字符,依些增加,直到遇到合適的匹配為止 惰性量詞僅僅在貪婪量詞后面加個(gè)"?"而已,如"a+"是貪婪匹配的,"a+?"則是惰性的 復(fù)制代碼 代碼如下:
var str = "abc"; var re = /\w+/;//將匹配abc re = /\w+?/;//將匹配a
多行模式 復(fù)制代碼 代碼如下:
var re = /[a-z]$/; var str = "ab\ncdef"; alert(str.replace(re,"#"));//ab\ncde# re =/[a-z]$/m; alert(str.replace(re,"#"));//a#\ncde#
分組與非捕獲性分組 復(fù)制代碼 代碼如下:
re = /abc{2}/;//將匹配abcc re = /(abc){2}/;//將匹配abcabc //上面的分組都是捕獲性分組 str = "abcabc ###"; arr = re.exec(str); alert(arr[1]);//abc //非捕獲性分組 (?:) re = /(?:abc){2}/; arr = re.exec(str); alert(arr[1]);//undefined
候選(也就是所說的“或”) 復(fù)制代碼 代碼如下:
re = /^a|bc$/;//將匹配開始位置的a或結(jié)束位置的bc str ="add"; alert(re.test(str));//true re = /^(a|bc)$/;//將匹配a或bc str ="bc"; alert(re.test(str));//true
當(dāng)包含分組的正則表達(dá)式進(jìn)行過test,match,search這些方法之后,每個(gè)分組都被放在一個(gè)特殊的地方以備將來使用,這些存儲是分組中的特殊值,我們稱之為反向引用 復(fù)制代碼 代碼如下:
var re = /(A?(B?(C?)))/; /*上面的正則表達(dá)式將依次產(chǎn)生三個(gè)分組 (A?(B?(C?))) 最外面的 (B?(C?)) (C?)*/ str = "ABC"; re.test(str);//反向引用被存儲在RegExp對象的靜態(tài)屬性$1—$9中 alert(RegExp.$1+"\n"+RegExp.$2+"\n"+RegExp.$3); //反向引用也可以在正則表達(dá)式中使用\1 ,\2...這類的形式使用 re = /\d+(\D)\d+\1\d+/; str = "2008-1-1"; alert(re.test(str));//true str = "2008-4_3"; alert(re.test(str));//false
使用反向引用可以要求字符串中某幾個(gè)位置上的字符必須相同.另外,在replace這類方法中可用特殊字符序列來表示反向引用 Js代碼 復(fù)制代碼 代碼如下:
re = /(\d)\s(\d)/; str = "1234 5678"; alert(str.replace(re,"$2 $1"));//在這個(gè)里面$1表示第一個(gè)分組1234,$2則表示5678
其它——〉正向前瞻,用來捕獲出現(xiàn)在特定字符之前的字符,只有當(dāng)字符后面跟著某個(gè)特定字符才去捕獲它。與正向前瞻對應(yīng)的有負(fù)向前瞻,它用匹配只有當(dāng)字符后面不跟著某個(gè)特定字符時(shí)才去匹配它。在執(zhí)行前瞻和負(fù)向前瞻之類的運(yùn)算時(shí),正則表達(dá)式引擎會留意字符串后面的部分,然而卻不移動index 復(fù)制代碼 代碼如下:
//正向前瞻 re = /([a-z]+(?=\d))/i; //我們要匹配后面跟一個(gè)數(shù)字的單詞,然后將單詞返回,而不要返回?cái)?shù)字 str = "abc every1 abc"; alert(re.test(str));//true alert(RegExp.$1);//every alert(re.lastIndex);//使用前瞻的好處是,前瞻的內(nèi)容(?=\d)并不會當(dāng)成一次匹配,下次匹配仍從它開始 //負(fù)向前瞻(?!) re = /([a-z](?!\d))/;i //將匹配后面不包含數(shù)字的字母,并且不會返回(?!\d)中的內(nèi)容 str = "abc1 one"; alert(re.test(str)); alert(RegExp.$1);//one
構(gòu)建一個(gè)驗(yàn)證電子郵箱地址有效性的正則表達(dá)式。電子郵箱地址有效性要求(我們姑且這樣定義):用戶名只能包含字母數(shù)字以及下劃線,最少一位,最多25位,用戶名后面緊跟@,后面是域名,域名名稱要求只能包含字母數(shù)字和減號(-),并且不能以減號開頭或結(jié)尾,然后后面是域名后綴(可以有多個(gè)),域名后綴必須是點(diǎn)號連上2-4位英文字母 復(fù)制代碼 代碼如下:
var re = /^\w{1,15}(?:@(?!-))(?:(?:[a-z0-9-]*)(?:[a-z0-9](?!-))(?:\.(?!-)))+[a-z]{2,4}$/;
好像漏了些,比如,replace方法第二個(gè)參數(shù)作為函數(shù)的情況 恰巧上次在某君博客里看到一個(gè)面試題,讀取一個(gè)文本文件中的字符串,統(tǒng)計(jì)其中的"9"出現(xiàn)的次數(shù),用JS寫個(gè)也很簡單(不包含打開文件的代碼,打開文件可以用ActiveXObject等瀏覽器提供的對象弄) 復(fù)制代碼 代碼如下:
var str="ADF9DF9DF9",//那個(gè)文本文件中的字符串; re=/9/gi,//匹配9 counter=0;//計(jì)數(shù)器 str.replace(re,function () { counter++;//每出現(xiàn)一次匹配,函數(shù)就被執(zhí)行一次,函數(shù)的返回值用來替換原值 return "#"; }); //最后str 變成 ADF#DF#DF#"
至于傳遞給replace方法的函數(shù)接收的參數(shù)....樓下繼續(xù) 你說的那個(gè)問題: $是lastMatch的短名字 還有,不知道為什么你的正則表達(dá)式中沒有對{}兩個(gè)特殊字符轉(zhuǎn)義 提到JS的兼容性問題,這里要提的是RegExp對象實(shí)例的compile 方法 compile方法用來將正則表達(dá)式編譯為內(nèi)部格式以使其執(zhí)行的更快 Js代碼 復(fù)制代碼 代碼如下:
var re = new RegExp(); re.compile("[0-9]\\n");//注意要對斜杠多轉(zhuǎn)義一次,compile方法返回值為re這個(gè)對象(編譯后的)
但經(jīng)測試,這個(gè)方法在Safari及Chrome類似的瀏覽器,compile方法始終返回undefined,不可用
您可能感興趣的文章: javascript IP、域名、手機(jī)號碼正則表達(dá)式驗(yàn)證代碼 javascript 手機(jī)號碼正則表達(dá)式驗(yàn)證函數(shù) php 手機(jī)號碼驗(yàn)證正則表達(dá)式