當where子句對某一列使用函數(shù)時,除非利用這個簡單的技術強制索引,否則Oracle優(yōu)化器不能在查詢中使用索引。 通常情況下,如果在WHERE子句中不使用諸如UPPER、REPLACE 或SUBSTRD等函數(shù),就不能對指定列建立特定的條件。但如果使用了這些函數(shù),則會出現(xiàn)一個問題:這些函數(shù)會阻礙Oracle優(yōu)化器對列使用索引,因而與采用索引的情況相比較,查詢會花費更多的時間。 慶幸的是,如果在使用函數(shù)的這些列中包含了字符型數(shù)據(jù),可以用這樣一種方法修改查詢語句,以達到強制性使用索引,更有效地運行查詢。這篇文章介紹了涉及的技術,并說明了在兩種典型情況下怎樣實現(xiàn)。
大小寫混合情況 在討論由于函數(shù)修改了列的內(nèi)容,如何強制使用索引前,讓我們首先看看為什么Oracle優(yōu)化器在這種情況下不能使用索引。假定我們要搜尋包含了大小寫混合的數(shù)據(jù),如在表1中ADDRESS表的NAME列。因為數(shù)據(jù)是用戶輸入的,我們無法使用已經(jīng)統(tǒng)一改為大寫的數(shù)據(jù)。為了找到每一個名為john的地址,我們使用包含了UPPER子句的查詢語句。如下所示:
SQL> select address from address where upper(name) like 'JOHN'; |
在運行這個查詢語句前,如果我們運行了命令"set autotrace on", 將會得到下列結(jié)果,其中包含了執(zhí)行過程:
ADDRESS cleveland 1 row selected. Execution Plan SELECT STATEMENT TABLE ACCESS FULL ADDRESS |
可以看到,在這種情況下,Oracle優(yōu)化器對ADDRESS 表作了一次完整的掃描,而沒有使用NAME 列的索引。這是因為索引是根據(jù)列中數(shù)據(jù)的實際值建立的,而UPPER 函數(shù)已經(jīng)將字符轉(zhuǎn)換成大寫,即修改了這些值,因此該查詢不能使用這列的索引。優(yōu)化器不能與索引項比較"JOHN",沒有索引項對應于"JOHN"-只有"john" 。 值得慶幸的是,如果在這種情況下想要強制使用索引,有一種簡便的方法:只要在WHERE 子句中增加一個或多個特定的條件,用于測試索引值,并減少需要掃描的行,但這并沒有修改原來SQL 編碼中的條件。以下列查詢語句為例:
SQL> select address from address where upper(name) like 'JO%' AND (name like 'J%' or name like 'j%'); |
使用這種查詢語句(已設置AUTOTRACE),可得到下列結(jié)果:
ADDRESS cleveland 1 row selected. Execution Plan SELECT STATEMENT CONCATENATION TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I |
現(xiàn)在,優(yōu)化器為WHERE 子句中AND 聯(lián)結(jié)的兩個語句中每一個語句確定的范圍進行掃描----第二個語句沒有引用函數(shù),因而使用了索引。在兩個范圍掃描后,將運行結(jié)果合并。 在這個例子中,如果數(shù)據(jù)庫有成百上千行,可以用下列方法擴充WHERE 子句,進一步縮小掃描范圍:
select address from address where upper(name) like 'JOHN' AND (name like 'JO%' or name like 'jo%' or name like 'Jo' or name like 'jO' ); |
得到的結(jié)果與以前相同,但是,其執(zhí)行過程如下所示,表明有4個掃描范圍。
Execution Plan SELECT STATEMENT CONCATENATION TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I TABLE ACCESS BY INDEX ROWID ADDRESS INDEX RANGE SCAN ADDRESS_I |
如果試圖進一步提高查詢速度,我們可以在特定的"name like"條件中指明3個或更多的字符。然而,這樣做會使得WHERE子句十分笨重。因為需要大小寫字符所有可能的組合-joh ,Joh,jOh,joH等等。除此之外,指定一個或兩個字符已足以加快查詢的運行速度了。 現(xiàn)在讓我們看看,當我們引用不同的函數(shù)時,怎樣運用這個基本技術。
使用REPLACE的情況 正如名字不總是以大寫輸入一樣,電話號碼也會以許多格式出現(xiàn): 如 123-456-7890, 123 456 7890,(123)456-7890 等等。 如果在列名為 PHONE_NUMBER中搜尋上述號碼時,可能需要使用函數(shù)REPLACE以保證統(tǒng)一的格式。如果在PHONE_NUMBER列中只包含空格、連字符和數(shù)字,where 子句可以如下所示:
WHERE replace(replace(phone_number , '-' ) , ' ' ) = '1234567890' |
WHERE子句兩次使用REPLACE 函數(shù)去掉了連字符和空格,保證了電話號碼是簡單的數(shù)字串。然而,該函數(shù)阻止了優(yōu)化器在該列使用索引。因此,我們按如下方法修改WHERE子句,以強制執(zhí)行索引。
WHERE replace(replace(phone_number, '-' ) , ' ' ) = '1234567890' |
AND phone_number like '123% '如果我們知道數(shù)據(jù)中可能包含圓括號,WHERE 子句會稍微復雜一點。我們可以再增加REPLACE 函數(shù)(去掉圓括號、連字符和空格),按如下所示擴充增加的條件:
WHERE replace(replace(replace(replace(phone_number , ' - ' ) ,' '), '( ' ) , ' ) ' ) = '1234567890' AND (phone number like ' 123% ' or phone_number like ' (123% ' ) ' |
該例強調(diào)了巧妙地選用WHERE 子句條件的重要性,而且,這些條件不會改變查詢結(jié)果。你的選擇應基于完全了解該列中存在的信息類型。在該例中,我們需要知道 PHONE_NUMBER 數(shù)據(jù)中存在幾種不同的格式,這樣,我們能夠修改WHERE 子句而不會影響查詢結(jié)果。
正確的條件 以后當你遇到包含CHARACTER 數(shù)據(jù)修改函數(shù)列的WHERE 子句時,應考慮怎樣利用增加一個或兩個特定的條件,迫使優(yōu)化器使用索引。適當?shù)剡x擇一組特定的條件能減少掃描行,并且強制使用索引不會影響查詢結(jié)果----但卻提高了查詢的執(zhí)行速度。