f_id | f_name | f_price |
---|---|---|
a1 | apple | 5 |
a2 | appricot | 2 |
b1 | blackberry | 10 |
b2 | berry | 8 |
c1 | cocount | 9 |
供應商表 suppliers表
s_id | s_name |
---|---|
101 | 天虹 |
102 | 沃爾瑪 |
103 | 家樂福 |
104 | 華潤萬家 |
我們將用這兩張表做演示。
exists
關鍵字后面的參數是一個任意的子查詢,系統(tǒng)對子查詢進行運算以判斷它是否返回行,如果至少返回一行,那么exists
的結果為true
,此時外層的查詢語句將進行查詢;如果子查詢沒有返回任何行,那么exists
的結果為false
,此時外層語句將不進行查詢。
需要注意的是,當我們的子查詢?yōu)?SELECT NULL
時,MYSQL仍然認為它是True
。
in 關鍵字進行子查詢時,內層查詢語句僅僅返回一個數據列,這個數據列的值將提供給外層查詢語句進行比較操作。
為了測試in 關鍵字,我在水果表中加了s_id一列
水果表 fruits表
f_id | f_name | f_price | s_id |
---|---|---|---|
a1 | apple | 5 | 101 |
a2 | appricot | 2 | 103 |
b1 | blackberry | 10 | 102 |
b2 | berry | 8 | 104 |
c1 | cocount | 9 | 103 |
in和exists到底有啥區(qū)別那,要什么時候用in,什么時候用exists?
我們先記住口訣再說細節(jié)!“外層查詢表小于子查詢表,則用exists,外層查詢表大于子查詢表,則用in,如果外層和子查詢表差不多,則愛用哪個用哪個。”
我想你已經看出來了,當fruits表數據很大的時候不適合用in,因為它最多會將fruits表數據全部遍歷一次。
如:suppliers表有10000條記錄,fruits表有1000000條記錄,那么最多有可能遍歷10000*1000000次,效率很差。
再如:suppliers表有10000條記錄,fruits表有100條記錄,那么最多有可能遍歷10000*100次,遍歷次數大大減少,效率大大提升。
但是:suppliers表有10000條記錄,fruits表有100條記錄,那么exists()還是執(zhí)行10000次,還不如使用in()遍歷10000*100次,因為in()是在內存里遍歷,而exists()需要查詢數據庫,我們都知道查詢數據庫所消耗的性能更高,而內存比較很快。
因此我們只需要記住口訣:“外層查詢表小于子查詢表,則用exists,外層查詢表大于子查詢表,則用in,如果外層和子查詢表差不多,則愛用哪個用哪個。”
和exists一樣,用到了suppliers上的id索引,exists()執(zhí)行次數為fruits.length,不緩存exists()的結果集。
因為not in實質上等于!= and != ···
,因為!=不會使用索引,故not in不會使用索引。
我們假設有100萬數據,s_id只有0和1兩個值,利用索引我們要先讀索引文件,然后二分查找,找到對應的數據磁盤指針,再根據讀到的指針在磁盤上對應的數據,影響結果集50萬,這種情況,和直接全表掃描哪個快顯而易見。
如果你s_id字段是一個unique,就會用到索引。
如果你一定要用索引,可以用force index,不過效率不會有改善一般還會更慢就是了。
合理使用索引,Cardinality是一個重要指標,太小的話跟沒建沒區(qū)別,還浪費空間。
因此,不管suppliers和fruits大小如何,均使用not exists效率會更高。
到此這篇關于MySQL中in和exists區(qū)別詳解的文章就介紹到這了,更多相關MySQL in和exists區(qū)別內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!