前言
索引是對數(shù)據(jù)庫中一或多個(gè)列值的排序,幫助數(shù)據(jù)庫高效獲取數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)
假如我們用類比的方法,數(shù)據(jù)庫中的索引就相當(dāng)于書籍中的目錄一樣,當(dāng)我們想找到書中的摸個(gè)知識點(diǎn),我們可以直接去目錄中找而不是在書中每頁的找,但是這也拋出了索引的一個(gè)缺點(diǎn),在對數(shù)據(jù)庫修改的時(shí)候要修改索引到導(dǎo)致時(shí)間變多。
但MySQL 索引你真的懂嗎?這幾道題帶你了解索引的幾個(gè)重要知識點(diǎn)
1. 什么是最左前綴原則?
以下回答全部是基于MySQL的InnoDB引擎
例如對于下面這一張表
![](http://img.jbzj.com/file_images/article/201905/201951991249157.jpg?201941991257)
如果我們按照 name 字段來建立索引的話,采用B+樹的結(jié)構(gòu),大概的索引結(jié)構(gòu)如下
![](http://img.jbzj.com/file_images/article/201905/201951991319347.jpg?201941991326)
如果我們要進(jìn)行模糊查找,查找name 以“張"開頭的所有人的ID,即 sql 語句為
select ID from table where name like '張%'
由于在B+樹結(jié)構(gòu)的索引中,索引項(xiàng)是按照索引定義里面出現(xiàn)的字段順序排序的,索引在查找的時(shí)候,可以快速定位到 ID 為 100的張一,然后直接向右遍歷所有張開頭的人,直到條件不滿足為止。
也就是說,我們找到第一個(gè)滿足條件的人之后,直接向右遍歷就可以了,由于索引是有序的,所有滿足條件的人都會聚集在一起。
而這種定位到最左邊,然后向右遍歷尋找,就是我們所說的最左前綴原則。
2. 為什么用 B+ 樹做索引而不用哈希表做索引?
1、哈希表是把索引字段映射成對應(yīng)的哈希碼然后再存放在對應(yīng)的位置,這樣的話,如果我們要進(jìn)行模糊查找的話,顯然哈希表這種結(jié)構(gòu)是不支持的,只能遍歷這個(gè)表。而B+樹則可以通過最左前綴原則快速找到對應(yīng)的數(shù)據(jù)。
2、如果我們要進(jìn)行范圍查找,例如查找ID為100 ~ 400的人,哈希表同樣不支持,只能遍歷全表。
3、索引字段通過哈希映射成哈希碼,如果很多字段都剛好映射到相同值的哈希碼的話,那么形成的索引結(jié)構(gòu)將會是一條很長的鏈表,這樣的話,查找的時(shí)間就會大大增加。
3. 主鍵索引和非主鍵索引有什么區(qū)別?
例如對于下面這個(gè)表(其實(shí)就是上面的表中增加了一個(gè)k字段),且ID是主鍵。
![](http://img.jbzj.com/file_images/article/201905/201951991412749.jpg?201941991419)
主鍵索引和非主鍵索引的示意圖如下:
![](http://img.jbzj.com/file_images/article/201905/201951991428130.jpg?201941991435)
其中R代表一整行的值。
從圖中不難看出,主鍵索引和非主鍵索引的區(qū)別是:非主鍵索引的葉子節(jié)點(diǎn)存放的是主鍵的值,而主鍵索引的葉子節(jié)點(diǎn)存放的是整行數(shù)據(jù),其中非主鍵索引也被稱為二級索引,而主鍵索引也被稱為聚簇索引。
根據(jù)這兩種結(jié)構(gòu)我們來進(jìn)行下查詢,看看他們在查詢上有什么區(qū)別。
1、如果查詢語句是 select * from table where ID = 100
,即主鍵查詢的方式,則只需要搜索 ID 這棵 B+樹。
2、如果查詢語句是 select * from table where k = 1
,即非主鍵的查詢方式,則先搜索k索引樹,得到ID=100,再到ID索引樹搜索一次,這個(gè)過程也被稱為回表。
現(xiàn)在,知道他們的區(qū)別了吧?
4. 為什么建議使用主鍵自增的索引?
對于這顆主鍵索引的樹
![](http://img.jbzj.com/file_images/article/201905/201951991523206.jpg?201941991530)
如果我們插入 ID = 650 的一行數(shù)據(jù),那么直接在最右邊插入就可以了
![](http://img.jbzj.com/file_images/article/201905/201951991546243.jpg?201941991554)
但是如果插入的是 ID = 350 的一行數(shù)據(jù),由于 B+ 樹是有序的,那么需要將下面的葉子節(jié)點(diǎn)進(jìn)行移動,騰出位置來插入 ID = 350 的數(shù)據(jù),這樣就會比較消耗時(shí)間,如果剛好 R4 所在的數(shù)據(jù)頁已經(jīng)滿了,需要進(jìn)行頁分裂操作,這樣會更加糟糕。
但是,如果我們的主鍵是自增的,每次插入的 ID 都會比前面的大,那么我們每次只需要在后面插入就行, 不需要移動位置、分裂等操作,這樣可以提高性能。也就是為什么建議使用主鍵自增的索引。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對腳本之家的支持。
您可能感興趣的文章:- Mysql數(shù)據(jù)庫索引面試題(程序員基礎(chǔ)技能)
- 幾個(gè)MySQL高頻面試題的解答
- 2019最新21個(gè)MySQL高頻面試題介紹
- 三道MySQL新手入門面試題,通往自由的道路