完美世界小说txt下载,欢乐颂第一季免费阅读,网络小说排行榜

主頁 > 知識庫 > Sql Server查詢性能優(yōu)化之不可小覷的書簽查找介紹

Sql Server查詢性能優(yōu)化之不可小覷的書簽查找介紹

小小程序猿SQL Server認知的成長
1.沒畢業(yè)或工作沒多久，只知道有數(shù)據(jù)庫、SQL這么個東東，渾然分不清SQL和Sql Server Oracle、MySql的關系，通常認為SQL就是SQL Server
2.工作好幾年了，也寫過不少SQL，卻渾然不知道索引為何物，只知道數(shù)據(jù)庫有索引這么個東西，分不清聚集索引和非聚集索引，只知道查詢慢了建個索引查詢就快了，到頭來索引也建了不少，查詢也確實快了，偶然問之：汝建之索引為何類型？答曰：。。。
3.終于受到刺激開始奮發(fā)圖強，買書，gg查資料終于知道原來索引分為聚集索引和非聚集索引，頓時淚流滿面，嗚呼哀哉，吾終知索引為何物也。
4.再進一步學習之亦知聚集索引為物理索引、非聚集索引為邏輯索引，聚集索引為數(shù)據(jù)的存儲順序，非聚集索引是邏輯索引既對聚集索引的索引
5.再往后學會了查看執(zhí)行計劃，通過查詢計劃終于對查詢過程有了大概了解，也知道了聚集索引掃描和表掃描沒有用到索引，看到聚集索引、索引查找高興的眉飛色舞，看到RID、鍵查找暗自竊喜，瞧，鍵查找肯定就是關鍵字查找了，用著索引呢，效率肯定高，于是每次寫完sql都要觀看下其執(zhí)行計劃，表掃描的干貨統(tǒng)統(tǒng)不要，俺只要索引查找、鍵查找。
6.自信滿滿的過著悠哉的小日子，突然有一天迷茫了，為嘛俺明明在這個字段上建立了索引，它她妹的老給我顯示聚集索引掃描的，難道查詢優(yōu)化器發(fā)燒了，實際執(zhí)行下，發(fā)現(xiàn)實際的執(zhí)行計劃還是表掃描，這下徹底迷惑了，興許是查詢優(yōu)化器顯示的有問題吧。
7.繼續(xù)深入學習終發(fā)現(xiàn)，數(shù)據(jù)庫這潭水太深了，了解的太片面了，想想從猿到人的進化過程吧，恩恩，現(xiàn)在就是一個靈智初開的程序猿，向著偉大的程序員奮勇前進
恩恩，跑題了，進入我們的主題：數(shù)據(jù)庫的書簽查找
認識書簽查找
書簽查找這個詞可能對于很多開發(fā)人員比較陌生，很多人都遇到過，但是卻沒引起足夠的重視以至于一直都忽略它的存在了
定義：當查詢優(yōu)化器使用非聚集索引進行查找時，如果所選擇的列或查詢條件中的列只部分包含在使用的非聚集索引和聚集索引中時，就需要一個查找（lookup）來檢索其他字段來滿足請求。對一個有聚簇索引的表來說是一個鍵查找（key lookup），對一個堆表來說是一個RID查找（RID lookup），這種查找即是——書簽查找(bookmark lookup)。簡單的說就是當你使用的sql查詢條件和select返回的列沒有完全包含在索引列中時就會發(fā)生書簽查找。
書簽查找的重要性
1.書簽查找發(fā)生條件：只有在使用非聚集索引進行數(shù)據(jù)查找時才會產(chǎn)生書簽查找，聚集索引查找、聚集索引掃描和表掃描不會發(fā)生書簽查找。
2.書簽查找發(fā)生頻率：書簽查找發(fā)生頻率非常高，甚至可以說大部分查詢都會發(fā)生書簽查找，我們知道一個表只能建立一個聚集索引，所以我們的查詢更多的會使用非聚集索引，非聚集索引不可能覆蓋所有的查詢列，所以會經(jīng)常性產(chǎn)生書簽查找。
3.書簽查找的影響：導致索引失效的主要原因之一。書簽查找根據(jù)索引的行定位器從表中讀取數(shù)據(jù)，除了索引頁面的邏輯讀取外，還需要數(shù)據(jù)頁面的邏輯讀取，如果查詢的結(jié)果返回數(shù)據(jù)量較大會導致大量的邏輯讀或者索引失效，這也是為什么我們查看查詢計劃時有時明明在查詢列上建立了索引，查詢優(yōu)化器卻依然使用表掃描的原因。
4.如何消除書簽查找:
　　1.使用聚集索引查找，聚集索引的葉子節(jié)點就是數(shù)據(jù)行本身，因此不存在書簽查找
　　2.聚集索引掃描、表掃描，說白了就是啥索引都不建直接全表掃描，肯定不會發(fā)生書簽查找，不過效率嗎。。。
　　3.使用非聚集索引的鍵列包含所有查詢或返回的列，這個不靠譜，非聚集索引最大鍵列數(shù)為16，最大索引鍵大小為900字節(jié)，就算你有勇氣在16列上全部建立索引，那如果表的列數(shù)超過16列了你咋辦，還有索引列長度之和不能超過900字節(jié)，所以不可能讓非聚集索引包含所有列，而且索引涉及到得列越多維護索引的開銷也就越大。
　　4.使用include，嗯，這是個好東東，索引做到只能包含16列且不能超過900字節(jié)，include不受此限制，最多可以包含1023列怎么也夠你用了，而且對長度也沒有限制你可以隨心所欲的包含nvarchar(max)這也的列，當然了text之流就不要考慮了
　　5.其它，其它還有神馬呢，這個我也不知道了，估計應該、可能、大概木有了吧，若有知道的兄弟可以告訴我聲哈

可能上面說的有點抽象，我們開看看具體的例子
一般我們的數(shù)據(jù)庫都會建上聚集索引(一般大家喜歡建表時有用沒有肯定先來個自增ID列當主鍵，這個主鍵SQL Server默認就給你創(chuàng)建成聚集索引了)，故我們這里都假設表上已經(jīng)建立了聚集索引，不考慮堆表(就是沒有聚集索引的表)

1.首先創(chuàng)建表Users、插入一些示例數(shù)據(jù)并建立聚集索引PK_UserID 非聚集索引IX_UserName

復制代碼代碼如下:

 
--懶得的肥兔 --創(chuàng)建表Users 
Create table Users 
( 
UserID int identity, 
UserName nvarchar(50), 
Age int, 
Gender bit, 
CreateTime datetime 
) 
--在UserID列創(chuàng)建聚集索引PK_UserID 
create unique clustered index PK_UserID on Users(UserID) 
--在UserName創(chuàng)建非聚集索引IX_UserName 
create index IX_UserName on Users(UserName) 

--插入示例數(shù)據(jù) 
insert into Users(UserName,Age,Gender,CreateTime) 
select N'Bob',20,1,'2012-5-1' 
union all 
select N'Jack',23,0,'2012-5-2' 
union all 
select N'Robert',28,1,'2012-5-3' 
union all 
select N'Janet',40,0,'2012-5-9' 
union all 
select N'Michael',22,1,'2012-5-2' 
union all 
select N'Laura',16,1,'2012-5-1' 
union all 
select N'Anne',36,1,'2012-5-7' 

2.執(zhí)行以下查詢并查看查詢計劃，可以看到第一個SQL執(zhí)行聚集索引掃描，第二個SQL執(zhí)行聚集索引查找都沒有使用到書簽查找

復制代碼代碼如下:

 
select * from Users 
select * from Users where UserID=4 

3.比較以下幾個查詢SQL，觀察其查詢計劃，思考下為什么會發(fā)生書簽查找

復制代碼代碼如下:

 
--查詢1:使用索引IX_UserName，選擇列UserID,UserName，查詢條件列為UserName 
select UserID,UserName from Users with(index(IX_UserName)) where UserName='Robert' 

--查詢2:使用索引IX_UserName，選擇列UserID,UserName,Age，查詢條件列為UserName 
select UserID,UserName,Age from Users with(index(IX_UserName)) where UserName='Robert' 

--查詢3:使用索引IX_UserName，選擇列UserID,UserName，查詢條件列為UserName,Age 
select UserID,UserName from Users with(index(IX_UserName)) where UserName='Robert' and Age=28 

--查詢4:使用索引IX_UserName，選擇列所有列，查詢條件列為UserName 
select * from Users with(index(IX_UserName)) where UserName='Robert' 

分析:

　　查詢1:選擇的列UserID是聚集索引PK_UserID的鍵列,UserName為索引IX_UserName的鍵列，查詢條件列為UserName，由于索引IX_UserName包含了查詢用到得所有列，所以僅需要掃描索引即可返回查詢結(jié)果，不需要再額外的去數(shù)據(jù)頁獲取數(shù)據(jù)，故不會發(fā)生書簽查找

　　查詢2:選擇列Age不包含在聚集索引PK_UserID和IX_UserName中，故需要進行額外的書簽查找

　　查詢3:查詢條件Age列不包含在聚集索引PK_UserID和IX_UserName中，故需要進行額外的書簽查找

　　查詢4:包含了所有的列，Age、Gender、CreateTime列均不在聚集索引PK_UserID和IX_UserName中，所以需要書簽查找以定位數(shù)據(jù)

　這里解釋下：查詢中用到的列無論是一列還是多列不在索引覆蓋范圍查詢開銷基本上一樣，每條記錄均只需要一次書簽查找開銷，不會說因為查詢3只有一個Age列，查詢4有Age、Gender、CreateTime 3列不在索引覆蓋范圍而導致額外的開銷　

分析:
　　查詢1:選擇的列UserID是聚集索引PK_UserID的鍵列,UserName為索引IX_UserName的鍵列，查詢條件列為UserName，由于索引IX_UserName包含了查詢用到得所有列，所以僅需要掃描索引即可返回查詢結(jié)果，不需要再額外的去數(shù)據(jù)頁獲取數(shù)據(jù)，故不會發(fā)生書簽查找
　　查詢2:選擇列Age不包含在聚集索引PK_UserID和IX_UserName中，故需要進行額外的書簽查找
　　查詢3:查詢條件Age列不包含在聚集索引PK_UserID和IX_UserName中，故需要進行額外的書簽查找
　　查詢4:包含了所有的列，Age、Gender、CreateTime列均不在聚集索引PK_UserID和IX_UserName中，所以需要書簽查找以定位數(shù)據(jù)

　這里解釋下：查詢中用到的列無論是一列還是多列不在索引覆蓋范圍查詢開銷基本上一樣，每條記錄均只需要一次書簽查找開銷，不會說因為查詢3只有一個Age列，查詢4有Age、Gender、CreateTime 3列不在索引覆蓋范圍而導致額外的開銷　　

書簽查找是怎么發(fā)生的

和許多人一樣看到大神們畫的二叉樹索引結(jié)構(gòu)圖就腦袋大，看得云里霧里，所以這里我們以表Users為例來說聚集索引(PK_UserID)和非聚集索引(IX_UserName)的結(jié)構(gòu)可以簡單的表示為下圖

首先我們來看聚集索引PK_UserID，對于聚集索引來說數(shù)據(jù)行就是其葉子節(jié)點，故當執(zhí)行聚集索引查找時找到了具體的鍵值后就可以直接去葉子節(jié)點獲取所有需要的數(shù)據(jù)不需要進行額外的邏輯讀，比如select * from Users where UserID=2,根據(jù)值2在索引PK_UserID中找到UserID為2的值后去葉子節(jié)點就可以拿到所需數(shù)據(jù)，然后返回查詢結(jié)果

然后看非聚集索引IX_UserName，上面我們說過非聚集索引覆蓋的列為非聚集索引的鍵列+包含的列+聚集索引的鍵列,對于IX_UserName來說就是如圖中所示鍵列UserName保存在索引的二叉樹節(jié)點中，聚集索引的列包含在其葉子節(jié)點中，這也就形成了對列(UserName,UserID)的覆蓋，對于查詢1(select UserID,UserName from Users with(index(IX_UserName)) where UserName='Robert')來說查詢只用到了UserName,UserID列，這樣只需要掃描索引IX_UserName即可拿到所有數(shù)據(jù)然后進行結(jié)果返回，而對于查詢2、查詢3來說由于需要用到Age列，而索引IX_UserName中并沒有包含Age列，這時就需要個書簽查找(bookmark lookup)根據(jù)葉節(jié)點中的RowID去定位到具體的數(shù)據(jù)行獲取Age列值，對于示例查詢來說先根據(jù)索引IX_UserName定位Robert所在行，然后根據(jù)RowID=3去數(shù)據(jù)表里獲取Age值，然后完成查詢，對于查詢4來說需要更多的列(Age,Gender,CreateTime)，同樣定位到Robert所在行RowID=3，去數(shù)據(jù)表一次性拿到Age,Gender,CreateTime數(shù)據(jù)然后返回，這樣就形成了書簽查找(查詢計劃中顯示為鍵查找或RID查找)

書簽查找的對查詢性能的影響
--這是我們現(xiàn)在使用的索引create index IX_UserName on Users(UserName)

打開IO統(tǒng)計并執(zhí)行下面兩個查詢

復制代碼代碼如下:

 
--set statistics io onselect * from Users where UserName like 'ja%'select * from Users with(index(IX_UserName)) where UserName like 'ja%' 

兩個查詢都返回2條數(shù)據(jù)，聚集索引掃描僅僅2次邏輯讀，使用索引IX_UserName卻達到了6次的邏輯讀

我們示例的數(shù)據(jù)量比較小，所以感受不明顯，不過我們卻也看到了我們在UserName列上市建立了索引 IX_UserName，默認情況下查詢優(yōu)化器并沒有使用我們的索引，而是選擇了表掃描，僅僅需要2次邏輯讀就拿到了我們需要的數(shù)據(jù)，在我們使用索引提示強制查詢優(yōu)化器使用索引IX_UserName后，同樣也是返回2條數(shù)據(jù)，邏輯讀缺達到了驚人的6次，看查詢計劃使用IX_UserName后發(fā)生了書簽查找，而這個開銷主要是有書簽查找造成的，而且隨著我們返回數(shù)據(jù)量的增加，由書簽查找導致的邏輯讀將會成直線上升，造成的結(jié)果就是查詢開銷比進行全表掃描還要大的多，最終導致索引失效

使用覆蓋索引避免書簽查找

覆蓋索引是指非聚集索引上的列(鍵列+包含列) + 聚集索引的鍵列包含了查詢中用到的所有列，對于索引IX_UserName來說索引覆蓋列就是(UserName,UserID)。若查詢中只用到了索引所覆蓋的列，那么只需掃描索引即可完成查詢，若用到了索引覆蓋范圍以外的列就需要書簽查找來獲取數(shù)據(jù)，當這種查找發(fā)生次較多時就會導致索引失效從而導致表掃描，因為查詢優(yōu)化器是基于開銷的優(yōu)化器，當其發(fā)現(xiàn)使用非聚集索引引發(fā)的書簽查找開銷比表掃描開銷還大時就會放棄使用索引，轉(zhuǎn)向表掃描。

1.在UserName,Age列上重建索引IX_UserName，這時對于索引IX_UserName來說覆蓋列變?yōu)?UserName,Age,UserID)，再次執(zhí)行上面的查詢SQL可以發(fā)現(xiàn)查詢計劃已經(jīng)發(fā)生變化

復制代碼代碼如下:

drop index IX_UserName on Userscreate index IX_UserName on Users(UserName,Age)

我們可以看到查詢2、查詢3的書簽查找已經(jīng)消失，因為索引IX_UserName包含了查詢中用到得所有列(UserID,UserName,Age)，查詢4因為選擇返回所有列我們的索引沒有包含Gender和CreateTime列，故還是會進行書簽查找

這時索引IX_UserName結(jié)構(gòu)表示如下

可見對于查詢2、查詢3僅僅通過索引IX_UserName既可以拿到需要的列UserName,Age,UserID，而對于查詢4索引并沒有全部覆蓋還是需要進行書簽查找

2.繼續(xù)修改我們的索引IX_UserName，使用include包含非鍵列(鍵列就是索引上的列，非鍵列就是索引之外的列，對于include來說就是存放于非聚集索引葉子節(jié)點上的列,聚集索引的列也放在非聚集索引的葉子節(jié)點上)

復制代碼代碼如下:

 
drop index IX_UserName on Userscreate index IX_UserName on Users(UserName,Age) include(Gender,CreateTime) 

可以看到我們修改索引使用include包含了Gender,CreateTime后，索引IX_UserName達到了對數(shù)據(jù)表Users的所有列的全覆蓋,這時候毫無疑問的查詢2、查詢3沒有出現(xiàn)書簽查找，查詢4的書簽查找也消失了。

此時索引IX_UserName 結(jié)構(gòu)如下

索引IX_UserName已經(jīng)達到了對Users表的全覆蓋，對于我們的查詢2、查詢3、查詢4來說，僅通過索引IX_UserName即可完成查詢，不需要進行書簽查找。

這時我們再來看一下這兩個查詢的開銷及查詢計劃，可以看到不需要我們進行索引提示，查詢優(yōu)化器已經(jīng)自動選擇了我們的索引，邏輯讀也降至了2次

select * from Users where UserName like 'ja%'select * from Users with(index(IX_UserName)) where UserName like 'ja%'

關于Include請參考 SQL Server 索引中include的魅力（具有包含性列的索引）

　　這里說明下書簽查找對查詢性能有著較大的影響并且基本上不可避免，這并不意味著書簽查找就是洪水猛獸，原來我們不是也不知道啥叫書簽查找么，查詢性能一樣也不差，是吧，呵呵。書簽查找也說明了為什么我們不推薦寫sql時使用select *，也解釋了為什么有時候我們的索引會失效，同時可以作為優(yōu)化查詢性能考慮的一個方面，在設計表和索引時盡量規(guī)避書簽查找?guī)淼呢撁嬗绊?，比如非聚集索引盡量選擇高選擇性的列即返回盡量少的行，需要大批量數(shù)據(jù)查詢時盡量使用聚集索引等?！　?

　　本文中為了便于演示僅僅使用了有幾條數(shù)據(jù)的表，而且查詢中為了使用索引都用了索引提示，實際開發(fā)中請不要使用索引提示，查詢優(yōu)化器大多數(shù)情況下會為我們生成最優(yōu)(最優(yōu)不代表開銷最小，只要開銷足夠小即認為最優(yōu))的執(zhí)行計劃，索引結(jié)構(gòu)里面用到得RowID也僅僅是為了演示虛構(gòu)出來的，我們只要認為它是對于數(shù)據(jù)行的一個標識位就行了。

　　此文旨在讓我們認識書簽查找并意識到書簽查找的意義，從而對于索引失效原因有清晰的認識，更好的理解查詢計劃。

您可能感興趣的文章:

SQL Server里書簽查找的性能傷害

標簽：新余金昌貸款群呼黃山河源宜春中衛(wèi) 濟寧

巨人網(wǎng)絡通訊聲明：本文標題《Sql Server查詢性能優(yōu)化之不可小覷的書簽查找介紹》，本文關鍵詞 Sql,Server,查詢,性能,優(yōu)化,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡，涉及言論、版權(quán)與本站無關。