正在看的db2教程是:在DB2中提高INSERT性能的技巧(1)。INSERT 處理過程概述
首先讓我們快速地看看插入一行時(shí)的處理步驟。這些步驟中的每一步都有優(yōu)化的潛力,對此我們在后面會一一討論。
- 在客戶機(jī)準(zhǔn)備 語句。對于動態(tài) SQL,在語句執(zhí)行前就要做這一步,此處的性能是很重要的;對于靜態(tài) SQL,這一步的性能實(shí)際上關(guān)系不大,因?yàn)檎Z句的準(zhǔn)備是事先完成的。
- 在客戶機(jī),將要插入的行的各個(gè) 列值組裝起來,發(fā)送到 DB2 服務(wù)器。
- DB2 服務(wù)器確定將這一行插入到哪一頁中。
- DB2 在 用于該頁的緩沖池中預(yù)留一個(gè)位置。如果 DB2 選定的是一個(gè)已有的頁,那么就需要讀磁盤;如果使用一個(gè)新頁,則要在表空間(如果是SMS,也就是系統(tǒng)管理存儲的表空間)中為該頁物理地分配空間。插入了新行的每一頁最后都要從緩沖池寫入到磁盤。
- 在目標(biāo)頁中對該行進(jìn)行格式化,并獲得該行上的一個(gè)X(exclusive,獨(dú)占的) 行鎖。
- 將反映該 insert 的一條記錄寫入到日志緩沖區(qū)中。
- 最后提交包含該 insert 的事務(wù),如果這時(shí)日志緩沖區(qū)中的記錄還沒有被寫入日志文件的話,則將這些記錄寫到日志文件中。
此外,還可能發(fā)生很多類型的附加處理,這取決于數(shù)據(jù)庫配置,例如,索引或觸發(fā)器的存在。這種額外的處理對于性能來說也是意義重大的,我們在后面會討論到。
insert 的替代方案
在詳細(xì)討論 insert 的優(yōu)化之前,讓我們先考慮一下 insert 的兩種替代方案:load 和 import。import 實(shí)用程序?qū)嶋H上是 SQL INSERT 的一個(gè)前端,但它的某些功能對于您來說也是有用的。load 也有一些有用的額外功能,但是我們使用 load 而不使用 insert 的主要原因是可以提高性能。
load 直接格式化數(shù)據(jù)頁,而避免了由于插入導(dǎo)致的對每一行進(jìn)行處理的大部分開銷(例如,日志記錄在這里實(shí)際上是消除了)。而且,load 可以更好地利用多處理器機(jī)器上的并行性。在 V8 load 中有兩個(gè)新功能,它們對于 load 成為 insert 的替代方案有著特別的功效,這兩個(gè)功能是:從游標(biāo)裝載和從調(diào)用層接口(CLI)應(yīng)用程序裝載。
從游標(biāo)裝載
這種方法可用于應(yīng)用程序的程序代碼(通過 db2Load API),或用于 DB2 腳本。下面是后一種情況的一個(gè)例子:
declare staffcursor cursor forselect * from staff;
load from staffcursor of cursor insert into myschema.new_staff;
這兩行可以用下面一行替代:
insert into myschema.new_staff select * from staff
同等效的 INSERT ... SELECT 語句相比,從游標(biāo)裝載幾乎可以提高 20% 的性能。
從 CLI 裝載
這種方法顯然只限于調(diào)用層接口(CLI)應(yīng)用程序,但是它非???。這種技巧非常類似于數(shù)組插入,DB2 附帶了這樣的示例,使用 load 時(shí)的速度是使用經(jīng)過完全優(yōu)化的數(shù)組插入時(shí)的兩倍,幾乎要比未經(jīng)優(yōu)化的數(shù)組插入快 10 倍。
所有 insert 可以改進(jìn)的地方
讓我們看看插入處理的一些必要步驟,以及我們可以用來優(yōu)化這些步驟的技巧。
1. 語句準(zhǔn)備
作為一條 SQL 語句,INSERT 語句在執(zhí)行之前必須由 DB2 進(jìn)行編譯。這一步驟可以自動發(fā)生(例如在 CLP 中,或者在一次 CLI SQLExecDirect 調(diào)用中),也可以顯式地進(jìn)行(例如,通過一條 SQL Prepare、CLI SQLPrepare 或 JDBC prepareStatement 語句)。該編譯過程牽涉到授權(quán)檢查、優(yōu)化,以及將語句轉(zhuǎn)化為可執(zhí)行格式時(shí)所需的其他一些活動。在編譯語句時(shí),語句的訪問計(jì)劃被存儲在包緩存中。
如果重復(fù)地執(zhí)行相同的 INSERT 語句,則該語句的訪問計(jì)劃(通常)會進(jìn)入到包緩存中,這樣就免除了編譯的開銷。然而,如果 insert 語句對于每一行有不同的值,那么每一條語句都將被看成是惟一的,必須單獨(dú)地進(jìn)行編譯。因此,將像下面這樣的重復(fù)語句:
insert into mytable values (1, 'abc')
insert into mytable values (2, 'def')
等等,
換成帶有參數(shù)標(biāo)記的語句,一次準(zhǔn)備,重復(fù)執(zhí)行,這樣做是十分可取的:
insert into mytable values (?, ?)
使用參數(shù)標(biāo)記可以讓一系列的 insert 的運(yùn)行速度提高數(shù)倍。(在靜態(tài) SQL 程序中使用主機(jī)變量也可以獲得類似的好處。)
2. 發(fā)送列值到服務(wù)器
可以歸為這一類的優(yōu)化技巧有好幾種。最重要的一種技巧是在每條 insert 語句中包括多行,這樣就可以避免對于每一行都進(jìn)行客戶機(jī)-服務(wù)器通信,同時(shí)也減少了 DB2 開銷??捎糜诙嘈胁迦氲募记捎校?