這篇文章主要介紹了我是如何把ruby gem contracts.ruby速度提升10倍的。
contracts.ruby在我項(xiàng)目里用來添加代碼合約(code contracts)到Ruby中??雌饋聿畈欢嗍沁@樣的:
Contract Num, Num => Num
def add(a, b)
a + b
end
只要add方法被調(diào)用,參數(shù)和返回值都會(huì)被檢查。
20秒
本周末,我對(duì)該庫進(jìn)行了測(cè)試,發(fā)現(xiàn)其性能非常糟:
![](http://img.jbzj.com/file_images/article/201504/2015410153558748.jpg?2015310153613)
這是在隨機(jī)輸入下,運(yùn)行1000次以后的結(jié)果。
所以,當(dāng)給一個(gè)函數(shù)加入合約功能后,運(yùn)行速度明顯下降(約40倍這樣),對(duì)此,我進(jìn)行了深入的研究。
8秒
我取得了較大的進(jìn)展,當(dāng)傳遞合約時(shí),我調(diào)用success_callback函數(shù),該函數(shù)是個(gè)空函數(shù),下面是這個(gè)函數(shù)的整個(gè)定義:
def self.success_callback(data)
end
原來函數(shù)調(diào)用在Ruby中是非常昂貴的,僅刪除這個(gè)調(diào)用,就節(jié)省了8秒鐘:
刪除其它一些附件函數(shù)的調(diào)用,時(shí)間花費(fèi)開始從9.84-> 9.59-> 8.01秒,該庫的速度馬上提升到以前的兩倍了。
現(xiàn)在,事情變的有點(diǎn)復(fù)雜了。
5.93秒
這里有許多年種定義一個(gè)合約的方式:匿名(lambdas)、類 (classes)、簡單舊數(shù)據(jù)(plain ol' values)等。 我有個(gè)很長的case語句,用來檢測(cè)合約的類型。在此合約類型基礎(chǔ)之上,我可以做不同的事情。通過把它改為if語句,我節(jié)約了一些時(shí)間,但每次調(diào)用這個(gè)函數(shù)時(shí),我仍然耗費(fèi)了不必要的時(shí)間在仔細(xì)檢查這個(gè)判定樹上面:
if contract.is_a?(Class)
# check arg
elsif contract.is_a?(Hash)
# check arg
...
當(dāng)定義合約和構(gòu)建lambda時(shí),對(duì)樹只做一次檢查:
if contract.is_a?(Class)
lambda { |arg| # check arg }
elsif contract.is_a?(Hash)
lambda { |arg| # check arg }
然后,我將完全繞過邏輯分支,通過將參數(shù)傳遞給預(yù)計(jì)算的lambda來進(jìn)行驗(yàn)證,這樣就節(jié)約了1.2秒時(shí)間。
![](http://img.jbzj.com/file_images/article/201504/2015410153721524.jpg?2015310153734)
預(yù)計(jì)算一些其它的If語句,差不多又節(jié)省了1秒時(shí)間:
![](http://img.jbzj.com/file_images/article/201504/2015410153747882.jpg?201531015384)
5.09秒
將.zip轉(zhuǎn)換為.times又為我節(jié)省了1秒時(shí)間:
![](http://img.jbzj.com/file_images/article/201504/2015410153823207.jpg?2015310153838)
結(jié)果證明:
args.zip(contracts).each do |arg, contract|
上面的代碼要比下面這個(gè)慢:
args.each_with_index do |arg, i|
要比下面這個(gè)更慢:
.zip要花費(fèi)不必要的時(shí)間復(fù)制和創(chuàng)建新的數(shù)組。而我認(rèn)為,.each_with_index之所以慢,是因?yàn)樗苤朴诒澈蟮?each,所以它涉及到兩個(gè)限制而不是一個(gè)。
4.23秒
下面再看些細(xì)節(jié)的東西,contracts庫在工作時(shí),它會(huì)為每一個(gè)方法添加class_eval(class_eval要比define_method快)的新方法,這個(gè)新方法里有一個(gè)對(duì)老方法的引用,當(dāng)調(diào)用新方法時(shí),它會(huì)檢查參數(shù),然后根據(jù)參數(shù)調(diào)用老方法,然后再檢查返回值,并且返回值。所有這些都會(huì)調(diào)用Contract class的check_args和check_result兩個(gè)方法。我取消了這兩個(gè)方法的調(diào)用,并且對(duì)新方法進(jìn)行正確檢查,結(jié)果又節(jié)省了0.9秒:
![](http://img.jbzj.com/file_images/article/201504/2015410153859686.jpg?2015310153913)
2.94秒
在上面,我已經(jīng)解釋了如何基于Contract類型創(chuàng)建lambda,然后使用這些來檢驗(yàn)參數(shù)?,F(xiàn)在,我換了種方法,用生成代碼來替代,當(dāng)我使用class_eval創(chuàng)建新方法時(shí),它就會(huì)從eval中獲得結(jié)果。一個(gè)可怕的漏洞,但它避免了一大堆方法調(diào)用,并且節(jié)省了1.25秒:
![](http://img.jbzj.com/file_images/article/201504/2015410153935485.jpg?2015310153951)
1.57秒
最后,我改變了調(diào)用重寫方法的方式,我先前是使用引用:
# simplification
old_method = method(name)= method(name)
class_eval %{%{
def #{name}(*args)def #{name}(*args)
old_method.bind(self).call(*args).bind(self).call(*args)
endend
}}
我進(jìn)行了修改,并使用alias_method方法:
alias_method :"original_#{name}", name:"original_#{name}", name
class_eval %{%{
def #{name}(*args)def #{name}(*args)
self.send(:"original_#{name}", *args)self.send(:"original_#{name}", *args)
endend
}}
驚喜,又節(jié)省了1.4秒。我不知道為什么aliaa_method會(huì)如此地快,我猜是因?yàn)樗^了一個(gè)方法的調(diào)用和綁定到.bindbind。
![](http://img.jbzj.com/file_images/article/201504/2015410154007723.jpg?2015310154022)
結(jié)果
我們成功的將時(shí)間從20秒優(yōu)化到1.5秒,我不認(rèn)為還有比這更好的結(jié)果的了。我所編寫的 這個(gè)測(cè)試腳本表明,一個(gè)被封裝過的add方法要比常規(guī)的add方法慢3倍,所以這些數(shù)字已經(jīng)足夠好了。
想要驗(yàn)證上面的結(jié)論很簡單,大量的時(shí)間花在調(diào)用方法上是只慢3倍的原因,這里有個(gè)更現(xiàn)實(shí)的例子:一個(gè)函數(shù)讀一個(gè)文件100000次:
![](http://img.jbzj.com/file_images/article/201504/2015410154044692.jpg?2015310154055)
稍微慢了點(diǎn)!add函數(shù)是個(gè)例外,我決定不再使用alias_method方法,因?yàn)樗廴玖嗣臻g,并且這些別名函數(shù)會(huì)到處出現(xiàn)(文檔、IDE的自動(dòng)完成等)。
其它原因:
在Ruby中調(diào)用方法很慢,我喜歡將代碼模塊化和重復(fù)使用,但或許是時(shí)候?qū)⒏嗟拇a進(jìn)行內(nèi)聯(lián)了。
測(cè)試你的代碼!刪掉一個(gè)簡單的未使用的方法時(shí)間從20秒縮短到了12秒。
其它嘗試
1.方法選擇器
Ruby 2.0里缺少方法選擇器這一特性,否則你還可以這樣寫:
class Foo Foo
def bar:beforedef bar:before
# will always run before bar, when bar is called# will always run before bar, when bar is called
endend
def bar:afterdef bar:after
# will always run after bar, when bar is called# will always run after bar, when bar is called
# may or may not be able to access and/or change bar's return value# may or may not be able to access and/or change bar's return value
endend
endend
這樣可能會(huì)更加容易編寫decorator,并且運(yùn)行速度也會(huì)加快。
2.關(guān)鍵字old
Ruby 2.0里缺乏的另一特性是引用重寫方法:
class Foo Foo
def bardef bar
'Hello''Hello'
endend
end end
class Fooclass Foo
def bardef bar
old + ' World'+ ' World'
endend
endend
Foo.new.bar # => 'Hello World'Foo.new.bar # => 'Hello World'
3.使用redef重新定義方法:
Matz曾說過:
為了消除alias_method_chain,我們引入了Module#prepend,prepend前面加#號(hào),這樣就沒機(jī)會(huì)在語言里加入冗余特性。
所以如果redef是冗余特征,也許prepend可以用來寫decorator?
4.其它實(shí)現(xiàn)
目前為止,這些都已經(jīng)在YARV做過測(cè)試。
您可能感興趣的文章:- 詳解Ruby中的異常
- 在Ruby中處理文件的輸入和輸出的教程
- Ruby中操作文件的方法介紹