前言
去年我參加了很多次會議,其中八次會議里我進(jìn)行了相關(guān)發(fā)言,這其中我多次談到了 PHP 的引用問題,因為很多人對它的理解有所偏差。在深入討論這個問題之前,我們先回顧一下引用的基本概念,明確什么是“引用傳遞”。
在 PHP 中引用意味著用不同的名字訪問同一個變量內(nèi)容,不論你用哪個名字對變量做出了運算,其他名字訪問的內(nèi)容也將改變。
讓我們通過代碼來加深對此的理解。 首先我們寫幾個簡單的語句,把一個變量賦值給另一個變量,并且改變另一個變量:
?php
$a = 23;
$b = $a;
$b = 42;
var_dump($a); // int(23)
var_dump($b); // int(42)
這個腳本顯示 $a 值仍然為 23 ,而 $b 則等于 42 。出現(xiàn)這個情況的原因是我們得到的是一個拷貝(具體發(fā)生了什么稍后講解。。。)現(xiàn)在我們使用引用來做同樣的事情:
?php
$a = 23;
$b = $a;
$b = 42;
var_dump($a); // int(42)
var_dump($b); // int(42)
?>
現(xiàn)在 $a 的值也改變成了 42 。 事實上,$a 和 $b 之間沒有任何區(qū)別,它們都使用了同一個變量容器(又名: zval )。 將這兩者分開的唯一方法是使用 unset() 函數(shù)銷毀其中任何一個變量。
在 PHP 中,引用不僅能用在普通語句中,還能用于函數(shù)參數(shù)和返回值:
?php
function foo($param) {
$param = 42;
return $param;
}
$a = 23;
echo "\$a before calling foo(): $a\n";
$b = foo($a);
echo "\$a after the call to foo(): $a\n";
$b = 23;
echo "\$a after touching the returned variable: $a\n";
?>
你認(rèn)為上面的結(jié)果是什么呢?—— 沒錯,就像下面這樣:
$a before calling foo(): 23
$a after the call to foo(): 42
$a after touching the returned variable: 42
這里我們初始化了一個變量,并把它作為一個引用參數(shù)傳給了一個函數(shù)。函數(shù)改變了它,它有了新值。該函數(shù)返回同一個變量,我們更改了返回的變量和它的原始值。。。 等等!它沒變,不是嗎!? —— 沒錯,可引用就是這樣。 具體發(fā)生了如下事情:該函數(shù)返回了一個引用,引用了 $a 的變量容器 zval,并且通過 = 賦值操作符為它創(chuàng)建了一個副本。
為了修復(fù)這個問題,我們需要添加一個額外的 操作符:
結(jié)果和我們所期望的一樣:
$a before calling foo(): 23
$a after the call to foo(): 42
$a after touching the returned value: 23
總結(jié)一下: PHP 的引用就是同一個變量的別名,想要正確的使用它們可能很難。想要詳細(xì)了解引用計數(shù),這里有份基礎(chǔ)資料,請參閱 手冊中的引用計數(shù)基本知識 。
PHP 5 發(fā)布時最大的變動是『對象處理方式』。一般我們理解為:
在 PHP 4 中,對象被當(dāng)成變量來對待,所以當(dāng)對象作為函數(shù)傳參時,他們是被復(fù)制的。但在 PHP 5 中,他們永遠(yuǎn)是『引用傳參』。
以上的理解并不完全正確。其主要目的是遵循『面對對象模式』:對象傳參給函數(shù)或者方法后,這個函數(shù)發(fā)送一個指令給對象(例如調(diào)用了一個方法)以此來改變對象的狀態(tài)(例如對象的屬性)。因此傳參進(jìn)去的對象必須為同一個。 PHP 4 的面對對象用戶使用『引用傳參』來解決這個問題,不過很難做到完美。PHP 5 引進(jìn)了獨立于變量容器的『對象存儲器』。當(dāng)一個對象賦值給變量時,變量不再存儲整個對象(屬性表和其他的『類』信息),而是存儲這個對象所在 存儲器的引用 —— 當(dāng)我們復(fù)制一個對象變量時,我們復(fù)制的是這個『存儲器的引用』。這很容易被誤解為『引用』,但是『存儲器的引用』與『引用』是完全不同的概念。下面的示例代碼有助于我們更好地區(qū)分:
?php
// 創(chuàng)建一個對象和此對象的引用變量
$a = new stdclass;
$b = $a;
$c = $a;
// 對『對象』進(jìn)行操作
$a->foo = 42;
var_dump($a->foo); // int(42)
var_dump($b->foo); // int(42)
var_dump($c->foo); // int(42)
// 現(xiàn)在直接改變變量的類型
$a = 42;
var_dump($a); // int(42)
var_dump($b); // object(stdClass)#1719 (1) {
// ["foo"]=>
// int(42)
// }
var_dump($c); // int(42)
?>
以上代碼中,修改對象的屬性會影響到 復(fù)制 的變量 $b 和引用的變量 $c。但是在最后區(qū)塊的代碼中,當(dāng)我們修改 $a 的類型時,引用的 $c 發(fā)生了變化,而復(fù)制得到的變量 $b 不會發(fā)生改變,這是個大多數(shù)有面對對象經(jīng)驗的工程師所期待的。
So, 面對對象是唯一使用『引用』的理由,但是現(xiàn)在 PHP 4 已死,你也可以放棄此類用法了。
另一個人們使用『引用』的理由是 —— 這將讓代碼更快。但是這是錯誤的,引用并不會使代碼執(zhí)行速度變快,更糟糕的是,很多時候『引用』會讓你的代碼執(zhí)行效率更低。
我必須再鄭重強(qiáng)調(diào)一次:是的,很多時候『引用』會讓你的代碼執(zhí)行效率更低。
別的語言的工程師,他們閱讀別的語言編碼規(guī)范,會看到建議在處理大的數(shù)據(jù)結(jié)構(gòu)或者字串時,使用指針來減小對內(nèi)存的消耗以提高運行效率。這些工程師誤將此概念理解到『引用』上,然而『指針』與『引用』是完全不同的技術(shù)模型。PHP 解析器與其他語言不同,在 PHP 中,我們使用『寫時復(fù)制(copy-on-write)』模型。
在『寫時復(fù)制』模型里,賦值和函數(shù)傳參不會觸發(fā) 復(fù)制 動作,你可以理解為多個不同的變量指向同一個『變量容器』,只有當(dāng)『寫』動作發(fā)生時,才會觸發(fā)復(fù)制動作。這意味著,即使變量看起來像是『復(fù)制』的,本質(zhì)上卻不是。所以當(dāng)傳參一個巨大的變量給某個函數(shù)時,并不會對性能造成多大影響。不過此時如果你使用引用傳參的話,引用傳參會關(guān)閉『寫時復(fù)制』機(jī)制,這會導(dǎo)致接下來那些沒有使用引用的變量傳參會被立刻復(fù)制一份。這也不是世界末日,你也可以在所有地方都引用就行了嘛。事實并非如此:PHP 的內(nèi)部機(jī)制依賴于『寫時復(fù)制』模型,存在很多你無法修改的內(nèi)部函數(shù)傳參。
我曾在某處看到過類似下面這樣的代碼:
?php
function foo($data) {
for ($i = 0; $i strlen($data); $i++) {
do_something($data{$i});
}
}
$string = "... looooong string with lots of data .....";
foo(string);
?>
顯然,上面這段代碼的第一個問題是:在循環(huán)中調(diào)用 strlen() 而不是使用已經(jīng)計算好的長度。也就是說調(diào)用一次 strlen($data) 就可以了的,但是他卻調(diào)用了很多次。 不同于 C 這類語言, 一般來說,PHP 的字符串都自帶了長度,因此也不用進(jìn)行長度的計算。所以就 strlen() 而言,這還不算太糟糕。 但現(xiàn)在另一個問題是,案例中的這個開發(fā)者為了節(jié)省時間,傳遞了一個引用作為參數(shù)以顯示自己的聰明。 然而,strlen() 期望得到的是一個副本?!簩憰r復(fù)制』不能用于引用,因此 $data 將會在 strlen() 調(diào)用時被復(fù)制,strlen() 將會做一個絕對簡單的操作 —— 事實上 strlen() 本來就是 PHP 里最簡單的函數(shù)之一 —— 緊接著該副本就會被直接銷毀。
如果沒有使用引用,也就沒必要進(jìn)行復(fù)制操作,代碼執(zhí)行也會更快。而且就算 strlen() 支持引用,你也不會因此獲得更多好處。
總的來說:
- 除了 PHP4 的遺留問題,不要在面向?qū)ο螅∣O)中使用引用。
- 不要使用引用來提升性能。
使用引用來完成事情的第三個問題是:通過參數(shù)的引用來返回數(shù)據(jù)所導(dǎo)致的糟糕的 API 設(shè)計。這個問題還是因為那個開發(fā)者沒有意識到『PHP 就是 PHP 而不是其他語言』所導(dǎo)致的。
在 PHP 中,同一個函數(shù)可以返回不同數(shù)據(jù)類型。—— 因此,你可以在函數(shù)執(zhí)行成功時返回一個字符串,而在失敗時返回一個布爾值 false,PHP 也允許返回復(fù)雜的結(jié)構(gòu)類型,比如數(shù)組和對象。所以在需要返回很多東西的時候,可以將他們打包在一起。另外,異常也是函數(shù)返回的一種方式。
使用引用是一件不好的事情,除了引用本身不好,并且還會使性能下降這個事實外,使用引用這種方式會使得代碼難以維護(hù)。像下面這段代碼的函數(shù)調(diào)用:
你希望 $var 發(fā)生改變嗎?—— 當(dāng)然不會。然而,如果 do_something() 傳遞的參數(shù)是引用,它就可能會改變。
這類 API 的另一個問題是:函數(shù)不能鏈?zhǔn)秸{(diào)用,因而你總會遇到必須使用臨時變量的場景。鏈?zhǔn)秸{(diào)用可能會使可讀性降低,但是在許多場景下,鏈?zhǔn)秸{(diào)用使得代碼更加簡潔。
關(guān)于引用的糟糕的設(shè)計決定,我個人最喜歡的一個例子是 PHP 自帶的 sort() 函數(shù)。sort() 使用一個數(shù)組作為引用參數(shù),然后通過引用返回一個排好序的數(shù)組。 像常規(guī)那樣通過值返回一個排好序的數(shù)組可能還更好些。當(dāng)然,這么做是由于歷史的原因:sort() 比『寫時復(fù)制』更早出現(xiàn)?!簩憰r復(fù)制』產(chǎn)生于 PHP4,而 sort() 則更早,它早在 PHP 還是作為一種在 Web 上做起事來很方便的東西,而不是真正的成為自己的語言的時候就存在了。
總之: 在 PHP 中,引用是不好的。 不要使用引用。 它們只會惹事生非,另外,不要對使用引用來提升引擎抱有希望。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
您可能感興趣的文章:- php 傳值賦值與引用賦值的區(qū)別
- php 引用()詳解
- PHP中函數(shù)內(nèi)引用全局變量的方法
- PHP引用(&)各種使用方法實例詳解
- PHP 引用文件技巧
- PHP正則表達(dá)式的逆向引用與子模式分析
- php中引用符號()的使用詳解
- php引用傳值實例詳解學(xué)習(xí)
- PHP的引用詳解