算法引進(jìn):
在這里我直接引用《大話數(shù)據(jù)結(jié)構(gòu)》里面的開頭:
在前面講到 簡單選擇排序 ,它在待排序的 n 個記錄中選擇一個最小的記錄需要比較 n - 1 次,本來這也可以理解,查找第一個數(shù)據(jù)需要比較這么多次是正常的,否則如何知道他是最小的記錄。
可惜的是,這樣的操作并沒有把每一趟的比較結(jié)果保存下來,在后一趟的比較重,有許多比較在前一趟已經(jīng)做過了,但由于前一趟排序時未保存這些比較結(jié)果,所以后一趟排序時又重復(fù)執(zhí)行了這些比較操作,因而記錄的比較次數(shù)較多。
如果可以做到每次在選擇到最小記錄的同時,并根據(jù)比較結(jié)果對其他記錄做出相應(yīng)的調(diào)整,那樣排序的總體效率就會非常高了。而堆排序,就是對簡單選擇排序進(jìn)行的一種改進(jìn),這種改進(jìn)的效果是非常明顯的。
基本思想:
在介紹堆排序之前,我們先來介紹一下堆:
《大話數(shù)據(jù)結(jié)構(gòu)》里的定義:堆 是具有下列性質(zhì)的完全二叉樹:每個節(jié)點(diǎn)的值都大于或等于其左右孩子節(jié)點(diǎn)的值,成為大頂堆(大根堆);或者每個節(jié)點(diǎn)的值都小于或等于其左右節(jié)點(diǎn)的值,成為小頂堆(小根堆)。
當(dāng)時我在看到這里的時候也對有“堆是否是完全二叉樹”有過疑問,網(wǎng)上也有說不是完全二叉樹的,但是無論堆是不是完全二叉樹,尚且保留意見。我們只要知道,在這里我們采用完全二叉樹形式的大根堆(小跟堆),主要是為了方便存儲和計(jì)算(后面我們會看到帶來的便利)。

堆排序算法:
堆排序就是利用堆(假設(shè)利用大根堆)進(jìn)行排序的方法,它的基本思想是:將待排序的序列構(gòu)造成一個大根堆。此時,整個序列的最大值就是堆頂?shù)母?jié)點(diǎn)。將它移走(其實(shí)就是將其與堆數(shù)組的末尾元素交換,此時末尾元素就是最大值),然后將剩余的 n - 1 個序列重新構(gòu)造成一個堆,這樣就會得到 n 個元素中的次小的值。如此反復(fù)執(zhí)行,便能得到一個有序序列了。
大根堆排序算法的基本操作:
①建堆,建堆是不斷調(diào)整堆的過程,從 len/2 處開始調(diào)整,一直到第一個節(jié)點(diǎn),此處 len 是堆中元素的個數(shù)。建堆的過程是線性的過程,從 len/2 到 0 處一直調(diào)用調(diào)整堆的過程,相當(dāng)于 o(h1) + o(h2) …+ o(hlen/2) 其中 h 表示節(jié)點(diǎn)的深度, len/2 表示節(jié)點(diǎn)的個數(shù),這是一個求和的過程,結(jié)果是線性的 O(n)。
②調(diào)整堆:調(diào)整堆在構(gòu)建堆的過程中會用到,而且在堆排序過程中也會用到。利用的思想是比較節(jié)點(diǎn)i和它的孩子節(jié)點(diǎn) left(i) , right(i),選出三者最大(或者最小)者,如果最大(?。┲挡皇枪?jié)點(diǎn)i而是它的一個孩子節(jié)點(diǎn),那邊交互節(jié)點(diǎn)i和該節(jié)點(diǎn),然后再調(diào)用調(diào)整堆過程,這是一個遞歸的過程。調(diào)整堆的過程時間復(fù)雜度與堆的深度有關(guān)系,是 lgn 的操作,因?yàn)槭茄刂疃确较蜻M(jìn)行調(diào)整的。
③堆排序:堆排序是利用上面的兩個過程來進(jìn)行的。首先是根據(jù)元素構(gòu)建堆。然后將堆的根節(jié)點(diǎn)取出(一般是與最后一個節(jié)點(diǎn)進(jìn)行交換),將前面 len-1 個節(jié)點(diǎn)繼續(xù)進(jìn)行堆調(diào)整的過程,然后再將根節(jié)點(diǎn)取出,這樣一直到所有節(jié)點(diǎn)都取出。堆排序過程的時間復(fù)雜度是 O(nlgn)。因?yàn)榻ǘ训臅r間復(fù)雜度是 O(n)(調(diào)用一次);調(diào)整堆的時間復(fù)雜度是 lgn,調(diào)用了 n-1 次,所以堆排序的時間復(fù)雜度是 O(nlgn)。
在這個過程中是需要大量的圖示才能看的明白的,但是我懶。。。。。。
算法實(shí)現(xiàn):
?php
//堆排序(對簡單選擇排序的改進(jìn))
function swap(array $arr,$a,$b){
$temp = $arr[$a];
$arr[$a] = $arr[$b];
$arr[$b] = $temp;
}
//調(diào)整 $arr[$start]的關(guān)鍵字,使$arr[$start]、$arr[$start+1]、、、$arr[$end]成為一個大根堆(根節(jié)點(diǎn)最大的完全二叉樹)
//注意這里節(jié)點(diǎn) s 的左右孩子是 2*s + 1 和 2*s+2 (數(shù)組開始下標(biāo)為 0 時)
function HeapAdjust(array $arr,$start,$end){
$temp = $arr[$start];
//沿關(guān)鍵字較大的孩子節(jié)點(diǎn)向下篩選
//左右孩子計(jì)算(我這里數(shù)組開始下標(biāo)識 0)
//左孩子2 * $start + 1,右孩子2 * $start + 2
for($j = 2 * $start + 1;$j = $end;$j = 2 * $j + 1){
if($j != $end $arr[$j] $arr[$j + 1]){
$j ++; //轉(zhuǎn)化為右孩子
}
if($temp >= $arr[$j]){
break; //已經(jīng)滿足大根堆
}
//將根節(jié)點(diǎn)設(shè)置為子節(jié)點(diǎn)的較大值
$arr[$start] = $arr[$j];
//繼續(xù)往下
$start = $j;
}
$arr[$start] = $temp;
}
function HeapSort(array $arr){
$count = count($arr);
//先將數(shù)組構(gòu)造成大根堆(由于是完全二叉樹,所以這里用floor($count/2)-1,下標(biāo)小于或等于這數(shù)的節(jié)點(diǎn)都是有孩子的節(jié)點(diǎn))
for($i = floor($count / 2) - 1;$i >= 0;$i --){
HeapAdjust($arr,$i,$count);
}
for($i = $count - 1;$i >= 0;$i --){
//將堆頂元素與最后一個元素交換,獲取到最大元素(交換后的最后一個元素),將最大元素放到數(shù)組末尾
swap($arr,0,$i);
//經(jīng)過交換,將最后一個元素(最大元素)脫離大根堆,并將未經(jīng)排序的新樹($arr[0...$i-1])重新調(diào)整為大根堆
HeapAdjust($arr,0,$i - 1);
}
}
$arr = array(9,1,5,8,3,7,4,6,2);
HeapSort($arr);
var_dump($arr);
時間復(fù)雜度分析:
它的運(yùn)行時間只要是消耗在初始構(gòu)建對和在重建堆屎的反復(fù)篩選上。
總體上來說,堆排序的時間復(fù)雜度是 O(nlogn)。由于堆排序?qū)υ加涗浀呐判驙顟B(tài)并不敏感,因此它無論是最好、最差和平均時間復(fù)雜度都是 O(nlogn)。這在性能上顯然要遠(yuǎn)遠(yuǎn)好于冒泡、簡單選擇、直接插入的 O(n^2) 的時間復(fù)雜度了。
堆排序是一種不穩(wěn)定排序方法。
本篇博客參考自《大話數(shù)據(jù)結(jié)構(gòu)》,在此僅作記錄,方便以后查閱,大神勿噴!
您可能感興趣的文章:- PHP排序算法之堆排序(Heap Sort)實(shí)例詳解
- PHP實(shí)現(xiàn)的堆排序算法詳解
- php堆排序?qū)崿F(xiàn)原理與應(yīng)用方法
- php堆排序(heapsort)練習(xí)
- php計(jì)數(shù)排序算法的實(shí)現(xiàn)代碼(附四個實(shí)例代碼)
- thinkphp框架無限級欄目的排序功能實(shí)現(xiàn)方法示例
- PHP實(shí)現(xiàn)常用排序算法的方法
- 基于PHP實(shí)現(xiàn)堆排序原理及實(shí)例詳解