Java数据结构与算法:堆
1. 堆的定義
設有n個數據元素的關鍵字為(k0、k1、…、kn-1),如果它們滿足以下的關系:ki<= k2i+1且ki<= k2i+2(或ki>= k2i+1且ki>= k2i+2)(i=0、1、…、(n-2)/2)則稱之為堆(Heap)。
如果將此數據元素序列用一維數組存儲,并將此數組對應一棵完全二叉樹,則堆的含義可以理解為:在完全二叉樹中任何非終端結點的關鍵字均不大于(或不小于)其左、右孩子結點的關鍵字。
下圖(b)、(c)分別給出了最小堆和最大堆的例子,前者任一非終端結點的關鍵字均小于或等于它的左、右孩子的關鍵字,此時位于堆頂(即完全二叉樹的根結點位置)的結點的關鍵字是整個序列中最小的,所以稱它為最小堆;后者任一非終端結點的關鍵字均大于或等于它的左、右孩子的關鍵字,此時位于堆頂的結點的關鍵字是整個序列中最大的,所以稱它為最大堆。
調整算法FilterDown要求將以分支結點i為根的子樹調整為最小堆,其基本思想是:從結點i開始向下調整,先比較結點i左孩子結點和右孩子結點的關鍵字大小,如果結點i左孩子結點的關鍵字小于右孩子結點的關鍵字,則沿結點i的左分支進行調整;否則沿結點i的右分支進行調整,在算法中用j指示關鍵字值較小的孩子結點。然后結點i和結點j進行關鍵字比較,若結點i的關鍵字大于結點j的關鍵字,則兩結點對調位置,相當于把關鍵字小的結點上浮。再令i=j,j=2*j十l,繼續向下一層進行比較;若結點i的關鍵字不大于結點j的關鍵字或結點i沒有孩子時調整結束。
注意:這里的“堆”是指一種的特殊的二叉樹,不要和java和C++等編程語言里的
“堆”混淆,后者指的是程序員用new能得到的計算機內存的可用部分。
堆的介紹
- 堆是完全二叉樹
- 常常用數組實現
- 每一個節點的關鍵字都大于(等于)這個節點的子節點的關鍵字
弱序,優先級隊列
2. 在堆中插入元素
在堆的類定義中成員函數Insert( )用于在堆中插入一個數據元素,在此規定數據元素總是插在已經建成的最小堆后面,如下圖所示在堆中插入關鍵字為14的數據元素。顯然在堆中插入元素后可能破壞堆的性質,所以還需要調用FilterUp( )函數,進行自下而上調整使之所在的子樹成為堆。
在堆的類定義中成員函數DeleteTop( )用于刪除堆頂數據元素。在從堆中刪除堆頂元素后,一般把堆的最后一個元素移到堆頂,并將堆的當前元素個數heapCurrentSize減1,最后需要調用FilterDown()函數從堆頂向下進行調整。如圖6-20所示給出了在堆中刪除堆頂元素的過程。
3. 二叉堆
二叉堆就是通常我們所說的數據結構中”堆”中的一種。和以往一樣,本文會先對二叉堆的理論知識進行簡單介紹,然后給出C語言的實現。后續再分別給出C++和Java版本的實現;實現的語言雖不同,但是原理如出一轍,選擇其中之一進行了解即可
4. 堆和二叉堆的介紹
4.1 堆的定義
堆(heap),這里所說的堆是數據結構中的堆,而不是內存模型中的堆。堆通常是一個可以被看做一棵樹,它滿足下列性質:
- [性質一] 堆中任意節點的值總是不大于(不小于)其子節點的值;
- [性質二] 堆總是一棵完全樹。
將任意節點不大于其子節點的堆叫做最小堆或小根堆,而將任意節點不小于其子節點的堆叫做最大堆或大根堆。常見的堆有二叉堆、左傾堆、斜堆、二項堆、斐波那契堆等等。
4.2 二叉堆的定義
二叉堆是完全二元樹或者是近似完全二元樹,它分為兩種:最大堆和最小堆。
最大堆:父結點的鍵值總是大于或等于任何一個子節點的鍵值;最小堆:父結點的鍵值總是小于或等于任何一個子節點的鍵值。示意圖如下:
二叉堆一般都通過”數組”來實現。數組實現的二叉堆,父節點和子節點的位置存在一定的關系。有時候,我們將”二叉堆的第一個元素”放在數組索引0的位置,有時候放在1的位置。當然,它們的本質一樣(都是二叉堆),只是實現上稍微有一丁點區別。
假設”第一個元素”在數組中的索引為 0 的話,則父節點和子節點的位置關系如下:
- 索引為i的左孩子的索引是 (2*i+1);
- 索引為i的左孩子的索引是 (2*i+2);
- 索引為i的父結點的索引是 floor((i-1)/2);
假設”第一個元素”在數組中的索引為 1 的話,則父節點和子節點的位置關系如下:
- 索引為i的左孩子的索引是 (2*i)
- 索引為i的左孩子的索引是 (2*i+1)
- 索引為i的父結點的索引是 floor(i/2)
注意:本文二叉堆的實現統統都是采用”二叉堆第一個元素在數組索引為0”的方式!
5. 二叉堆的圖文解析
在前面,我們已經了解到:”最大堆”和”最小堆”是對稱關系。這也意味著,了解其中之一即可。本節的圖文解析是以”最大堆”來進行介紹的。
二叉堆的核心是”添加節點”和”刪除節點”,理解這兩個算法,二叉堆也就基本掌握了。下面對它們進行介紹。
5.1 添加
假設在最大堆[90,80,70,60,40,30,20,10,50]種添加85,需要執行的步驟如下:
如上圖所示,當向最大堆中添加數據時:先將數據加入到最大堆的最后,然后盡可能把這個元素往上挪,直到挪不動為止!
將85添加到[90,80,70,60,40,30,20,10,50]中后,最大堆變成了[90,85,70,60,80,30,20,10,50,40]。
/** 最大堆的向上調整算法(從start開始向上直到0,調整堆)** 注:數組實現的堆中,第N個節點的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。** 參數說明:* start -- 被上調節點的起始位置(一般為數組中最后一個元素的索引)*/ protected void filterup(int start) {int c = start; // 當前節點(current)的位置int p = (c-1)/2; // 父(parent)結點的位置 T tmp = mHeap.get(c); // 當前節點(current)的大小while(c > 0) {int cmp = mHeap.get(p).compareTo(tmp);if(cmp >= 0)break;else {mHeap.set(c, mHeap.get(p));c = p;p = (p-1)/2; } }mHeap.set(c, tmp); }/* * 將data插入到二叉堆中*/ public void insert(T data) {int size = mHeap.size();mHeap.add(data); // 將"數組"插在表尾filterup(size); // 向上調整堆 }insert(data)的作用:將數據data添加到最大堆中。mHeap是動態數組ArrayList對象。
當堆已滿的時候,添加失敗;否則data添加到最大堆的末尾。然后通過上調算法重新調整數組,使之重新成為最大堆。
5.2 刪除
假設從最大堆[90,85,70,60,80,30,20,10,50,40]中刪除90,需要執行的步驟如下:
如上圖所示,當從最大堆中刪除數據時:先刪除該數據,然后用最大堆中最后一個的元素插入這個空位;接著,把這個“空位”盡量往上挪,直到剩余的數據變成一個最大堆。
從[90,85,70,60,80,30,20,10,50,40]刪除90之后,最大堆變成了[85,80,70,60,40,30,20,10,50]。
注意:考慮從最大堆[90,85,70,60,80,30,20,10,50,40]中刪除60,執行的步驟不能單純的用它的字節點來替換;而必須考慮到”替換后的樹仍然要是最大堆”!
/* * 最大堆的向下調整算法** 注:數組實現的堆中,第N個節點的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。** 參數說明:* start -- 被下調節點的起始位置(一般為0,表示從第1個開始)* end -- 截至范圍(一般為數組中最后一個元素的索引)*/ protected void filterdown(int start, int end) {int c = start; // 當前(current)節點的位置int l = 2*c + 1; // 左(left)孩子的位置T tmp = mHeap.get(c); // 當前(current)節點的大小while(l <= end) {int cmp = mHeap.get(l).compareTo(mHeap.get(l+1));// "l"是左孩子,"l+1"是右孩子if(l < end && cmp<0)l++; // 左右兩孩子中選擇較大者,即mHeap[l+1]cmp = tmp.compareTo(mHeap.get(l));if(cmp >= 0)break; //調整結束else {mHeap.set(c, mHeap.get(l));c = l;l = 2*l + 1; } } mHeap.set(c, tmp); }/** 刪除最大堆中的data** 返回值:* 0,成功* -1,失敗*/ public int remove(T data) {// 如果"堆"已空,則返回-1if(mHeap.isEmpty() == true)return -1;// 獲取data在數組中的索引int index = mHeap.indexOf(data);if (index==-1)return -1;int size = mHeap.size();mHeap.set(index, mHeap.get(size-1));// 用最后元素填補mHeap.remove(size - 1); // 刪除最后的元素if (mHeap.size() > 1)filterdown(index, mHeap.size()-1); // 從index號位置開始自上向下調整為最小堆return 0; }6. 二叉堆的Java實現
6.1 二叉堆(最大堆)
/*** 二叉堆(最大堆)** @author skywang* @date 2014/03/07*/import java.util.ArrayList; import java.util.List;public class MaxHeap<T extends Comparable<T>> {private List<T> mHeap; // 隊列(實際上是動態數組ArrayList的實例)public MaxHeap() {this.mHeap = new ArrayList<T>();}/* * 最大堆的向下調整算法** 注:數組實現的堆中,第N個節點的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。** 參數說明:* start -- 被下調節點的起始位置(一般為0,表示從第1個開始)* end -- 截至范圍(一般為數組中最后一個元素的索引)*/protected void filterdown(int start, int end) {int c = start; // 當前(current)節點的位置int l = 2*c + 1; // 左(left)孩子的位置T tmp = mHeap.get(c); // 當前(current)節點的大小while(l <= end) {int cmp = mHeap.get(l).compareTo(mHeap.get(l+1));// "l"是左孩子,"l+1"是右孩子if(l < end && cmp<0)l++; // 左右兩孩子中選擇較大者,即mHeap[l+1]cmp = tmp.compareTo(mHeap.get(l));if(cmp >= 0)break; //調整結束else {mHeap.set(c, mHeap.get(l));c = l;l = 2*l + 1; } } mHeap.set(c, tmp);}/** 刪除最大堆中的data** 返回值:* 0,成功* -1,失敗*/public int remove(T data) {// 如果"堆"已空,則返回-1if(mHeap.isEmpty() == true)return -1;// 獲取data在數組中的索引int index = mHeap.indexOf(data);if (index==-1)return -1;int size = mHeap.size();mHeap.set(index, mHeap.get(size-1));// 用最后元素填補mHeap.remove(size - 1); // 刪除最后的元素if (mHeap.size() > 1)filterdown(index, mHeap.size()-1); // 從index號位置開始自上向下調整為最小堆return 0;}/** 最大堆的向上調整算法(從start開始向上直到0,調整堆)** 注:數組實現的堆中,第N個節點的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。** 參數說明:* start -- 被上調節點的起始位置(一般為數組中最后一個元素的索引)*/protected void filterup(int start) {int c = start; // 當前節點(current)的位置int p = (c-1)/2; // 父(parent)結點的位置 T tmp = mHeap.get(c); // 當前節點(current)的大小while(c > 0) {int cmp = mHeap.get(p).compareTo(tmp);if(cmp >= 0)break;else {mHeap.set(c, mHeap.get(p));c = p;p = (p-1)/2; } }mHeap.set(c, tmp);}/* * 將data插入到二叉堆中*/public void insert(T data) {int size = mHeap.size();mHeap.add(data); // 將"數組"插在表尾filterup(size); // 向上調整堆}@Overridepublic String toString() {StringBuilder sb = new StringBuilder();for (int i=0; i<mHeap.size(); i++)sb.append(mHeap.get(i) +" ");return sb.toString();}public static void main(String[] args) {int i;int a[] = {10, 40, 30, 60, 90, 70, 20, 50, 80};MaxHeap<Integer> tree=new MaxHeap<Integer>();System.out.printf("== 依次添加: ");for(i=0; i<a.length; i++) {System.out.printf("%d ", a[i]);tree.insert(a[i]);}System.out.printf("\n== 最 大 堆: %s", tree);i=85;tree.insert(i);System.out.printf("\n== 添加元素: %d", i);System.out.printf("\n== 最 大 堆: %s", tree);i=90;tree.remove(i);System.out.printf("\n== 刪除元素: %d", i);System.out.printf("\n== 最 大 堆: %s", tree);System.out.printf("\n");} }6.2 二叉堆(最小堆)
/*** 二叉堆(最小堆)** @author skywang* @date 2014/03/07*/import java.util.ArrayList; import java.util.List;public class MinHeap<T extends Comparable<T>> {private List<T> mHeap; // 存放堆的數組public MinHeap() {this.mHeap = new ArrayList<T>();}/* * 最小堆的向下調整算法** 注:數組實現的堆中,第N個節點的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。** 參數說明:* start -- 被下調節點的起始位置(一般為0,表示從第1個開始)* end -- 截至范圍(一般為數組中最后一個元素的索引)*/protected void filterdown(int start, int end) {int c = start; // 當前(current)節點的位置int l = 2*c + 1; // 左(left)孩子的位置T tmp = mHeap.get(c); // 當前(current)節點的大小while(l <= end) {int cmp = mHeap.get(l).compareTo(mHeap.get(l+1));// "l"是左孩子,"l+1"是右孩子if(l < end && cmp>0)l++; // 左右兩孩子中選擇較小者,即mHeap[l+1]cmp = tmp.compareTo(mHeap.get(l));if(cmp <= 0)break; //調整結束else {mHeap.set(c, mHeap.get(l));c = l;l = 2*l + 1; } } mHeap.set(c, tmp);}/** 最小堆的刪除** 返回值:* 成功,返回被刪除的值* 失敗,返回null*/public int remove(T data) {// 如果"堆"已空,則返回-1if(mHeap.isEmpty() == true)return -1;// 獲取data在數組中的索引int index = mHeap.indexOf(data);if (index==-1)return -1;int size = mHeap.size();mHeap.set(index, mHeap.get(size-1));// 用最后元素填補mHeap.remove(size - 1); // 刪除最后的元素if (mHeap.size() > 1)filterdown(index, mHeap.size()-1); // 從index號位置開始自上向下調整為最小堆return 0;}/** 最小堆的向上調整算法(從start開始向上直到0,調整堆)** 注:數組實現的堆中,第N個節點的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。** 參數說明:* start -- 被上調節點的起始位置(一般為數組中最后一個元素的索引)*/protected void filterup(int start) {int c = start; // 當前節點(current)的位置int p = (c-1)/2; // 父(parent)結點的位置 T tmp = mHeap.get(c); // 當前節點(current)的大小while(c > 0) {int cmp = mHeap.get(p).compareTo(tmp);if(cmp <= 0)break;else {mHeap.set(c, mHeap.get(p));c = p;p = (p-1)/2; } }mHeap.set(c, tmp);}/* * 將data插入到二叉堆中*/public void insert(T data) {int size = mHeap.size();mHeap.add(data); // 將"數組"插在表尾filterup(size); // 向上調整堆}public String toString() {StringBuilder sb = new StringBuilder();for (int i=0; i<mHeap.size(); i++)sb.append(mHeap.get(i) +" ");return sb.toString();}public static void main(String[] args) {int i;int a[] = {80, 40, 30, 60, 90, 70, 10, 50, 20};MinHeap<Integer> tree=new MinHeap<Integer>();System.out.printf("== 依次添加: ");for(i=0; i<a.length; i++) {System.out.printf("%d ", a[i]);tree.insert(a[i]);}System.out.printf("\n== 最 小 堆: %s", tree);i=15;tree.insert(i);System.out.printf("\n== 添加元素: %d", i);System.out.printf("\n== 最 小 堆: %s", tree);i=10;tree.remove(i);System.out.printf("\n== 刪除元素: %d", i);System.out.printf("\n== 最 小 堆: %s", tree);System.out.printf("\n");} }6.3 二叉堆的Java測試程序
測試程序已經包含在相應的實現文件中了,這里只說明運行結果。
最大堆(MaxHeap.java)的運行結果:
== 依次添加: 10 40 30 60 90 70 20 50 80 == 最 大 堆: 90 80 70 60 40 30 20 10 50 == 添加元素: 85 == 最 大 堆: 90 85 70 60 80 30 20 10 50 40 == 刪除元素: 90 == 最 大 堆: 85 80 70 60 40 30 20 10 50最小堆(MinHeap.java)的運行結果:
== 最 小 堆: 10 20 30 50 90 70 40 80 60 == 添加元素: 15 == 最 小 堆: 10 15 30 50 20 70 40 80 60 90 == 刪除元素: 10 == 最 小 堆: 15 20 30 50 90 70 40 80 60PS. 二叉堆是”堆排序”的理論基石。以后講解算法時會講解到”堆排序”,理解了”二叉堆”之后,”堆排序”就很簡單了
總結
以上是生活随笔為你收集整理的Java数据结构与算法:堆的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java数据结构和算法:字符串、数组和广
- 下一篇: 国内一线互联网公司内部面试题库