程序员必知3大查找
?
三種查找算法:
順序查找,二分法查找(折半查找),分塊查找,散列表(以后談)
?
?
?
一、順序查找的基本思想:
從表的一端開始,順序掃描表,依次將掃描到的結(jié)點(diǎn)關(guān)鍵字和給定值(假定為a)相比較,若當(dāng)前結(jié)點(diǎn)關(guān)鍵字與a相等,則查找成功;若掃描結(jié)束后,仍未找到關(guān)鍵字等于a的結(jié)點(diǎn),則查找失敗。
?
說白了就是,從頭到尾,一個一個地比,找著相同的就成功,找不到就失敗。很明顯的缺點(diǎn)就是查找效率低。
?
適用于線性表的順序存儲結(jié)構(gòu)和鏈?zhǔn)酱鎯Y(jié)構(gòu)。
?
?
?
計(jì)算平均查找長度。
例如上表,查找1,需要1次,查找2需要2次,依次往下推,可知查找16需要16次,
可以看出,我們只要將這些查找次數(shù)求和(我們初中學(xué)的,上底加下底乘以高除以2),然后除以結(jié)點(diǎn)數(shù),即為平均查找長度。
設(shè)n=節(jié)點(diǎn)數(shù)
平均查找長度=(n+1)/2
?
二、二分法查找(折半查找)的基本思想:
?
前提:
(1)確定該區(qū)間的中點(diǎn)位置:mid=(low+high)/2????
min代表區(qū)間中間的結(jié)點(diǎn)的位置,low代表區(qū)間最左結(jié)點(diǎn)位置,high代表區(qū)間最右結(jié)點(diǎn)位置
(2)將待查a值與結(jié)點(diǎn)mid的關(guān)鍵字(下面用R[mid].key)比較,若相等,則查找成功,否則確定新的查找區(qū)間:
如果R[mid].key>a,則由表的有序性可知,R[mid].key右側(cè)的值都大于a,所以等于a的關(guān)鍵字如果存在,必然在R[mid].key左邊的表中。這時high=mid-1
如果R[mid].key<a,則等于a的關(guān)鍵字如果存在,必然在R[mid].key右邊的表中。這時low=mid
如果R[mid].key=a,則查找成功。
(3)下一次查找針對新的查找區(qū)間,重復(fù)步驟(1)和(2)
(4)在查找過程中,low逐步增加,high逐步減少,如果high<low,則查找失敗。
?
?
?
平均查找長度=Log2(n+1)-1
?
注:雖然二分法查找的效率高,但是要將表按關(guān)鍵字排序。而排序本身是一種很費(fèi)時的運(yùn)算,所以二分法比較適用于順序存儲結(jié)構(gòu)。為保持表的有序性,在順序結(jié)構(gòu)中插入和刪除都必須移動大量的結(jié)點(diǎn)。因此,二分查找特別適用于那種一經(jīng)建立就很少改動而又經(jīng)常需要查找的線性表。
?
三、分塊查找的基本思想:
?
二分查找表使分塊有序的線性表和索引表(抽取各塊中的最大關(guān)鍵字及其起始位置構(gòu)成索引表)組成,由于表是分塊有序的,所以索引表是一個遞增有序表,因此采用順序或二分查找索引表,以確定待查結(jié)點(diǎn)在哪一塊,由于塊內(nèi)無序,只能用順序查找。
?
?
?
?
設(shè)表共n個結(jié)點(diǎn),分b塊,s=n/b
(分塊查找索引表)平均查找長度=Log2(n/s+1)+s/2
(順序查找索引表)平均查找長度=(S2+2S+n)/(2S)
?
?
注:分塊查找的優(yōu)點(diǎn)是在表中插入或刪除一個記錄時,只要找到該記錄所屬塊,就在該塊中進(jìn)行插入或刪除運(yùn)算(因塊內(nèi)無序,所以不需要大量移動記錄)。它主要代價是增加一個輔助數(shù)組的存儲控件和將初始表分塊排序的運(yùn)算。
?
它的性能介于順序查找和二分查找之間。
?
四、最近比較忙,后續(xù)找個時間還會談?wù)勆⒘斜?#xff08;哈希表)技術(shù),希望大家關(guān)注!
?
散列表查找技術(shù)不同于順序查找、二分查找、分塊查找。它不以關(guān)鍵字的比較為基本操作,采用直接尋址技術(shù)。在理想情況下,無須任何比較就可以找到待查關(guān)鍵字,查找的期望時間為O(1)。
?
?
?
?
?
前兩篇
?
《程序員必知8大排序3大查找(一)》
?
《程序員必知8大排序3大查找(二)》
轉(zhuǎn) http://blog.csdn.net/shan9liang/article/details/7555811
?
總結(jié)
- 上一篇: B 树、B+ 树、B* 树
- 下一篇: 鑫科平板电脑是品牌吗?