浅谈哈希表
1. 引言
????????哈希表(Hash Table)的應用近兩年才在NOI中出現,作為一種高效的數據結構,它正在競賽中發揮著越來越重要的作用。
哈希表最大的優點,就是把數據的存儲和查找消耗的時間大大降低,幾乎可以看 成是常數時間;而代價僅僅是消耗比較多的內存。然而在當前可利用內存越來越 多的情況下,用空間換時間的做法是值得的。另外,編碼比較容易也是它的特點之一。
????????哈希表又叫做散列表,分為“開散列” 和“閉散列”??紤]到競賽時多數人通常避免使用動態存儲結構,本文中的“哈希表”僅指“閉散列”,關于其他方面讀者可參閱其他書籍。
2. 基礎操作
2.1 基本原理
????????我們使用一個下標范圍比較大的數組來存儲元素??梢栽O計一個函數(哈希函數, 也叫做散列函數),使得每個元素的關鍵字都與一個函數值(即數組下標)相對應,于是用這個數組單元來存儲這個元素;也可以簡單的理解為,按照關鍵字為每一 個元素“分類”,然后將這個元素存儲在相應“類”所對應的地方。 但是,不能夠保證每個元素的關鍵字與函數值是一一對應的,因此極有可能出現對于不同的元素,卻計算出了相同的函數值,這樣就產生了“沖突”,換句話說,就是把不同的元素分在了相同的“類”之中。后面我們將看到一種解決“沖突”的簡便做法。
總的來說,“直接定址”與“解決沖突”是哈希表的兩大特點。
2.2 函數構造
構造函數的常用方法(下面為了敘述簡潔,設 h(k) 表示關鍵字為 k 的元素所對應的函數值):
a) 除余法:
選擇一個適當的正整數 p ,令 h(k ) = k mod p ,這里, p 如果選取的是比較大的素數,效果比較好。而且此法非常容易實現,因此是最常用的方法。
b) 數字選擇法:
如果關鍵字的位數比較多,超過長整型范圍而無法直接運算,可以選擇其中數字分布比較均勻的若干位,所組成的新的值作為關鍵字或者直接作為函數值。
2.3 沖突處理
????????線性重新散列技術易于實現且可以較好的達到目的。令數組元素個數為 S ,則當 h(k) 已經存儲了元素的時候,依次探查 (h(k)+i) mod S , i=1,2,3…… ,直到找到空的存儲單元為止(或者從頭到尾掃描一圈仍未發現空單元,這就是哈希表已經滿了,發生了錯誤。當然這是可以通過擴大數組范圍避免的)。
轉載于:https://www.cnblogs.com/wspblog/p/4931238.html
總結
- 上一篇: 用来用去还是觉得SDCMS好用
- 下一篇: C#循环语句(for循环)