Java中常见数据结构Map之LinkedHashMap
1, LinkedHashMap基本結構 LinkedHashMap是HashMap的一個子類,它保留插入的順序,如果需要輸出的順序和輸入時的相同,那么就選用LinkedHashMap。 LinkedHashMap是Map接口的哈希表和鏈接列表實現(xiàn),具有可預知的迭代順序。此實現(xiàn)提供所有可選的映射操作,并允許使用null值和null鍵。此類不保證映射的順序,特別是它不保證該順序恒久不變。 LinkedHashMap實現(xiàn)與HashMap的不同之處在于,后者維護著一個運行于所有條目的雙重鏈接列表。此鏈接列表定義了迭代順序,該迭代順序可以是插入順序或者是訪問順序。 注意,此實現(xiàn)不是同步的。如果多個線程同時訪問鏈接的哈希映射,而其中至少一個線程從結構上修改了該映射,則它必須保持外部同步。
?
根據(jù)鏈表中元素的順序可以分為:按插入順序的鏈表,和按訪問順序(調用get方法)的鏈表。?
默認是按插入順序排序,如果指定按訪問順序排序,那么調用get方法后,會將這次訪問的元素移至鏈表尾部,不斷訪問可以形成按訪問順序排序的鏈表。? 可以重寫removeEldestEntry方法返回true值指定插入元素時移除最老的元素。(以下源碼截圖皆為JDK7) LinkedHashMap是繼承HashMap, 也就是說LinkedHashMap的結構也是和HashMap那樣(數(shù)組+鏈表)。 LinkedHashMap最大的差別在于Entry的定義上: 這里維護了一個before和after的Entry, 見名思意, 就是每個Entry<K,V>都維護它的上一個元素和下一個元素的關系。這也是LinkedHashMap有序的關鍵所在。 接著我們再看下header的定義: 上圖可以看出header的hash值為-1, 所以并不在hash表的table上。 其實header就是為了記錄雙向鏈表的頭結點和尾節(jié)點。 LinkedHashMap的元素關系如下: 2, LinkedHashMap中主要方法介紹
LinkedHashMap中重寫的方法不是很多, 請看下圖: 以下部分截取自: http://www.cnblogs.com/xiaoxi/p/6170590.html?? 感謝原作者, 寫的確實很好。???? 假如有這么一段代碼:
首先是第3行~第4行,new一個LinkedHashMap出來,看一下做了什么:
通過源代碼可以看出,在LinkedHashMap的構造方法中,實際調用了父類HashMap的相關構造方法來構造一個底層存放的table數(shù)組。
我們已經(jīng)知道LinkedHashMap的Entry元素繼承HashMap的Entry,提供了雙向鏈表的功能。在上述HashMap的構造器中,最后會調用init()方法,進行相關的初始化,這個方法在HashMap的實現(xiàn)中并無意義,只是提供給子類實現(xiàn)相關的初始化調用。
LinkedHashMap重寫了init()方法,在調用父類的構造方法完成構造后,進一步實現(xiàn)了對其元素Entry的初始化操作。
這里出現(xiàn)了第一個多態(tài):init()方法。盡管init()方法定義在HashMap中,但是由于:
1、LinkedHashMap重寫了init方法
2、實例化出來的是LinkedHashMap
因此實際調用的init方法是LinkedHashMap重寫的init方法。假設header的地址是0x00000000,那么初始化完畢,實際上是這樣的:
注意這個header,hash值為-1,其他都為null,也就是說這個header不放在數(shù)組中,就是用來指示開始元素和標志結束元素的。
header的目的是為了記錄第一個插入的元素是誰,在遍歷的時候能夠找到第一個元素。
五、LinkedHashMap存儲元素
LinkedHashMap并未重寫父類HashMap的put方法,而是重寫了父類HashMap的put方法調用的子方法void recordAccess(HashMap m)? ,void addEntry(int hash, K key, V value, int bucketIndex) 和void createEntry(int hash, K key, V value, int bucketIndex),提供了自己特有的雙向鏈接列表的實現(xiàn)。
繼續(xù)看LinkedHashMap存儲元素,也就是put("111","111")做了什么,首先當然是調用HashMap的put方法:
第23行又是一個多態(tài),因為LinkedHashMap重寫了addEntry方法,因此addEntry調用的是LinkedHashMap重寫了的方法:
因為LinkedHashMap由于其本身維護了插入的先后順序,因此LinkedHashMap可以用來做緩存,第7行~第9行是用來支持FIFO算法的,這里暫時不用去關心它??匆幌耤reateEntry方法:?
createEntry(int hash,K key,V value,int bucketIndex)方法覆蓋了父類HashMap中的方法。這個方法不會拓展table數(shù)組的大小。該方法首先保留table中bucketIndex處的節(jié)點,然后調用Entry的構造方法(將調用到父類HashMap.Entry的構造方法)添加一個節(jié)點,即將當前節(jié)點的next引用指向table[bucketIndex] 的節(jié)點,之后調用的e.addBefore(header)是修改鏈表,將e節(jié)點添加到header節(jié)點之前。
第2行~第4行的代碼和HashMap沒有什么不同,新添加的元素放在table[i]上,差別在于LinkedHashMap還做了addBefore操作,這四行代碼的意思就是讓新的Entry和原鏈表生成一個雙向鏈表。假設字符串111放在位置table[1]上,生成的Entry地址為0x00000001,那么用圖表示是這樣的:
如果熟悉LinkedList的源碼應該不難理解,還是解釋一下,注意下existingEntry表示的是header:
1、after=existingEntry,即新增的Entry的after=header地址,即after=0x00000000
2、before=existingEntry.before,即新增的Entry的before是header的before的地址,header的before此時是0x00000000,因此新增的Entry的before=0x00000000
3、before.after=this,新增的Entry的before此時為0x00000000即header,header的after=this,即header的after=0x00000001
4、after.before=this,新增的Entry的after此時為0x00000000即header,header的before=this,即header的before=0x00000001
這樣,header與新增的Entry的一個雙向鏈表就形成了。再看,新增了字符串222之后是什么樣的,假設新增的Entry的地址為0x00000002,生成到table[2]上,用圖表示是這樣的:
?
就不細解釋了,只要before、after清除地知道代表的是哪個Entry的就不會有什么問題。
注意,這里的插入有兩重含義:
1.從table的角度看,新的entry需要插入到對應的bucket里,當有哈希沖突時,采用頭插法將新的entry插入到?jīng)_突鏈表的頭部。
2.從header的角度看,新的entry需要插入到雙向鏈表的尾部。
3、LinkedHashMap讀取元素
LinkedHashMap重寫了父類HashMap的get方法,實際在調用父類getEntry()方法取得查找的元素后,再判斷當排序模式accessOrder為true時(即按訪問順序排序),先將當前節(jié)點從鏈表中移除,然后再將當前節(jié)點插入到鏈表尾部。由于的鏈表的增加、刪除操作是常量級的,故并不會帶來性能的損失。
4、利用LinkedHashMap實現(xiàn)LRU算法緩存
前面講了LinkedHashMap添加元素,刪除、修改元素就不說了,比較簡單,和HashMap+LinkedList的刪除、修改元素大同小異,下面講一個新的內容。
LinkedHashMap可以用來作緩存,比方說LRUCache,看一下這個類的代碼,很簡單,就十幾行而已:
顧名思義,LRUCache就是基于LRU算法的Cache(緩存),這個類繼承自LinkedHashMap,而類中看到?jīng)]有什么特別的方法,這說明LRUCache實現(xiàn)緩存LRU功能都是源自LinkedHashMap的。LinkedHashMap可以實現(xiàn)LRU算法的緩存基于兩點:
1、LinkedList首先它是一個Map,Map是基于K-V的,和緩存一致
2、LinkedList提供了一個boolean值可以讓用戶指定是否實現(xiàn)LRU
那么,首先我們了解一下什么是LRU:LRU即Least Recently Used,最近最少使用,也就是說,當緩存滿了,會優(yōu)先淘汰那些最近最不常訪問的數(shù)據(jù)。比方說數(shù)據(jù)a,1天前訪問了;數(shù)據(jù)b,2天前訪問了,緩存滿了,優(yōu)先會淘汰數(shù)據(jù)b。
我們看一下LinkedList帶boolean型參數(shù)的構造方法:
就是這個accessOrder,它表示:
(1)false,所有的Entry按照插入的順序排列
(2)true,所有的Entry按照訪問的順序排列
第二點的意思就是,如果有1 2 3這3個Entry,那么訪問了1,就把1移到尾部去,即2 3 1。每次訪問都把訪問的那個數(shù)據(jù)移到雙向隊列的尾部去,那么每次要淘汰數(shù)據(jù)的時候,雙向隊列最頭的那個數(shù)據(jù)不就是最不常訪問的那個數(shù)據(jù)了嗎?換句話說,雙向鏈表最頭的那個數(shù)據(jù)就是要淘汰的數(shù)據(jù)。
"訪問",這個詞有兩層意思:
1、根據(jù)Key拿到Value,也就是get方法
2、修改Key對應的Value,也就是put方法
首先看一下get方法,它在LinkedHashMap中被重寫:
然后是put方法,沿用父類HashMap的:
修改數(shù)據(jù)也就是第6行~第14行的代碼??吹絻啥舜a都有一個共同點:都調用了recordAccess方法,且這個方法是Entry中的方法,也就是說每次的recordAccess操作的都是某一個固定的Entry。
recordAccess,顧名思義,記錄訪問,也就是說你這次訪問了雙向鏈表,我就把你記錄下來,怎么記錄?把你訪問的Entry移到尾部去。這個方法在HashMap中是一個空方法,就是用來給子類記錄訪問用的,看一下LinkedHashMap中的實現(xiàn):
看到每次recordAccess的時候做了兩件事情:
1、把待移動的Entry的前后Entry相連
2、把待移動的Entry移動到尾部
當然,這一切都是基于accessOrder=true的情況下。最后用一張圖表示一下整個recordAccess的過程吧:
void recordAccess(HashMap<K,V> m) 這個方法就是我們一開始說的,accessOrder為true時,就是使用的訪問順序,訪問次數(shù)最少到訪問次數(shù)最多,此時要做特殊處理。處理機制就是訪問了一次,就將自己往后移一位,這里就是先將自己刪除了,然后在把自己添加,這樣,近期訪問的少的就在鏈表的開始,最近訪問的元素就會在鏈表的末尾。如果為false。那么默認就是插入順序,直接通過鏈表的特點就能依次找到插入元素,不用做特殊處理。
5、代碼演示LinkedHashMap按照訪問順序排序的效果
最后代碼演示一下LinkedList按照訪問順序排序的效果,驗證一下上一部分LinkedHashMap的LRU功能:
注意這里的構造方法要用三個參數(shù)那個且最后的要傳入true,這樣才表示按照訪問順序排序。看一下代碼運行結果:
代碼運行結果證明了兩點:
1、LinkedList是有序的
2、每次訪問一個元素(get或put),被訪問的元素都被提到最后面去了總結
以上是生活随笔為你收集整理的Java中常见数据结构Map之LinkedHashMap的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java类集框架 —— LinkedLi
- 下一篇: 英语写作-Introduction