唯一的hashCodes不足以避免冲突
有一個常見的誤解,即如果您具有唯一的hashCode(),則不會發(fā)生沖突。 雖然唯一或幾乎唯一的hashCodes很好,但這還不是故事的結(jié)局。
問題在于HashMap的大小不是無限的(或大小至少為2 ^ 32),這意味著hashCode()的數(shù)量必須減少為較小的位數(shù)。
HashMap以及HashSet和LinkedHashMap的工作方式是按以下方式對位進(jìn)行突變:
然后為最低位應(yīng)用掩碼以選擇存儲區(qū)。 問題在于,即使像Integer一樣使用唯一的hashCode(),也會有具有不同哈希碼的值映射到同一存儲桶。 您可以研究Integer.hashCode()的工作方式:
public static void main(String[] args) {Set integers = new HashSet<>();for (int i = 0; i <= 400; i++)if ((hash(i) & 0x1f) == 0)integers.add(i);Set integers2 = new HashSet<>();for (int i = 400; i >= 0; i--)if ((hash(i) & 0x1f) == 0)integers2.add(i);System.out.println(integers);System.out.println(integers2);}static int hash(int h) {// This function ensures that hashCodes that differ only by// constant multiples at each bit position have a bounded// number of collisions (approximately 8 at default load factor).h ^= (h >>> 20) ^ (h >>> 12);return h ^ (h >>> 7) ^ (h >>> 4); }打印:
[373, 343, 305, 275, 239, 205, 171, 137, 102, 68, 34, 0] [0, 34, 68, 102, 137, 171, 205, 239, 275, 305, 343, 373]條目的順序與之相反,因為它們是作為HashMap的鏈接列表而添加的,將所有條目置于同一存儲桶中。
解決方案?
一個簡單的解決方案是讓一個存儲桶變成一棵樹,而不是一個鏈表。 在Java 8中,它將對字符串鍵執(zhí)行此操作,但是可以對所有可比較類型AFAIK執(zhí)行此操作。
另一種方法是允許使用自定義哈希策略,以使開發(fā)人員避免此類問題,或者在每個集合的基礎(chǔ)上隨機(jī)化突變,從而將應(yīng)用程序的成本攤銷到應(yīng)用程序中。
其他注意事項
我傾向于支持64位哈希碼,尤其是支持復(fù)雜對象的哈希碼。 哈希碼本身發(fā)生沖突的可能性很小,并且很好地支持非常大的數(shù)據(jù)結(jié)構(gòu)。 例如數(shù)十億。
翻譯自: https://www.javacodegeeks.com/2013/10/unique-hashcodes-is-not-enough-to-avoid-collisions.html
總結(jié)
以上是生活随笔為你收集整理的唯一的hashCodes不足以避免冲突的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 网易猫官网电脑版(网易云官网电脑版网址)
- 下一篇: 东陵石玉是什么玉(东陵玉是什么材质,为什