Java HashMap如何使用相同的散列代码处理不同的对象?

下面是针对Java 8版本的HashMap机制的粗略描述(它可能与Java 6略有不同)。

数据结构

哈希表哈希值通过key上的Hash()计算，它决定对给定的键使用哈希表的哪个桶。链表(单个) 当桶中的元素数量较小时，使用单链表。红黑树当一个桶中的元素数量很大时，使用红黑树。

类(内部)

地图。条目在map中表示单个实体，即键/值实体。 HashMap。节点节点的链表版本。它可以表示: 哈希桶。因为它有哈希属性。单链表中的节点(因此也是链表的头)。 HashMap。TreeNode 节点的树版本。

字段(内部)

节点[]表桶表(链表的头)。如果一个bucket不包含元素，那么它就是null，因此只占用一个引用的空间。设置<地图。入口> entrySet 实体的集合。 int大小实体数量。负载系数浮动在调整大小之前，指示允许的哈希表有多满。 int阈值下一个要调整大小的大小。公式:阈值=容量* loadFactor

方法(内部)

int散列(关键) 按键计算哈希值。如何映射哈希到桶? 使用以下逻辑: static int hashToBucket(int tableSize, int hash) { return (tableSize - 1) & hash; ｝

关于能力

在哈希表中，容量是指桶数，可以从table.length中获取。 Also可以通过threshold和loadFactor计算，因此不需要定义为类字段。

可以通过:capacity()得到有效容量

操作

按键查找实体。首先通过哈希值找到桶，然后循环链表或搜索排序树。用键添加实体。首先根据key的哈希值找到桶。然后试着找出它的值: 如果找到，则替换该值。否则，在链表的开头添加一个新节点，或插入到排序树中。调整当达到阈值时，将哈希表的容量(table.length)翻倍，然后对所有元素重新哈希以重建表。这可能是一次昂贵的手术。

性能

获取并放置时间复杂度为O(1)，因为: 桶通过数组索引访问，因此是O(1)。每个桶中的链表长度较小，可见为O(1)。树的大小也是有限的，因为当元素数量增加时将扩展容量并重新哈希，所以可以将其视为O(1)，而不是O(log N)。

2014-06-05 12:11:44

下面是针对Java 8版本的HashMap机制的粗略描述(它可能与Java 6略有不同)。

数据结构

哈希表哈希值通过key上的Hash()计算，它决定对给定的键使用哈希表的哪个桶。链表(单个) 当桶中的元素数量较小时，使用单链表。红黑树当一个桶中的元素数量很大时，使用红黑树。

类(内部)

地图。条目在map中表示单个实体，即键/值实体。 HashMap。节点节点的链表版本。它可以表示: 哈希桶。因为它有哈希属性。单链表中的节点(因此也是链表的头)。 HashMap。TreeNode 节点的树版本。

字段(内部)

节点[]表桶表(链表的头)。如果一个bucket不包含元素，那么它就是null，因此只占用一个引用的空间。设置<地图。入口> entrySet 实体的集合。 int大小实体数量。负载系数浮动在调整大小之前，指示允许的哈希表有多满。 int阈值下一个要调整大小的大小。公式:阈值=容量* loadFactor

方法(内部)

int散列(关键) 按键计算哈希值。如何映射哈希到桶? 使用以下逻辑: static int hashToBucket(int tableSize, int hash) { return (tableSize - 1) & hash; ｝

关于能力

在哈希表中，容量是指桶数，可以从table.length中获取。 Also可以通过threshold和loadFactor计算，因此不需要定义为类字段。

可以通过:capacity()得到有效容量

操作

按键查找实体。首先通过哈希值找到桶，然后循环链表或搜索排序树。用键添加实体。首先根据key的哈希值找到桶。然后试着找出它的值: 如果找到，则替换该值。否则，在链表的开头添加一个新节点，或插入到排序树中。调整当达到阈值时，将哈希表的容量(table.length)翻倍，然后对所有元素重新哈希以重建表。这可能是一次昂贵的手术。

性能

获取并放置时间复杂度为O(1)，因为: 桶通过数组索引访问，因此是O(1)。每个桶中的链表长度较小，可见为O(1)。树的大小也是有限的，因为当元素数量增加时将扩展容量并重新哈希，所以可以将其视为O(1)，而不是O(log N)。

2014-06-05 12:11:44

记住这里对hashmap结构的解释，也许有人可以解释Baeldung上的以下段落:-

Java有接口Map的几个实现，每个实现都有自己的特殊性。

但是，现有的Java核心Map实现都不允许Map处理单个键的多个值。

正如我们所看到的，如果我们试图为同一个键插入两个值，第二个值将被存储，而第一个值将被删除。

它还将返回(由put(K键，V值)方法的每个正确实现):

Map<String, String> map = new HashMap<>();
assertThat(map.put("key1", "value1")).isEqualTo(null);
assertThat(map.put("key1", "value2")).isEqualTo("value1");
assertThat(map.get("key1")).isEqualTo("value2");

2021-11-01 11:56:54

你的第三个断言是不正确的。

两个不相等的对象拥有相同的哈希码是完全合法的。它被HashMap用作“第一遍过滤器”，以便映射可以快速找到具有指定键的可能条目。然后测试具有相同哈希码的键是否与指定的键相等。

您不会希望要求两个不相等的对象不能具有相同的哈希码，否则将限制为232个可能的对象。(这也意味着不同类型甚至不能使用对象的字段来生成哈希码，因为其他类可以生成相同的哈希码。)

2011-06-27 13:34:39

hashcode决定要检查hashmap的哪个bucket。如果存储桶中有多个对象，则执行线性搜索以查找存储桶中的哪个项目等于所需的项目(使用equals()方法)。

In other words, if you have a perfect hashcode then hashmap access is constant, you will never have to iterate through a bucket (technically you would also have to have MAX_INT buckets, the Java implementation may share a few hash codes in the same bucket to cut down on space requirements). If you have the worst hashcode (always returns the same number) then your hashmap access becomes linear since you have to search through every item in the map (they're all in the same bucket) to get what you want.

大多数情况下，编写良好的hashcode并不完美，但它足够独特，可以为您提供或多或少的恒定访问。

2011-06-27 13:34:13

你在第三点上错了。两个条目可以具有相同的哈希码，但不相等。看一下HashMap的实现。从OpenJdk中获取。你可以看到它检查哈希值是否相等键值是否相等。如果第三点成立，那么检查键值是否相等就没有必要了。哈希码在键之前进行比较，因为前者是更有效的比较。

如果您有兴趣进一步了解这方面的知识，请参阅Wikipedia关于开放寻址冲突解决的文章，我认为这是OpenJdk实现使用的机制。这种机制与另一个答案中提到的“桶”方法略有不同。

2011-06-27 13:50:35

Java HashMap如何使用相同的散列代码处理不同的对象?

推荐文章

最新文章

标签