面试精选11-谈HashSet的工作原理

2022-10-02 09:55 作者:架构风清扬-趣学旅程 0人读过 | 我要投稿

HashSet的存储原理或者工作原理，主要是从如何保证唯一性来说起。

这里面主要有3个问题，需要回答？

第一，为什么要采用Hash算法？有什么优势，解决了什么问题？

第二，所谓哈希表是一张什么表？

第三，HashSet如何保证保存对象的唯一性？会经历一个什么样的运算过程？

大家可以先思考，下面来看解读！

第一，为什么要采用Hash算法？有什么优势，解决了什么问题？

解决的问题是唯一性判断的效率问题，保证为O(1)的复杂度

其存储数据的底层结构采用的是数组

当我们往数组放数据的时候，你如何判断是否唯一？

可以采用遍历的方式，逐个比较，但是这种效率低，尤其是数据很多的情况下，时间复杂度为O(n)

所以，为了解决这个效率低的问题，我们采用新的方式

采用hash算法的关键，是通过调用存储对象的hashcode方法得到一个数值，然后再根据这个数值，经过一通复杂的固定运算规则，得到我们要存储在数组的下标，如果此时计算的下标位置没有其他元素，则直接存储，不用比较，所以最佳的效果可以达到O(1)

此处，我们只会用到hashCode

但是随着元素的不断添加，就可能出现“哈希冲突”，不同的对象计算出来的hash值是相同的，这个时候，我们就需要比较，才需要用到equals方法

如果equals相同，则不插入，不相等，则形成链表

第二，所谓哈希表是一张什么表？

本质是一个数组，而且数组的元素是链表

以上是JDK1.7的版本实现

在JDK1.8版本之后做了优化

优化点：随着元素不断添加，链表可能会越来越长，那么再遍历链表的效率也会下降，所以会优化为红黑树，具体这个阈值是什么？

大家可以查看下源码，印象更深刻！

标签：

面试精选11-谈HashSet的工作原理的评论 (共条)