关于Java HashMap的认知

消耗积分:2 | 格式:rar | 大小:0.8 MB | 2017-09-27

分享资料个

　　HashMap详解

　　HashMap 和 HashSet 是 Java Collection Framework 的两个重要成员，其中 HashMap 是 Map 接口的常用实现类，HashSet 是 Set 接口的常用实现类。虽然 HashMap 和 HashSet 实现的接口规范不同，但它们底层的 Hash 存储机制完全一样，甚至 HashSet 本身就采用 HashMap 来实现的（使用HashMap的key来存储HashSet的值，value是一个无意义的对象）。

　　通过 HashMap、HashSet 的源代码分析其 Hash 存储机制

　　实际上，HashSet 和 HashMap 之间有很多相似之处，对于 HashSet 而言，系统采用 Hash 算法决定集合元素的存储位置，这样可以保证能快速存、取集合元素；对于 HashMap 而言，系统 key-value 当成一个整体进行处理，系统总是根据 Hash 算法来计算 key-value 的存储位置，这样可以保证能快速存、取 Map 的 key-value 对。

　　在介绍集合存储之前需要指出一点：虽然集合号称存储的是 Java 对象，但实际上并不会真正将 Java 对象放入 Set 集合中，只是在 Set 集合中保留这些对象的引用而言。也就是说：Java 集合实际上是多个引用变量所组成的集合，这些引用变量指向实际的 Java 对象。

　　集合和引用

　　就像引用类型的数组一样，当我们把 Java 对象放入数组之时，并不是真正的把 Java 对象放入数组中，只是把对象的引用放入数组中，每个数组元素都是一个引用变量。

　　HashMap 的存储实现

　　当程序试图将多个 key-value 放入 HashMap 中时，以如下代码片段为例：

　　HashMap《 String， Double》 map= newHashMap《 String， Double》（）; map.put（ “高数”，60.0）; map.put（ “大英”， 89.0）; map.put（ “大物”， 78.2）;

　　HashMap 采用一种所谓的“Hash 算法”来决定每个元素的存储位置。

　　当程序执行 map.put（“高数” ， 60.0）; 时，系统将调用”高数”的 hashCode（）方法得到其 hashCode 值——每个 Java 对象都有 hashCode（）方法，都可通过该方法获得它的 hashCode 值。得到这个对象的 hashCode 值之后，系统会根据该 hashCode 值来决定该元素的存储位置。

　　我们可以看 HashMap 类的 put（K key ， V value）方法的源代码：

　　publicV put（K key， V value） { // 如果 key 为 null，调用 putForNullKey 方法进行处理 if（key == null） returnputForNullKey（ value）; // 根据 key 的 keyCode 计算 Hash 值 inthash = hash（key.hashCode（））; // 搜索指定 hash 值在对应 table 中的索引 inti = indexFor（hash， table.length）; // 如果 i 索引处的 Entry 不为 null，通过循环不断遍历 e 元素的下一个元素for（Entry《K，V》 e = table［i］; e ！= null; e = e.next） { Object k; // 找到指定 key 与需要放入的 key 相等（hash 值相同 // 通过 equals 比较放回 true） if（e.hash == hash && （（k = e.key） == key || key.equals（k））） { V oldValue = e. value; e. value= value; e.recordAccess（ this）;returnoldValue; } } // 如果 i 索引处的 Entry 为 null，表明此处还没有 Entry modCount++; // 将 key、value 添加到 i 索引处 addEntry（hash， key， value， i）; returnnull; }

　　上面程序中用到了一个重要的内部接口：Map.Entry，每个 Map.Entry 其实就是一个 key-value 对。从上面程序中可以看出：当系统决定存储 HashMap 中的 key-value 对时，完全没有考虑 Entry 中的 value，仅仅只是根据 key 来计算并决定每个 Entry 的存储位置。这也说明了前面的结论：我们完全可以把 Map 集合中的 value 当成 key 的附属，当系统决定了 key 的存储位置之后，value 随之保存在那里即可。

　　上面方法提供了一个根据 hashCode（）返回值来计算 Hash 码的方法：hash（），这个方法是一个纯粹的数学计算，其方法如下：

　　staticinthash（ inth） { h ^= （h 》》》 20） ^ （h 》》》 12）; returnh ^ （h 》》》 7） ^ （h 》》》 4）; }

　　对于任意给定的对象，只要它的 hashCode（）返回值相同，那么程序调用 hash（int h）方法所计算得到的 Hash 码值总是相同的。接下来程序会调用 indexFor（int h， int length）方法来计算该对象应该保存在 table 数组的哪个索引处。indexFor（int h， int length）方法的代码如下：

　　static intindexFor（ inth， intlength） { returnh & （ length- 1）; }

　　这个方法非常巧妙，它总是通过 h &（table.length -1）来得到该对象的保存位置——而 HashMap 底层数组的长度总是 2 的 n 次方，这一点可参看后面关于 HashMap 构造器的介绍。

　　当 length 总是 2 的倍数时，h & （length-1）将是一个非常巧妙的设计：假设 h=5，length=16，那么 h & length - 1 将得到 5；如果 h=6，length=16，那么 h & length - 1 将得到 6 ……如果 h=15，length=16，那么 h & length - 1 将得到 15；但是当 h=16 时， length=16 时，那么 h & length - 1 将得到 0 了；当 h=17 时， length=16 时，那么 h & length - 1 将得到 1 了……这样保证计算得到的索引值总是位于 table 数组的索引之内。

　　根据上面 put 方法的源代码可以看出，当程序试图将一个 key-value 对放入 HashMap 中时，程序首先根据该 key 的 hashCode（）返回值决定该 Entry 的存储位置：如果两个 Entry 的 key 的 hashCode（）返回值相同，那它们的存储位置相同。如果这两个 Entry 的 key 通过 equals 比较返回 true，新添加 Entry 的 value 将覆盖集合中原有 Entry 的 value，但 key 不会覆盖。如果这两个 Entry 的 key 通过 equals 比较返回 false，新添加的 Entry 将与集合中原有 Entry 形成 Entry 链，而且新添加的 Entry 位于 Entry 链的头部——具体说明继续看 addEntry（）方法的说明。

　　当向 HashMap 中添加 key-value 对，由其 key 的 hashCode（）返回值决定该 key-value 对（就是 Entry 对象）的存储位置。当两个 Entry 对象的 key 的 hashCode（）返回值相同时，将由 key 通过 eqauls（）比较值决定是采用覆盖行为（返回 true），还是产生 Entry 链（返回 false）。

　　上面程序中还调用了 addEntry（hash， key， value， i）; 代码，其中 addEntry 是 HashMap 提供的一个包访问权限的方法，该方法仅用于添加一个 key-value 对。下面是该方法的代码：

　　voidaddEntry（ inthash， K key， V value， intbucketIndex） { // 获取指定 bucketIndex 索引处的 Entry Entry《K，V》 e = table［bucketIndex］; // ① // 将新创建的 Entry 放入 bucketIndex 索引处，并让新的 Entry 指向原来的 Entry table［bucketIndex］ = newEntry《K，V》（hash， key，value， e）; // 如果 Map 中的 key-value 对的数量超过了极限 if（size++ 》= threshold） // 把 table 对象的长度扩充到 2 倍。 resize（ 2* table.length）; // ② }

　　上面方法的代码很简单，但其中包含了一个非常优雅的设计：系统总是将新添加的 Entry 对象放入 table 数组的 bucketIndex 索引处——如果 bucketIndex 索引处已经有了一个 Entry 对象，那新添加的 Entry 对象指向原有的 Entry 对象（产生一个 Entry 链），如果 bucketIndex 索引处没有 Entry 对象，也就是上面程序①号代码的 e 变量是 null，也就是新放入的 Entry 对象指向 null，也就是没有产生 Entry 链。

　　JDK 源码

　　在 JDK 安装目录下可以找到一个 src.zip 压缩文件，该文件里包含了 Java 基础类库的所有源文件。只要读者有学习兴趣，随时可以打开这份压缩文件来阅读 Java 类库的源代码，这对提高读者的编程能力是非常有帮助的。需要指出的是：src.zip 中包含的源代码并没有包含像上文中的中文注释，这些注释是笔者自己添加进去的。

　　Hash 算法的性能选项

　　根据上面代码可以看出，在同一个 bucket 存储 Entry 链的情况下，新放入的 Entry 总是位于 bucket 中，而最早放入该 bucket 中的 Entry 则位于这个 Entry 链的最末端。

　　上面程序中还有这样两个变量：

　　size：该变量保存了该 HashMap 中所包含的 key-value 对的数量。

　　threshold：该变量包含了 HashMap 能容纳的 key-value 对的极限，它的值等于 HashMap 的容量乘以负载因子（load factor）。

　　从上面程序中②号代码可以看出，当 size++ 》= threshold 时，HashMap 会自动调用 resize 方法扩充 HashMap 的容量。每扩充一次，HashMap 的容量就增大一倍。

　　上面程序中使用的 table 其实就是一个普通数组，每个数组都有一个固定的长度，这个数组的长度就是 HashMap 的容量。HashMap 包含如下几个构造器：

　　HashMap（）：构建一个初始容量为 16，负载因子为 0.75 的 HashMap。

　　HashMap（int initialCapacity）：构建一个初始容量为 initialCapacity，负载因子为 0.75 的 HashMap。

　　HashMap（int initialCapacity， float loadFactor）：以指定初始容量、指定的负载因子创建一个 HashMap。

　　当创建一个 HashMap 时，系统会自动创建一个 table 数组来保存 HashMap 中的 Entry，下面是 HashMap 中一个构造器的代码：

　　// 以指定初始化容量、负载因子创建 HashMap 我的Java学习交流QQ群：589809992public HashMap（ intinitialCapacity， floatloadFactor） { // 初始容量不能为负数if（initialCapacity 《 0） throw newIllegalArgumentException（ “Illegal initial capacity： ”+ initialCapacity）; // 如果初始容量大于最大容量，让出示容量 if（initialCapacity 》 MAXIMUM_CAPACITY） initialCapacity = MAXIMUM_CAPACITY; // 负载因子必须大于 0 的数值 if（loadFactor 《= 0|| Float.isNaN（loadFactor）） throw newIllegalArgumentException（ loadFactor）; // 计算出大于 initialCapacity 的最小的 2 的 n 次方值。 intcapacity = 1;while（capacity 《 initialCapacity） capacity 《《= 1; this.loadFactor = loadFactor; // 设置容量极限等于容量 * 负载因子 threshold = （ int）（capacity * loadFactor）; // 初始化 table 数组table = newEntry［capacity］; // ① init（）; }

　　上面代码中粗体字代码包含了一个简洁的代码实现：找出大于 initialCapacity 的、最小的 2 的 n 次方值，并将其作为 HashMap 的实际容量（由 capacity 变量保存）。例如给定 initialCapacity 为 10，那么该 HashMap 的实际容量就是 16。

　　程序①号代码处可以看到：table 的实质就是一个数组，一个长度为 capacity 的数组。

　　对于 HashMap 及其子类而言，它们采用 Hash 算法来决定集合中元素的存储位置。当系统开始初始化 HashMap 时，系统会创建一个长度为 capacity 的 Entry 数组，这个数组里可以存储元素的位置被称为“桶（bucket）”，每个 bucket 都有其指定索引，系统可以根据其索引快速访问该 bucket 里存储的元素。

　　无论何时，HashMap 的每个“桶”只存储一个元素（也就是一个 Entry），由于 Entry 对象可以包含一个引用变量（就是 Entry 构造器的的最后一个参数）用于指向下一个 Entry，因此可能出现的情况是：HashMap 的 bucket 中只有一个 Entry，但这个 Entry 指向另一个 Entry ——这就形成了一个 Entry 链。如图 1 所示：

　　关于Java HashMap的认知

　　HashMap 的读取实现

　　当 HashMap 的每个 bucket 里存储的 Entry 只是单个 Entry ——也就是没有通过指针产生 Entry 链时，此时的 HashMap 具有最好的性能：当程序通过 key 取出对应 value 时，系统只要先计算出该 key 的 hashCode（）返回值，在根据该 hashCode 返回值找出该 key 在 table 数组中的索引，然后取出该索引处的 Entry，最后返回该 key 对应的 value 即可。看 HashMap 类的 get（K key）方法代码

JAVA

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

暂无相关数据

关于Java HashMap的认知

Java编程思想练习题源码

关于JAVA的相关基础知识

阿里巴巴Java开发手册

关于STM32F407芯片结构的个人认知

知乎高赞：Java和嵌入式，选哪个？

嵌入式 or JAVA

JAVA连接Oracle数据库实代码+详细注释

(网盘)java之package以及eclipse的使用等试验视频资料

认知无线电MAC层与应用层仿真软件

认知无线电MAC层与应用层仿真平台

Java工具软件免费下载

Java智能卡EEPROM碎片整理算法

关于车载信息系统方面的设计

认知无线电技术及在军事通信中的应用总结

认知无线电技术及其在军事通信上的应用总结

具有能量收集功能的认知中继网络模型

蓝牙产品开发，常见的5大错误认知资料下载

基于Unity3D游戏引擎的神经反馈治疗系统

关于PC板卡供电模块的二三事资料下载

Java中的XML与内容管理

一种认知中继网络时隙分配与传输方案

Java的iterator和foreach遍历集合源代码

基于智能决策理论的无人机集群认知干扰算法

讲解Java数组

学习Java语言必须需要的六大要点是什么

Java Script的编码规范详细说明

Java的23种设计模式详细资料说明

Java基础教程PDF电子书免费下载

JAVA程序设计教程之JSP程序设计实验

使用java语言导入SQL到MySql的源代码免费下载

带你初步简单认识的Java编程语言资料免费下载

别被过时认知误导！打破关于TSN的7大认知误区

Java 23功能介绍

华纳云：java web和java有什么区别java web和java有什么区别

鸿蒙语言基础类库：ohos.util.HashMap 非线性容器HashMap

OpenHarmony语言基础类库【@ohos.util.HashMap (非线性容器HashMap)】

为什么HashMap会产生死循环呢？

关于2023年Java趋势的内容

java环境搭建及配置教程

idea怎么创建Java项目

简单了解Java的新特性

java内存溢出排查方法

java中常用的包有哪些

java的util包下有哪些类

java导入包import怎么写

javaweb和java有什么区别

盘点那些强大又低调的Java缓存

认知扭曲类别

Java Agent的作用及原理

JDK中java.util.HashSet 类的介绍

如何通过注解来优化我们的Java代码

关于Java继承的问题

对比Java中HashMap的一些异同

Java泛型的背景和作用

为什么要使用Redis做缓存？

HashMap遍历操作为什么不能一边遍历一遍删除呢？

HashMap夺命14问，你能坚持到第几问？

初学者：讲解Java程序的开发与运行原理

关于选择处理器的八个认知错误

Java中如何获取文件的路径

Java程序是如何运行的

下载排行榜