散列表学习

news/2025/3/22 2:12:14

散列表的内部数据结构是数组和链表的结合,好处是增删查改速度快,坏处是如果冲突过多会影响性能。

散列表的工作原理就是按照每一个元素给定的 键(key)值和散列函数决定这一个元素存放在数组的位置,下次取值时只需给出所需元素的 键(key)值,就可以按照散列函数找到存放位置,将此处的元素返回。

在进行存放元素时因数组大小限制,可能会有 键(key)值不同但经过散列函数计算后结果相等的元素,这种情况称之为“冲突”,因为数组长度的限制,所以在使用时“冲突”经常出现,所以为了解决这个问题,有两种方法解决这种“冲突”问题。

链接法

当有多个元素的 键(key)值不同,但经过散列函数计算后的值相同时,会将这几个元素放到数组中的同一个位置,产生数据丢失,所以可以将这几个元素组成链表,将表头放入数组中,这样就等于是在数组的每一个位置放入了一个链表,链表中储存的是通过散列函数计算后值相同的元素。

代码示例:

/*** @author mojiayi* @date 2019-01-29 04:52* 散列表链接法实现* 通过输入键值与散列函数计算得到元素存放位置* 线程不安全*/
public class MyHashMap<K,V> {/*** 存放元素的数组*/private Object[] cao;/*** 数组默认长度10*/private int capacity = 100;MyHashMap(){cao = new Object[capacity];}MyHashMap(int capacity){cao = new Object[capacity];this.capacity = capacity;}/*** 通过键(key)值计算存放在数组的位置* @param key* @return*/private int getLocation(K key){return key.hashCode() % capacity;}/*** 插入时如果数组位置为空,在节点头部创建一个空节点作为头节点保存在数组中,* 插入元素放在头节点后* 节点使用内部类 Node 实现* @param key* @param value*/public void put(K key, V value){int i = getLocation(key);if(cao[i]==null){Node node = new Node(key, value, null, null);cao[i] = new Node(null, null, node, null);node.pre = (Node) cao[i];return;}Node node = findNode((Node) cao[i], key);if(node != null){node.obj = value;return;}Node tmp = (Node) cao[i];node = new Node(key, value, tmp.next, tmp);tmp.next.pre = node;tmp.next = node;}/*** 根据键(key)值得到数组位置后,* 从头节点开始遍历寻找和传入键(key)值相同的元素* @param node* @param key* @return*/private Node findNode(Node node, K key) {if(key.equals(node.key))return node;if(node.next==null)return null;return findNode(node.next, key);}/*** 根据键(key)值查找元素得到节点的元素值* 返回 Node 对象的 obj 值* @param key* @return*/public V get(K key) {Node node = (Node) cao[getLocation(key)];if(node==null)return null;Node res = findNode(node, key);return res==null?null:res.obj;}public boolean remove(K key){int i = getLocation(key);if(cao[i] == null)return false;Node node = findNode((Node) cao[i], key);if(node == null)return false;if(node.next == null){node.pre.next = null;node.pre = null;node.obj = null;node.key = null;node = null;return true;}System.out.println(node);node.pre.next = node.next;node.next.pre = node.pre;node.pre = null;node.next = null;node.key = null;node.obj = null;node = null;return true;}/*** 内部类* 用来实现链表节点*/private class Node{private K key;private V obj;private Node next;private Node pre;Node(K key, V obj, Node next, Node pre){this.key = key;this.next = next;this.obj = obj;this.pre = pre;}@Overridepublic String toString() {return "["+key+","+obj+"]";}}@Overridepublic String toString() {return "["+key+","+obj+"]";}}@Overridepublic String toString() {StringBuilder builder = new StringBuilder();for(int i = 0; i < cao.length; i++){if(cao[i] != null){Node node = (Node) cao[i];builder.append(node.toString());while(node.next != null){builder.append(node.next.toString());//System.out.println(node);node = node.next;}builder.append("\n");}}return builder.toString();}
}
复制代码

开放寻址法

我们称数组中每一个位置为桶,在链接法中每个桶内存储的是一条链表,表示哈希到此位置的每一个元素。开放寻址法在每一个桶中放一个元素而不是链表,当插入一个元素时,映射到的桶已经存在元素,则向后移动寻找桶防止元素,具体规则如下:

(1)线性探测再散列:每次向后移动一个位置,若为空则放置元素

(2)平方探测再散列:i=1;i++;每次向后移动 i 平方个位置,若桶不为空,则从第一次哈希到的位置向前移动 i 平方的位置。

在开放寻址法中需要一个负载因子(load),当元素个数 == 哈希表容量 * load 时,需要扩容哈希表。负载因在的选择很重要,当 load 过大,就有可能影响哈希表的查找效率;若 load 太小,则会经常出发扩容,因为哈希表的本质是数组,则扩容操作也非常影响效率。

开放寻址法的缺点:

(1)删除一个节点时需要额外的开销

(2)容易产生聚集,当一个桶附近发生了大量的冲突,就会在这一片地址占用很多空间,下次在插入时若哈希计算到这附近,会再次产生冲突,产生连锁效应,严重影响效率。

公共溢出区

除了散列表之外,再建立一个溢出区;若哈希计算产生冲突,则将元素放入溢出区中。

转载于:https://juejin.im/post/5c51ea43e51d4502723b2a6d


https://dhexx.cn/news/show-2612010.html

相关文章

11月15日云栖精选夜读 | 人人都能看懂的云计算知识科普 !

双十一期间&#xff0c;我想很多小伙伴都被阿里云的促销活动刷屏了&#xff0c;大家组队组团&#xff0c;可以得到较为便宜的阿里云服务器。另外&#xff0c;Docker 也红得发紫&#xff0c;与之对应的 DevOps 和 NoOps 持续高温。 但是对于不少企业尤其是传统企业&#xff0c;云…

同义词相似度可以怎样计算

前言 词语的相似性的计算方法有很多&#xff0c;比如字面相似度计算方法、基于语义词典的计算方法、基于统计的相似度&#xff08;向量空间模型&#xff09;计算方法和基于神经网络的相似度计算方法。 本篇文章讲讲基于词林的语义相似性。 词林 《同义词词林》是上世纪80年代出…

制作一个Mac APP:XcodeExtension

作为一个iOS developer 突然想尝试Mac开发&#xff0c;这是我第一个Mac APP 这个软件目前包含以下功能 ConvertFromCase 把选择的下划线内容变为驼峰DeleteEmptyLines 删除选中的空行SortLines 排列选中的行JsonToModel 把Json数据转成Swift模型&#xff0c;会把下划线命名变为…

C# 递归获取 文件夹的 所有文件

public void Director(string dir, List<string> list) {DirectoryInfo d new DirectoryInfo(dir);FileInfo[] files d.GetFiles();//文件DirectoryInfo[] directs d.GetDirectories();//文件夹foreach (FileInfo f in files){list.Add(f.Name);//添加文件名到列表中 …

天台人满为患,不如来看下这个Ramnit蠕虫DesktopLayer.exe分析

今年的世界杯越来越看不懂&#xff0c;想去天台吹吹风都不一定有位置&#xff0c;心凉了&#xff0c;事儿还得做&#xff0c;先从网上抓个可疑样本压压惊&#xff01;上手分析才发现并没有我想得那么简单…… 一、基本信息 MD5ff5e1f27193ce51eec318714ef038bef 文件大小 55 KB…

软件架构设计2

中间件提高开发效率 提高复用性 安全性 降低难度 中间件代理机制 适配器 是进行接口转换 java架构体系里面 不同的名词对应的组件是有好处的 数据库规范程度越高 数据表拆的越散 避免数据的冗余&#xff0c;操作异常等一系列问题。表格拆的太散 会带来效率问题 负载均衡 做业…

TOMCAT源码分析-事件与监听

开篇 作为Tomcat生命周期的补充&#xff0c;解释下事件的触发。 源码部分 每个容器由于继承自LifecycleBase&#xff0c;当容器状态发生变化时都会调用fireLifecycleEvent方法生成LifecycleEvent&#xff0c;并且交由此容器的事件监听器处理。通过addLifecycleListener添加事件…

架构论文准备

数据库建模 概念模式关系模型 可靠性 冗余备份 安全性 安全技术 加密 信息摘要 数字证书 体系结构 就是 架构风格 架构的演化 就是考察架构风格 以前用什么架构 现在用什么架构架构优缺点 。 论面向服务的架构设计 就是SOA 摘要 背景 两段 过度段 回应题目子题目…

GMTC 大前端时代前端监控的最佳实践

摘要&#xff1a;今天我分享的内容分成三个部分&#xff1a; 第一部分是“大前端时代前端监控新的变化”, 讲述这些年来&#xff0c;前端监控一些新的视角以及最前沿的一些思考。 第二部分"前端监控的最佳实践"&#xff0c; 从使用的角度出发&#xff0c;介绍前端监控…