散列表的内部数据结构是数组和链表的结合,好处是增删查改速度快,坏处是如果冲突过多会影响性能。
散列表的工作原理就是按照每一个元素给定的 键(key)值和散列函数决定这一个元素存放在数组的位置,下次取值时只需给出所需元素的 键(key)值,就可以按照散列函数找到存放位置,将此处的元素返回。
在进行存放元素时因数组大小限制,可能会有 键(key)值不同但经过散列函数计算后结果相等的元素,这种情况称之为“冲突”,因为数组长度的限制,所以在使用时“冲突”经常出现,所以为了解决这个问题,有两种方法解决这种“冲突”问题。
链接法
当有多个元素的 键(key)值不同,但经过散列函数计算后的值相同时,会将这几个元素放到数组中的同一个位置,产生数据丢失,所以可以将这几个元素组成链表,将表头放入数组中,这样就等于是在数组的每一个位置放入了一个链表,链表中储存的是通过散列函数计算后值相同的元素。代码示例:
/*** @author mojiayi* @date 2019-01-29 04:52* 散列表链接法实现* 通过输入键值与散列函数计算得到元素存放位置* 线程不安全*/
public class MyHashMap<K,V> {/*** 存放元素的数组*/private Object[] cao;/*** 数组默认长度10*/private int capacity = 100;MyHashMap(){cao = new Object[capacity];}MyHashMap(int capacity){cao = new Object[capacity];this.capacity = capacity;}/*** 通过键(key)值计算存放在数组的位置* @param key* @return*/private int getLocation(K key){return key.hashCode() % capacity;}/*** 插入时如果数组位置为空,在节点头部创建一个空节点作为头节点保存在数组中,* 插入元素放在头节点后* 节点使用内部类 Node 实现* @param key* @param value*/public void put(K key, V value){int i = getLocation(key);if(cao[i]==null){Node node = new Node(key, value, null, null);cao[i] = new Node(null, null, node, null);node.pre = (Node) cao[i];return;}Node node = findNode((Node) cao[i], key);if(node != null){node.obj = value;return;}Node tmp = (Node) cao[i];node = new Node(key, value, tmp.next, tmp);tmp.next.pre = node;tmp.next = node;}/*** 根据键(key)值得到数组位置后,* 从头节点开始遍历寻找和传入键(key)值相同的元素* @param node* @param key* @return*/private Node findNode(Node node, K key) {if(key.equals(node.key))return node;if(node.next==null)return null;return findNode(node.next, key);}/*** 根据键(key)值查找元素得到节点的元素值* 返回 Node 对象的 obj 值* @param key* @return*/public V get(K key) {Node node = (Node) cao[getLocation(key)];if(node==null)return null;Node res = findNode(node, key);return res==null?null:res.obj;}public boolean remove(K key){int i = getLocation(key);if(cao[i] == null)return false;Node node = findNode((Node) cao[i], key);if(node == null)return false;if(node.next == null){node.pre.next = null;node.pre = null;node.obj = null;node.key = null;node = null;return true;}System.out.println(node);node.pre.next = node.next;node.next.pre = node.pre;node.pre = null;node.next = null;node.key = null;node.obj = null;node = null;return true;}/*** 内部类* 用来实现链表节点*/private class Node{private K key;private V obj;private Node next;private Node pre;Node(K key, V obj, Node next, Node pre){this.key = key;this.next = next;this.obj = obj;this.pre = pre;}@Overridepublic String toString() {return "["+key+","+obj+"]";}}@Overridepublic String toString() {return "["+key+","+obj+"]";}}@Overridepublic String toString() {StringBuilder builder = new StringBuilder();for(int i = 0; i < cao.length; i++){if(cao[i] != null){Node node = (Node) cao[i];builder.append(node.toString());while(node.next != null){builder.append(node.next.toString());//System.out.println(node);node = node.next;}builder.append("\n");}}return builder.toString();}
}
复制代码
开放寻址法
我们称数组中每一个位置为桶,在链接法中每个桶内存储的是一条链表,表示哈希到此位置的每一个元素。开放寻址法在每一个桶中放一个元素而不是链表,当插入一个元素时,映射到的桶已经存在元素,则向后移动寻找桶防止元素,具体规则如下:(1)线性探测再散列:每次向后移动一个位置,若为空则放置元素
(2)平方探测再散列:i=1;i++;每次向后移动 i 平方个位置,若桶不为空,则从第一次哈希到的位置向前移动 i 平方的位置。
在开放寻址法中需要一个负载因子(load),当元素个数 == 哈希表容量 * load 时,需要扩容哈希表。负载因在的选择很重要,当 load 过大,就有可能影响哈希表的查找效率;若 load 太小,则会经常出发扩容,因为哈希表的本质是数组,则扩容操作也非常影响效率。
开放寻址法的缺点:
(1)删除一个节点时需要额外的开销
(2)容易产生聚集,当一个桶附近发生了大量的冲突,就会在这一片地址占用很多空间,下次在插入时若哈希计算到这附近,会再次产生冲突,产生连锁效应,严重影响效率。