小言_互联网的博客

我的jdk源码(十四):Hashtable类

484人阅读  评论(0)

一、概述

    Hashtable类继承于Dictionary抽象类,jdk注释中说明了Dictionary类已经过时,新的实现类应该去实现Map接口,而不是继承Dictionary类。但是面试的时候还是常常会问到Hashtable与HashMap的区别,所以我们还是来看一下Hashtable类的源码,以及现在的实际应用场景中用什么类来代替它。

二、源码分析

    (1) 类的声明


  
  1. public class Hashtable<K,V>
  2. extends Dictionary< K, V>
  3. implements Map< K, V>, Cloneable, java. io. Serializable

    与HashMap类相比,实现的接口完全一致,只是集成的父类不同:Hashtable继承了Dictionary类;HashMap则是继承自AbstractMap类。

    (2) 成员变量


  
  1. //存放Entry元素的数组
  2. private transient Entry<?,?>[] table;
  3. //实际元素的数量
  4. private transient int count;
  5. //扩容的临界容量,threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
  6. private int threshold;
  7. //负载因子
  8. private float loadFactor;
  9. //修改标记,用于fail-fast机制
  10. private transient int modCount = 0;
  11. //指定的序列化标识ID
  12. private static final long serialVersionUID = 1421746759512286392L;
  13. //数组最大容量,留8个字节存储对象头,具体可在jvm的学习中了解
  14. private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

    transient修饰符修饰的成员变量不会被序列化。 

  (3) 构造方法


  
  1. //默认无参构造函数,设置默认的容量为11,负载因子为0.75f
  2. public Hashtable() {
  3. this( 11, 0.75f);
  4. }
  5. //指定容量的构造函数
  6. public Hashtable(int initialCapacity) {
  7. this(initialCapacity, 0.75f);
  8. }
  9. //指定容量和负载因子的构造函数
  10. public Hashtable(int initialCapacity, float loadFactor) {
  11. if (initialCapacity < 0)
  12. throw new IllegalArgumentException( "Illegal Capacity: "+
  13. initialCapacity);
  14. if (loadFactor <= 0 || Float.isNaN(loadFactor))
  15. throw new IllegalArgumentException( "Illegal Load: "+loadFactor);
  16. //如果指定容量为0,那么返回的容量为1
  17. if (initialCapacity== 0)
  18. initialCapacity = 1;
  19. this.loadFactor = loadFactor;
  20. table = new Entry<?,?>[initialCapacity];
  21. threshold = ( int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
  22. }
  23. //传入指定的Map返回为Hashtable
  24. public Hashtable(Map<? extends K, ? extends V> t) {
  25. //设置容量Math.max(2*t.size(), 11),取2倍t的元素数量和11比较,取大的值
  26. this(Math.max( 2*t.size(), 11), 0.75f);
  27. putAll(t);
  28. }

    不同于HashMap的是,Hashtable在成员变量中并没有设置默认容量,而是在构造函数中设置的,并且默认容量为11;HashMap是成员变量中就设置了初始容量为16。

    (4) Entry<K,V>源码如下:


  
  1. private static class Entry<K,V> implements Map.Entry<K,V> {
  2. final int hash;
  3. final K key;
  4. V value;
  5. Entry<K,V> next;
  6. protected Entry(int hash, K key, V value, Entry<K,V> next) {
  7. this.hash = hash;
  8. this.key = key;
  9. this.value = value;
  10. this.next = next;
  11. }
  12. //这里与HashMap的Node不同,HashMap的Node没有clone()方法
  13. @SuppressWarnings( "unchecked")
  14. protected Object clone() {
  15. return new Entry<>(hash, key, value,
  16. (next== null ? null : (Entry<K,V>) next.clone()));
  17. }
  18. public K getKey() {
  19. return key;
  20. }
  21. public V getValue() {
  22. return value;
  23. }
  24. //设置value时,如果value为null,则直接抛出异常
  25. public V setValue(V value) {
  26. if (value == null)
  27. throw new NullPointerException();
  28. V oldValue = this.value;
  29. this.value = value;
  30. return oldValue;
  31. }
  32. public boolean equals(Object o) {
  33. //先判断对象类型是否一致
  34. if (!(o instanceof Map.Entry))
  35. return false;
  36. Map.Entry<?,?> e = (Map.Entry<?,?>)o;
  37. //必须是key和value都相等才返回true
  38. return (key== null ? e.getKey()== null : key.equals(e.getKey())) &&
  39. (value== null ? e.getValue()== null : value.equals(e.getValue()));
  40. }
  41. //hashCode()与HashMap也不同,HashMap是将key和value的hash值进行异或运算。
  42. public int hashCode() {
  43. return hash ^ Objects.hashCode(value);
  44. }
  45. public String toString() {
  46. return key.toString()+ "="+value.toString();
  47. }
  48. }

    (5) addEntry()方法


  
  1. //添加一个Entry元素到指定位置index
  2. private void addEntry(int hash, K key, V value, int index) {
  3. //修改标记+1
  4. modCount++;
  5. Entry<?,?> tab[] = table;
  6. //如果元素数量超过了限制的数量,就调用rehash()方法进行扩容
  7. if (count >= threshold) {
  8. // Rehash the table if the threshold is exceeded
  9. rehash();
  10. tab = table;
  11. //用k的hash值与Integer.MAX_VALUE-1进行&与运算后的结果对table的容量取模获得新下标
  12. hash = key.hashCode();
  13. index = (hash & 0x7FFFFFFF) % tab.length;
  14. }
  15. //创建新元素,并获取旧元素e的引用
  16. @SuppressWarnings( "unchecked")
  17. Entry<K,V> e = (Entry<K,V>) tab[index];
  18. //将index位置设置为新元素,且新元素的下一个元素指定为e,也就是说每次添加元素都是添加在链表头
  19. tab[index] = new Entry<>(hash, key, value, e);
  20. //元素总数+1
  21. count++;
  22. }

    (6) rehash()方法


  
  1. //扩容方法
  2. protected void rehash() {
  3. //记录原始的容量为oldCapacity
  4. int oldCapacity = table.length;
  5. //记录下原始的容器为oldMap
  6. Entry<?,?>[] oldMap = table;
  7. //计算新容量newCapacity的值为2倍oldCapacity的值+1,也就是newCapacity = 2oldCapacity + 1
  8. int newCapacity = (oldCapacity << 1) + 1;
  9. //如果新容量大于数组最大运行容量MAX_ARRAY_SIZE,也就是Integer.MAX_VALUE - 8
  10. if (newCapacity - MAX_ARRAY_SIZE > 0) {
  11. //判断原始容量oldCapacity是否已经等于了MAX_ARRAY_SIZE,如果是则直接return
  12. if (oldCapacity == MAX_ARRAY_SIZE)
  13. // Keep running with MAX_ARRAY_SIZE buckets
  14. return;
  15. //如果原始容量oldCapacity还未达到MAX_ARRAY_SIZE,则将此次新容量newCapacity设置为MAX_ARRAY_SIZE
  16. newCapacity = MAX_ARRAY_SIZE;
  17. }
  18. //用新容量初始化一个Entry数组
  19. Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
  20. //修改标记+1
  21. modCount++;
  22. //计算新的扩容临界值threshold,取新容量newCapacity和负载因子loadFactor的乘积与MAX_ARRAY_SIZE + 1中较小的值
  23. threshold = ( int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
  24. //将新Map设置为容器
  25. table = newMap;
  26. //循环将旧容器oldMap中的元素添加到新容器中
  27. for ( int i = oldCapacity ; i-- > 0 ;) {
  28. for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
  29. //获取当前元素
  30. Entry<K,V> e = old;
  31. //指向下一位元素
  32. old = old.next;
  33. //重新计算hash值
  34. int index = (e.hash & 0x7FFFFFFF) % newCapacity;
  35. //把newMap原来index下的元素设置为e的下一个元素,并将元素e放在index位置上
  36. e.next = (Entry<K,V>)newMap[index];
  37. newMap[index] = e;
  38. }
  39. }
  40. }

    HashTable的扩容机制如下:例如默认初始容量是11,加载因子为0.75,那么扩容阀值就是8,当数组长度达到8的时候,HashTable就会进行一第次扩容,扩容后的容量就是 8 * 2 + 1 = 17 ( int newCapacity = (oldCapacity << 1) + 1) ,此时的扩容阀值就是 17 * 0.75 = 13 ,当下次达到13的时候,就会在重复扩容一次。其实,这个扩容消耗还是蛮大的,因为扩容后需要原来HashTable中的元素一一复制到新的HashTable中。

    (7) put()方法


  
  1. //添加一个元素
  2. public synchronized V put(K key, V value) {
  3. // 如果value为null,直接抛出异常
  4. if (value == null) {
  5. throw new NullPointerException();
  6. }
  7. //获取现有的容器tab[]
  8. Entry<?,?> tab[] = table;
  9. //计算桶位,如果key为null,此处会抛异常
  10. int hash = key.hashCode();
  11. int index = (hash & 0x7FFFFFFF) % tab.length;
  12. @SuppressWarnings( "unchecked")
  13. Entry<K,V> entry = (Entry<K,V>)tab[index];
  14. //循环遍历是否有相同key的元素存在,如果有就替换旧元素的value值,并且返回旧元素的alue值
  15. for(; entry != null ; entry = entry.next) {
  16. if ((entry.hash == hash) && entry.key.equals(key)) {
  17. V old = entry.value;
  18. entry.value = value;
  19. return old;
  20. }
  21. }
  22. //如果遍历完,不存在相同的key,则调用addEntry()方法添加元素
  23. addEntry(hash, key, value, index);
  24. return null;
  25. }

    我们可以看到Hashtable类的put()方法加入了synchronized关键字修饰,以确保此方法线程安全。

    (8) get()方法


  
  1. //获取指定key的value值,线程安全
  2. public synchronized V get(Object key) {
  3. Entry<?,?> tab[] = table;
  4. //计算hash
  5. int hash = key.hashCode();
  6. //获取下标
  7. int index = (hash & 0x7FFFFFFF) % tab.length;
  8. //遍历链表,找到元素返回
  9. for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
  10. if ((e.hash == hash) && e.key.equals(key)) {
  11. return (V)e.value;
  12. }
  13. }
  14. //没有返回 null
  15. return null;
  16. }

    (9) clear()方法


  
  1. //将元素全部置为null,也是线程安全的
  2. public synchronized void clear() {
  3. Entry<?,?> tab[] = table;
  4. modCount++;
  5. for ( int index = tab.length; --index >= 0; )
  6. tab[index] = null;
  7. count = 0;
  8. }

    (10) containsKey()方法


  
  1. //判断是否包含key,线程安全
  2. public synchronized boolean containsKey(Object key) {
  3. Entry<?,?> tab[] = table;
  4. int hash = key.hashCode();
  5. int index = (hash & 0x7FFFFFFF) % tab.length;
  6. //找到“key对应的Entry(链表)”,然后在链表中找出“哈希值”和“键值”与key都相等的元素
  7. for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
  8. if ((e.hash == hash) && e.key.equals(key)) {
  9. return true;
  10. }
  11. }
  12. return false;
  13. }

    没啥好说的,就是拿key直接转化为坐标index,从index往后找,查找是否存在此key的元素,判断的依据是hash值和key值都要相同。

    (11) containsValue()方法


  
  1. public boolean containsValue(Object value) {
  2. return contains(value);
  3. }
  4. public synchronized boolean contains(Object value) {
  5. //如果value为null直接抛异常
  6. if (value == null) {
  7. throw new NullPointerException();
  8. }
  9. Entry<?,?> tab[] = table;
  10. //循环遍历容器
  11. for ( int i = tab.length ; i-- > 0 ;) {
  12. for (Entry<?,?> e = tab[i] ; e != null ; e = e.next) {
  13. if (e.value.equals(value)) {
  14. return true;
  15. }
  16. }
  17. }
  18. return false;
  19. }

三、总结

    Hashtable类还是要与HashMap来比较着分析,主要有一下几点不同:

    * 继承的父类不同:Hashtable类继承自Dictionary这一过时的类;HashMap类继承自AbstractMap类。

    * 数据结构不同:Hashtable始终是"数组+链表"的形式;HashMap在jdk1.8后是有"数组+链表"和"数组+红黑树"的形式的。

    * 无参初始容量不同:Hashtable无参初始容量为11;HashMap的无参初始容量为16

    * hash值计算方式不同:HashTable计算哈希的方式是直接取key本身的hash;而HashMap计算hash的方式为"(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16) ",即自身哈希和哈希无符号右移16位做与运算。

    * 获得索引key的方式不同:Hashtable是“index = (hash & 0x7FFFFFFF) % tab.length”,采用的是取模运算;而HashMap在jdk1.8已经采用“(length - 1) & hash”,把hash值和容量进行“与”操作,这得益于HashMap的容量始终为2的次幂,这样计算效率大大提升。

    * 扩容机制不同:一般情况下,Hashtable每次扩容是从n到2n+1;HashMap每次扩容从n变为2n,并且由于HashMap在指定容量进行初始化以及每次扩容时都会调用 inflateTable()方法来保证自己的容器容量始终是2的次幂。

    * key和value限制不同:Hashtable不允许key为null,也不允许value为null,源码中我们得知,每次都会判断value是否为null,如果是就直接抛出异常,而key则是在调用key.hashCode()时,如果key为null也会抛出异常;HashMap中的源码在判断key为null后,会设置key的hash值为0,也就是放在桶的第一个位置,代码中也不会value是否为null做限制,那么结论就是HashMap允许一个key为null的元素(再有就覆盖原来的value),允许多个value为null的元素。

    * 线程安全问题:Hashtable中涉及容器变化以及访问的方法,都采用了synchronized关键字修饰,以保证线程安全,相对的效率低一些;HashMap无synchronized修饰,线程不安全,相比Hashtable效率高一些。

    值得注意的是Hashtable类似乎也要被淘汰了,jdk1.8的Hashtable类的注释中有写: 如果你不需要线程同步,建议使用HashMap来代替HashTable,如果你的你是需要线程同步的话使用ConcurrentHashMap来替代Hashtable 。

    更多精彩内容,敬请扫描下方二维码,关注我的微信公众号【Java觉浅】,获取第一时间更新哦!


转载:https://blog.csdn.net/qq_34942272/article/details/106405975
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场