8. 集合 1

在实现方法时,选择不同的数据结构会导致其实现风格以及性能存在着很大差异。需要快速地搜索成千上万个(甚至上百万)有序的数据项吗? 需要快速地在有序的序列中间插人元素或删除元素吗? 需要建立键与值之间的关联吗?这些要求数组肯定是没有办法做到的,因为数组的缺点是一旦声明之后,长度就不可变了;同时,声明数组时的数据类型也决定了该数组存储的数据的类型;而且,数组存储的数据是有序的、可重复的,特点单一。但是集合提高了数据存储的灵活性,Java 集合不仅可以用来存储不同类型不同数量的对象,还可以保存具有映射关系的数据。

表 8.1 Java 库中的具体集合(未包含线程安全集合)

集合类型

描述

ArrayList

一种可以动态增长和缩减的索引序列

LinkedList

一种可以在任何位置进行高效的插入和删除操作的有序序列

ArrayDeque

一种可以循环数组实现的双端队列

HashSet

一种没有重复元素的无序集合

TreeSet

一种有序集合(PS:没有重复元素)

EnumSet

一种包含枚举类型的集合

LinkedHashSet

一种可以记住元素插入次序的集合

PriorityQueue

一种允许高效删除最小元素的集合

HashMap

一种存储键/值关联的数据结构

TreeMap

一种键值有序排列的映射表

EnumMap

一种键值属于枚举类型的映射表

LinkedHashMap

一种可以记住键值项添加次序的映射表

WeakHashMap

一种其值无用武之地后可以被垃圾回收器回收的映射表

IdentityHashMap

一种用==而不是用equals比较键值的映射表

集合框架中的类

图 8.1 集合框架中的类

我们在不处理大量或复杂数据的情况下使用较多的类应当是 ArrayList 和 HashMap 两个。

Java 集合, 也叫作容器,主要是由两大接口派生而来:一个是 Collection接口,主要用于存放单一元素;另一个是 Map 接口,主要用于存放键值对。

对于Collection 接口,下面又有三个主要的子接口:List、Set 和 Queue。

Java 集合

图 8.2 Java 集合 2

List
  • ArrayList : Object[] 数组

  • Vector :Object[] 数组

  • LinkedList : 双向链表(JDK1.6 之前为循环链表,JDK1.7 取消了循环)

Set
  • HashSet (无序,唯一): 基于 HashMap 实现的,底层采用 HashMap 来保存元素

  • LinkedHashSet : LinkedHashSetHashSet 的子类,并且其内部是通过 LinkedHashMap 来实现的。有点类似于我们之前说的 LinkedHashMap 其内部是基于 HashMap 实现一样,不过还是有一点点区别的

  • TreeSet (有序,唯一): 红黑树(自平衡的排序二叉树)

Queue
  • PriorityQueue : Object[] 数组来实现二叉堆

  • ArrayQueue : Object[] 数组 + 双指针

Map
  • HashMap : JDK1.8 之前 HashMap 由数组+链表组成的,数组是 HashMap 的主体,链表则是主要为了解决哈希冲突而存在的(“拉链法”解决冲突)。JDK1.8 以后在解决哈希冲突时有了较大的变化,当链表长度大于阈值(默认为 8)(将链表转换成红黑树前会判断,如果当前数组的长度小于 64,那么会选择先进行数组扩容,而不是转换为红黑树)时,将链表转化为红黑树,以减少搜索时间

  • LinkedHashMapLinkedHashMap 继承自 HashMap ,所以它的底层仍然是基于拉链式散列结构即由数组和链表或红黑树组成。另外, LinkedHashMap 在上面结构的基础上,增加了一条双向链表,使得上面的结构可以保持键值对的插入顺序。同时通过对链表进行相应的操作,实现了访问顺序相关逻辑。详细可以查看:《LinkedHashMap 源码详细分析(JDK1.8)》 (opens new window)

  • Hashtable : 数组+链表组成的,数组是 Hashtable 的主体,链表则是主要为了解决哈希冲突而存在的

  • TreeMap : 红黑树(自平衡的排序二叉树)

8.1. List, Set, Queue, Map 四者的区别

  • List (对付顺序的好帮手): 存储的元素是有序的、可重复的。

  • Set (注重独一无二的性质): 存储的元素是无序的、不可重复的。

  • Queue (实现排队功能的叫号机): 按特定的排队规则来确定先后顺序,存储的元素是有序的、可重复的。

  • Map (用 key 来搜索的专家): 使用键值对(key-value)存储,类似于数学上的函数 y=f(x),“x” 代表 key,“y” 代表 value,key 是无序的、不可重复的,value 是无序的、可重复的,每个键最多映射到一个值。

8.2. Collection 子接口之 List


1

考虑到讲到 Java 集合框架就不可避免地要涉及数据结构,所以在本章节中就不对 Java 集合进行详细讲解。同时本文章参考 JavaGuide 容器

2

图中只列举了主要的继承派生关系,并没有列举所有关系。比方省略了AbstractList, NavigableSet等抽象类以及其他的一些辅助类。