我们知道Java集合主要分为三种类型:
• Set(集) • List(列表) • Map(映射)
正如鲁迅先生所讲"世界上本没有集合,想要的人多了,便有了集合"
几乎所有的集合都是基于数组来实现的,因为集合是对数组的封装,所以,数组永远比任何一个集合要快;但任何一个集合比数组提供的功能要多。
1.数组和集合的区别:
数组声明了它容纳的元素的类型,而集合不声明。这是由于集合以object形式来存储它们的元素。一个数组实例具有固定的大小,不能伸缩。集合则可根据需要动态改变大小。数组是一种可读/可写数据结构,我们没有办法创建一个只读数组。然而可以使用集合提供的ReadOnly方法,以只读方式来使用集合。该方法将返回一个集合的只读版本。2.Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种:
(1)效率高,但容量固定且无法动态改变。 array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。 (2)Java中有一个Arrays类,专门用来操作array。 arrays中拥有一组static函数, equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。 fill():将值填入array中。 sort():用来对array进行排序。 binarySearch():在排好序的array中寻找元素。 System.arraycopy():array的复制。
若程序中不知道对象的数量,需要在空间不足时自动扩增容量,则需要使用容器类库,数组不适用。所以就要用到集合。 那我们开始讨论java中的集合。 这里有一张图参考看一下: 图片来源:(https://baijiahao.baidu.com/s?id=1620007201190925694&wfr=spider&for=pc)
我们可以看到Collection下有:List、Set Map下面有:HashMap、HashTable、TreeMap
Collection是最基本的集合接口,声明了适用于JAVA集合(只包括Set和List)的通用方法。 Set 和List 都继承了Conllection。
Collection接口的方法:
boolean add(Object o); //向集合中加入一个对象的引用 void clear(); //删除集合中所有的对象,即不再持有这些对象的引用 boolean isEmpty(); //判断集合是否为空 boolean contains(Object o); //判断集合中是否持有特定对象的引用 boolean remove(Object o); //从集合中删除一个对象的引用 int size(); //返回集合中元素的数目 Iterartor iterator(); //返回一个Iterator对象,可以用来遍历集合中的元素 Object[] toArray(); //返回一个数组,该数组中包括集合中的所有元素关于:Iterator() 和toArray() 方法都用于集合的所有的元素,前者返回一个Iterator对象,后者返回一个包含集合中所有元素的数组。
Iterator接口声明了如下方法:
hasNext(); //判断集合中元素是否遍历完毕,如果没有,就返回true next(); //返回下一个元素 remove(); //从集合中删除上一个有next()方法返回的元素。List的特征是其元素以线性方式存储,集合中可以存放重复对象;可以插入多个null元素;是一个有序容器,保持了每一个元素的插入顺序,插入的顺序即输出的顺序;区别于Map集合,List集合是单列集合。
List的接口有三个实现类。 (1) ArrayList(代表长度可以改变得数组,可以对元素进行随机的访问) 优点: 底层数据结构是数组,查询快,增删慢。 缺点: 线程不安全(一般不考虑到线程的安全因素,用Arraylist效率比较高) (2) LinkedList(在实现中采用链表数据结构,双向链表的数据结构存储数据) 优点: 底层数据结构是链表,增删快,查询慢。 缺点: 线程不安全。 (3)Vector 优点: 底层数据结构是数组,查询快,增删慢。线程安全。 缺点: 效率低(相比 ArrayList 线程不安全的,性能会稍慢一些)。
Set是最简单的一种集合。集合中的对象不按特定的方式排序,且没有重复对象;只允许一个 null 元素 。
Set接口有三个实现类 (1) HashSet 为快速查找而设计的Set,依赖hashCode()和equals()方法保证元素的唯一性。 HashSet类按照哈希算法来存取集合中的对象,存取速度比较快 如果没有其他限制,这就是我们的默认选择,因为他对速度进行了优化。它不保证 set 元素的迭代顺序。 (2)TreeSet 底层为树结构,通过 Comparator 或者 Comparable 接口保证元素处于排序状态。 TreeSet类还实现了SortedSet接口,能够对集合中的对象进行排序。 (3)LinkedHashSet 具有HsahSet的查询速度,内部使用链表维护元素的顺序(插入的次序)在使用迭代器遍历Set时,结果会按元素插入的次序显示。元素也必须定义hashCode()方法。
Map 是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。Map没有继承于Collection接口,Map本身是一个接口 ,它存储的数据是没有顺序的,可能会持有相同的值对象但键对象必须是唯一的,这是双列集合的特点 ;Map 里你可以拥有随意个 null 值但最多只能有一个 null 键 。
Map接口有6个实现类。 (1) HashMap HashMap 底层基于拉链式的散列结构,并在 JDK 1.8 中引入红黑树优化过长链表的问题。插入和查询"键值对"的开销是固定的。可以通过构造器设置容量和负载因子,以调整容器性能。 基于这样结构,HashMap 可提供高效的增删改查操作。 (2) LinkedHashMap 类似于HashMap,但是迭代遍历时,取得的"键值对"的顺序是其插入次序,或是最近最少使用的(LRU)的次序。 只比HashMap慢一点,通过维护一条双向链表,实现了散列数据结构的有序遍历。;而在迭代访问时反而更快,因为他使用链表维护内部次序。 (3)TreeMap 是SortedMap现阶段的唯一实现。基于红黑树实现。按 key 排序,默认的排序方式是升序自定义排序需要由Comparable或Comparator决定。 TreeMap的特点在于,所得到的结果是经过排序的。 (4)Hashtable 内部存储的键值对是无序的是按照哈希算法进行排序,与 HashMap 最大的区别就是线程安全。键或者值不能为 null,为 null 就会抛出空指针异常。 (5) WeakHashMap 弱键(weak key)映射,允许释放映射所指的对象;这是为解决某类特殊问题而设计的。如果映射之外没有引用指向某个"键",则此"键"可以被垃圾回收器回收。 (6) ConcurrentHashMap 一种线程安全的Map。 (7) IdentityHashMap 使用"=="代替"equals()"对键进行比较的散列映射,专门解决特殊问题而设计出的。
如果你经常会使用索引来对容器中的元素进行访问,那么 List 是你的正确的选择。如果你已经知道索引了的话,那么 List 的实现类比如 ArrayList 可以提供更快速的访问,如果经常添加删除元素的,那么肯定要选择LinkedList。
如果你想容器中的元素能够按照它们插入的次序进行有序存储,那么还是 List,因为 List 是一个有序容器,它按照插入顺序进行存储。
如果你想保证插入元素的唯一性,也就是你不想有重复值的出现,那么可以选择一个 Set 的实现类,比如 HashSet、LinkedHashSet 或者 TreeSet。所有 Set 的实现类都遵循了统一约束比如唯一性,而且还提供了额外的特性比如 TreeSet 还是一个 SortedSet,所有存储于 TreeSet 中的元素可以使用 Java 里的 Comparator 或者 Comparable 进行排序。LinkedHashSet 也按照元素的插入顺序对它们进行存储。
如果你以键和值的形式进行数据存储那么 Map 是你正确的选择。你可以根据你的后续需要从 Hashtable、HashMap、TreeMap 中进行选择。
(1)ArrayList和LinkedList区别:
a.ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。 b.对于随机访问get和set,ArrayList觉得优于LinkedList,因为LinkedList要移动指针。 c.对于新增和删除操作add和remove,LinedList比较占优势,因为ArrayList要移动数据。
(2)Vector和ArrayList 区别:
a.Vector的方法都是同步的(Synchronized),是线程安全的(thread-safe),而ArrayList的方法不是,由于线程的同步必然要影响性能,因此,ArrayList的性能比Vector好。
b.当Vector或ArrayList中的元素超过它的初始大小时,Vector会将它的容量翻倍,而ArrayList只增加50%的大小,这样,ArrayList就有利于节约内存空间。
(3)HashSet和TreeSet的区别:
a.TreeSet 是二叉树实现的,Treeset中的数据是自动排好序的,不允许放入null值。 b2.HashSet 是哈希表实现的,HashSet中的数据是无序的,可以放入null,但只能放入一个null,两者中的值都不能重复,就如数据库中唯一约束。 c.HashSet要求放入的对象必须实现HashCode()方法,放入的对象,是以hashcode码作为标识的,而具有相同内容的 String对象,hashcode是一样,所以放入的内容不能重复。但是同一个类的对象可以放入不同的实例 。
(4)HashSet与HashMap的区别:
HashMapHashSet实现了Map接口实现Set接口存储键值对仅存储对象调用put()向map中添加元素调用add()方法向Set中添加元素HashMap使用键(Key)计算HashcodeHashSet使用成员对象来计算hashcode值,对于两个对象来说hashcode可能相同,所以equals()方法用来判断对象的相等性,如果两个对象不同的话,那么返回falseHashMap相对于HashSet较快,因为它是使用唯一的键获取对象HashSet较HashMap来说比较慢(5)TreeSet和TreeMap的关系 与HashSet完全类似,TreeSet里面绝大部分方法都市直接调用TreeMap方法来实现的。
相同点:
a.TreeMap和TreeSet都是非同步集合,因此他们不能在多线程之间共享,不过可以使用方法Collections.synchroinzedMap()来实现同步。 b.运行速度都要比Hash集合慢,他们内部对元素的操作时间复杂度为O(logN),而HashMap/HashSet则为O(1)。 c. TreeMap和TreeSet都是有序的集合,也就是说他们存储的值都是拍好序的。
不同点:
最主要的区别就是TreeSet和TreeMap分别实现Set和Map接口 TreeSet只存储一个对象,而TreeMap存储两个对象Key和Value(仅仅key对象有序) TreeSet中不能有重复对象,而TreeMap中value可以存在重复对象。 TreeMap的底层采用红黑树的实现,完成数据有序的插入,排序。
(6)HashMap和HashTable的区别:
a.HashMap是非线程安全的,Hashtable是线程安全的,所以Hashtable重量级一些,因为使用了synchronized关键字来保证线程安全。 b.HashMap允许key和value都为null,而Hashtable都不能为null。 Hashtable继承自 JDK 1.0 的Dictionary 虚拟类,而HashMap是 JDK 1.2 引进的 Map 接口的一个实现。 c.Hashtable和HashMap扩容的方法不一样,Hashtable中数组默认大小11,扩容方式是old*2+1。 d.HashMap中数组的默认大小是16,而且一定是2的指数,增加为原来的2倍。 e.两者通过hash值散列到hash表的算法不一样,Hashtable是古老的除留余数法,直接使用Object的hashcode,而后者是强制容量为2的幂,重新根据hashcode计算hash值,在使用hash和(hash表长度– 1)进行与运算,也等价取膜,但更加高效,取得的位置更加分散,偶数,奇数保证了都会分散到。前者就不能保证。 f. HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException,但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。
List 和 Map 区别?
一个是存储单列数据的集合,另一个是存储键和值这样的双列数据的集合,List 中存储的数据是有顺序,并且允许重复;Map 中存储的数据是没有顺序的,其 key 是不能重复的,它的值是可以有重复的。
Collection 和 Map 的区别:
4.1、Collection 和 Map 的区别 容器内每个为之所存储的元素个数不同。 Collection类型者,每个位置只有一个元素。 Map类型者,持有 key-value pair,像个小型数据库。
各自旗下的子类关系
Collection
List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。 ArrayList / LinkedList / Vector Set : 不能含有重复的元素 HashSet / TreeSetMap
HashMapHashTableTreeMap其他特征
List,Set,Map将持有对象一律视为Object型别。Collection、List、Set、Map都是接口,不能实例化。继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。
如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
在除需要排序时使用TreeSet,TreeMap外,都应使用HashSet,HashMap,因为他们 的效率更高。
要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变。这就是针对抽象编程。 注意:
1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。 2、Set和Collection拥有一模一样的接口。 3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)…。(add/get) 4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。 5、Map用 put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。 HashMap会利用对象的hashCode来快速找到key。 6、Map中元素,可以将key序列、value序列单独抽取出来。 使用keySet()抽取key序列,将map中的所有keys生成一个Set。 使用values()抽取value序列,将map中的所有values生成一个Collection。 为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。
参考博客:
Java中List Set和Map之间的区别_动力节点Java学院整理List、Set、Map的特点及区别详解(Java基础)浅谈集合List,Set以及Map集合的特点及区别