java基础之数据结构4（Set和List）

2023年3月6日 127次阅读来源: YitaiCloud

此文已经同步至个人站点博客，点击下方链接可以体验更加阅读模式：《java题库》

一、Set

1.Set 里的元素是不能重复的，那么用什么方法来区分重复与否呢？是用 == 还是 equals()？它们有何区别?

如果hash码值不相同，说明是一个新元素，存；
如果没有元素和传入对象（也就是add的元素）的hash值相等，那么就认为这个元素在table中不存在，将其添加进table；
如果hash码值相同，且equles判断相等，说明元素已经存在，不存；如果hash码值相同，且equles判断不相等，说明元素不存在，存；

java中的数据类型，可分为两类：
1.基本数据类型
也称原始数据类型。byte,short,char,int,long,float,double,boolean,他们之间的比较，应用双等号（==），比较的是他们的值。基本数据类型没有equals方法哦。
2.复合数据类型(类)
当他们用（==）进行比较的时候，比较的是他们在内存中的存放地址，所以，除非是同一个new出来的对象，他们的比较后的结果为true，否则比较后结果为false。 JAVA当中所有的类都是继承于Object这个基类的，在Object中的基类中定义了一个equals的方法，这个方法的初始行为是比较对象的内存地址，但在一些类库当中这个方法被覆盖掉了，如String,Integer,Date在这些类当中equals有其自身的实现，而不再是比较类在堆内存中的存放地址了。
对于复合数据类型之间进行equals比较，在没有覆写equals方法的情况下，他们之间的比较还是基于他们在内存中的存放位置的地址值的，因为Object的equals方法也是用双等号（==）进行比较的，所以比较后的结果跟双等号（==）的结果相同。

2.TreeMap：TreeMap 是采用什么树实现的？TreeMap、HashMap、LindedHashMap的区别。

TreeMap 是一个有序的key-value集合，它是通过红黑树实现的。 TreeMap 继承于AbstractMap，所以它是一个Map，即一个key-value集合。TreeMap 实现了NavigableMap接口，意味着它支持一系列的导航方法。比如返回有序的key集合。TreeMap 实现了Cloneable接口，意味着它能被克隆。 TreeMap 实现了java.io.Serializable接口，意味着它支持序列化。
TreeMap基于红黑树（Red-Black tree）实现。该映射根据其键的自然顺序进行排序，或者根据创建映射时提供的 Comparator 进行排序，具体取决于使用的构造方法。 TreeMap的基本操作 containsKey、get、put 和 remove 的时间复杂度是 log(n) 。另外，TreeMap是非同步的。它的iterator 方法返回的迭代器是fail-fastl的。

3.TreeMap和TreeSet在排序时如何比较元素？Collections工具类中的sort()方法如何比较元素？

TreeSet要求存放的对象所属的类必须实现Comparable接口，该接口提供了比较元素的compareTo()方法，当插入元素时会回调该方法比较元素的大小。TreeMap要求存放的键值对映射的键必须实现Comparable接口从而根据键对元素进行排序。Collections工具类的sort方法有两种重载的形式，第一种要求传入的待排序容器中存放的对象必须实现Comparable接口以实现元素的比较；第二种不强制性的要求容器中的元素必须可比较，但是要求传入第二个参数，参数是Comparator接口的子类型（需要重写compare方法实现元素的比较），相当于一个临时定义的排序规则，其实就是通过接口注入比较元素大小的算法，也是对回调模式的应用（Java中对函数式编程的支持）。

3.TreeSet：一个已经构建好的 TreeSet，怎么完成倒排序。

1、自然顺序
即类要实现Comparable接口，并重写compareTo()方法，TreeSet对象调用add()方法时，会将存入的对象提升为Comparable类型，然后调用对象中的compareTo()方法进行比较，根据比较的返回值进行存储。
因为TreeSet底层是二叉树，当compareTo方法返回0时，不存储；当compareTo方法返回正数时，存入二叉树的右子树；当compareTo方法返回负数时，存入二叉树的左子树。如果一个类没有实现Comparable接口就将该类对象存入TreeSet集合，会发生类型转换异常。
2、比较器顺序Comparator
创建TreeSet对象的时候可以指定一个比较器，即传入一个Comparator对象，那么TreeSet会优先按照Comparator中的compare()方法排序，compare方法中有两个参数，第一个是调用该方法的对象，第二个值集合中已经存入的对象。

4.EnumSet 是什么

5.HashSet和TreeSet有什么区别?

底层存储的数据结构不同
HashSet底层用的是HashMap哈希表结构存储，而TreeSet底层用的是TreeMap树结构存储
存储时保证数据唯一性依据不同
HashSet是通过复写hashCode()方法和equals()方法来保证的，而HashSet通过Compareable接口的compareTo()方法来保证的
有序性不一样
HashSet无序，TreeSet有序

6.HashSet 内部是如何工作的

HashSet:底层数据结构是哈希表，本质就是对哈希值的存储，通过判断元素的hashCode方法和equals方法来保证元素的唯一性，当hashCode值不相同，就直接存储了，不用在判断equals了，当hashCode值相同时，会在判断一次euqals方法的返回值是否为true，如果为true则视为用一个元素，不用存储，如果为false，这些相同哈希值不同内容的元素都存放一个bucket桶里（当哈希表中有一个桶结构，每一个桶都有一个哈希值）
TreeSet:底层的数据结构是二叉树，可以对Set集合中的元素进行排序,这种结构，可以提高排序性能, 根据比较方法的返回值确定的,只要返回的是0.就代表元素重复

7.WeakHashMap 是怎么工作的？

二、 List

1.List, Set, Map三个接口，存取元素时各有什么特点？

List与Set都是单列元素的集合，它们有一个功共同的父接口Collection。
Set里面不允许有重复的元素，
存元素：add方法有一个boolean的返回值，当集合中没有某个元素，此时add方法可成功加入该元素时，则返回true；当集合含有与某个元素equals相等的元素时，此时add方法无法加入该元素，返回结果为false。
取元素：没法说取第几个，只能以Iterator接口取得所有的元素，再逐一遍历各个元素。

List表示有先后顺序的集合，
存元素：多次调用add(Object)方法时，每次加入的对象按先来后到的顺序排序，也可以插队，即调用add(int index,Object)方法，就可以指定当前对象在集合中的存放位置。
取元素：
方法1：Iterator接口取得所有，逐一遍历各个元素
方法2：调用get(index i)来明确说明取第几个。使用此接口能够精确的控制每个元素插入的位置。用户能够使用索引（元素在List中的位置，类似于数组下标）来访问List中的元素，这类似于Java的数组。

Map是双列的集合，存放用put方法:put(obj key,obj value)，每次存储时，要存储一对key/value，不能存储重复的key，这个重复的规则也是按equals比较相等。
取元素：用get(Object key)方法根据key获得相应的value。
也可以获得所有的key的集合，还可以获得所有的value的集合，
还可以获得key和value组合成的Map.Entry对象的集合。

List以特定次序来持有元素，可有重复元素。Set无法拥有重复元素,内部排序。Map 保存key-value值，value可多值。

2.List, Set, Map 是否继承自 Collection 接口

List和Set是的，而Map不是。

3.遍历一个 List 有哪些不同的方式

       Iterator it1 = list.iterator();
       while(it1.hasNext()){
           System.out.println(it1.next());
       }

       //方法2
       for(Iterator it2 = list.iterator();it2.hasNext();){
            System.out.println(it2.next());
       }

       //方法3
       for(String tmp:list){
           System.out.println(tmp);
       }

       //方法4
       for(int i = 0;i < list.size(); i ++){
           System.out.println(list.get(i));
       }

三、LinkedList

1.LinkedList 是单向链表还是双向链表

Linkedlist，双向链表，优点，增加删除，用时间很短，但是因为没有索引，对索引的操作，比较麻烦，只能循环遍历，但是每次循环的时候，都会先判断一下，这个索引位于链表的前部分还是后部分，每次都会遍历链表的一半，而不是全部遍历。
双向链表，都有一个previous和next，链表最开始的部分都有一个fiest和last指向第一个元素，和最后一个元素。增加和删除的时候，只需要更改一个previous和next，就可以实现增加和删除，所以说，LinkedList对于数据的删除和增加相当的方便。

2.LinkedList 与 ArrayList 有什么区别?

因为Array是基于索引(index)的数据结构，它使用索引在数组中搜索和读取数据是很快的。Array获取数据的时间复杂度是O(1),但是要删除数据却是开销很大的，因为这需要重排数组中的所有数据。
相对于ArrayList，LinkedList插入是更快的。因为LinkedList不像ArrayList一样，不需要改变数组的大小，也不需要在数组装满的时候要将所有的数据重新装入一个新的数组，这是ArrayList最坏的一种情况，时间复杂度是O(n)，而LinkedList中插入或删除的时间复杂度仅为O(1)。ArrayList在插入数据时还需要更新索引（除了插入数组的尾部）。
类似于插入数据，删除数据时，LinkedList也优于ArrayList。
LinkedList需要更多的内存，因为ArrayList的每个索引的位置是实际的数据，而LinkedList中的每个节点中存储的是实际的数据和前后节点的位置。

3.描述下 Java 中集合（Collections），接口（Interfaces），实现（Implementations）的概念。

4.插入数据时，ArrayList, LinkedList, Vector谁速度较快？

ArrayList和Vector都是数组实现，但不同的是，Vector是线程安全，加了同步，所以原则上ArrayList比Vector比快；
LinkekList是链表实现，增删快，查找慢，所以你要是插入数据时，显然LinkedList是最快的，其次是ArrayList，再者Vector属于遗留容器（Java早期的版本中提供的容器，除此之外，Hashtable、Dictionary、BitSet、Stack、Properties都是遗留容器），已经不推荐使用，但是由于ArrayList和LinkedListed都是非线程安全的，如果遇到多个线程操作同一个容器的场景，则可以通过工具类Collections中的synchronizedList方法将其转换成线程安全的容器后再使用（这是对装潢模式的应用，将已有对象传入另一个类的构造器中创建新的对象来增强实现）。

四、ArrayList

1.ArrayList 和 HashMap 的默认大小是多数?

这里要讨论这些常用的默认初始容量和扩容的原因是：
当底层实现涉及到扩容时，容器或重新分配一段更大的连续内存（如果是离散分配则不需要重新分配，离散分配都是插入新元素时动态分配内存），要将容器原来的数据全部复制到新的内存上，这无疑使效率大大降低。
加载因子的系数小于等于1，意指即当元素个数超过容量长度*加载因子的系数时，进行扩容。另外，扩容也是有默认的倍数的，不同的容器扩容情况不同。

ArrayList、Vector默认初始容量为10。
Vector：线程安全，但速度慢。底层数据结构是数组结构，加载因子为1：即当元素个数超过容量长度时，进行扩容。扩容增量：原容量的 1倍。如 Vector的容量为10，一次扩容后是容量为20。
ArrayList：线程不安全，查询速度快。底层数据结构是数组结构，扩容增量：原容量的 0.5倍+1，如 ArrayList的容量为10，一次扩容后是容量为16。

Set(集) 元素无序的、不可重复。
HashSet：线程不安全，存取速度快。
底层实现是一个HashMap（保存数据），实现Set接口
默认初始容量为16（为何是16，见下方对HashMap的描述）
加载因子为0.75：即当元素个数超过容量长度的0.75倍时，进行扩容
扩容增量：原容量的1倍
如 HashSet的容量为16，一次扩容后是容量为32。

Map是一个双列集合
HashMap：默认初始容量为16
（为何是16：16是2^4，可以提高查询效率，另外，32=16<<1 –>至于详细的原因可另行分析，或分析源代码）
加载因子为0.75：即当元素个数超过容量长度的0.75倍时，进行扩容
扩容增量：原容量的 1倍
如 HashSet的容量为16，一次扩容后是容量为32。

2.ArrayList 和 Set 的区别？

Set 集合是无序不可以重复的的、List集合是有序可以重复的。
ArrayList是数组存储的方式，HashSet存储会先进行HashCode值得比较(hashcode和equals方法)，若相同就不会再存储。

补充一下：Hashset就是采用哈希算法存取对象的集合，对象用完之后没有回收就是内存泄漏。一个对象一旦hashCode生成之后，再对属性值修改后其Hashcode值就会发生改变，再通过hashSet删除就删除不掉了。

以上的问题还可以继续有如下变形，理解了就能融会贯通：
ArrayList, LinkedList, Vector的区别
ArrayList是如何实现的，ArrayList 和 LinkedList 的区别
ArrayList如何实现扩容

6.Array 和 ArrayList 有何区别？什么时候更适合用Array？

ArrayList可以算是Array的加强版，（对array有所取舍的加强）。
**存储内容比较： **
•Array数组可以包含基本类型和对象类型，
•ArrayList却只能包含对象类型。
但是需要注意的是：Array数组在存放的时候一定是同种类型的元素。ArrayList就不一定了，因为ArrayList可以存储Object。

空间大小比较：
• 它的空间大小是固定的，空间不够时也不能再次申请，所以需要事前确定合适的空间大小。
• ArrayList的空间是动态增长的，如果空间不够，它会创建一个空间比原空间大一倍的新数组，然后将所有元素复制到新数组中，接着抛弃旧数组。而且，每次添加新的元素的时候都会检查内部数组的空间是否足够。（比较麻烦的地方）。

**方法上的比较： **
ArrayList作为Array的增强版，当然是在方法上比Array更多样化，比如添加全部addAll()、删除全部removeAll()、返回迭代器iterator()等。

适用场景：
如果想要保存一些在整个程序运行期间都会存在而且不变的数据，我们可以将它们放进一个全局数组里，但是如果我们单纯只是想要以数组的形式保存数据，而不对数据进行增加等操作，只是方便我们进行查找的话，那么，我们就选择ArrayList。而且还有一个地方是必须知道的，就是如果我们需要对元素进行频繁的移动或删除，或者是处理的是超大量的数据，那么，使用ArrayList就真的不是一个好的选择，因为它的效率很低，使用数组进行这样的动作就很麻烦，那么，我们可以考虑选择LinkedList。

    原文作者：YitaiCloud
    原文地址: https://www.jianshu.com/p/a841e89fe9dd
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。