Java Set系列集合 – 源码巴士

Set系列集合特点：

无序:存取顺序不一致
不重复:可以去除重复

无索引:没有带索引的方法，所以不能使用普通for循环遍历，也不能通过索引来获取元素。

Set集合实现类特点：

Hashset :无序、不重复、无索引。
LinkedHashSet:有序、不重复、无索引。

TreeSet:排序、不重复、无索引。

Set集合的功能基本上与Collection的API一致。

import java.util.HashSet;
import java.util.LinkedHashSet;
import java.util.Set;
import java.util.TreeSet;

public class SetDemo1 {
    public static void main(String[] args) {
        //Hashset :无序、不重复、无索引。
//        Set<String> sets = new HashSet<>();
        //LinkedHashSet:有序、不重复、无索引。
//        Set<String> sets = new LinkedHashSet<>();
        //TreeSet:排序、不重复、无索引。
        Set<String> sets = new TreeSet<>();
        sets.add("java");
        sets.add("java");
        sets.add("Mybatis");
        sets.add("HTML");
        sets.add("Spring");
        sets.add("Java");
//        System.out.println(sets);//HashSet:[Java, java, HTML, Spring, Mybatis]无序不重复无索引
//        System.out.println(sets);//LinkedHashSet:[java, Mybatis, HTML, Spring, Java]有序不重复无索引
        System.out.println(sets);//TreeSet:[HTML, Java, Mybatis, Spring, java]无序不重复无索引
    }
}

HashSet元素无序的底层原理：哈希表

HashSet集合底层采取哈希表存储的数据。
哈希表是一种对于增删改查数据性能都较好的结构。

哈希表的组成：

JDK8之前的，底层使用数组+链表组成
JDK8开始后，底层采用数组+链表+红黑树组成。

哈希值：

是JDK根据对象的地址，按照某种规则算出来的int类型的数值。
Object类的API：public int hashcode():返回对象的哈希值

对象的哈希值特点

- 同一个对象多次调用hashCode()方法返回的哈希值是相同的。
- 默认情况下，不同对象的哈希值是不同的。

public class HashDemo {
    public static void main(String[] args) {
        String name = "oreo";
        //同一对象的哈希值一样
        System.out.println(name.hashCode());//3419597
        System.out.println(name.hashCode());//3419597
        //不同对象间的哈希值不一样
        String name1 = "oreo1";
        System.out.println(name1.hashCode());//106007556
        System.out.println(name1.hashCode());//106007556
    }
}

HashSet1.7版本原理解析：数组＋链表＋(结合哈希算法)：

创建一个默认长度16的数组，数组名table
根据元素的哈希值跟数组的长度求余计算出应存入的位置（哈希算法)

判断当前位置是否为null，如果是null直接存入
如果位置不为null，表示有元素，则调用equals方法比较

如果一样，则不存，如果不一样，则存入数组

- JDK7新元素占老元素位置，指向老元素（链表）
- JDK8中新元素挂在老元素下面

结论:哈希表是一种对于增删改查数据性能都较好的结构。

JDK1.8版本开始HashSet原理解析：哈希表（数组、链表、红黑树的结合体)，当挂在元素下面的数据过多时，查询性能降低，从JDK8开始后，当链表长度超过8的时候，自动转换为红黑树。

哈希表的详细流程：

创建一个默认长度16，默认加载因为0.75的数组，数组名table
根据元素的哈希值跟数组的长度计算出应存入的位置

③判断当前位置是否为null，如果是null直接存入，如果位置不为null，表示有元素，则调用equals方法比较属性值，如果一样，则不存，如果不一样，则存入数组。
④当数组存满到16*0.75=12时，就自动扩容，每次扩容为原先的两倍。

HashSet去重复原理解析：

创建一个默认长度16的数组，数组名table
根据元素的哈希值跟数组的长度求余计算出应存入的位置（哈希算法)

判断当前位置是否为null，如果是null直接存入
如果位置不为null，表示有元素，则调用equals方法比较

如果一样，则不存，如果不一样，则存入数组，

结论:如果希望Set集合认为2个内容一样的对象是重复的，必须重写对象的hashCode()和equals()方法

LinkedHashSet集合

概述和特点：有序、不重复、无索引。
这里的有序指的是保证存储和取出的元素顺序一致。

原理：底层数据结构是依然哈希表，只是每个元素又额外的多了一个双链表的机制记录存储的顺序。

Treeset集合

概述和特点：不重复、无索引、可排序。
可排序:按照元素的大小默认升序（有小到大)排序。

TreeSet集合底层是基于红黑树的数据结构实现排序的，增删改查性能都较好。
注意:TreeSet集合是一定要排序的，可以将元素按照指定的规则进行排序。

Treeset集合默认的规则

对于数值类型: Integer , Double，官方默认按照大小进行升序排序。
对于字符串类型：默认按照首字符的编号升序排序。

对于自定义类型如Student对象，TreeSet无法直接排序。

结论：想要使用TreeSet存储自定义类型，需要制定排序规则。

自定义排序规则

TreeSet集合存储对象的的时候有2种方式可以设计自定义比较规则

方式一

让自定义的类（如学生类)实现Comparable接口重写里面的compareTo方法来定制比较规则。

方式二

TreeSet集合有参数构造器，可以设置Comparator接口对应的比较器对象，来定制比较规则。

两种方式中，关于返回值的规则:

如果认为第一个元素大于第二个元素返回正整数即可。
如果认为第一个元素小于第二个元素返回负整数即可。

如果认为第一个元素等于第二个元素返回0即可，此时TreeSet集合只会保留一个元素，认为两者重复。

import java.applet.AppletContext;
import java.util.Comparator;
import java.util.Set;
import java.util.TreeSet;

public class Main {
    public static void main(String[] args) {
        Set<Integer> sets = new TreeSet<>();
        sets.add(1);
        sets.add(33);
        sets.add(8);
        sets.add(12);
        sets.add(5);
        System.out.println(sets);//[1, 5, 8, 12, 33]

        Set<String> sets1 = new TreeSet<>();
        sets1.add("java");
        sets1.add("about");
        sets1.add("python");
        sets1.add("About");
        sets1.add("樊东");
        sets1.add("ui");
        System.out.println(sets1);//[About, about, java, python, ui, 樊东]

        System.out.println("-----------------------");
        //方式二：集合自带的比较器对象进行规则定制
        //如果方式一和方式二都有，默认使用方式二
//        Set<Apple> apples = new TreeSet<>(new Comparator<Apple>() {
//            @Override
//            public int compare(Apple o1, Apple o2) {
//                //return o1.getWeight() - o2.getWeight();//升序
//                //return o2.getWeight() - o1.getWeight();//降序
//                //浮点型建议直接使用Double.compare()进行比较
//                return Double.compare(o2.getPrice(),o1.getPrice());//按照价格降序
//            }
//        });
        //简化版
        Set<Apple> apples = new TreeSet<>((o1, o2)-> Double.compare(o2.getPrice(),o1.getPrice()));
        apples.add(new Apple("红苹果","红色",9.9,500));
        apples.add(new Apple("绿苹果","绿色",19.9,300));
        apples.add(new Apple("青苹果","青色",14.9,700));
        apples.add(new Apple("黄苹果","黄色",9.8,500));
        System.out.println(apples);
        /*
        只用方式一的结果
        [Apple{name='绿苹果', color='绿色', price=19.9, weight=300},
        Apple{name='黄苹果', color='黄色', price=9.8, weight=500},
        Apple{name='红苹果', color='红色', price=9.9, weight=500},
        Apple{name='青苹果', color='青色', price=14.9, weight=700}]
         */
        /*
        方式二：按照价格降序
        [Apple{name='绿苹果', color='绿色', price=19.9, weight=300},
        Apple{name='青苹果', color='青色', price=14.9, weight=700},
        Apple{name='红苹果', color='红色', price=9.9, weight=500},
        Apple{name='黄苹果', color='黄色', price=9.8, weight=500}]
         */

    }
}

public class Apple implements Comparable<Apple>{
    private String name;
    private String color;
    private double price;
    private int weight;

    public Apple(String name, String color, double price, int weight) {
        this.name = name;
        this.color = color;
        this.price = price;
        this.weight = weight;
    }

    public Apple() {
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getColor() {
        return color;
    }

    public void setColor(String color) {
        this.color = color;
    }

    public double getPrice() {
        return price;
    }

    public void setPrice(double price) {
        this.price = price;
    }

    public int getWeight() {
        return weight;
    }

    public void setWeight(int weight) {
        this.weight = weight;
    }

    @Override
    public String toString() {
        return "Apple{" +
                "name='" + name + '\'' +
                ", color='" + color + '\'' +
                ", price=" + price +
                ", weight=" + weight +
                '}';
    }

    /**
     * 方式一：类自定义比较规则
     * @param o
     * @return
     */
    @Override
    public int compareTo(Apple o) {
        //按照重量比较
//        return this.weight - o.weight;  //会去掉重量重复的元素
        return this.weight - o.weight >= 1 ? 1:-1;//保留重量重复的元素
    }
}

如果希望元素可以重复，又有索引，索引查询要快?

用ArrayList集合，基于数组的。(用的最多)

如果希望元素可以重复，又有索引，增删首尾操作快?

用LinkedList集合，基于链表的。（栈、队列、排队叫号系统）

如果希望增删改查都快，但是元素不重复、无序、无索引。

用HashSet集合，基于哈希表的。

如果希望增删改查都快，但是元素不重复、有序、无索引。

用LinkedHashSet集合，基于哈希表和双链表。

如果要对对象进行排序。

用TreeSet集合，基于红黑树。后续也可以用List集合实现排序。

原文链接：https://blog.csdn.net/m0_47320958/article/details/121736421