Java Set系列集合

Set系列集合特点:

  • 无序:存取顺序不一致
  • 不重复:可以去除重复
  • 无索引:没有带索引的方法,所以不能使用普通for循环遍历,也不能通过索引来获取元素。

Set集合实现类特点:

  • Hashset :无序、不重复、无索引。
  • LinkedHashSet:有序、不重复、无索引。
  • TreeSet:排序、不重复、无索引。

Set集合的功能基本上与Collection的API一致。

import java.util.HashSet;
import java.util.LinkedHashSet;
import java.util.Set;
import java.util.TreeSet;

public class SetDemo1 {
    public static void main(String[] args) {
        //Hashset :无序、不重复、无索引。
//        Set<String> sets = new HashSet<>();
        //LinkedHashSet:有序、不重复、无索引。
//        Set<String> sets = new LinkedHashSet<>();
        //TreeSet:排序、不重复、无索引。
        Set<String> sets = new TreeSet<>();
        sets.add("java");
        sets.add("java");
        sets.add("Mybatis");
        sets.add("HTML");
        sets.add("Spring");
        sets.add("Java");
//        System.out.println(sets);//HashSet:[Java, java, HTML, Spring, Mybatis]无序不重复无索引
//        System.out.println(sets);//LinkedHashSet:[java, Mybatis, HTML, Spring, Java]有序不重复无索引
        System.out.println(sets);//TreeSet:[HTML, Java, Mybatis, Spring, java]无序不重复无索引
    }
}

HashSet元素无序的底层原理:哈希表

  • HashSet集合底层采取哈希表存储的数据。
  • 哈希表是一种对于增删改查数据性能都较好的结构。

哈希表的组成:

  • JDK8之前的,底层使用数组+链表组成
  • JDK8开始后,底层采用数组+链表+红黑树组成。

哈希值:

  • 是JDK根据对象的地址,按照某种规则算出来的int类型的数值。
  • Object类的API:public int hashcode():返回对象的哈希值
  • 对象的哈希值特点
    • 同一个对象多次调用hashCode()方法返回的哈希值是相同的。
    • 默认情况下,不同对象的哈希值是不同的。
public class HashDemo {
    public static void main(String[] args) {
        String name = "oreo";
        //同一对象的哈希值一样
        System.out.println(name.hashCode());//3419597
        System.out.println(name.hashCode());//3419597
        //不同对象间的哈希值不一样
        String name1 = "oreo1";
        System.out.println(name1.hashCode());//106007556
        System.out.println(name1.hashCode());//106007556
    }
}

HashSet1.7版本原理解析:数组+链表+(结合哈希算法):

  • 创建一个默认长度16的数组,数组名table
  • 根据元素的哈希值跟数组的长度求余计算出应存入的位置(哈希算法)
  • 判断当前位置是否为null,如果是null直接存入
  • 如果位置不为null,表示有元素,则调用equals方法比较
  • 如果一样,则不存,如果不一样,则存入数组
    • JDK7新元素占老元素位置,指向老元素(链表)
    • JDK8中新元素挂在老元素下面

结论:哈希表是一种对于增删改查数据性能都较好的结构。

JDK1.8版本开始HashSet原理解析:哈希表(数组、链表、红黑树的结合体),当挂在元素下面的数据过多时,查询性能降低,从JDK8开始后,当链表长度超过8的时候,自动转换为红黑树。

哈希表的详细流程:

  • 创建一个默认长度16,默认加载因为0.75的数组,数组名table
  • 根据元素的哈希值跟数组的长度计算出应存入的位置
  • ③判断当前位置是否为null,如果是null直接存入,如果位置不为null,表示有元素,则调用equals方法比较属性值,如果一样,则不存,如果不一样,则存入数组。
  • ④当数组存满到16*0.75=12时,就自动扩容,每次扩容为原先的两倍。

HashSet去重复原理解析:

  • 创建一个默认长度16的数组,数组名table
  • 根据元素的哈希值跟数组的长度求余计算出应存入的位置(哈希算法)
  • 判断当前位置是否为null,如果是null直接存入
  • 如果位置不为null,表示有元素,则调用equals方法比较
  • 如果一样,则不存,如果不一样,则存入数组,

结论:如果希望Set集合认为2个内容一样的对象是重复的,必须重写对象的hashCode()和equals()方法

LinkedHashSet集合

  • 概述和特点:有序、不重复、无索引。
  • 这里的有序指的是保证存储和取出的元素顺序一致。
  • 原理:底层数据结构是依然哈希表,只是每个元素又额外的多了一个双链表的机制记录存储的顺序。

Treeset集合

  • 概述和特点:不重复、无索引、可排序。
  • 可排序:按照元素的大小默认升序(有小到大)排序。
  • TreeSet集合底层是基于红黑树的数据结构实现排序的,增删改查性能都较好。
  • 注意:TreeSet集合是一定要排序的,可以将元素按照指定的规则进行排序。

Treeset集合默认的规则

  • 对于数值类型: Integer , Double,官方默认按照大小进行升序排序。
  • 对于字符串类型:默认按照首字符的编号升序排序。
  • 对于自定义类型如Student对象,TreeSet无法直接排序。

结论:想要使用TreeSet存储自定义类型,需要制定排序规则。

自定义排序规则

  • TreeSet集合存储对象的的时候有2种方式可以设计自定义比较规则

方式一

  • 让自定义的类(如学生类)实现Comparable接口重写里面的compareTo方法来定制比较规则。

方式二

  • TreeSet集合有参数构造器,可以设置Comparator接口对应的比较器对象,来定制比较规则。

两种方式中,关于返回值的规则:

  • 如果认为第一个元素大于第二个元素返回正整数即可。
  • 如果认为第一个元素小于第二个元素返回负整数即可。
  • 如果认为第一个元素等于第二个元素返回0即可,此时TreeSet集合只会保留一个元素,认为两者重复。
import java.applet.AppletContext;
import java.util.Comparator;
import java.util.Set;
import java.util.TreeSet;

public class Main {
    public static void main(String[] args) {
        Set<Integer> sets = new TreeSet<>();
        sets.add(1);
        sets.add(33);
        sets.add(8);
        sets.add(12);
        sets.add(5);
        System.out.println(sets);//[1, 5, 8, 12, 33]

        Set<String> sets1 = new TreeSet<>();
        sets1.add("java");
        sets1.add("about");
        sets1.add("python");
        sets1.add("About");
        sets1.add("樊东");
        sets1.add("ui");
        System.out.println(sets1);//[About, about, java, python, ui, 樊东]

        System.out.println("-----------------------");
        //方式二:集合自带的比较器对象进行规则定制
        //如果方式一和方式二都有,默认使用方式二
//        Set<Apple> apples = new TreeSet<>(new Comparator<Apple>() {
//            @Override
//            public int compare(Apple o1, Apple o2) {
//                //return o1.getWeight() - o2.getWeight();//升序
//                //return o2.getWeight() - o1.getWeight();//降序
//                //浮点型建议直接使用Double.compare()进行比较
//                return Double.compare(o2.getPrice(),o1.getPrice());//按照价格降序
//            }
//        });
        //简化版
        Set<Apple> apples = new TreeSet<>((o1, o2)-> Double.compare(o2.getPrice(),o1.getPrice()));
        apples.add(new Apple("红苹果","红色",9.9,500));
        apples.add(new Apple("绿苹果","绿色",19.9,300));
        apples.add(new Apple("青苹果","青色",14.9,700));
        apples.add(new Apple("黄苹果","黄色",9.8,500));
        System.out.println(apples);
        /*
        只用方式一的结果
        [Apple{name='绿苹果', color='绿色', price=19.9, weight=300},
        Apple{name='黄苹果', color='黄色', price=9.8, weight=500},
        Apple{name='红苹果', color='红色', price=9.9, weight=500},
        Apple{name='青苹果', color='青色', price=14.9, weight=700}]
         */
        /*
        方式二:按照价格降序
        [Apple{name='绿苹果', color='绿色', price=19.9, weight=300},
        Apple{name='青苹果', color='青色', price=14.9, weight=700},
        Apple{name='红苹果', color='红色', price=9.9, weight=500},
        Apple{name='黄苹果', color='黄色', price=9.8, weight=500}]
         */

    }
}
public class Apple implements Comparable<Apple>{
    private String name;
    private String color;
    private double price;
    private int weight;

    public Apple(String name, String color, double price, int weight) {
        this.name = name;
        this.color = color;
        this.price = price;
        this.weight = weight;
    }

    public Apple() {
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getColor() {
        return color;
    }

    public void setColor(String color) {
        this.color = color;
    }

    public double getPrice() {
        return price;
    }

    public void setPrice(double price) {
        this.price = price;
    }

    public int getWeight() {
        return weight;
    }

    public void setWeight(int weight) {
        this.weight = weight;
    }

    @Override
    public String toString() {
        return "Apple{" +
                "name='" + name + '\'' +
                ", color='" + color + '\'' +
                ", price=" + price +
                ", weight=" + weight +
                '}';
    }

    /**
     * 方式一:类自定义比较规则
     * @param o
     * @return
     */
    @Override
    public int compareTo(Apple o) {
        //按照重量比较
//        return this.weight - o.weight;  //会去掉重量重复的元素
        return this.weight - o.weight >= 1 ? 1:-1;//保留重量重复的元素
    }
}

如果希望元素可以重复,又有索引,索引查询要快?

  • 用ArrayList集合,基于数组的。(用的最多)

如果希望元素可以重复,又有索引,增删首尾操作快?

  • 用LinkedList集合,基于链表的。(栈、队列、排队叫号系统)

如果希望增删改查都快,但是元素不重复、无序、无索引。

  • 用HashSet集合,基于哈希表的。

如果希望增删改查都快,但是元素不重复、有序、无索引。

  • 用LinkedHashSet集合,基于哈希表和双链表。

如果要对对象进行排序。

  • 用TreeSet集合,基于红黑树。后续也可以用List集合实现排序。


版权声明:本文为m0_47320958原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。