Java Stream groupingBy()常用案例

groupingBy()是Stream API中最强大的收集器Collector之一,提供与SQL的GROUP BY子句类似的功能。
使用形式如下:

.collect(groupingBy(...));

需要指定一个属性才能使用,通过该属性执行分组。我们通过提供功能接口的实现来实现这一点 - 通常通过传递lambda表达式。

例如,如果我们想按长度对字符串进行分组,我们可以通过将String::length传递给groupingBy()来实现:

List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "cc", "ddd"));
// collect = {1=[a], 2=[bb, cc], 3=[ddd]}
Map<Integer, List<String>> collect = strings.stream().collect(Collectors.groupingBy(String::length));

分组到自定义Map实现

如果需要提供自定义Map实现,可以使用提供的groupingBy()重载来实现:

List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "cc", "ddd"));
// collect = {1=[a], 2=[bb, cc], 3=[ddd]}
TreeMap<Integer, List<String>> collect = strings.stream().collect(Collectors.groupingBy(String::length, TreeMap::new, Collectors.toList()));

提供自定义的下一个Collection

如果需要将分组元素存储在自定义集合中,可以使用toCollection()收集器来实现。
例如,如果要在HashSet实例中对元素进行分组,然后输出到一个新的Collection,则可以这样:

List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "bb", "cc", "ddd"));
// collect = {1=[a], 2=[bb, cc], 3=[ddd]}
Map<Integer, HashSet<String>> collect = strings.stream().collect(Collectors.groupingBy(String::length, Collectors.toCollection(HashSet::new)));

分组计数

如果您只想知道分组元素的数量,提供自定义counting()就可以:

List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "bb", "cc", "ddd"));
        // collect = {1=1, 2=3, 3=1}
Map<Integer,Long>collect=strings.stream().collect(Collectors.groupingBy(String::length,Collectors.counting()));

将每个组转为字符串

如果需要对元素进行分组并为每个组创建单个String表示,可以使用join()来实现:

List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "cc", "ddd"));
// collect = {1=<p>a<s>, 2=<p>bb|cc<s>, 3=<p>ddd<s>}
Map<Integer, String> collect = strings.stream().collect(Collectors.groupingBy(String::length,joining("|", "<p>", "<s>")));

分组和计算每组平均值

如果需要派生每组条目的平均属性,那么有一些方便的收集器:

  • averagingInt()
  • averagingLong()
  • averagingDouble()
List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "cc", "ddd"));
// collect = {1=97.0, 2=3152.0, 3=99300.0}
Map<Integer, Double> collect = strings.stream().collect(Collectors.groupingBy(String::length, averagingInt(String::hashCode)));

分组和计算每组的总和

如果要对分组条目进行累计总和:

  • summingInt()
  • summingLong()
  • summingDouble()
List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "bb", "cc", "ddd"));
// collect = {1=97, 2=9440, 3=99300}
Map<Integer, Integer> collect = strings.stream().collect(groupingBy(String::length, summingInt(String::hashCode)));

reducing缩减操作

List<String> strings = new ArrayList<>(Arrays.asList("a", "bb", "bb", "cc", "ddd"));
// collect = {1=Optional[a], 2=Optional[cc], 3=Optional[ddd]}
Comparator<String> comparing = Comparator.comparing(String::hashCode);
Map<Integer, Optional<String>> collect = strings.stream().collect(groupingBy(String::length, reducing(BinaryOperator.maxBy(comparing))));

本文为转载文章,原文jdk应该为9及以上版本,所以本人修改了一些用例、删除jdk8中不存在的api和进行了一点排版的修改,足够日常业务中使用。
原文
原文也是转载帖并进行了中文翻译,英文版原文在此:英文版原文