JAVA1.8--Stream系列介绍(七)

这节咱们详细讲一下Stream

/**
* Stream--函数式数据处理
*
*        Stream是Java8中处理集合的关键抽象概念，它可以指定你希望对集合进行的操作，可以执行
*    非常复杂的查找、过滤和映射数据等操作。使用Stream API对集合数据进行操作就类似于使用SQL
*    执行的数据库查询。也可以使用Stream API来并行执行操作。简而言之，Stream API提供了一种
*    高效且易于使用的处理数据的方式。
*
* 1.Stream是个啥
*
*        Stream(流)是数据渠道，用于操作数据源(集合、数组等)所生成的元素序列。
*
*        集合讲的是数据，流讲的是计算！！！
*
*        1.Stream自己不会存储元素
*        2.Stream不会改变源对象。相反，他们会返回一个持有结果的新Stream
*        3.Stream操作是延迟执行的。这意味着他们会等到需要结果的时候才执行
*
*        流操作有两个重要特点：
*
*        1.流水线--很多流操作本身会返回一个流，这样多个操作就可以链接起来，形成一个大的流水线
*        2.内部迭代--与迭代器显示迭代集合不同，流的迭代操作都是在背后进行
*
* 2.Stream的操作三个步骤
*
*    1.创建Stream一个数据源(如：集合、数组)，获取一个流
*    2.中间操作(一个中间操作链，对数据源的数据进行处理，形成一条流的流水线)
*    3.终止操作(一个终止操作，执行中间操作链，并产生结果)
*
* 2.1创建Stream
*
*    Java8中的Collection接口被扩展，提供了两个获取流的方法：
*
*        default Stream<E> stream():返回一个顺序流
*
*        default Stream<E> parallelStream:返回一个并行流
*
* 由数组创建流
*
*        Java8中的Arrays的静态方法stream()可以获取数组流：
*            static Stream stream(T[] array):返回一个流
*
*    重载形式，能够处理对应基本类型的数组:
*
*        public static IntStream stream(int[] array)
*        public static LongStream stream(long[] array)
*        public static DoubleStream stream(double[] array)
*
*    由值创建流
*
*     可以使用静态方法Stream.of(),通过显示值创建一个流。它可以接收任意数量的参数。
*     public static<T> Stream<T> of(T... value):返回一个流
*
* 由函数创建流：创建无限流
*
*     可以使用静态方法Stream.iterate()和Stream.generate(),创建无限流。
*
* 迭代
*       public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f)
*
*    生成
*        public static<T> Stream<T> generate(Supplier<T> s)
*
* 2.2.Stream的中间操作
*
*    多个中间操作可以连接起来形成一个流水线，除非流水线上触发终止操作，否则中间操作不会执行任何的处理
* 而在终止操作时一次性全部处理，称为"惰性求值"。
*
*    2.2.1 筛选与切片
*
*                方法                       描述
*     filter(Predicate p)           接收Lambda，从流中排除某些元素
*     distinct()                   筛选，通过流所生成元素的hashCode()和equals()去除重复元素
*     limit(long maxSize)           截断流，使其元素不超过给定数量
*     skip(long n)               跳过元素，返回一个扔掉了前n个元素的流。若流中元素不足n个，则返回一个空流。与limit(n)互补
*
* 2.2.2 映射
*
*                方法                       描述
*        map(Function f)               接收一个函数作为参数，该函数会被应用到每个元素上，并将其映射成一个新的元素
*    mapToDouble(ToDoubleFunction f) 接收一个函数作为参数，该函数会被应用到每个元素上，产生一个新的DoubleStream
*    mapToInt(ToIntFunction f)       接收一个函数作为参数，该函数会被应用到每个元素上，产生一个新的IntStream
*    mapToLong(ToLongFunction f) 接收一个函数作为参数，该函数会被应用到每个元素上，产生一个新的LongStream
*    flatMap(Function f)               接受一个函数作为参数，将流中的每个值都换成另一个流，然后把所有流连接成一个流
*
* 2.2.3 排序
*
*            方法                           描述
*        sorted()                   产生一个新流，其中按自然顺序排序
*    sorted(Comparator comp)           产生一个新流，其中按比较器顺序排序
*
* 2.3 Stream的终止操作
*
*        终端操作会从流的流水线生成结果。其结果可以是任何不是流的值，例如List、Integer，甚至是void
*
* 2.3.1 查找与匹配
*
*         方法                           描述
*     allMatch(Predicate p)       检查是否匹配所有元素
*     anyMatch(Predicate p)       检查是否至少匹配一个元素
*     noneMatch(Predicate p)       检查是否没有匹配所有元素
*     findFirst()                   返回第一个元素
*     findAny()                   返回当前流中的任意元素
*     count()                       返回流中的元素总数
*     max(Comparator c)           返回流中的最大值
*     min(Comparator c)           返回流中的最小值
*     forEach(Consumer c)           内部迭代(使用Collection接口需要用户去做迭代，称为外部迭代。
*                                 相反，Stream API使用内部迭代即不需要用户去实现迭代)
* 2.3.2 规约
*
*            方法                               描述
*    reduce(T iden,BinaryOpenrator b)   可以将流中元素反复结合起来，得到一个值。返回T
*    reduce(BinaryOperator b)           可以将流中元素反复结合起来，得到一个值。返回Optional<T>
*
* 2.3.3 收集
*
*            方法                               描述
*    collect(Collector c)   将流转换为其他形式。接收一个Collector接口的实现，用于给Stream中元素做汇总的方法
*
* Collectors
*
* Collector接口中方法的实现决定了如何对流执行收集操作(如收集到List、Set、Map)。但是Collectors实用类
* 提供了很多静态方法，可以方便的创建常见收集器实例，如下表：
*
* 方法           返回类型               作用                           示例
* tolist           List           把流中元素收集到List       List list=list.stream()
*                                                             .collect(Collectors
*                                                                 .toList());
* toSet           Set               把流中元素收集到Set           Set   set=list.stream()
*                                                             .collect(Collectors
*                                                                 .toSet());
* toCollection   Collection       把流中元素收集到创建的集合        Collection maps=list.stream()
*                                                             .collect(Collectors
*                                                                 .toCollection(ArrayList::new));
* counting       Long           计算流中元素的个数           long count=list.stream()
*                                                             .collect(Collectors
*                                                                 .counting());
* summingInt       Integer           对流中元素的整数属性求和       Integer sum=persons.stream()
*                                                             .collect(Collectors
*                                                                 .summingInt(Person::getAge));
* averagingInt   Double           计算流中元素Integer属性       double avg=list.stream()
*                                 的平均值                       .collect(Collectors
*                                                                 .averagingInt(Person::getAge));
* summarizingInt   IntSummary-       收集流中Integer属性       IntSummaryStatistics iss= list.stream()
*                 -Statistics       的统计值.如：平均值               .collect(Collectors
*                                                                 .summarizingInt(Person::getAge));
*    joining           String           连接流中每个字符串           String str=list.stream()
*                                                                .map(Person::getName)
*                                                                .collect(Collectors.joining());
* maxBy           Optional<T>       根据比较器选择最大值           Optional max=list.stream()
*                                                             .collect(Collectors
*                                                                 .maxBy(comparingInt(Person:getAge)));
* minBy           Optional<T>       根据比较器选择最小值           Optional min=list.stream()
*                                                             .collect(Collectors
*                                                                 .minBy(comparingInt(Person:getAge)));
* reducing       规约产生的类型       从一个作为累加器的初始值开始，   int total=list.stream()
*                                 利用BinaryOperator与流中       .collect(Collectors
*                                 元素逐个结合，从而规约成单个值           .reducing(0,Person::getAge,Integer::sum))
* collecting-       转换函数返回的类型   包裹另一个收集器，对其结果       int how=list.stream()
* -AndThen                       转化函数                       .collect(Collectors
*                                                                    .collectingAndThen(Collectors.toList(),List::size))
*    groupingBy       Map<K,List<T>>   根据某属性值对流分组，属性为K,   Map<Person.Sex,List<Person>>
*                                    结果为V                       map=persons.stream().collect(Collectors
*                                                                    .groupingBy(Person:;getGender))
*    partitioningBy   Map<Boolean       根据true或false进行分区       Map<Boolean,List<Person>>
*                        ,List<T>>                               map=persons.stream().collect(Collectors
*                                                                    .partitioningBy(e -> e.getAge()>=50))
* 3.并行流与串行流
*
* 先说说并行和并发
*
* 并发是两个任务共享时间段，并行则是两个任务在同一时间发生，比如运行在多核CPU上。
*
* 并行流就是把一个内容分成多个数据块，并用不同的线程分别处理每个数据块的流。
*
* Java8中将并行进行了优化，我们可以很容易的对数据进行并行操作。Stream API可以声明性的通过
* parallel()与sequential()在并行流与顺序流之间进行切换。如果想从一个集合类创建一个流，
* 调用parallerStream就可以获取一个并行流。
*
* 配置并行流使用的线程池
*
* 使用流的parallel方法你会想到，并行流用的线程是从哪儿来的？有多少个？怎么自定义？
*
* 并行流内部使用默认的ForkJoinPool(分支/合并框架)，它默认的线程数量就是你的处理器数量，
* 这个值是由Runtime.getRuntime().availableProcessors()得到
*
* 你可以通过系统属性java.util.concurrent.ForkJoinPool.common.parallelist
* 来改变线程池大小，如下：
* System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism","12");
* 这是一个全局设置，因此会影响代码中所有的并行流
* （目前还无法专门为某个并行流指定该值，一般而言，
* 让ForkJoinPool的大小等于处理器数量是个不错的默认值）
*
* 高效使用并行流
*
*    1.并行流并不是总比顺序流快
* 2.留意装箱。自动装箱和拆箱操作会大大降低性能，Java8中有原始类型流(IntStream、LongStream...)
* 来避免这种操作
* 3.有些操作本身在并行流上的性能就比顺序流差，特别是limit和findFirst等依赖元素顺序的操作，
* 他们在并行流上执行的代价就非常大
* 4.还要考虑流的操作流水线的总计算成本
* 5.对于较小的数据量，没有必要使用并行流
* 6.要考虑流背后的数据结构是否易于分解，比如：ArrayList的拆分效率比LinkedList高很多，前者无需遍历
* 7.还要考虑终端操作中合并步骤的代价是大是小(如：Collector中的combiner方法)
*
* 4.Fork/Join框架
*
*    并行流背后使用的基础框架就是Java7中引入的分支/合并框架。
*
*    Fork/Join(分支/合并)框架的目的是以递归方式将可以并行的任务拆分(fork)成更小的任务，
* 然后将每个任务的结果合并(join)起来生成整体效果，它是ExectorService接口的一个实现，
* 把子任务分配给线程池(称为ForkJoinPool)中的工作线程
*
*    Fork/Join框架：就是在必要的情况下，将一个大任务，进行拆分(fork)成若干个小任务(拆到不可再拆时)，
* 再将一个个的小任务的运算的记过进行join汇总
*
*
*    Fork/Join框架与传统线程池的区别
*
*    1.采用"工作窃取"模式(work-stealing):当执行新的任务时，它可以将其拆分成更小的任务执行，
*    并将小任务加到线程队列中，然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。
* 2.相对于一般的线程池实现，fork/join框架的优势体现在对其中包含的任务的处理方式上，在一般的
* 线程池中，如果一个线程正在执行的任务由于某些原因无法继续运行，那么该线程会处于等待状态，而在
* fork/join框架实现中,如果某个子问题由于等待另外一个子问题的完成而无法继续进行，那么处理该
* 子问题的线程会主动寻找其他尚未运行的子问题来执行，这种方式减少了线程的等待时间，提高了性能。
*
* 使用Fork/Join框架的最佳做法
*
* 1.对一个任务调用join方法会阻塞调用方，知道该任务作出结果。因此，有必要在两个子任务的计算
* 都开始之后再调用它
* 2.不应该在RecursiveTask内部使用ForkJoinPool的invoke方法。相反，你应该始终直接调用
* compute或fork方法，只有顺序代码才应该用invoke来启动并行计算
*
* 5.Spliterator
*
*    "可分迭代器" --spliterator，和Iterator一样，也用于遍历数据源中的元素，
*    它是为了并行执行而设计的。
*
*    Java8为集合框架中包含的所有数据结构都提供了一个默认的Spliterator方法。
* 集合实现了Spliterator接口，接口提供了一个Spliterator方法。
*
* */

public class StreamInfo {
	
	//创建Stream
	@Test
	public void test(){
		//1.Collection 提供了两个方法 stream()与parallelStream()
		List<String> list = new ArrayList<String>();
		Stream<String> stream = list.stream();
		Stream<String> paralleStream = list.parallelStream();
		
		//2.通过Arrays中的stream()获取一个数组流
		Integer[] nums = new Integer[10];
		Stream<Integer> stream1 = Arrays.stream(nums);
		
		//3.通过Stream类中的静态方法of（）
		Stream<Integer> Stream2 = Stream.of(1,2,3);
		
		//4.创建无限流
		//迭代                 其中iterate(final T seed, final UnaryOperator<T> f)
		//          接口UnaryOperator继承了Function
		//			功能是：对数据进行操作，生成一个与同类型对象
		Stream<Integer> stream3 = Stream.iterate(0, (x) -> x + 2).limit(10);
		stream3.forEach(p -> System.out.println(p));
		
		//生成		其中generate(Supplier<T> s)
		//			参数Supplier接口为一个提供者用于创建对象的工厂，可以这么理解吧
		Stream<Double> stream4 = Stream.generate(Math::random).limit(2);
		stream4.forEach(System.out::println);
	} 
	
	//生成多个Person对象
	List<Person> persons = Person.createRoster();
	//内部迭代：迭代操作Stream API内部完成
	@Test
	public void test2(){
		Stream<Person> stream = persons.stream()
				.filter(
					p -> {
						System.out.println("测试中间操作");
						return p.getAge() <=35;
					}
				);
		//只有当做终止操作时，所有的中间操作才会一次性的全部执行
		stream.forEach(System.out::println);
	}
	//外部迭代
	@Test
	public void test3(){
		Iterator<Person> it = persons.iterator();
		
		while(it.hasNext()){
			System.out.println(it.next());
		}
	}
	
	@Test
	public void test4(){
		persons.stream()
			.filter(p -> {
				System.out.println("大于25岁成员：");
				return p.getAge()>=25;
			}).limit(3)
			.forEach(p -> System.out.println(p));
	}
	
	@Test
	public void test5(){
		persons.parallelStream()
			.filter(p -> p.getAge()>=25)
			.skip(2)
			.forEach(System.out::println);
	}
	
	@Test
	public void test6(){
		persons.stream()
			.distinct()
			.forEach(System.out::println);
	}
	
	/**
	 * 映射
	 * */
	@Test
	public void test7(){
		Stream<String> str = persons.stream()
				.map(e -> e.getName());
		System.out.println("---------------------------------");
		List<String> strList = Arrays.asList("aaa","bbb","ccc","ddd","eee");
		Stream<String> stream = strList.stream().map(p -> p.toUpperCase());
//		Stream<String> stream = strList.stream().map(String::toUpperCase);
		stream.forEach(p -> System.out.println(p));
//		stream.forEach(System.out::println);
		
		System.out.println("---------------------------------");
		
		Stream<Character> stream2 = strList.stream()
				.flatMap(StreamInfo::filterCharacter);
//		Stream<Character> stream3 = strList.stream()
//				.flatMap(s -> StreamInfo.filterCharacter(s));
		
		stream2.forEach(System.out::print);
		
		
		
	} 
	public static Stream<Character> filterCharacter(String str){
		  List<Character> list = new ArrayList<>();
		  for (Character ch : str.toCharArray()) {
		    list.add(ch);
		  }
		  return list.stream();
	}
	
}

源码下载地址：https://download.csdn.net/download/qq_20410965/12434193

原文链接：https://blog.csdn.net/qq_20410965/article/details/106853313