JAVA1.8--Stream系列介绍(七)

这节咱们详细讲一下Stream

/**
 * Stream--函数式数据处理
 *     
 *         Stream是Java8中处理集合的关键抽象概念,它可以指定你希望对集合进行的操作,可以执行
 *     非常复杂的查找、过滤和映射数据等操作。使用Stream API对集合数据进行操作就类似于使用SQL
 *     执行的数据库查询。也可以使用Stream API来并行执行操作。简而言之,Stream API提供了一种
 *     高效且易于使用的处理数据的方式。
 * 
 * 1.Stream是个啥
 * 
 *         Stream(流)是数据渠道,用于操作数据源(集合、数组等)所生成的元素序列。
 * 
 *         集合讲的是数据,流讲的是计算!!!
 * 
 *         1.Stream自己不会存储元素
 *         2.Stream不会改变源对象。相反,他们会返回一个持有结果的新Stream
 *         3.Stream操作是延迟执行的。这意味着他们会等到需要结果的时候才执行
 * 
 *         流操作有两个重要特点:
 *     
 *         1.流水线--很多流操作本身会返回一个流,这样多个操作就可以链接起来,形成一个大的流水线
 *         2.内部迭代--与迭代器显示迭代集合不同,流的迭代操作都是在背后进行
 * 
 * 2.Stream的操作三个步骤
 * 
 *     1.创建Stream一个数据源(如:集合、数组),获取一个流
 *     2.中间操作(一个中间操作链,对数据源的数据进行处理,形成一条流的流水线)
 *     3.终止操作(一个终止操作,执行中间操作链,并产生结果)
 * 
 * 2.1创建Stream
 * 
 *     Java8中的Collection接口被扩展,提供了两个获取流的方法:
 *         
 *         default Stream<E> stream():返回一个顺序流
 * 
 *         default Stream<E> parallelStream:返回一个并行流
 *  
 *  由数组创建流
 *         
 *         Java8中的Arrays的静态方法stream()可以获取数组流:
 *             static Stream stream(T[] array):返回一个流
 * 
 *     重载形式,能够处理对应基本类型的数组:
 * 
 *         public static IntStream stream(int[] array)
 *         public static LongStream stream(long[] array)
 *         public static DoubleStream stream(double[] array)
 * 
 *     由值创建流
 * 
 *      可以使用静态方法Stream.of(),通过显示值创建一个流。它可以接收任意数量的参数。
 *      public static<T> Stream<T> of(T... value):返回一个流
 *  
 *  由函数创建流:创建无限流
 *  
 *      可以使用静态方法Stream.iterate()和Stream.generate(),创建无限流。
 *  
 *    迭代
 *        public static<T> Stream<T> iterate(final T seed, final UnaryOperator<T> f)
 *         
 *          生成
 *         public static<T> Stream<T> generate(Supplier<T> s)
 * 
 * 2.2.Stream的中间操作
 *     
 *     多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理
 * 而在终止操作时一次性全部处理,称为"惰性求值"。
 * 
 *     2.2.1  筛选与切片
 *     
 *                 方法                        描述
 *      filter(Predicate p)            接收Lambda,从流中排除某些元素
 *      distinct()                    筛选,通过流所生成元素的hashCode()和equals()去除重复元素
 *      limit(long maxSize)            截断流,使其元素不超过给定数量
 *      skip(long n)                跳过元素,返回一个扔掉了前n个元素的流。若流中元素不足n个,则返回一个空流。与limit(n)互补
 * 
 * 2.2.2 映射
 * 
 *                 方法                        描述
 *         map(Function f)                接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素
 *     mapToDouble(ToDoubleFunction f) 接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的DoubleStream
 *     mapToInt(ToIntFunction f)        接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的IntStream
 *     mapToLong(ToLongFunction f)     接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的LongStream
 *     flatMap(Function f)                接受一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流
 * 
 * 2.2.3 排序
 *             
 *             方法                            描述
 *         sorted()                    产生一个新流,其中按自然顺序排序
 *     sorted(Comparator comp)            产生一个新流,其中按比较器顺序排序
 * 
 * 2.3 Stream的终止操作
 * 
 *         终端操作会从流的流水线生成结果。其结果可以是任何不是流的值,例如List、Integer,甚至是void
 * 
 * 2.3.1 查找与匹配
 *  
 *          方法                            描述
 *      allMatch(Predicate p)        检查是否匹配所有元素
 *      anyMatch(Predicate p)        检查是否至少匹配一个元素
 *      noneMatch(Predicate p)        检查是否没有匹配所有元素
 *      findFirst()                    返回第一个元素
 *      findAny()                    返回当前流中的任意元素
 *      count()                        返回流中的元素总数
 *      max(Comparator c)            返回流中的最大值
 *      min(Comparator c)            返回流中的最小值
 *      forEach(Consumer c)            内部迭代(使用Collection接口需要用户去做迭代,称为外部迭代。
 *                                  相反,Stream API使用内部迭代即不需要用户去实现迭代)
 * 2.3.2 规约
 *         
 *             方法                                描述
 *     reduce(T iden,BinaryOpenrator b)    可以将流中元素反复结合起来,得到一个值。返回T
 *     reduce(BinaryOperator b)            可以将流中元素反复结合起来,得到一个值。返回Optional<T>
 *  
 * 2.3.3 收集
 *         
 *             方法                                描述
 *     collect(Collector c)    将流转换为其他形式。接收一个Collector接口的实现,用于给Stream中元素做汇总的方法 
 *  
 *  Collectors
 * 
 *  Collector接口中方法的实现决定了如何对流执行收集操作(如收集到List、Set、Map)。但是Collectors实用类
 *  提供了很多静态方法,可以方便的创建常见收集器实例,如下表:
 *  
 *    方法            返回类型                作用                            示例
 *  tolist            List            把流中元素收集到List        List list=list.stream()
 *                                                              .collect(Collectors
 *                                                                  .toList());
 *  toSet            Set                把流中元素收集到Set            Set    set=list.stream()
 *                                                              .collect(Collectors
 *                                                                  .toSet());
 *  toCollection    Collection        把流中元素收集到创建的集合         Collection maps=list.stream()
 *                                                              .collect(Collectors
 *                                                                  .toCollection(ArrayList::new));
 *  counting        Long            计算流中元素的个数            long count=list.stream()
 *                                                              .collect(Collectors
 *                                                                  .counting());
 *  summingInt        Integer            对流中元素的整数属性求和        Integer sum=persons.stream()
 *                                                              .collect(Collectors
 *                                                                  .summingInt(Person::getAge));
 *  averagingInt    Double            计算流中元素Integer属性        double avg=list.stream()
 *                                  的平均值                        .collect(Collectors
 *                                                                  .averagingInt(Person::getAge));
 *  summarizingInt    IntSummary-        收集流中Integer属性        IntSummaryStatistics iss= list.stream()
 *                  -Statistics        的统计值.如:平均值                .collect(Collectors
 *                                                                  .summarizingInt(Person::getAge));
 *     joining            String            连接流中每个字符串            String str=list.stream()
 *                                                                 .map(Person::getName)
 *                                                                 .collect(Collectors.joining());
 *  maxBy            Optional<T>        根据比较器选择最大值            Optional max=list.stream()
 *                                                              .collect(Collectors
 *                                                                  .maxBy(comparingInt(Person:getAge)));
 *  minBy            Optional<T>        根据比较器选择最小值            Optional min=list.stream()
 *                                                              .collect(Collectors
 *                                                                  .minBy(comparingInt(Person:getAge)));
 *  reducing        规约产生的类型        从一个作为累加器的初始值开始,    int total=list.stream()
 *                                  利用BinaryOperator与流中        .collect(Collectors
 *                                  元素逐个结合,从而规约成单个值            .reducing(0,Person::getAge,Integer::sum))
 *  collecting-        转换函数返回的类型    包裹另一个收集器,对其结果        int how=list.stream()
 *  -AndThen                        转化函数                        .collect(Collectors
 *                                                                     .collectingAndThen(Collectors.toList(),List::size))
 *     groupingBy        Map<K,List<T>>    根据某属性值对流分组,属性为K,    Map<Person.Sex,List<Person>> 
 *                                     结果为V                        map=persons.stream().collect(Collectors
 *                                                                     .groupingBy(Person:;getGender))
 *     partitioningBy    Map<Boolean        根据true或false进行分区        Map<Boolean,List<Person>>
 *                         ,List<T>>                                map=persons.stream().collect(Collectors
 *                                                                     .partitioningBy(e -> e.getAge()>=50))
 * 3.并行流与串行流
 * 
 * 先说说并行和并发
 * 
 * 并发是两个任务共享时间段,并行则是两个任务在同一时间发生,比如运行在多核CPU上。
 * 
 * 并行流就是把一个内容分成多个数据块,并用不同的线程分别处理每个数据块的流。
 * 
 * Java8中将并行进行了优化,我们可以很容易的对数据进行并行操作。Stream API可以声明性的通过
 * parallel()与sequential()在并行流与顺序流之间进行切换。如果想从一个集合类创建一个流,
 * 调用parallerStream就可以获取一个并行流。
 * 
 * 配置并行流使用的线程池
 * 
 * 使用流的parallel方法你会想到,并行流用的线程是从哪儿来的?有多少个?怎么自定义?
 * 
 * 并行流内部使用默认的ForkJoinPool(分支/合并框架),它默认的线程数量就是你的处理器数量,
 * 这个值是由Runtime.getRuntime().availableProcessors()得到
 * 
 * 你可以通过系统属性java.util.concurrent.ForkJoinPool.common.parallelist
 * 来改变线程池大小,如下:
 * System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism","12");
 * 这是一个全局设置,因此会影响代码中所有的并行流
 * (目前还无法专门为某个并行流指定该值,一般而言,
 * 让ForkJoinPool的大小等于处理器数量是个不错的默认值)
 * 
 * 高效使用并行流
 *     
 *     1.并行流并不是总比顺序流快
 *  2.留意装箱。自动装箱和拆箱操作会大大降低性能,Java8中有原始类型流(IntStream、LongStream...)
 *    来避免这种操作
 *  3.有些操作本身在并行流上的性能就比顺序流差,特别是limit和findFirst等依赖元素顺序的操作,
 *    他们在并行流上执行的代价就非常大
 *  4.还要考虑流的操作流水线的总计算成本
 *  5.对于较小的数据量,没有必要使用并行流
 *  6.要考虑流背后的数据结构是否易于分解,比如:ArrayList的拆分效率比LinkedList高很多,前者无需遍历
 *  7.还要考虑终端操作中合并步骤的代价是大是小(如:Collector中的combiner方法)
 * 
 * 4.Fork/Join框架
 * 
 *     并行流背后使用的基础框架就是Java7中引入的分支/合并框架。
 * 
 *     Fork/Join(分支/合并)框架的目的是以递归方式将可以并行的任务拆分(fork)成更小的任务,
 *  然后将每个任务的结果合并(join)起来生成整体效果,它是ExectorService接口的一个实现,
 *  把子任务分配给线程池(称为ForkJoinPool)中的工作线程
 * 
 *     Fork/Join框架:就是在必要的情况下,将一个大任务,进行拆分(fork)成若干个小任务(拆到不可再拆时),
 *  再将一个个的小任务的运算的记过进行join汇总
 *  
 *  
 *     Fork/Join框架与传统线程池的区别
 * 
 *      1.采用"工作窃取"模式(work-stealing):当执行新的任务时,它可以将其拆分成更小的任务执行,
 *           并将小任务加到线程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。
 *   2.相对于一般的线程池实现,fork/join框架的优势体现在对其中包含的任务的处理方式上,在一般的
 *     线程池中,如果一个线程正在执行的任务由于某些原因无法继续运行,那么该线程会处于等待状态,而在
 *     fork/join框架实现中,如果某个子问题由于等待另外一个子问题的完成而无法继续进行,那么处理该
 *     子问题的线程会主动寻找其他尚未运行的子问题来执行,这种方式减少了线程的等待时间,提高了性能。
 *    
 *  使用Fork/Join框架的最佳做法
 *  
 *   1.对一个任务调用join方法会阻塞调用方,知道该任务作出结果。因此,有必要在两个子任务的计算
 *     都开始之后再调用它
 *   2.不应该在RecursiveTask内部使用ForkJoinPool的invoke方法。相反,你应该始终直接调用
 *     compute或fork方法,只有顺序代码才应该用invoke来启动并行计算
 * 
 * 5.Spliterator
 * 
 *      "可分迭代器" --spliterator,和Iterator一样,也用于遍历数据源中的元素,
 *     它是为了并行执行而设计的。
 * 
 *      Java8为集合框架中 包含的所有数据结构都提供了一个默认的Spliterator方法。
 *  集合实现了Spliterator接口,接口提供了一个Spliterator方法。
 * 
 * */

public class StreamInfo {
	
	//创建Stream
	@Test
	public void test(){
		//1.Collection 提供了两个方法 stream()与parallelStream()
		List<String> list = new ArrayList<String>();
		Stream<String> stream = list.stream();
		Stream<String> paralleStream = list.parallelStream();
		
		//2.通过Arrays中的stream()获取一个数组流
		Integer[] nums = new Integer[10];
		Stream<Integer> stream1 = Arrays.stream(nums);
		
		//3.通过Stream类中的静态方法of()
		Stream<Integer> Stream2 = Stream.of(1,2,3);
		
		//4.创建无限流
		//迭代                 其中iterate(final T seed, final UnaryOperator<T> f)
		//          接口UnaryOperator继承了Function
		//			功能是:对数据进行操作,生成一个与同类型对象
		Stream<Integer> stream3 = Stream.iterate(0, (x) -> x + 2).limit(10);
		stream3.forEach(p -> System.out.println(p));
		
		//生成		其中generate(Supplier<T> s)
		//			参数Supplier接口为一个提供者用于创建对象的工厂,可以这么理解吧
		Stream<Double> stream4 = Stream.generate(Math::random).limit(2);
		stream4.forEach(System.out::println);
	} 
	
	//生成多个Person对象
	List<Person> persons = Person.createRoster();
	//内部迭代:迭代操作Stream API内部完成
	@Test
	public void test2(){
		Stream<Person> stream = persons.stream()
				.filter(
					p -> {
						System.out.println("测试中间操作");
						return p.getAge() <=35;
					}
				);
		//只有当做终止操作时,所有的中间操作才会一次性的全部执行
		stream.forEach(System.out::println);
	}
	//外部迭代
	@Test
	public void test3(){
		Iterator<Person> it = persons.iterator();
		
		while(it.hasNext()){
			System.out.println(it.next());
		}
	}
	
	@Test
	public void test4(){
		persons.stream()
			.filter(p -> {
				System.out.println("大于25岁成员:");
				return p.getAge()>=25;
			}).limit(3)
			.forEach(p -> System.out.println(p));
	}
	
	@Test
	public void test5(){
		persons.parallelStream()
			.filter(p -> p.getAge()>=25)
			.skip(2)
			.forEach(System.out::println);
	}
	
	@Test
	public void test6(){
		persons.stream()
			.distinct()
			.forEach(System.out::println);
	}
	
	/**
	 * 映射
	 * */
	@Test
	public void test7(){
		Stream<String> str = persons.stream()
				.map(e -> e.getName());
		System.out.println("---------------------------------");
		List<String> strList = Arrays.asList("aaa","bbb","ccc","ddd","eee");
		Stream<String> stream = strList.stream().map(p -> p.toUpperCase());
//		Stream<String> stream = strList.stream().map(String::toUpperCase);
		stream.forEach(p -> System.out.println(p));
//		stream.forEach(System.out::println);
		
		System.out.println("---------------------------------");
		
		Stream<Character> stream2 = strList.stream()
				.flatMap(StreamInfo::filterCharacter);
//		Stream<Character> stream3 = strList.stream()
//				.flatMap(s -> StreamInfo.filterCharacter(s));
		
		stream2.forEach(System.out::print);
		
		
		
	} 
	public static Stream<Character> filterCharacter(String str){
		  List<Character> list = new ArrayList<>();
		  for (Character ch : str.toCharArray()) {
		    list.add(ch);
		  }
		  return list.stream();
	}
	
}

源码下载地址:https://download.csdn.net/download/qq_20410965/12434193


版权声明:本文为qq_20410965原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。