【Flink】小例子入门

Flink

介绍

基于数据流的,有状态的计算,计算作用在有界或者无界的数据流上

流类型

无界流:有开始,没有结束的数据流,采用的处理方式按照一定顺序处理(时间。。。)

有界流:有开始,有结束的数据流,经常采用处理方式用批处理

spark、flink对比

1、spark、flink 支持流、批处理

2、flink 高吞吐、低延迟

词频统计

需求:词频统计(word count),一个文件,统计文件中每个单词出现的次数,分隔符是\t,统计结果输出到控制台(生产环境上肯定是Sink到达目的地)

开发批处理应用程序

实现方式

flink+Java

Apache Flink 1.7 Documentation: Project Template for Java

开发流程/开发八股文编程

  1. set up the batch execution environment(设置批处理执行环境)
  2. read(读取数据)
  1. tranform operations(开发的核心所在:开发业务逻辑)
  2. execute program

flink+scala

Apache Flink 1.7 Documentation: Project Template for Scala


版权声明:本文为zlt995768025原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。