Spark SQL执行流程解析之 sql执行顺序

一.Spark SQL模板解析

   Spark Sql 关键字执行顺序跟Sql执行顺序类似:

1.先将from前两表做笛卡尔积加载进来形成虚拟表vt1,

2.on条件后为真的插入虚拟表形成vt2,

如果包含多个表,重复操作,

完成所有数据加载后, 开始对形成的大虚拟表vt2进行处理, 

3.where 后为真的插入vt3

4.group by 进行行分组形成vt4

5.cube|roll up:超组形成vt5

6. HIving: 为true的插入vt6

7.select :形成vt7

8.distinct:形成vt8

10.order by形成vt9

11.top:形成vt10


版权声明:本文为lyz13469312003原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。