本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的Hadoop部分补充。
1 Shuffle机制
Map方法之后,Reduce方法之前的数据处理过程称之为Shuffle。如图4-14所示。
2 Partition分区
3 Partition分区案例实操
1.需求
将统计结果按照手机归属地不
本文是对《【硬刚大数据之学习路线篇】从零到大数据专家的学习指南(全面升级版)》的Hadoop部分补充。
Map方法之后,Reduce方法之前的数据处理过程称之为Shuffle。如图4-14所示。
1.需求
将统计结果按照手机归属地不