Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing 阅读笔记文章目录背景弹性分布式数据集(RDDs)如何产生 RDD用户可以对 RDD 的控制Spark 提供的编程接口lineage 图示RDDs 表示实现作业调度调度思想阶段(stage)解释器整合scala 解释器spark 解释器内存管理检查点的支持评估迭代式机器学习应用理解速度提升PageRank版权声明:本文为weixin_39139505原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。原文链接:https://blog.csdn.net/weixin_39139505/article/details/109022326