4.Apache Spark的工作原理

Apache Spark的工作原理

1 Why Apache Spark
2 关于Apache Spark
3 如何安装Apache Spark
4 Apache Spark的工作原理
5 spark弹性分布式数据集
6 RDD持久性
7 spark共享变量
8 Spark SQL
9 Spark Streaming

原文链接:http://blogxinxiucan.sh1.newtouch.com/2017/07/23/Apache-Spark%E7%9A%84%E5%B7%A5%E4%BD%9C%E5%8E%9F%E7%90%86/

Spark引擎提供了一种在一组机器上分布式内存中处理数据的方法。图7显示了典型的Spark作业如何处理信息的逻辑图。

《4.Apache Spark的工作原理》
《4.Apache Spark的工作原理》

主控制如何分割数据,并利用数据位置,同时跟踪从机上的所有分布式数据计算。如果某台从机不可用,该机器上的数据将在其他可用的机器上重建。“大师”目前是一个单一的失败点,但将在即将发布的版本中修复。

公众号:it全能程序猿

《4.Apache Spark的工作原理》

    原文作者:全能程序猿
    原文地址: https://www.jianshu.com/p/c7ed521f99ec
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞