spark从入门到放弃十二: 深度剖析宽依赖与窄依赖

文章地址:http://www.haha174.top/article/details/256658
根据hello world 的例子介绍一个什么是宽依赖和窄依赖。
[图片上传失败…(image-2d03e-1522073561144)]
窄依赖:英文全名,Narrow Dependence.什么样的情况,叫做窄依赖呢?一个RDD对他的父RDD只有简单的1对1的依赖关系。也即是说。RDD的每个partition.仅仅依赖于父RDD中的一个partition。父RDD和子RDD的关系是一对一的如图

宽依赖:英文全名 Shuffle Dependence 每一个父类的RDD都可能传输一部分到下一个RDD的每个partition中。此时就会出现父子RDD之间错综复杂的关系。那么这种情况称为两个RDD之间的宽依赖。同时他们之间的操作也是shuffle.
欢迎关注,更多福利

《spark从入门到放弃十二: 深度剖析宽依赖与窄依赖》 这里写图片描述

    原文作者:意浅离殇
    原文地址: https://www.jianshu.com/p/fa88f842ccd5
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞