帮你快速理解 Spark 的分区器 2019年6月8日 Spark 0条评论 200次阅读 0人点赞 本文基于Spark2.1.0版本 0,引言: Spark一般是部署在分布式环境中的(有可能是在区域集中的集群上,也有可能跨城市),而在分布式环境中,数据在各节点进行网络的传递代价是很大的。借用Spark源码里对group…