SPARK[RDD之partitions] 2023年11月25日 Spark 0条评论 277次阅读 0人点赞 RDD是容错、并行的数据结构,具备分区的属性,这个分区可以是单机上分区也可以是多机上的分区,对于RDD分区的数量涉及到这个RDD进行并发计算的粒度。每一个分区都会在一个单独的task中执行。 可以为其指定分区个数,如果从…