使用parallelize创建RDD 也 可以使用makeRDD来创建RDD。 通过查看源码可以发现,makeRDD执行的时候,也是在调用parallelize函数,二者无区别。 通过 .textFile 可以通过文件读…
分类:rdd
spark基础-rdd特性
RDD特性: 1.RDD是spark提供的核心抽象,全称:Resillient Distributed Dataset,即弹性分布式数据集。 2.RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的,氛围多个分区,…
使用parallelize创建RDD 也 可以使用makeRDD来创建RDD。 通过查看源码可以发现,makeRDD执行的时候,也是在调用parallelize函数,二者无区别。 通过 .textFile 可以通过文件读…
RDD特性: 1.RDD是spark提供的核心抽象,全称:Resillient Distributed Dataset,即弹性分布式数据集。 2.RDD在抽象上来说是一种元素集合,包含了数据。它是被分区的,氛围多个分区,…