spark读取hdfs上的文件和写入数据到hdfs上面

def main(args: Array[String]): Unit = {
      val conf = new SparkConf()
      conf.set("spark.master", "local")
      conf.set("spark.app.name", "spark demo")
      val sc = new SparkContext(conf);
      // 读取hdfs数据
      val textFileRdd = sc.textFile("hdfs://m2:9820/README.md")
      val fRdd = textFileRdd.flatMap { _.split(" ") }
      val mrdd = fRdd.map { (_, 1) }
      val rbkrdd = mrdd.reduceByKey(_+_)
      // 写入数据到hdfs系统
      rbkrdd.saveAsTextFile("hdfs://m2:9820/wcresult")
  }

  

    原文作者:spark
    原文地址: https://www.cnblogs.com/heml/p/6186109.html
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞