Spark-RDD-countByValue

rdd.countByValue

dfNotNull.map(_.getAs[String]("allSixId")).filter(_.startsWith("advertising_id_s")).countByValue.toList.filter(_._2 > 1).sortBy(_._2).foreach(println)
    原文作者:Zachary4biz
    原文地址: https://www.jianshu.com/p/810824d7360b
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞