1.Pair RDD的转化操作 以键值对集合{(1,2),(3,4),(3,6)}为例 1.reduceByKey(func) 合并具有相同键的值 rdd.reduceByKey((x,y) => x+y) 结果:…
标签:func
spark streaming 实时日志清洗和统计
1、数据处理加工模型 (1)输入:文件,数据库,消息队列 (2)处理:函数,sql,mapreduce,bolt,transform/action (3)输出:文件,数据库 2、spark简介 spark与hadoop开…