闲来无事,研究一下Spark Rdd的处理过程。 以一个简单的例子看看: val textRDD = sc.textFile("/home/ubuntu/people.txt") val filterRDD = text…
标签:textfile
(三)Hive的文件存储格式
hive文件存储格式包括以下几类: TEXTFILE SEQUENCEFILE RCFILE 自定义格式 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理。…