经常研究社会关系网的同学应该对社会关系网中的分析法比较熟悉,最近在写毕业设计用到了这方面的知识,所以在这做个总结。社会关系网是一门研究社会中社会实体(称为参与者)以及他们之间的活动与关系的学问。这种关系和活动可以用网络或…
标签:note
帮你快速理解 Spark 的分区器
本文基于Spark2.1.0版本 0,引言: Spark一般是部署在分布式环境中的(有可能是在区域集中的集群上,也有可能跨城市),而在分布式环境中,数据在各节点进行网络的传递代价是很大的。借用Spark源码里对group…
Hive创建snappy压缩格式的orc文件类型表
创建表时添加一些两个选项 文件存储格式: [STORED AS file_format] file_format: : SEQUENCEFILE | TEXTFILE — (Default, dependin…