Hive数据去重 – 菠萝大数据梦工厂(Free World) – 博客频道 – CSDN.NET http://blog.csdn.net/jiangshouzhuang/artic…
标签:id
mybatis插入数据时,自动获取主键的自增id
首先int i = userMapper.insertSelective(user),这里返回的并不是主键自增id,而是成功插入的条数。如果想获取主键自增id,除了插入记录之后再查询之外,也可以使用mybatis提供的两…
Hive-SQL
每天有多少用户首次流失 select t4.aa,count(*) from ( select t3.role_id role_id,min(t3.date1) aa from ( select t2.role_id r…
oracle创建表时添加表注释
CREATE TABLE t1( id varchar2(32) primary key, name VARCHAR2(32) , age VARCHAR2(32) ) 添加表注释: COMMENT …
mysql中位数、众数计算
平均数、中位数、众数常用来描述数据的集中程度,在mysql中,均值的计算较为简单,但中位数和众数尚不支持可以直接计算的函数,在这里向大家介绍一下中位数和众数的计算方法。 本文所使用的数据表为score,包含三个字段: s…
MongoDB 判断字段是否存在
使用 $exists 判断字段是否存在 ###### 所有数据 > db.book.find({}) { "_id" : ObjectId("58b395fbab449b190054c556"), "title" …
##[优化]hive优化总结
hive优化总结 – 上帝之手 – 博客频道 – CSDN.NET http://blog.csdn.net/preterhuman_peak/article/details/4064…
SQL语句各个部分执行顺序
http://www.tuicool.com/articles/fERNv2 下面先给出上面的SQL语句的执行顺序,然后进行讲解: (8) select (9) distinct (11) top 1 (6) T…
pgsql 学习笔记(一):批量修改数据表 id 的自增序列
前言: 我学习 pgsql 没有多久,对于数据库方面一知半解。开始写这个系列只是为了锻炼自己,有出错之处,敬请谅解,并请告知。 正文: 首先讲一下 pgsql 和 mysql 在 id 自增这一点上的不同:在 mysql…
集群搭建(kafka+hadoop+spark+elasticsearch)
集群搭建(两台与多台一样,hadoop没有选则HA方案) 1. vim /etc/hosts (每个节点都修改) 10.128.7.39 hostname1 10.128.7.84 hostname2 2. 安装jdk,…
pandas x sql server
需求: 从多个子表中,提取相关性信息,合并 思路: 使用pandas读取sql server 表内容,将需要的列修改为对应列名(例:子表a中id列对应子表b中的a_id,则将读取出来后的数据表b,列a_id => …
PHP实现多服务器SESSION共享
为什么要session共享 现在稍微大一点的网站基本上都有好几个子域名,比如www.jiayuan.com, vip.jiayuan.com,这些网站如果需要共用用户登录信息,那么就需要做到session共享,当然前提是…