这篇文章记载日常工作中遇到时间戳格式化的方法,因为python,mysql,hive交错使用,因为分别总结,没有多少技术含量,关键在于需要用的时候能够快速查到。
TimeStamp是什么?
TimeStamp叫做时间戳,是指距离格林威治时间1970年01月01日00时00分00秒的秒数,在数据处理过程中经常会遇到它。
为何要格式化?
因为计算机容易处理它,但是人不行啊!格式化就是把它变成人能看懂的时间。比如TimeStamp 1465779665 对应的日期是2016/06/13。
如何格式化?
- mysql语法
<code>
select
timestamp,
FROM_UNIXTIME(timestamp,’%Y%m%d’)
from
mytable
</code>
需要记住FROM_UNIXTIME函数,已经它的字符串格式化方法,其次就是各个字母对应的格式化内容了,见下表:
%M 月名字(January……December)
%W 星期名字(Sunday……Saturday)
%D 有英语前缀的月份的日期(1st, 2nd, 3rd, 等等。)
%Y 年, 数字, 4 位
%y 年, 数字, 2 位
%a 缩写的星期名字(Sun……Sat)
%d 月份中的天数, 数字(00……31)
%e 月份中的天数, 数字(0……31)
%m 月, 数字(01……12)
%c 月, 数字(1……12)
%b 缩写的月份名字(Jan……Dec)
%j 一年中的天数(001……366)
%H 小时(00……23)
%k 小时(0……23)
%h 小时(01……12)
%I 小时(01……12)
%l 小时(1……12)
%i 分钟, 数字(00……59)
%r 时间,12 小时(hh:mm:ss [AP]M)
%T 时间,24 小时(hh:mm:ss)
%S 秒(00……59)%s 秒(00……59)
%p AM或PM
%w 一个星期中的天数(0=Sunday ……6=Saturday )
%U 星期(0……52), 这里星期天是星期的第一天
%u 星期(0……52), 这里星期一是星期的第一天
%% 一个文字“%” - hive sql 语法
hive sql的语法和MySQL类似,但是不用%
<code>
select
timestamp,
from_unixtime(timestamp,”yyyyMMd”)
from
mytable
</code>
具体的格式化方法参见:
http://docs.oracle.com/javase/7/docs/api/java/text/SimpleDateFormat.html - python 语法
举个栗子,把20160101变为2016-01-01,可以用下面的代码:
<code>
datetime.datetime.strptime(‘20160101′,’%Y%m%d’).strftime(‘%Y-%m-%d’)
</code>
具体的格式化方法参见文档:
https://docs.python.org/3/library/datetime.html