Python pandas dataframe 日期时间列中提取月份和年份

@创建于:20210716
@修改于:20210716

文章目录

1、pandas.Series.dt.year() 和 pandas.Series.dt.month() 方法提取月份和年份

应用于 Datetime 类型的 pandas.Series.dt.year() 和 pandas.Series.dt.month() 方法分别返回系列对象中 Datetime 条目的年和月的 numpy 数组。

注意:如果该列不是 Datetime 类型,则应首先使用 to_datetime() 方法将该列转换为 Datetime 类型,pd.to_datetime()

import pandas as pd

list_of_dates = ['2019-11-20', '2020-01-02', '2020-02-05','2020-03-10','2020-04-16']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({ 'Joined date': pd.to_datetime(list_of_dates)}, index=employees)

df['Year'] = df['Joined date'].dt.year
df['Month'] = df['Joined date'].dt.month
df['Day'] = df['Joined date'].dt.day
# 转化为日期类型datetime64[ns]
df['Date'] = pd.to_datetime(df['Joined date'].dt.date)
print(df)

输出

        Joined date  Year  Month  Day       Date
Hisila   2019-11-20  2019     11   20 2019-11-20
Shristi  2020-01-02  2020      1    2 2020-01-02
Zeppy    2020-02-05  2020      2    5 2020-02-05
Alina    2020-03-10  2020      3   10 2020-03-10
Jerry    2020-04-16  2020      4   16 2020-04-16
df.dtypes

Joined date    datetime64[ns]
Year                    int64
Month                   int64
Day                     int64
Date           datetime64[ns]
dtype: object

2、strftime() 方法提取年份和月份

strftime() 方法使用 Datetime,将格式代码作为输入,并返回表示输出中指定的特定格式的字符串。使用%Y 和%m 作为格式代码来提取年份和月份。

import pandas as pd

list_of_dates = ['2019-11-20', '2020-01-02', '2020-02-05','2020-03-10','2020-04-16']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({ 'Joined date': pd.to_datetime(list_of_dates)},index=employees)

df['year'] = df['Joined date'].dt.strftime('%Y')
df['month'] = df['Joined date'].dt.strftime('%m')

输出:

        Joined date  year month
Hisila   2019-11-20  2019    11
Shristi  2020-01-02  2020    01
Zeppy    2020-02-05  2020    02
Alina    2020-03-10  2020    03
Jerry    2020-04-16  2020    04

3、pandas.DatetimeIndex.month 和 pandas.DatetimeIndex.year 提取年份和月份

从 Datetime 列中提取月份和年份的另一种简单方法是检索 pandas.DatetimeIndex 对象的年份和月份属性的值类。

此时,datatime是DataFrame的索引,时间类型的索引。比非时间索引类型的时间类型列,在抽取年月的时候,少个dt。

import pandas as pd

list_of_dates = ['2019-11-20', '2020-01-02', '2020-02-05','2020-03-10','2020-04-16']
employees=['Hisila', 'Shristi','Zeppy','Alina','Jerry']
df = pd.DataFrame({ 'Joined date': pd.to_datetime(list_of_dates)},index=employees)

df['year'] = pd.DatetimeIndex(df['Joined date']).year
df['month'] = pd.DatetimeIndex(df['Joined date']).month

print(df)

输出:

        Joined date  year  month
Hisila   2019-11-20  2019     11
Shristi  2020-01-02  2020      1
Zeppy    2020-02-05  2020      2
Alina    2020-03-10  2020      3
Jerry    2020-04-16  2020      4

4、参考资料

如何从 Pandas 的日期时间列中提取月份和年份

扩展:
如何根据 Pandas 中的日期过滤 DataFrame 行

使用布尔掩码选择两个日期之间的行
pandas.DataFrame.query() 选择两个日期之间的 DataFrame 行
pandas.DataFrame.isin() 选择两个日期之间的 DataFrame 行
pandas.Series.between() 选择两个日期之间的 DataFrame 行
    原文作者:条件漫步
    原文地址: https://blog.csdn.net/chenhepg/article/details/118799729
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞