从Pandas Datetime列中分别提取月份和年份

我有一个数据框架，df，有以下列:

df['ArrivalDate'] =
...
936   2012-12-31
938   2012-12-29
965   2012-12-31
966   2012-12-31
967   2012-12-31
968   2012-12-31
969   2012-12-31
970   2012-12-29
971   2012-12-31
972   2012-12-29
973   2012-12-29
...

列的元素是pandas. tslip . timestamp。

我想只包括年份和月份。我以为会有简单的方法，但我想不出来。

以下是我的尝试:

df['ArrivalDate'].resample('M', how = 'mean')

我得到了以下错误:

Only valid with DatetimeIndex or PeriodIndex

然后我试着:

df['ArrivalDate'].apply(lambda(x):x[:-2])

我得到了以下错误:

'Timestamp' object has no attribute '__getitem__'

有什么建议吗?

编辑:我有点明白了。

df.index = df['ArrivalDate']

然后，我可以使用索引重新采样另一列。

但是我仍然想要一个重新配置整个列的方法。什么好主意吗?

当前回答

如果你想要新的列分别显示年和月，你可以这样做:

df['year'] = pd.DatetimeIndex(df['ArrivalDate']).year
df['month'] = pd.DatetimeIndex(df['ArrivalDate']).month

还是……

df['year'] = df['ArrivalDate'].dt.year
df['month'] = df['ArrivalDate'].dt.month

然后你就可以把它们组合起来，或者直接使用它们。

2014-08-05 22:18:11

其他回答

提取年份say from ['2018-03-04']

df['Year'] = pd.DatetimeIndex(df['date']).year

df['Year']创建一个新列。而如果你想提取月份，只需使用.month

2018-03-15 08:43:53

在不使用apply方法的情况下，有两个步骤来提取所有数据帧的年份。

Step1

将列转换为datetime:

df['ArrivalDate']=pd.to_datetime(df['ArrivalDate'], format='%Y-%m-%d')

步骤2

使用DatetimeIndex()方法提取年份或月份

 pd.DatetimeIndex(df['ArrivalDate']).year

2019-08-12 13:55:04

感谢jaknap32，我想根据年和月聚合结果，所以这是有效的:

df_join['YearMonth'] = df_join['timestamp'].apply(lambda x:x.strftime('%Y%m'))

输出很简洁:

0    201108
1    201108
2    201108

2017-05-09 09:17:28

@KieranPC的解决方案是Pandas的正确方法，但不容易扩展到任意属性。为此，你可以在生成器理解中使用getattr，并使用pd.concat进行组合:

# input data
list_of_dates = ['2012-12-31', '2012-12-29', '2012-12-30']
df = pd.DataFrame({'ArrivalDate': pd.to_datetime(list_of_dates)})

# define list of attributes required    
L = ['year', 'month', 'day', 'dayofweek', 'dayofyear', 'weekofyear', 'quarter']

# define generator expression of series, one for each attribute
date_gen = (getattr(df['ArrivalDate'].dt, i).rename(i) for i in L)

# concatenate results and join to original dataframe
df = df.join(pd.concat(date_gen, axis=1))

print(df)

  ArrivalDate  year  month  day  dayofweek  dayofyear  weekofyear  quarter
0  2012-12-31  2012     12   31          0        366           1        4
1  2012-12-29  2012     12   29          5        364          52        4
2  2012-12-30  2012     12   30          6        365          52        4

2018-10-13 13:20:01

您可以先用熊猫转换日期字符串。To_datetime，它允许您访问所有numpy datetime和timedelta工具。例如:

df['ArrivalDate'] = pandas.to_datetime(df['ArrivalDate'])
df['Month'] = df['ArrivalDate'].values.astype('datetime64[M]')

2017-04-22 16:03:17

从Pandas Datetime列中分别提取月份和年份

推荐文章

最新文章

标签