在pandas数据框架中合并两列文本

我有一个20 x 4000的数据帧在Python中使用熊猫。其中两列分别命名为Year和quarter。我想创建一个名为period的变量，使Year = 2000, quarter= q2变为2000q2。

有人能帮忙吗?

当前回答

df = pd.DataFrame({'Year': ['2014', '2015'], 'quarter': ['q1', 'q2']})
df['period'] = df[['Year', 'quarter']].apply(lambda x: ''.join(x), axis=1)

产生这个数据框架

   Year quarter  period
0  2014      q1  2014q1
1  2015      q2  2015q2

该方法通过将df[['Year'， 'quarter']]替换为数据帧的任意列片来泛化任意数量的字符串列，例如df.iloc[:，0:2]。Apply (lambda x: " .join(x)， axis=1)。

您可以在这里查看有关apply()方法的更多信息

2015-09-11 17:36:18

其他回答

df = pd.DataFrame({'Year': ['2014', '2015'], 'quarter': ['q1', 'q2']})
df['period'] = df[['Year', 'quarter']].apply(lambda x: ''.join(x), axis=1)

产生这个数据框架

   Year quarter  period
0  2014      q1  2014q1
1  2015      q2  2015q2

该方法通过将df[['Year'， 'quarter']]替换为数据帧的任意列片来泛化任意数量的字符串列，例如df.iloc[:，0:2]。Apply (lambda x: " .join(x)， axis=1)。

您可以在这里查看有关apply()方法的更多信息

2015-09-11 17:36:18

使用.combine_first。

df['Period'] = df['Year'].combine_first(df['Quarter'])

2018-02-10 04:01:46

虽然@silvado的答案是好的，如果你把df.map(str)改为df.astype(str)，它会更快:

import pandas as pd
df = pd.DataFrame({'Year': ['2014', '2015'], 'quarter': ['q1', 'q2']})

In [131]: %timeit df["Year"].map(str)
10000 loops, best of 3: 132 us per loop

In [132]: %timeit df["Year"].astype(str)
10000 loops, best of 3: 82.2 us per loop

2015-11-25 10:25:15

如果两个列都是字符串，你可以直接连接它们:

df["period"] = df["Year"] + df["quarter"]

如果一个(或两个)列不是字符串类型的，你应该先转换它(它们)，

df["period"] = df["Year"].astype(str) + df["quarter"]

这样做时要当心nan !

如果你需要连接多个字符串列，你可以使用agg:

df['period'] = df[['Year', 'quarter', ...]].agg('-'.join, axis=1)

其中“-”是分隔符。

2013-10-15 10:09:51

我把…

listofcols = ['col1','col2','col3']
df['combined_cols'] = ''

for column in listofcols:
    df['combined_cols'] = df['combined_cols'] + ' ' + df[column]
'''

2020-08-18 04:13:36

在pandas数据框架中合并两列文本

推荐文章

最新文章

标签