如何添加一个空列到一个数据框架?

向pandas DataFrame对象添加空列的最简单方法是什么?我碰到的最好的是

df['foo'] = df.apply(lambda _: '', axis=1)

有没有更合理的方法?

当前回答

从v0.16.0开始，可以使用DF.assign()将新列(单个/多个)分配给DF。这些列按字母顺序插入DF的末尾。

当你想直接对返回的数据帧执行一系列链式操作时，这比简单的赋值更有优势。

考虑@DSM演示的相同DF示例:

df = pd.DataFrame({"A": [1,2,3], "B": [2,3,4]})
df
Out[18]:
   A  B
0  1  2
1  2  3
2  3  4

df.assign(C="",D=np.nan)
Out[21]:
   A  B C   D
0  1  2   NaN
1  2  3   NaN
2  3  4   NaN

请注意，这将返回一个副本，其中包含所有以前的列以及新创建的列。为了对原始DF进行相应的修改，可以这样使用:DF = DF .assign(…)，因为它目前不支持就地操作。

2017-01-31 08:53:31

其他回答

下面的代码解决了“如何向现有数据框架中添加n个空列”的问题。为了将类似问题的解决方案保存在一个地方，我在这里添加了它。

方法1(创建64个附加列，列名从1到64)

m = list(range(1,65,1)) 
dd=pd.DataFrame(columns=m)
df.join(dd).replace(np.nan,'') #df is the dataframe that already exists

方法2(创建64个附加列，列名从1到64)

df.reindex(df.columns.tolist() + list(range(1,65,1)), axis=1).replace(np.nan,'')

2019-09-12 11:48:42

如果您想从列表中添加列名

df=pd.DataFrame()
a=['col1','col2','col3','col4']
for i in a:
    df[i]=np.nan

2018-03-22 04:30:06

这也适用于多个列:

df = pd.DataFrame({"A": [1,2,3], "B": [2,3,4]})
>>> df
   A  B
0  1  2
1  2  3
2  3  4

df1 = pd.DataFrame(columns=['C','D','E'])
df = df.join(df1, how="outer")

>>>df
    A   B   C   D   E
0   1   2   NaN NaN NaN
1   2   3   NaN NaN NaN
2   3   4   NaN NaN NaN

然后对列做任何你想做的事情 pd.Series.map pd.Series.fillna (), () 等。

2021-06-10 06:26:09

df["C"] = ""
df["D"] = np.nan

赋值会给你这个警告SettingWithCopyWarning:

一个值正试图从数据帧(DataFrame)中设置一个片的副本。试一试使用.loc[row_indexer,col_indexer] = value代替

所以最好使用insert:

df.insert(index, column-name, column-value)

2022-06-17 07:51:07

@emunsing的回答非常酷，可以添加多列，但我在python 2.7中无法让它为我工作。相反，我发现这个方法很有效:

mydf = mydf.reindex(columns = np.append( mydf.columns.values, ['newcol1','newcol2'])

2017-04-17 13:23:59

如何添加一个空列到一个数据框架?

推荐文章

最新文章

标签