我有一个初始数据帧d,我从中提取了两个数据帧,如下所示:
A = D[D.label == k]
B = D[D.label != k]
我想把A和B合并成一个数据框架。数据的顺序并不重要。然而,当我们从D中采样A和B时,它们保留了D中的索引。
我有一个初始数据帧d,我从中提取了两个数据帧,如下所示:
A = D[D.label == k]
B = D[D.label != k]
我想把A和B合并成一个数据框架。数据的顺序并不重要。然而,当我们从D中采样A和B时,它们保留了D中的索引。
当前回答
跨行合并:
df_row_merged = pd.concat([df_a, df_b], ignore_index=True)
跨列合并:
df_col_merged = pd.concat([df_a, df_b], axis=1)
其他回答
跨行合并:
df_row_merged = pd.concat([df_a, df_b], ignore_index=True)
跨列合并:
df_col_merged = pd.concat([df_a, df_b], axis=1)
用pd。Concat连接多个数据框架:
df_merged = pd.concat([df1, df2], ignore_index=True, sort=False)
如果您正在处理大数据,并且需要连接多个数据集,那么多次调用concat可能会提高性能。
如果你不想每次都创建一个新的df,你可以聚合这些变化并只调用concat一次:
frames = [df_A, df_B] # Or perform operations on the DFs
result = pd.concat(frames)
这一点在熊猫文档中指出,在部分底部的连接对象下):
注意:值得注意的是,concat(因此是append) 生成数据的完整副本,并不断重用此数据 函数会对性能造成很大的影响。如果你需要的话 对多个数据集的操作,使用列表推导式。
如果你想用第二个数据帧df2的值更新/替换第一个数据帧df1的值。你可以按照以下步骤来做
第一步:设置第一个数据帧的索引(df1)
df1.set_index('id')
第二步:设置第二个数据帧的索引(df2)
df2.set_index('id')
最后使用下面的代码片段更新数据帧-
df1.update(df2)
使用下面的代码水平附加两个Pandas数据帧:
df3 = pd.concat([df1, df2],axis=1, ignore_index=True, sort=False)
您必须指定围绕哪个轴合并两个帧。