我如何结合两个数据框架?

我有一个初始数据帧d，我从中提取了两个数据帧，如下所示:

A = D[D.label == k]
B = D[D.label != k]

我想把A和B合并成一个数据框架。数据的顺序并不重要。然而，当我们从D中采样A和B时，它们保留了D中的索引。

当前回答

跨行合并:

df_row_merged = pd.concat([df_a, df_b], ignore_index=True)

跨列合并:

df_col_merged = pd.concat([df_a, df_b], axis=1)

2016-09-22 08:38:50

其他回答

弃用:DataFrame。附加和系列。在v1.4.0中已弃用。

使用附加:

df_merged = df1.append(df2, ignore_index=True)

为了保留它们的索引，设置ignore_index=False。

2012-10-12 00:07:38

用pd。Concat连接多个数据框架:

df_merged = pd.concat([df1, df2], ignore_index=True, sort=False)

2015-05-31 11:47:29

跨行合并:

df_row_merged = pd.concat([df_a, df_b], ignore_index=True)

跨列合并:

df_col_merged = pd.concat([df_a, df_b], axis=1)

2016-09-22 08:38:50

# collect excel content into list of dataframes
data = []
for excel_file in excel_files:
    data.append(pd.read_excel(excel_file, engine="openpyxl"))

# concatenate dataframes horizontally
df = pd.concat(data, axis=1)
# save combined data to excel
df.to_excel(excelAutoNamed, index=False)

当你横向追加时，你可以尝试上面的方法!希望这对sum1有所帮助

2022-06-08 18:57:58

如果您正在处理大数据，并且需要连接多个数据集，那么多次调用concat可能会提高性能。

如果你不想每次都创建一个新的df，你可以聚合这些变化并只调用concat一次:

frames = [df_A, df_B]  # Or perform operations on the DFs
result = pd.concat(frames)

这一点在熊猫文档中指出，在部分底部的连接对象下):

注意:值得注意的是，concat(因此是append) 生成数据的完整副本，并不断重用此数据函数会对性能造成很大的影响。如果你需要的话对多个数据集的操作，使用列表推导式。

2017-10-10 07:53:37

我如何结合两个数据框架?

推荐文章

最新文章

标签