通过每次追加一行来创建Pandas数据框架

我如何创建一个空DataFrame，然后添加行，一个接一个?

我创建了一个空DataFrame:

df = pd.DataFrame(columns=('lib', 'qty1', 'qty2'))

然后我可以在最后添加一个新行，并填充一个字段:

df = df._set_value(index=len(df), col='qty1', value=10.0)

它一次只适用于一个领域。向df中添加新行有什么更好的方法?

当前回答

如果你可以提前获得数据帧的所有数据，有一个比追加到数据帧更快的方法:

创建一个字典列表，其中每个字典对应一个输入数据行。从这个列表创建一个数据帧。

我有一个类似的任务，一行一行地添加到一个数据帧花了30分钟，从字典列表中创建一个数据帧在几秒钟内完成。

rows_list = []
for row in input_rows:

        dict1 = {}
        # get input row in dictionary format
        # key = col_name
        dict1.update(blah..) 

        rows_list.append(dict1)

df = pd.DataFrame(rows_list)

2013-07-05 20:38:13

其他回答

您还可以建立一个列表的列表，并将其转换为数据框架-

import pandas as pd

columns = ['i','double','square']
rows = []

for i in range(6):
    row = [i, i*2, i*i]
    rows.append(row)

df = pd.DataFrame(rows, columns=columns)

给

    i   double  square
0   0   0   0
1   1   2   1
2   2   4   4
3   3   6   9
4   4   8   16
5   5   10  25

2017-10-13 12:16:23

如果你可以提前获得数据帧的所有数据，有一个比追加到数据帧更快的方法:

创建一个字典列表，其中每个字典对应一个输入数据行。从这个列表创建一个数据帧。

我有一个类似的任务，一行一行地添加到一个数据帧花了30分钟，从字典列表中创建一个数据帧在几秒钟内完成。

rows_list = []
for row in input_rows:

        dict1 = {}
        # get input row in dictionary format
        # key = col_name
        dict1.update(blah..) 

        rows_list.append(dict1)

df = pd.DataFrame(rows_list)

2013-07-05 20:38:13

可以使用ignore_index选项将单行追加为字典。

>>> f = pandas.DataFrame(data = {'Animal':['cow','horse'], 'Color':['blue', 'red']})
>>> f
  Animal Color
0    cow  blue
1  horse   red
>>> f.append({'Animal':'mouse', 'Color':'black'}, ignore_index=True)
  Animal  Color
0    cow   blue
1  horse    red
2  mouse  black

2016-02-23 16:43:07

与ShikharDua的答案(基于行)中的字典列表不同，我们也可以将我们的表表示为一个列表字典(基于列)，其中每个列表按行顺序存储一列，前提是我们事先知道我们的列。最后，我们构造一次DataFrame。

在这两种情况下，字典键始终是列名。行顺序隐式存储为列表中的order。对于c列和n行，它使用一个c个字典列表，而不是一个n个字典列表。字典列表方法让每个字典冗余地存储所有键，并且需要为每一行创建一个新字典。这里我们只追加到列表中，这总体上是相同的时间复杂度(向列表和字典中添加条目都是平摊常数时间)，但由于操作简单，开销可能更小。

# Current data
data = {"Animal":["cow", "horse"], "Color":["blue", "red"]}

# Adding a new row (be careful to ensure every column gets another value)
data["Animal"].append("mouse")
data["Color"].append("black")

# At the end, construct our DataFrame
df = pd.DataFrame(data)
#   Animal  Color
# 0    cow   blue
# 1  horse    red
# 2  mouse  black

2019-12-30 01:35:57

您可以为此连接两个数据框架。我基本上遇到了这个问题，用字符索引(不是数字)向现有的DataFrame添加新行。

因此，我在一个管道()中输入新行数据，并在一个列表中索引。

new_dict = {put input for new row here}
new_list = [put your index here]

new_df = pd.DataFrame(data=new_dict, index=new_list)

df = pd.concat([existing_df, new_df])

2020-04-30 14:07:19

通过每次追加一行来创建Pandas数据框架

推荐文章

最新文章

标签