通过每次追加一行来创建Pandas数据框架

与ShikharDua的答案(基于行)中的字典列表不同，我们也可以将我们的表表示为一个列表字典(基于列)，其中每个列表按行顺序存储一列，前提是我们事先知道我们的列。最后，我们构造一次DataFrame。

在这两种情况下，字典键始终是列名。行顺序隐式存储为列表中的order。对于c列和n行，它使用一个c个字典列表，而不是一个n个字典列表。字典列表方法让每个字典冗余地存储所有键，并且需要为每一行创建一个新字典。这里我们只追加到列表中，这总体上是相同的时间复杂度(向列表和字典中添加条目都是平摊常数时间)，但由于操作简单，开销可能更小。

# Current data
data = {"Animal":["cow", "horse"], "Color":["blue", "red"]}

# Adding a new row (be careful to ensure every column gets another value)
data["Animal"].append("mouse")
data["Color"].append("black")

# At the end, construct our DataFrame
df = pd.DataFrame(data)
#   Animal  Color
# 0    cow   blue
# 1  horse    red
# 2  mouse  black

2019-12-30 01:35:57

这不是OP问题的答案，而是一个玩具例子来说明ShikharDua的答案，我觉得非常有用。

虽然这个片段很简单，但在实际数据中，我有1000行和许多列，我希望能够根据不同的列进行分组，然后对多个目标列执行下面的统计。因此，有一种可靠的方法来一次一行地构建数据帧是非常方便的。谢谢你，ShikharDua!

import pandas as pd

BaseData = pd.DataFrame({ 'Customer' : ['Acme','Mega','Acme','Acme','Mega','Acme'],
                          'Territory'  : ['West','East','South','West','East','South'],
                          'Product'  : ['Econ','Luxe','Econ','Std','Std','Econ']})
BaseData

columns = ['Customer','Num Unique Products', 'List Unique Products']

rows_list=[]
for name, group in BaseData.groupby('Customer'):
    RecordtoAdd={} #initialise an empty dict
    RecordtoAdd.update({'Customer' : name}) #
    RecordtoAdd.update({'Num Unique Products' : len(pd.unique(group['Product']))})
    RecordtoAdd.update({'List Unique Products' : pd.unique(group['Product'])})

    rows_list.append(RecordtoAdd)

AnalysedData = pd.DataFrame(rows_list)

print('Base Data : \n',BaseData,'\n\n Analysed Data : \n',AnalysedData)

2016-07-13 09:49:18

下面是在Pandas数据框架中添加/追加一行的方法:

def add_row(df, row):
    df.loc[-1] = row
    df.index = df.index + 1
    return df.sort_index()

add_row(df, [1,2,3])

它可以用于在空的或填充的Pandas数据框架中插入/追加一行。

2018-09-05 19:30:54

与ShikharDua的答案(基于行)中的字典列表不同，我们也可以将我们的表表示为一个列表字典(基于列)，其中每个列表按行顺序存储一列，前提是我们事先知道我们的列。最后，我们构造一次DataFrame。

在这两种情况下，字典键始终是列名。行顺序隐式存储为列表中的order。对于c列和n行，它使用一个c个字典列表，而不是一个n个字典列表。字典列表方法让每个字典冗余地存储所有键，并且需要为每一行创建一个新字典。这里我们只追加到列表中，这总体上是相同的时间复杂度(向列表和字典中添加条目都是平摊常数时间)，但由于操作简单，开销可能更小。

# Current data
data = {"Animal":["cow", "horse"], "Color":["blue", "red"]}

# Adding a new row (be careful to ensure every column gets another value)
data["Animal"].append("mouse")
data["Color"].append("black")

# At the end, construct our DataFrame
df = pd.DataFrame(data)
#   Animal  Color
# 0    cow   blue
# 1  horse    red
# 2  mouse  black

2019-12-30 01:35:57

可以使用ignore_index选项将单行追加为字典。

>>> f = pandas.DataFrame(data = {'Animal':['cow','horse'], 'Color':['blue', 'red']})
>>> f
  Animal Color
0    cow  blue
1  horse   red
>>> f.append({'Animal':'mouse', 'Color':'black'}, ignore_index=True)
  Animal  Color
0    cow   blue
1  horse    red
2  mouse  black

2016-02-23 16:43:07

如果你可以提前获得数据帧的所有数据，有一个比追加到数据帧更快的方法:

创建一个字典列表，其中每个字典对应一个输入数据行。从这个列表创建一个数据帧。

我有一个类似的任务，一行一行地添加到一个数据帧花了30分钟，从字典列表中创建一个数据帧在几秒钟内完成。

rows_list = []
for row in input_rows:

        dict1 = {}
        # get input row in dictionary format
        # key = col_name
        dict1.update(blah..) 

        rows_list.append(dict1)

df = pd.DataFrame(rows_list)

2013-07-05 20:38:13

通过每次追加一行来创建Pandas数据框架

推荐文章

最新文章

标签