向数据框架中添加常值列

我有一个现有的数据框架，我需要添加一个额外的列，其中将包含每一行相同的值。

现有的df:

Date, Open, High, Low, Close
01-01-2015, 565, 600, 400, 450

新df:

Name, Date, Open, High, Low, Close
abc, 01-01-2015, 565, 600, 400, 450

我知道如何附加现有的系列/数据帧列。但这是一个不同的情况，因为我所需要的是添加'Name'列，并将每一行设置为相同的值，在本例中为'abc'。

df['Name']='abc'将添加新列，并将所有行设置为该值:

In [79]:

df
Out[79]:
         Date, Open, High,  Low,  Close
0  01-01-2015,  565,  600,  400,    450
In [80]:

df['Name'] = 'abc'
df
Out[80]:
         Date, Open, High,  Low,  Close Name
0  01-01-2015,  565,  600,  400,    450  abc

2015-04-08 14:09:52

单尾管工程

df['Name'] = 'abc'

创建“名称”列，并将所有行设置为abc值

2015-04-08 14:10:27

您可以使用insert来指定新列的位置。在本例中，我使用0将新列放在左边。

df.insert(0, 'Name', 'abc')

  Name        Date  Open  High  Low  Close
0  abc  01-01-2015   565   600  400    450

2017-06-20 15:42:00

总结其他人的建议，并加入第三种方法

您可以:

分配(* * kwargs): df.assign (Name = ' abc ') 访问新的列系列(它将被创建)并设置它: df['Name'] = 'abc' insert(loc, column, value, allow_duplates =False) df。insert(0， 'Name'， 'abc')

其中参数loc (0 <= loc <= len(columns))允许您在想要的位置插入列。

'loc'给出了你的列在插入后的索引。例如，上面的代码将列Name插入为第0列，即它将插入到第一列之前，成为新的第一列。(索引从0开始)。

所有这些方法都允许您从Series中添加一个新列(只需将上面的'abc'默认参数替换为Series)。

2018-05-14 09:20:53

One Line帮我搞定了。

df['New Column'] = 'Constant Value'
df['New Column'] = 123

2021-07-15 11:49:53

您可以简单地执行以下操作:

df['New Col'] = pd.Series(["abc" for x in range(len(df.index))])

2021-09-08 14:16:46

我想让大家更多地关注一下@michele-piccolini的部分回答。

我坚信.assign是最好的解决方案。在现实世界中，这些操作不是孤立的，而是在一系列操作中。如果你想要支持一个操作链，你可能应该使用.assign方法。

下面是一个使用滑雪胜地降雪数据的例子(但同样的原则也适用于……金融数据)。

这段代码读起来像一个步骤食谱。赋值(with =)和.insert都让这变得更加困难:

raw = pd.read_csv('https://github.com/mattharrison/datasets/raw/master/data/alta-noaa-1980-2019.csv',
                  parse_dates=['DATE'])
def clean_alta(df):
    return (df
            .loc[:, ['STATION', 'NAME', 'LATITUDE', 'LONGITUDE', 'ELEVATION', 'DATE', 
                     'PRCP', 'SNOW', 'SNWD', 'TMAX', 'TMIN', 'TOBS']]
            .groupby(pd.Grouper(key='DATE', freq='W'))
            .agg({'PRCP': 'sum', 'TMAX': 'max', 'TMIN': 'min', 'SNOW': 'sum', 'SNWD': 'mean'})
            .assign(LOCATION='Alta', 
                    T_RANGE=lambda w_df: w_df.TMAX-w_df.TMIN)
    )

clean_alta(raw)

请注意.assign(LOCATION='Alta'这一行，它在其余操作中间创建了一个包含单个值的列。

2022-06-13 15:56:40

好的，我在这里有一个类似的情况，但如果我把这段代码使用:df['Name']='abc' 相反，'abc'是我想从csv文件中的其他地方获取的新列的名称。

正如你从图片中看到的，df还没有被清理，但我想创建2列，名称为“ADI dms rivoli”，这将继续用于每一行，“December 2019”也是如此。希望你明白了，很难解释，对不起。

2022-09-12 08:34:34

这一行就可以了。

df['name'] = 'abc'

2022-09-21 05:24:26

append方法自Pandas 1.4.0以来已弃用

因此，只有在使用实际的pandas DataFrame对象时才使用上述方法:

df["column"] = "value"

或者，如果在DataFrame副本的视图上设置值，请使用concat()或assign():

通过这种方式，新创建的Series具有与原始DataFrame相同的索引，因此将匹配精确的行

# adds a new column in view `where_there_is_one` named 
# `client` with value `display_name`
# `df` remains unchanged
df = pd.DataFrame({"number": ([1]*5 + [0]*5 )})

where_there_is_one = df[ df["number"] == 1]
where_there_is_one = pd.concat([
    where_there_is_one,
    pd.Series(["display_name"]*df.shape[0],
              index=df.index, 
              name="client")
   ], 
join="inner", axis=1)


# Or use assign
where_there_is_one = where_there_is_one.assign(client = "display_name")

输出:

where_there_is_one:                df:
| 0   | number | client       |    | 0 | number |
| --- | ---    | ---          |    |---| -------|
| 0   | 1      | display_name |    | 0 | 1      |
| 1   | 1      | display_name |    | 1 | 1      |
| 2   | 1      | display_name |    | 2 | 1      |
| 3   | 1      | display_name |    | 3 | 1      |
| 4   | 1      | display_name |    | 4 | 1      |
                                   | 5 | 0      |
                                   | 6 | 0      |
                                   | 7 | 0      |
                                   | 8 | 0      |
                                   | 9 | 0      |

2023-02-02 07:55:46

向数据框架中添加常值列

推荐文章

最新文章

标签