我无法得到熊猫列的平均值或平均值。A有一个数据框架。下面我尝试的两种方法都没有给出列权值的平均值

>>> allDF 
         ID           birthyear  weight
0        619040       1962       0.1231231
1        600161       1963       0.981742
2      25602033       1963       1.3123124     
3        624870       1987       0.94212

下面返回多个值,而不是一个:

allDF[['weight']].mean(axis=1)

这个也一样:

allDF.groupby('weight').mean()

当前回答

你可以简单地选择: df.describe () 这将为你提供所有你需要的相关细节,但要找到特定列的最小值,最大值或平均值(在你的情况下说“权重”),使用:

    df['weights'].mean(): For average value
    df['weights'].max(): For maximum value
    df['weights'].min(): For minimum value

其他回答

你可以使用agg (aggregate)方法:

df.agg('mean')

可以应用多个统计数据:

df.agg(['mean', 'max', 'min'])

尝试df.mean(axis=0), axis=0参数计算数据帧的列平均值,因此结果将是axis=1是行平均值,因此您将获得多个值。

你可以使用下面两种说法中的任何一种:

numpy.mean(df['col_name'])
# or
df['col_name'].mean()

请注意,它首先需要是数值数据类型。

 import pandas as pd
 df['column'] = pd.to_numeric(df['column'], errors='coerce')

接下来,使用describe()找到一列或所有数字列的平均值。

df['column'].mean()
df.describe()

来自describe的结果示例:

          column 
count    62.000000 
mean     84.678548 
std     216.694615 
min      13.100000 
25%      27.012500 
50%      41.220000 
75%      70.817500 
max    1666.860000

你也可以使用点符号(也称为属性访问)访问一个列,然后计算它的平均值:

df.your_column_name.mean()