轴在熊猫中是什么意思?

下面是我生成一个数据框架的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据框架:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我输入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的参考，axis=1代表列，我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

我的问题是:轴在熊猫中是什么意思?

当前回答

我是这样理解的:

比如说，如果你的操作需要在数据框架中从左到右/从右到左，你显然是在合并列。你在不同的列上操作。这是轴=1

例子

df = pd.DataFrame(np.arange(12).reshape(3,4),columns=['A', 'B', 'C', 'D'])
print(df)
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11 

df.mean(axis=1)

0    1.5
1    5.5
2    9.5
dtype: float64

df.drop(['A','B'],axis=1,inplace=True)

    C   D
0   2   3
1   6   7
2  10  11

这里需要注意的是，我们是在列上操作

类似地，如果您的操作需要在数据帧中从上到下/从下到上遍历，那么您正在合并行。轴为0。

2018-12-28 04:06:23

其他回答

The easiest way for me to understand is to talk about whether you are calculating a statistic for each column (axis = 0) or each row (axis = 1). If you calculate a statistic, say a mean, with axis = 0 you will get that statistic for each column. So if each observation is a row and each variable is in a column, you would get the mean of each variable. If you set axis = 1 then you will calculate your statistic for each row. In our example, you would get the mean for each observation across all of your variables (perhaps you want the average of related measures).

轴= 0:按列=按列=沿行

轴= 1:按行=按行=沿列

2017-02-16 19:34:33

在Pandas上有两种最常见的axis用法:

用作索引，如df。iloc [0, 1] 用作函数内的参数，如df.mean(axis=1)

当使用作为索引时，我们可以解释为axis=0代表行，axis=1代表列，即df。iloc(行、列)。所以,df。Iloc[0,1]表示从第0行和第1列中选择数据，在本例中，它返回1.52325。

当使用作为参数时，axis=0表示垂直跨行选择对象，而axis=1表示水平跨列选择对象。

因此，df.mean(axis=1)表示水平计算跨列的平均值，它返回:

0    1.074821
dtype: float64

轴的一般用途是用于选择要操作的特定数据。而理解轴的关键，是把“选择”和“操作”的过程分开。

我们用一种额外的情况来解释:df。下降(A轴= 1)

该操作是df.drop()，它需要目标对象的名称列，在这里是A。它和df。mean()不一样对数据内容进行操作。选择的是列的名称，而不是列的数据内容。由于所有列名都是水平排列在列之间的，所以我们使用axis=1来选择name对象。

总之，我们最好把“选择”和“操作”分开，对以下问题有一个清晰的认识:

选择什么对象是怎么安排的

2021-10-04 05:56:34

让我们看看Wiki上的表格。这是国际货币基金组织对2010年至2019年前十大国家GDP的估计。

1. 如果你想计算每个国家过去十年(2010-2019)的平均GDP，你需要做，df.mean(轴=1)。例如，如果你想计算美国从2010年到2019年的平均GDP, df。loc['美国',' 2010 ':' 2019 '].mean(轴= 1)

2. 如果我想计算所有国家每年的平均GDP(平均值)，你需要做，df.mean(轴=0)。例如，如果你想计算2015年美国、中国、日本、德国和印度的平均GDP, df。loc(“美国”:“印度”,' 2015 '].mean(轴= 0) 注意:上述代码只有在使用set_index方法将“国家(或附属领土)”列设置为索引后才能工作。

2019-01-02 17:27:12

这些答案确实有助于解释这一点，但对于非程序员(例如，像我这样第一次在数据科学课程背景下学习Python的人)来说，它仍然不是完全直观的。我仍然发现使用术语“沿着”或“每个”wrt的行和列是令人困惑的。

对我来说更有意义的是这样说:

轴0将作用于每个COLUMN中的所有row 轴1将作用于每个ROW中的所有COLUMNS

0轴上的均值是每列中所有行的均值，1轴上的均值是每行中所有列的均值。

从根本上说，这和@zhangxaochen和@Michael的意思是一样的，只是用一种更容易让我内化的方式。

2017-09-14 16:15:29

熊猫的设计师韦斯•麦金尼(Wes McKinney)曾大量从事金融数据方面的工作。将列视为股票名称，将指数视为每日价格。然后，您可以猜测关于此财务数据的默认行为是什么(即，axis=0)。Axis =1可以简单地认为是“另一个方向”。

例如，诸如mean()、sum()、describe()、count()等统计函数都默认按列执行，因为对每只股票执行这些函数更有意义。Sort_index (by=)也默认为column。Fillna (method='ffill')将沿着列填充，因为它是相同的股票。Dropna()默认为row，因为您可能只是想丢弃当天的价格，而不是丢弃该股票的所有价格。

类似地，方括号索引指的是列，因为更常见的是选择股票而不是选择日期。

2016-07-15 02:56:44

轴在熊猫中是什么意思?

推荐文章

最新文章

标签