轴在熊猫中是什么意思?

下面是我生成一个数据框架的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据框架:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我输入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的参考，axis=1代表列，我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

我的问题是:轴在熊猫中是什么意思?

当前回答

有一件重要的事情要记住，当你使用均值、中值等函数时，你基本上是在做numpy聚合。可以将聚合看作是获得最终的单个输出，该输出可以是列输出、行输出，也可以是整个数据集的单个数字。

当我们说数组中的聚合时，用numpy。Sum (data, axis = 0)，我们真正的意思是我们想要删除这个特定的轴(这里是0轴)。

示例:对于这个特定的数据集，如果我们通过axis = 0计算和，我们实际上对删除(聚集)零轴感兴趣。一旦我们移除零轴，沿着零轴的聚合将导致[1,4,3]等于8，[2,3,6]等于11，[5,7,9]等于21。类似的逻辑可以扩展到axis = 1。

对于drop, concat和其他一些函数，我们实际上不是聚合结果。

我用于直觉的心智模型:

假设当轴= 0时，我们在第一列的每个单元格中放置了袋鼠/青蛙;如果轴= 1，则沿着第一行放置了袋鼠/青蛙。

情况:轴= 0时

把加绿色的形状想象成青蛙。

轴0表示沿着行移动

Sum:假设我们正在计算Sum，那么首先它们将计算它们的位置(r1c1, r2c1, r3c1)[1,4,3] =[8]的和。然后它们的下一个移动也是沿着轴为0的那一行。他们的新位置在下一张图片中(下图)。

删除:如果在一行中它们遇到(r1c1, r2c1, r3c1)中的任何NaN，它们将删除对应的行，因为axis = 0

求和:现在，它们将计算它们的位置(r1c2, r2c2, r3c2)[2,3,6] =[11]的和，类似地，它们将沿着行向前移动一步，并计算第三列[21]的和。

删除:如果在一行中它们遇到(r1c2, r2c2, r3c2)中的任何NaN，它们将在axis = 0时删除相应的行。类似的逻辑可以扩展到不同的轴和额外的行/列。

2022-06-05 19:32:32

其他回答

数组被设计为坐标轴=0，行被垂直放置，而坐标轴=1，列被水平放置。Axis指的是数组的尺寸。

2018-03-17 20:19:48

熊猫的设计师韦斯•麦金尼(Wes McKinney)曾大量从事金融数据方面的工作。将列视为股票名称，将指数视为每日价格。然后，您可以猜测关于此财务数据的默认行为是什么(即，axis=0)。Axis =1可以简单地认为是“另一个方向”。

例如，诸如mean()、sum()、describe()、count()等统计函数都默认按列执行，因为对每只股票执行这些函数更有意义。Sort_index (by=)也默认为column。Fillna (method='ffill')将沿着列填充，因为它是相同的股票。Dropna()默认为row，因为您可能只是想丢弃当天的价格，而不是丢弃该股票的所有价格。

类似地，方括号索引指的是列，因为更常见的是选择股票而不是选择日期。

2016-07-15 02:56:44

Axis指的是数组的维度，在pd的情况下。DataFrames轴=0是指向下方的维度，轴=1是指向右侧的维度。

示例:考虑一个形状为(3,5,7)的ndarray。

a = np.ones((3,5,7))

A是一个三维ndarray，即它有3个轴(“axis”是“axis”的复数)。a的构型看起来就像3片面包每片的尺寸都是5乘7。A[0，:，:]表示第0个切片，A[1，:，:]表示第1个切片，等等。

a.s sum(axis=0)将沿着a的第0个轴应用sum()。你将添加所有的切片，最终得到一个形状(5,7)的切片。

a.s sum(axis=0)等价于

b = np.zeros((5,7))
for i in range(5):
    for j in range(7):
        b[i,j] += a[:,i,j].sum()

B和a.sum(轴=0)看起来都是这样的

array([[ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.]])

在警局里。DataFrame，轴的工作方式与numpy相同。数组:axis=0将对每一列应用sum()或任何其他约简函数。

注意:在@zhangxaochen的回答中，我发现“沿着行”和“沿着列”这两个短语有点让人困惑。Axis =0表示“沿每列”，Axis =1表示“沿每行”。

2017-03-02 02:08:17

我的想法是:Axis = n，其中n = 0,1等意味着矩阵沿该轴折叠(折叠)。所以在一个二维矩阵中，当你沿着0(行)折叠时，你实际上是一次对一列进行操作。对于高阶矩阵也是如此。

这与对矩阵中维数的正常引用不同，其中0 ->行和1 ->列。对于N维数组中的其他维度也是如此。

2018-04-25 09:40:07

我是这样理解的:

比如说，如果你的操作需要在数据框架中从左到右/从右到左，你显然是在合并列。你在不同的列上操作。这是轴=1

例子

df = pd.DataFrame(np.arange(12).reshape(3,4),columns=['A', 'B', 'C', 'D'])
print(df)
   A  B   C   D
0  0  1   2   3
1  4  5   6   7
2  8  9  10  11 

df.mean(axis=1)

0    1.5
1    5.5
2    9.5
dtype: float64

df.drop(['A','B'],axis=1,inplace=True)

    C   D
0   2   3
1   6   7
2  10  11

这里需要注意的是，我们是在列上操作

类似地，如果您的操作需要在数据帧中从上到下/从下到上遍历，那么您正在合并行。轴为0。

2018-12-28 04:06:23

轴在熊猫中是什么意思?

推荐文章

最新文章

标签