轴在熊猫中是什么意思?

下面是我生成一个数据框架的代码:

import pandas as pd
import numpy as np

dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB'))

然后我得到了数据框架:

+------------+---------+--------+
|            |  A      |  B     |
+------------+---------+---------
|      0     | 0.626386| 1.52325|
+------------+---------+--------+

当我输入命令时:

dff.mean(axis=1)

我得到:

0    1.074821
dtype: float64

根据pandas的参考，axis=1代表列，我希望命令的结果是

A    0.626386
B    1.523255
dtype: float64

我的问题是:轴在熊猫中是什么意思?

当前回答

我以前也很困惑，但我记得是这样的。

它指定将更改的数据帧的维度，或者将在其上执行操作。

让我们通过一个例子来理解这一点。我们有一个数据框架df，它的形状是(5,10)，这意味着它有5行10列。

现在，当我们使用df。mean(axis=1)时，它意味着维数1将被改变，这意味着它将有相同的行数，但不同的列数。因此得到的结果将是(5,1)的形状。

类似地，如果我们使用df.mean(axis=0)，这意味着维度0将被改变，这意味着行数将被改变，但列数将保持不变，因此结果将是形状(1,10)。

试着把这个和问题中提供的例子联系起来。

2021-08-30 10:01:15

其他回答

Axis指的是数组的维度，在pd的情况下。DataFrames轴=0是指向下方的维度，轴=1是指向右侧的维度。

示例:考虑一个形状为(3,5,7)的ndarray。

a = np.ones((3,5,7))

A是一个三维ndarray，即它有3个轴(“axis”是“axis”的复数)。a的构型看起来就像3片面包每片的尺寸都是5乘7。A[0，:，:]表示第0个切片，A[1，:，:]表示第1个切片，等等。

a.s sum(axis=0)将沿着a的第0个轴应用sum()。你将添加所有的切片，最终得到一个形状(5,7)的切片。

a.s sum(axis=0)等价于

b = np.zeros((5,7))
for i in range(5):
    for j in range(7):
        b[i,j] += a[:,i,j].sum()

B和a.sum(轴=0)看起来都是这样的

array([[ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.],
       [ 3.,  3.,  3.,  3.,  3.,  3.,  3.]])

在警局里。DataFrame，轴的工作方式与numpy相同。数组:axis=0将对每一列应用sum()或任何其他约简函数。

注意:在@zhangxaochen的回答中，我发现“沿着行”和“沿着列”这两个短语有点让人困惑。Axis =0表示“沿每列”，Axis =1表示“沿每行”。

2017-03-02 02:08:17

熊猫的设计师韦斯•麦金尼(Wes McKinney)曾大量从事金融数据方面的工作。将列视为股票名称，将指数视为每日价格。然后，您可以猜测关于此财务数据的默认行为是什么(即，axis=0)。Axis =1可以简单地认为是“另一个方向”。

例如，诸如mean()、sum()、describe()、count()等统计函数都默认按列执行，因为对每只股票执行这些函数更有意义。Sort_index (by=)也默认为column。Fillna (method='ffill')将沿着列填充，因为它是相同的股票。Dropna()默认为row，因为您可能只是想丢弃当天的价格，而不是丢弃该股票的所有价格。

类似地，方括号索引指的是列，因为更常见的是选择股票而不是选择日期。

2016-07-15 02:56:44

这些答案确实有助于解释这一点，但对于非程序员(例如，像我这样第一次在数据科学课程背景下学习Python的人)来说，它仍然不是完全直观的。我仍然发现使用术语“沿着”或“每个”wrt的行和列是令人困惑的。

对我来说更有意义的是这样说:

轴0将作用于每个COLUMN中的所有row 轴1将作用于每个ROW中的所有COLUMNS

0轴上的均值是每列中所有行的均值，1轴上的均值是每行中所有列的均值。

从根本上说，这和@zhangxaochen和@Michael的意思是一样的，只是用一种更容易让我内化的方式。

2017-09-14 16:15:29

记住轴1(列)与轴0(行)的简单方法之一是您期望的输出。

如果你希望每行都有输出，使用axis='columns'，另一方面，如果你想为每一列输出，你可以使用axis='rows'。

2019-07-26 13:19:55

轴= 0表示从上到下轴= 1表示从左到右

sums[key] = lang_sets[key].iloc[:,1:].sum(axis=0)

给定的例子是取column == key中所有数据的和。

2017-11-16 13:59:37

轴在熊猫中是什么意思?

推荐文章

最新文章

标签