从Pandas聚合结果中格式化/抑制科学符号

如何修改pandas中groupby操作的输出格式，以生成非常大的数字的科学计数法?

我知道如何在python中进行字符串格式化，但当涉及到在这里应用它时，我不知所措。

df1.groupby('dept')['data1'].sum()

dept
value1       1.192433e+08
value2       1.293066e+08
value3       1.077142e+08

这抑制了科学符号，如果我转换为字符串，但现在我只是想知道如何字符串格式和添加小数。

sum_sales_dept.astype(str)

当前回答

这是另一种方法，类似于Dan Allan的答案，但没有lambda函数:

>>> pd.options.display.float_format = '{:.2f}'.format
>>> Series(np.random.randn(3))
0    0.41
1    0.99
2    0.10

>>> pd.set_option('display.float_format', '{:.2f}'.format)

2017-10-10 17:12:33

其他回答

扩展这个有用的注释，下面是一个解决方案，设置格式选项只显示结果，而不永久更改选项:

with pd.option_context('display.float_format', lambda x: f'{x:,.3f}'):
    display(sum_sales_dept)

dept
value1  119,243,300.0
value2  129,306,600.0
value3  107,714,200.0

2022-07-11 09:03:48

当然，我在评论中链接的答案并不是很有用。您可以像这样指定自己的字符串转换器。

In [25]: pd.set_option('display.float_format', lambda x: '%.3f' % x)

In [28]: Series(np.random.randn(3))*1000000000
Out[28]: 
0    -757322420.605
1   -1436160588.997
2   -1235116117.064
dtype: float64

我不确定这是否是首选的方法，但它确实有效。

纯粹出于审美目的将数字转换为字符串似乎是一个坏主意，但如果你有一个很好的理由，这是一种方法:

In [6]: Series(np.random.randn(3)).apply(lambda x: '%.3f' % x)
Out[6]: 
0     0.026
1    -0.482
2    -0.694
dtype: object

2014-01-15 14:40:32

这是另一种方法，类似于Dan Allan的答案，但没有lambda函数:

>>> pd.options.display.float_format = '{:.2f}'.format
>>> Series(np.random.randn(3))
0    0.41
1    0.99
2    0.10

>>> pd.set_option('display.float_format', '{:.2f}'.format)

2017-10-10 17:12:33

如果你想在jupyter notebook单元格中设置数据帧的输出样式，你可以在每个数据帧的基础上设置显示样式:

df = pd.DataFrame({'A': np.random.randn(4)*1e7})
df.style.format("{:.1f}")

请在这里查看文档。

2019-06-18 11:08:27

你可以使用round函数来抑制特定数据帧的科学符号:

df1.round(4)

或者你可以通过以下方法全局抑制is:

pd.options.display.float_format = '{:.4f}'.format

2018-01-23 14:00:05

从Pandas聚合结果中格式化/抑制科学符号

推荐文章

最新文章

标签