我想打印用Pandas分组的结果。

我有一个数据框架:

import pandas as pd
df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)})
print(df)

       A  B
0    one  0
1    one  1
2    two  2
3  three  3
4  three  4
5    one  5

当按“A”分组后打印时,我有以下内容:

print(df.groupby('A'))

<pandas.core.groupby.DataFrameGroupBy object at 0x05416E90>

如何打印分组的数据框架?

如果我这样做:

print(df.groupby('A').head())

我获得的数据帧好像它没有分组:

             A  B
A                
one   0    one  0
      1    one  1
two   2    two  2
three 3  three  3
      4  three  4
one   5    one  5

我期待的是:

             A  B
A                
one   0    one  0
      1    one  1
      5    one  5
two   2    two  2
three 3  three  3
      4  three  4

当前回答

如果你只是在寻找一种显示它的方法,你可以使用describe():

grp = df.groupby['colName']
grp.describe()

这样就得到了一个整洁的表格。

其他回答

你不能直接通过print语句看到groupBy数据,但你可以通过使用for循环迭代组来看到 尝试这段代码以按数据查看组

group = df.groupby('A') #group variable contains groupby data
for A,A_df in group: # A is your column and A_df is group of one kind at a time
  print(A)
  print(A_df)

在尝试之后,您将得到一个输出作为groupby结果

我希望这对你们有帮助

我确认了head()的行为在0.12和0.13版本之间发生了变化。我看这像只虫子。我制造了一个问题。

但是groupby操作实际上并不返回按组排序的DataFrame。这里的.head()方法有点误导人——它只是一个方便的特性,可以让您重新检查分组的对象(在本例中为df)。groupby的结果是一个单独类型的对象,一个groupby对象。必须应用、转换或筛选才能返回到数据帧或系列。

如果你想做的只是按列A中的值排序,你应该使用df.sort('A')。

只是做的事:

grouped_df = df.groupby('A')

for key, item in grouped_df:
    print(grouped_df.get_group(key), "\n\n")

弃用通知:ix在0.20.0中已弃用

这也是可行的,

grouped_df = df.groupby('A')    
gb = grouped_df.groups

for key, values in gb.iteritems():
    print(df.ix[values], "\n\n")

对于选择性键分组:使用gb.keys()将您想要的键插入到key_list_from_gb,在下面:

gb = grouped_df.groups
gb.keys()

key_list_from_gb = [key1, key2, key3]

for key, values in gb.items():
    if key in key_list_from_gb:
        print(df.ix[values], "\n")

为Groupby对象分配一个变量并使用.first()方法。例子:

 a = df_apps_clean[['App', 'Installs']].groupby('Installs')
 a.first()  <----

你只需要将DataFrameGroupBy对象转换为列表,你可以简单地打印它。 ls_grouped_df = list(df.groupby('A')) 打印(ls_grouped_df)