python groupby 函数 as_index

python

在官方网站中对as_index有以下介绍:

as_index : boolean, default True

For aggregated output, return object with group labels as the index. Only relevant for DataFrame input. as_index=False is effectively “SQL-style” grouped output

翻译过来就是说as_index 的默认值为True, 对于聚合输出,返回以组标签作为索引的对象。仅与DataFrame输入相关。as_index = False实际上是“SQL风格”的分组输出。举例如下

python;gutter:true;">import pandas as pd

df = pd.DataFrame(data={'books':['bk1','bk1','bk1','bk2','bk2','bk3'], 'price': [12,12,12,15,15,17]})

print df

print

print df.groupby('books', as_index=True).sum()

print

print df.groupby('books', as_index=False).sum()

  

输出如下:

  books  price

0 bk1 12

1 bk1 12

2 bk1 12

3 bk2 15

4 bk2 15

5 bk3 17

price

books

bk1 36

bk2 30

bk3 17

books price

0 bk1 36

1 bk2 30

2 bk3 17

  

代码中注释的两段代码报错,分析可以看到:

当as_index=True时,没有显示索引项,而是以第一列组标签为索引值,故不能通过df.loc[0]取值,可以通过df.loc[‘bk1’]取值;

当as_index=False时,显示索引项,此时可以通过df.loc[0]取得值。因此as_index的作用是控制聚合输出是否以组标签为索引值。

原文:https://blog.csdn.net/buside/article/details/86597764

以上是 python groupby 函数 as_index 的全部内容, 来源链接: utcz.com/z/386557.html

回到顶部