Como usar o groupby no Python?
pandas GroupBy: Seu Guia para Agrupar Dados em Python
por Brad Solomon (data-science, intermediate)
Este tutorial irá ajudá-lo a entender e visualizar as operações de GroupBy do pandas, desde o início até o fim. Ele é destinado a complementar a documentação oficial do pandas e o pandas Cookbook, onde você encontrará exemplos autossuficientes e em tamanho reduzido. Aqui, no entanto, você se concentrará em três exemplos mais envolvidos que usam conjuntos de dados do mundo real.
Neste tutorial, você aprenderá:
- Como usar as operações GroupBy do pandas em dados reais
- Como funciona a cadeia de operações split-apply-combine
- Como decompor a cadeia split-apply-combine em etapas
- Como categorizar os métodos de um objeto GroupBy do pandas com base em sua intenção e resultado
Você pode baixar o código-fonte de todos os exemplos deste tutorial clicando no link abaixo:
Pré-requisitos
- Windows
- Linux + macOS
Windows PowerShell:
Shell:
Neste tutorial, você se concentrará em três conjuntos de dados:
- O conjunto de dados do Congresso dos Estados Unidos contém informações públicas sobre membros históricos do Congresso e ilustra várias capacidades fundamentais do
.groupby()
. - O conjunto de dados do agregador de notícias possui metadados de centenas de milhares de artigos de notícias. Você estará trabalhando com strings e realizando manipulação de texto com o
.groupby()
.
Você pode baixar o código-fonte de todos os exemplos deste tutorial clicando no link abaixo:
Depois de baixar o arquivo .zip
, descompacte-o em uma pasta chamada