Pular para o conteúdo

Como usar o groupby no Python?

[

pandas GroupBy: Seu Guia para Agrupar Dados em Python

por Brad Solomon (data-science, intermediate)

Este tutorial irá ajudá-lo a entender e visualizar as operações de GroupBy do pandas, desde o início até o fim. Ele é destinado a complementar a documentação oficial do pandas e o pandas Cookbook, onde você encontrará exemplos autossuficientes e em tamanho reduzido. Aqui, no entanto, você se concentrará em três exemplos mais envolvidos que usam conjuntos de dados do mundo real.

Neste tutorial, você aprenderá:

  • Como usar as operações GroupBy do pandas em dados reais
  • Como funciona a cadeia de operações split-apply-combine
  • Como decompor a cadeia split-apply-combine em etapas
  • Como categorizar os métodos de um objeto GroupBy do pandas com base em sua intenção e resultado

Você pode baixar o código-fonte de todos os exemplos deste tutorial clicando no link abaixo:

Pré-requisitos

  • Windows
  • Linux + macOS

Windows PowerShell:

Terminal window
PS> python -m venv venv
PS> venv\Scripts\activate
(venv) PS> python -m pip install pandas

Shell:

Terminal window
$ python3 -m venv venv
$ source venv/bin/activate
(venv) $ python -m pip install pandas

Neste tutorial, você se concentrará em três conjuntos de dados:

  1. O conjunto de dados do Congresso dos Estados Unidos contém informações públicas sobre membros históricos do Congresso e ilustra várias capacidades fundamentais do .groupby().
  2. O conjunto de dados do agregador de notícias possui metadados de centenas de milhares de artigos de notícias. Você estará trabalhando com strings e realizando manipulação de texto com o .groupby().

Você pode baixar o código-fonte de todos os exemplos deste tutorial clicando no link abaixo:

Depois de baixar o arquivo .zip, descompacte-o em uma pasta chamada