콘텐츠로 건너뛰기

파이썬에서 groupby 사용 방법 설명

[

pandas GroupBy: Python에서 데이터 그룹화하기

이 튜토리얼은 pandas의 핵심 기능 중 하나를 깊이 있게 이해하고 상세한 설명과 실행 가능한 단계별 샘플 코드를 포함하는 정보성 피쳐 파이썬 튜토리얼을 제공합니다. 단락을 구분하는 데 테이블과 볼드체, 이탤릭체를 사용하여 내용을 더 가독성 있게 만들어봅시다.

사전 요구 사항

이 튜토리얼을 진행하기 전에, pandas가 있는 최신 버전이 새로운 가상 환경 내에서 사용 가능한지 확인하세요.

Terminal window
# Windows
PS> python -m venv venv
PS> venv\Scripts\activate
(venv) PS> python -m pip install pandas
# Linux + macOS
$ python3 -m venv venv
$ source venv/bin/activate
(venv) $ python -m pip install pandas

이 튜토리얼에서는 다음과 같이 세 가지 데이터 세트에 초점을 맞출 것입니다.

  1. 미국 의회 데이터 세트는 의회의 역사적 회원에 대한 공개 정보를 포함하고 있으며, .groupby()의 몇 가지 핵심 기능을 설명합니다.
  2. 대기 질 데이터 세트는 주기적인 가스 센서의 측정값을 포함하고 있습니다. 이를 통해 부동 소수점 및 시계열 데이터 작업을 수행할 수 있습니다.
  3. 뉴스 어그리게이터 데이터 세트는 수십만 개의 뉴스 기사에 대한 메타데이터를 보유하고 있습니다. 이 튜토리얼에서는 문자열 작업 및 .groupby()를 사용한 텍스트 전처리 작업을 다룰 예정입니다.

튜토리얼에서 사용되는 모든 예제의 소스 코드는 아래 링크를 통해 다운로드할 수 있습니다.

.zip 파일을 다운로드한 후 파일을 ‘datasets’라는 이름의 폴더에 푸십시오.

예제 1: 미국 의회 데이터 세트

  • pandas GroupBy의 Hello, World!
  • pandas GroupBy vs SQL
  • pandas GroupBy 작동 방식

예제 2: 대기 질 데이터 세트

  • 파생 배열에 대한 그룹화
  • 리샘플링

예제 3: 뉴스 어그리게이터 데이터 세트

  • .groupby()에서 람다 함수 사용
  • .groupby()의 성능 향상

pandas GroupBy: 모두 한데 모으기

결론

이 튜토리얼에서는 .groupby() 작업을 시작부터 끝까지 상세하게 분석하고 시각화하는 방법을 다룹니다. 이번 튜토리얼은 pandas의 공식 문서와 pandas Cookbook을 보완하는 내용으로 실제 데이터 세트를 사용한 세 가지 더 복잡한 예시에 초점을 맞출 것입니다.

이 튜토리얼의 모든 예제에 대한 소스 코드를 다운로드하려면 아래 링크를 클릭하세요.


[Python 튜토리얼 → 심화된 기사와 비디오 과정](/search?kind=article&kind=course&order=newest) 학습 경로 → 가속화된 학습을 위한 안내된 공부 계획 퀴즈 → 학습 진행 상태 확인 주제 탐색 → 특정 분야 또는 기술 레벨에 초점 커뮤니티 채팅 → 다른 Python 개발자와 함께 학습 회사 소개 → Python 전문가와의 실시간 Q&A 팟캐스트 → Python의 새로운 소식 듣기 책 → 지식을 더 풍부하게 해주며 오프라인에서 배울 수 있음 모든 내용 잠금 해제 →

더 많은 내용

Learner Stories Python 뉴스레터 Python Job Board 팀 만나기 튜토리얼 작성자가 되기 [비디오 강의자가 되기](/become-an- instructor/)

/

— FREE Email Series —

🐍 Python 트릭 💌

Python 트릭 - 딕셔너리 병합

Python 트릭 받기 »

🔒 스팸은 없습니다. 언제든지 언구하십시오.

주제 탐색 안내된 학습 경로
기초 중급 고급


햇 브래드 솔로몬에의한

무료 이메일 시리즈

🐍 Python 트릭 💌

Python 트릭 다운로드 »

🔒 악성 코드 없음. 언제든지 구독 해지 가능.

탩색

[공유](https://twitter.com/intent/tweet/?text=@realpython가 전달하는 이 %23Python groupby/를 참조하세요.)

groupby/) [이메일](mailto:?subject=Python article for you&body=이 Python groupby/)

![Pandas GroupBy: Your Guide to Grouping Data in Pandas_Watermarked.d79eb1266abf.jpg)

pandas GroupBy: Python에서 데이터 그룹화하기

Brad Solomon의 data-science intermediate에 의해 작성됨

[광고 삭제](/account/join/)

pandas를 시작으로 한 기본 기능을 마스터하려는 경우 또는 .groupby()에 대한 이해도를 채우고자하는 경우, 이 튜토리얼은 시작부터 끝까지 pandas GroupBy 작업을 분해하고 시각화하는 데 도움이 될 것입니다.

이 튜토리얼은 공식 pandas 문서pandas Cookbook와 함께 사용되어 응용 가능한 단위별 예시를 볼 수 있습니다. 그러나 본 튜토리얼에서는 세 가지 실제 데이터 세트를 사용하는 더 복잡한 단계별 연습에 초점을 맞춥니다.

이 튜토리얼에서는 다음과 같은 내용을 다룰 것입니다:

  • 실제 데이터를 사용한 pandas GroupBy 작업 방법
  • 분할-적용-결합 연쇄 작업이 작동하는 방식
  • 분할-적용-결합 연쇄를 단계별로 분해하는 방법
  • pandas GroupBy 개체의 메소드를 의도와 결과에 따라 분류하는 방법

이 튜토리얼의 모든 예제에 대한 소스 코드는 아래 링크를 클릭하여 다운로드할 수 있습니다.

[광고 삭제](/account/join/)