파이썬에서 groupby 사용 방법 설명
pandas GroupBy: Python에서 데이터 그룹화하기
이 튜토리얼은 pandas의 핵심 기능 중 하나를 깊이 있게 이해하고 상세한 설명과 실행 가능한 단계별 샘플 코드를 포함하는 정보성 피쳐 파이썬 튜토리얼을 제공합니다. 단락을 구분하는 데 테이블과 볼드체, 이탤릭체를 사용하여 내용을 더 가독성 있게 만들어봅시다.
사전 요구 사항
이 튜토리얼을 진행하기 전에, pandas가 있는 최신 버전이 새로운 가상 환경 내에서 사용 가능한지 확인하세요.
이 튜토리얼에서는 다음과 같이 세 가지 데이터 세트에 초점을 맞출 것입니다.
- 미국 의회 데이터 세트는 의회의 역사적 회원에 대한 공개 정보를 포함하고 있으며,
.groupby()
의 몇 가지 핵심 기능을 설명합니다. - 대기 질 데이터 세트는 주기적인 가스 센서의 측정값을 포함하고 있습니다. 이를 통해 부동 소수점 및 시계열 데이터 작업을 수행할 수 있습니다.
- 뉴스 어그리게이터 데이터 세트는 수십만 개의 뉴스 기사에 대한 메타데이터를 보유하고 있습니다. 이 튜토리얼에서는 문자열 작업 및
.groupby()
를 사용한 텍스트 전처리 작업을 다룰 예정입니다.
튜토리얼에서 사용되는 모든 예제의 소스 코드는 아래 링크를 통해 다운로드할 수 있습니다.
.zip
파일을 다운로드한 후 파일을 ‘datasets’라는 이름의 폴더에 푸십시오.
예제 1: 미국 의회 데이터 세트
- pandas GroupBy의 Hello, World!
- pandas GroupBy vs SQL
- pandas GroupBy 작동 방식
예제 2: 대기 질 데이터 세트
- 파생 배열에 대한 그룹화
- 리샘플링
예제 3: 뉴스 어그리게이터 데이터 세트
- .groupby()에서 람다 함수 사용
- .groupby()의 성능 향상
pandas GroupBy: 모두 한데 모으기
결론
이 튜토리얼에서는 .groupby()
작업을 시작부터 끝까지 상세하게 분석하고 시각화하는 방법을 다룹니다. 이번 튜토리얼은 pandas의 공식 문서와 pandas Cookbook을 보완하는 내용으로 실제 데이터 세트를 사용한 세 가지 더 복잡한 예시에 초점을 맞출 것입니다.
이 튜토리얼의 모든 예제에 대한 소스 코드를 다운로드하려면 아래 링크를 클릭하세요.
- 시작하기
- Python 배우기
[Python 튜토리얼 → 심화된 기사와 비디오 과정](/search?kind=article&kind=course&order=newest) 학습 경로 → 가속화된 학습을 위한 안내된 공부 계획 퀴즈 → 학습 진행 상태 확인 주제 탐색 → 특정 분야 또는 기술 레벨에 초점 커뮤니티 채팅 → 다른 Python 개발자와 함께 학습 회사 소개 → Python 전문가와의 실시간 Q&A 팟캐스트 → Python의 새로운 소식 듣기 책 → 지식을 더 풍부하게 해주며 오프라인에서 배울 수 있음 모든 내용 잠금 해제 →
더 많은 내용
Learner Stories Python 뉴스레터 Python Job Board 팀 만나기 튜토리얼 작성자가 되기 [비디오 강의자가 되기](/become-an- instructor/)
— FREE Email Series —
🐍 Python 트릭 💌
Python 트릭 받기 »
🔒 스팸은 없습니다. 언제든지 언구하십시오.
햇 브래드 솔로몬에의한
무료 이메일 시리즈
🐍 Python 트릭 💌
Python 트릭 다운로드 »
🔒 악성 코드 없음. 언제든지 구독 해지 가능.
[공유](https://twitter.com/intent/tweet/?text=@realpython가 전달하는 이 %23Python groupby/를 참조하세요.)
groupby/) [이메일](mailto:?subject=Python article for you&body=이 Python groupby/)
![Pandas GroupBy: Your Guide to Grouping Data in Pandas_Watermarked.d79eb1266abf.jpg)
pandas GroupBy: Python에서 데이터 그룹화하기
Brad Solomon의 data-science intermediate에 의해 작성됨
[광고 삭제](/account/join/)
pandas를 시작으로 한 기본 기능을 마스터하려는 경우 또는 .groupby()
에 대한 이해도를 채우고자하는 경우, 이 튜토리얼은 시작부터 끝까지 pandas GroupBy 작업을 분해하고 시각화하는 데 도움이 될 것입니다.
이 튜토리얼은 공식 pandas 문서와 pandas Cookbook와 함께 사용되어 응용 가능한 단위별 예시를 볼 수 있습니다. 그러나 본 튜토리얼에서는 세 가지 실제 데이터 세트를 사용하는 더 복잡한 단계별 연습에 초점을 맞춥니다.
이 튜토리얼에서는 다음과 같은 내용을 다룰 것입니다:
- 실제 데이터를 사용한 pandas GroupBy 작업 방법
- 분할-적용-결합 연쇄 작업이 작동하는 방식
- 분할-적용-결합 연쇄를 단계별로 분해하는 방법
- pandas GroupBy 개체의 메소드를 의도와 결과에 따라 분류하는 방법
이 튜토리얼의 모든 예제에 대한 소스 코드는 아래 링크를 클릭하여 다운로드할 수 있습니다.
[광고 삭제](/account/join/)