콘텐츠로 건너뛰기

판다스(pandas)를 사용하여 두 데이터프레임(DataFrames)을 결합(join)하는 방법

[

pandas merge(): 두 개의 DataFrame을 결합하기

판다스(pandas)의 merge() 함수는 두 개의 DataFrame을 결합하는 데 사용됩니다. 이 함수를 사용하면 공통된 열 또는 인덱스를 기준으로 데이터를 결합할 수 있습니다. 아래에서는 merge() 함수의 사용 방법과 예제를 살펴보겠습니다.

merge() 함수 사용 방법

merge() 함수는 다음과 같은 형태로 사용됩니다:

df_merged = pd.merge(left, right, on='key')

여기서 leftright는 결합할 두 개의 DataFrame 객체이고, on은 공통 열을 지정합니다.

예제

두 개의 DataFrame을 결합하는 예제를 살펴보겠습니다:

import pandas as pd
# 첫 번째 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value1': [1, 2, 3, 4]})
# 두 번째 DataFrame
df2 = pd.DataFrame({'key': ['B', 'D', 'E', 'F'],
'value2': [5, 6, 7, 8]})
# 두 DataFrame을 결합
df_merged = pd.merge(df1, df2, on='key')
# 결과 출력
print(df_merged)

이 예제에서는 첫 번째 DataFrame인 df1과 두 번째 DataFrame인 df2key 열을 기준으로 결합합니다. 결합된 DataFrame df_merged를 출력하면 다음과 같은 결과를 얻을 수 있습니다:

key value1 value2
0 B 2 5
1 D 4 6

결과에서 볼 수 있듯이, key 열이 ‘B’와 ‘D’인 행만 남게 됩니다.

이와 같이, merge() 함수를 사용하면 두 개의 DataFrame을 공통된 열 또는 인덱스를 기준으로 쉽게 결합할 수 있습니다. 이를 통해 데이터를 조합하여 보다 효과적으로 분석할 수 있습니다.