Python/Pandas

[Python] Pandas : DataFrame 병합할 때 사용하는 함수

다애루 2021. 4. 18. 16:37

Pandas 라이브러리의 다양한 내장함수 중

DataFrame을 병합할 때 사용하는 함수에 대해 알아보자!

 


1. concat

물리적으로 이어주는 함수

axis=0 : 0이 기본 값

 

1 ) 다중 인덱싱 : keys 속성 이용

 

2 ) 인덱스 확인 : index 함수 사용

 

3 ) join 속성 사용

 

outer : 합집합, default값(기본값)

inner : 교집합, 합치는 데이터들이 동일하게 가지고 있는 기준(인덱스)만 출력

공통적으로 가지고 있는 데이터만 출력

pd.concat([df1, df4], axis=1, join='outer')

pd.concat([df1, df4], axis=1, join='inner')

 

4 ) ignore_index

ingnore_index : 기존 인덱스를 무시하고 새로운 인덱스 부여

ingnore_index=False(기본값, default값)

ingnore_index=True -> 새로운 인덱스 부여

pd.concat([df1, df4], ignore_index=True)

 


2. merge

공통된 데이터를 기준으로 데이터를 합침

속성 'how' : 병합의 방법을 지칭

concat의 join과 동일한 기능

 

1 ) outer : 전체 값 출력

df_merge = pd.merge(df5, df6, how='outer')

 

2 ) inner : 공통된 데이터의 값만 출력, 기본값

 

3 ) left : 먼저 적은 데이터(의 컬럼)를 기준으로 값 출력

 

4 ) right : 나중에 적은 데이터(의 컬럼)를 기준으로 값 출력

 

5 ) 공통된 컬럼을 기준으로 merge

컬럼이 같은 데이터가 여러 개일 때 경우의 수를 모두 따진다.

 

 

 


 

프로그래밍 공부를 위해 여러 자료들을 토대로 작성한 기록입니다.

개인 공부에만 사용해주시고, 상업적인 활용과 재배포를 금지합니다.