[Python] Pandas : DataFrame 병합할 때 사용하는 함수

Python/Pandas

[Python] Pandas : DataFrame 병합할 때 사용하는 함수

다애루 2021. 4. 18. 16:37

Pandas 라이브러리의 다양한 내장함수 중

DataFrame을 병합할 때 사용하는 함수에 대해 알아보자!

1. concat

물리적으로 이어주는 함수

axis=0 : 0이 기본 값

1 ) 다중 인덱싱 : keys 속성 이용

2 ) 인덱스 확인 : index 함수 사용

3 ) join 속성 사용

outer : 합집합, default값(기본값)

inner : 교집합, 합치는 데이터들이 동일하게 가지고 있는 기준(인덱스)만 출력

공통적으로 가지고 있는 데이터만 출력

pd.concat([df1, df4], axis=1, join='outer')

pd.concat([df1, df4], axis=1, join='inner')

4 ) ignore_index

ingnore_index : 기존 인덱스를 무시하고 새로운 인덱스 부여

ingnore_index=False(기본값, default값)

ingnore_index=True -> 새로운 인덱스 부여

pd.concat([df1, df4], ignore_index=True)

2. merge

공통된 데이터를 기준으로 데이터를 합침

속성 'how' : 병합의 방법을 지칭

concat의 join과 동일한 기능

1 ) outer : 전체 값 출력

df_merge = pd.merge(df5, df6, how='outer')

2 ) inner : 공통된 데이터의 값만 출력, 기본값

3 ) left : 먼저 적은 데이터(의 컬럼)를 기준으로 값 출력

4 ) right : 나중에 적은 데이터(의 컬럼)를 기준으로 값 출력

5 ) 공통된 컬럼을 기준으로 merge

컬럼이 같은 데이터가 여러 개일 때 경우의 수를 모두 따진다.

프로그래밍 공부를 위해 여러 자료들을 토대로 작성한 기록입니다.

개인 공부에만 사용해주시고, 상업적인 활용과 재배포를 금지합니다.

저작자표시 비영리 변경금지 (새창열림)

'Python > Pandas' 카테고리의 다른 글

[Python] Pandas : DataFrame (loc 인덱서) (0)	2021.04.19
[Python] Pandas : DataFrame (iloc 인덱서) (0)	2021.04.19
[Python] Pandas : csv 파일 불러오기 (0)	2021.04.17
[Python] Pandas : 통계 관련 함수 (0)	2021.04.16
[Python] pandas 라이브러리 그게 뭔데? (0)	2021.04.15

현재글[Python] Pandas : DataFrame 병합할 때 사용하는 함수

코린이에서 시작해 개발자가 된 후 이어가는 기록

개발자, 넘파이, indexing, 안드로이드, 프로그래밍, 앱개발, 자바, iloc, pandas, 코딩, python, 판다스, 전자정부프레임워크, smhrd, 스프링프레임워크, 안드로이드스튜디오, 머신러닝, 파이썬, 인덱싱, 라이브러리,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

개발하고 기록하기