Pandas 라이브러리의 다양한 내장함수 중
DataFrame을 병합할 때 사용하는 함수에 대해 알아보자!
1. concat
물리적으로 이어주는 함수
axis=0 : 0이 기본 값
1 ) 다중 인덱싱 : keys 속성 이용
2 ) 인덱스 확인 : index 함수 사용
3 ) join 속성 사용
outer : 합집합, default값(기본값)
inner : 교집합, 합치는 데이터들이 동일하게 가지고 있는 기준(인덱스)만 출력
공통적으로 가지고 있는 데이터만 출력
pd.concat([df1, df4], axis=1, join='outer')
pd.concat([df1, df4], axis=1, join='inner')
4 ) ignore_index
ingnore_index : 기존 인덱스를 무시하고 새로운 인덱스 부여
ingnore_index=False(기본값, default값)
ingnore_index=True -> 새로운 인덱스 부여
pd.concat([df1, df4], ignore_index=True)
2. merge
공통된 데이터를 기준으로 데이터를 합침
속성 'how' : 병합의 방법을 지칭
concat의 join과 동일한 기능
1 ) outer : 전체 값 출력
df_merge = pd.merge(df5, df6, how='outer')
2 ) inner : 공통된 데이터의 값만 출력, 기본값
3 ) left : 먼저 적은 데이터(의 컬럼)를 기준으로 값 출력
4 ) right : 나중에 적은 데이터(의 컬럼)를 기준으로 값 출력
5 ) 공통된 컬럼을 기준으로 merge
컬럼이 같은 데이터가 여러 개일 때 경우의 수를 모두 따진다.
프로그래밍 공부를 위해 여러 자료들을 토대로 작성한 기록입니다.
개인 공부에만 사용해주시고, 상업적인 활용과 재배포를 금지합니다.
'Python > Pandas' 카테고리의 다른 글
[Python] Pandas : DataFrame (loc 인덱서) (0) | 2021.04.19 |
---|---|
[Python] Pandas : DataFrame (iloc 인덱서) (0) | 2021.04.19 |
[Python] Pandas : csv 파일 불러오기 (0) | 2021.04.17 |
[Python] Pandas : 통계 관련 함수 (0) | 2021.04.16 |
[Python] pandas 라이브러리 그게 뭔데? (0) | 2021.04.15 |