Pandas DataFrame에서 특정 행/열을 선택하는 방법은 여러가지가 있다.
iloc indexer, loc indexer 두 가지 함수를 사용하는 방법으로 나눠진다.
Indexer는 행과 열을 한번에 인덱싱하거나 슬라이싱 해주는 함수를 말한다.
loc 인덱서는 실제 인덱스를 사용해서 데이터를 가지고 올 때 사용한다.
즉, label or 조건 표현으로 선택하는 방법이다.
iloc 인덱서는 numpy의 array방식으로 행을 가지고 올 때 사용하는데,
간단하게 말해서 행 번호로 선택하는 방법이다.
이번 글에서는 loc 함수에 대해 알아보자!
. l o c ( )
index label과 index를 사용해서 인덱싱
ex ) 행과 열의 label을 사용해서 인덱싱하는 경우
* 행 넘버와 다르게 마지막 값까지 포함된다.
ex ) 열의 label을 사용해서 인덱싱하는 경우
ex ) loc 와 sum 함수를 함께 사용해서 '합계' 컬럼 추가
data['합계'] = data.loc[:,:'4반'].sum(axis=1)
데이터는 Series or DataFrame 의 형식으로 출력되는데
이 부분은 추후 더 공부해서 포스팅해보도록 하겠다!
프로그래밍 공부를 위해 여러 자료들을 토대로 작성한 기록입니다.
개인 공부에만 사용해주시고, 상업적인 활용과 재배포를 금지합니다.
'Python > Pandas' 카테고리의 다른 글
[Python] Pandas : DataFrame (iloc 인덱서) (0) | 2021.04.19 |
---|---|
[Python] Pandas : DataFrame 병합할 때 사용하는 함수 (0) | 2021.04.18 |
[Python] Pandas : csv 파일 불러오기 (0) | 2021.04.17 |
[Python] Pandas : 통계 관련 함수 (0) | 2021.04.16 |
[Python] pandas 라이브러리 그게 뭔데? (0) | 2021.04.15 |