Python/Pandas

[Python] Pandas : DataFrame (loc 인덱서)

다애루 2021. 4. 19. 10:46

 

Pandas DataFrame에서 특정 행/열을 선택하는 방법은 여러가지가 있다.

iloc  indexer, loc indexer  두 가지 함수를 사용하는 방법으로 나눠진다.

 

Indexer는 행과 열을 한번에 인덱싱하거나 슬라이싱 해주는 함수를 말한다.

loc 인덱서는 실제 인덱스를 사용해서 데이터를 가지고 올 때 사용한다.

즉, label or 조건 표현으로 선택하는 방법이다.

iloc 인덱서는 numpy의 array방식으로 행을 가지고 올 때 사용하는데,

간단하게 말해서 행 번호로 선택하는 방법이다.

 

이번 글에서는 loc 함수에 대해 알아보자!


. l o c ( ) 

index label과 index를 사용해서 인덱싱

 


ex ) 행과 열의 label을 사용해서 인덱싱하는 경우

* 행 넘버와 다르게 마지막 값까지 포함된다.

 


ex ) 열의 label을 사용해서 인덱싱하는 경우

 


ex ) loc 와 sum 함수를 함께 사용해서 '합계' 컬럼 추가

 

data['합계'] = data.loc[:,:'4반'].sum(axis=1)

 

 

데이터는 Series or DataFrame 의 형식으로 출력되는데

이 부분은 추후 더 공부해서 포스팅해보도록 하겠다!

 

 


 

프로그래밍 공부를 위해 여러 자료들을 토대로 작성한 기록입니다.

개인 공부에만 사용해주시고, 상업적인 활용과 재배포를 금지합니다.