파이썬/데이터분석

pandas pivot_table

공부짱짱열심히하기 2022. 11. 30. 16:21

피벗테이블

 

컬럼값을 인덱스로 만들고, 인덱스를 중복제거하여 유니크하게 만드는 방법

 

pd.pivot_table(데이터프레임, index = ['컬럼명']

이러한 데이터 프레임이 있다면 여기서 Name 컬럼에 중복되는 데이터가 많다 이러한 경우 피벗테이블을 이용해 쉽게 유니크 시킬수 있음

 

이런식으로 중복되는 컬럼은 인덱스로 옮기며 하나로 합쳐지고

그외 숫자 데이터도 합쳐지는걸 볼수있다.

이때, 기본 디폴트는 숫자데이터의 평균

당연히 문자데이터로된 여러 컬럼을 인덱스로 만들수 있음

 

 

 파라미터
 aggfunc= np.sum

파라미터 aggfunc은 데이터 처리를 표현해줌

이젠 합으로 표현
aggfunc 안에 리스트화 시켜서 넣으면 당연히 두개 연산도 가능

 

 

 

파라미터
values = ['컬럼명']

원하는 데이터만 피벗테이블화 시킬수 있음

 

쓸모없는 Account같은 컬럼은 빼버리기

 

 

 

 

피벗테이블

함수)
pd.pivot_table(데이터프레임, index = ['컬럼명'])

  파라미터
   aggfunc= 식
      숫자데이터 계산
   values = ['컬럼명']
       가저올 숫자데이터      

이때 만들어진 디폴트 데이터는 합친 숫자데이터의 평균