파이썬/데이터 시각화

데이터시각화 라이브러리1 카운트플롯 matplotlib/seaborn/plt/barchart

공부짱짱열심히하기 2022. 11. 28. 12:20

데이터 시각화

 

많은 데이터를 보기쉽게 시각화 하여 빅데이터를 처리하기 용이하게 해주는 과정

 

대표적인 데이터 시각화로

 


Plot

 파이썬에 내장된 가장 기본적인 데이터 시각화 방법

import matplotlib.pyplot as plt

 

x가 0~9까지 숫자라고 하고

y와 x가 같다고 했을때

 
plt.plot(x,y)
 
[<matplotlib.lines.Line2D at 0x13a119a2a60>]
 
 

 

plt.show()

위에 더러운거 없이 깨끗함

 

 

plt.savefig('test.jpg')

사진저장 실행중인 주피터노트북 위치에 저장


막대차트

데이터프레임, csv 에서 특정 컬럼이 카테고리컬 데이터일때

각 value 별로 몇개씩이 있는지를 차트로 표현이 가능하다

 

seaboen 라이브러리 사용후 카운트플로 함수를 사용
sb.countplot(data = '데이터프레임' , x='특정칼럼', color=, order= '순서')

여러 파라미터가 있으며 활용이 가능

 

데이터에서
 

generation_id 컬럼이 카테고리 컬럼인데

여기서 각 id별로 몇개가 있는지 bar chart로 표현하기

 
이렇게 표현가능
2)색 바꾸기
sb.color_palette()

기본 색깔

여기서 나온 색들을 index로 위치를 표시한후 color로 지정해주면됨

 

 

3)정렬하기

 

 

 


 

데이터가 많아서 안보일때

 

plt.xticks(rotation = n)

x축을 조절 하는 함수

 

 

데이터시각화
많은 데이터를 보기쉽게 시각화 하여 빅데이터를 처리하기 용이하게 해주는 과정

1.plot

import matplotlib.pyplot as plt

plt.savefig('test.jpg')
사진저장 실행중인 주피터노트북 위치에 저장

plt.show()
위에 더러운거 없이 깨끗함


2.카운트플로

sb.countplot(data = '데이터프레임' , x='특정칼럼', color=, order= '순서')

 1)차트만들기
sb.countplot(data = '데이터프레임' , x='특정칼럼', color=, order= '순서')

2)색바꾸기

sb.color_palette()

3)정렬

데이터를 정렬후 order에 표현

x축 조절
plt.xticks(rotation = n)