파이썬/라이브러리

파이썬 라이브러리12 pandas 1차원 : pandas Seires/액세스/연산

공부짱짱열심히하기 2022. 11. 24. 09:06

기본

  • Allows the use of labels for rows and columns
  • 기본적인 통계데이터 제공
  • NaN values 를 알아서 처리함.
  • 숫자 문자열을 알아서 로드함.
  • 데이터셋들을 merge 할 수 있음.
  • It integrates with NumPy and Matplotlib

import pandas as pd

 

판다스를 import 하고 앞으로 모든 판다스 함수는 pd로 표현

 


pandas 데이터

판다스의 1차원 데이터를 의미

pd.Series(data = 변수 )

Seires에서 사용하는 data란 파라미터를 의미하며 이 Seires 함수 안에서 사용

※변수를 의미는것이 아님

 

판다스에서 인덱스란

행 제일 왼쪽에 붙는 글자로 데이터 관리를 쉽게 볼 수있게 해줌

 

 ※일반적으로 사용했던 컴퓨터가 매기는 0부터 시작하는 숫자가 아님

 

판다스에서 value란

데이터 값을 의미

이런 변수가 존재할때

 

 
groceries = pd.Series(data = data , index = index )
 
 
 
groceries
Out
eggs       30
apples      6
milk      Yes
bread      No
dtype: object
   index          data
 
groceries.index

out

Index(['eggs', 'apples', 'milk', 'bread'], dtype='object')

 

 

그외 함수

.shape   shape확인
.ndim    차원확인
.size    데이터 갯수확인

 


액세스

일차원 리스트와 똑같이 인덱스로 액세스 가능하고

또 인덱스의 문자열을 통해서도 값을 알수 있다

 

groceries[0]

groceries['apples']
 
이런식
 
여러 데이터를 얻을때는 
 
groceries[['eggs','bread']]
eggs     30
bread    No
dtype: object

이렇게 리스트로 묶어서도 할수있다

 

슬라이싱에선 출발 부분부터 끝 부분까지 데이터 추출 가능

 
 
groceries[ 1: ]
Out
apples      6
milk      Yes
bread      No
dtype: object

 


연산

당연히 연산도 넘파이처럼 가능

fruits = fruits +5