기본
- Allows the use of labels for rows and columns
- 기본적인 통계데이터 제공
- NaN values 를 알아서 처리함.
- 숫자 문자열을 알아서 로드함.
- 데이터셋들을 merge 할 수 있음.
- It integrates with NumPy and Matplotlib
import pandas as pd
판다스를 import 하고 앞으로 모든 판다스 함수는 pd로 표현
pandas 데이터
판다스의 1차원 데이터를 의미
pd.Series(data = 변수 )
Seires에서 사용하는 data란 파라미터를 의미하며 이 Seires 함수 안에서 사용
※변수를 의미는것이 아님
판다스에서 인덱스란
행 제일 왼쪽에 붙는 글자로 데이터 관리를 쉽게 볼 수있게 해줌
※일반적으로 사용했던 컴퓨터가 매기는 0부터 시작하는 숫자가 아님
판다스에서 value란
데이터 값을 의미
groceries = pd.Series(data = data , index = index )
groceries
Out
eggs 30
apples 6
milk Yes
bread No
dtype: object
index data
groceries.index
out
Index(['eggs', 'apples', 'milk', 'bread'], dtype='object')
그외 함수
.shape shape확인
.ndim 차원확인
.size 데이터 갯수확인
액세스
일차원 리스트와 똑같이 인덱스로 액세스 가능하고
또 인덱스의 문자열을 통해서도 값을 알수 있다
groceries[0]
groceries['apples']
이런식
여러 데이터를 얻을때는
groceries[['eggs','bread']]
eggs 30
bread No
dtype: object
이렇게 리스트로 묶어서도 할수있다
슬라이싱에선 출발 부분부터 끝 부분까지 데이터 추출 가능
groceries[ 1: ]
Out
apples 6
milk Yes
bread No
dtype: object
연산
당연히 연산도 넘파이처럼 가능
fruits = fruits +5
'파이썬 > 라이브러리' 카테고리의 다른 글
파이썬 라이브러리14 pandas 데이터프레임: 2차원 데이터 액세스 .loc[,] /.lioc[,] /액세스를 통한 데이터 추가 (0) | 2022.11.24 |
---|---|
파이썬 라이브러리13 pandas 2차원: DataFrame만들기/ pd.read_csv 불러오기 / csv 불러오기중 주의사항 (0) | 2022.11.24 |
파이썬(라이브러리11) 넘파이 boolean/연산/브로드캐스트 (0) | 2022.11.23 |
파이썬(라이브러리10) 넘파이 인덱스: 데이터 액세스/copy (0) | 2022.11.23 |
파이썬(라이브러리9) 넘파이 응용2: 함수 모음 (max,min,sum,median ,unique) (0) | 2022.11.23 |