파이썬/데이터분석

[numpy, pandas] time Seires: datetime64 / pd.to_datetime / pd.date_range()

공부짱짱열심히하기 2022. 11. 30. 16:22

[numpy] datetime64

기존의 파이썬 datetime 을 보강하기 위해, date 의 array 도 처리할 수 있게 numpy 에서 64-bit 로 처리하도록 라이브러리를 강화한 형태

 

np.array('날짜', dtype = np.datetime64)

 

기존 데이터의 dtype은 <u10
dtype이 변한걸 볼수있다

 

이렇게 datetiem64를 활용할경우 연산이 훨씬 편해진다

이런식으로 현재 시간에 숫자를 통해 몇일인지 표현가능하며

당연히 넘파이 함수이기 때문에 arange와 연산도 가능하다

 

 


판다스 to_datetime

 

문자열로 되어있는 날짜의 리스트를 한번에 파이썬의 날짜형식으로 변환하는 함수

pd.to_datetime(date_list)

 

그냥 눈으로 봤을때는 날짜 형식이지만 실제로는 문자열로 되어있는 데이터를 쉽게 날짜로 바꿔버림

날짜데이터로 이루어진 시리즈, dtype은 오브젝트로 되어있음
datetime64로 되어이있는 dtype

전체 데이터를 날짜로 바꿨기 때문에 모든 데이터를 쉽게 가공할수있음


[pandas] date_range

 

시작날짜와 종료날짜를 세팅하면 날짜를 알아서 채워주는 함수

날짜계의 arange같은 함수

pd.date_range('시작날짜' , '종료날짜')

파라미터
freq

Frequencies를 통해서 데이터 활용이 가능하다

 

 

CodeDescriptionCodeDescription

D Calendar day B Business day
W Weekly    
M Month end BM Business month end
Q Quarter end BQ Business quarter end
A Year end BA Business year end
H Hours BH Business hours
T Minutes    
S Seconds    
L Milliseonds    
U Microseconds    
N nanoseconds    

 

 

1.넘파이 데이트64

np.array('날짜', dtype = np.datetime64)

2. 판다스 데이트타임

pd.to_datetime(date_list)

3.판다스 데이트레인지
 
pd.date_range('시작날짜' , '종료날짜')


freq 파라미터 활용