라이브러리 33

파이썬 라이브러리13 pandas 2차원: DataFrame만들기/ pd.read_csv 불러오기 / csv 불러오기중 주의사항

DataFrame 판다스 2차원 데이터 처리는 데이터 프레임으로 처리한다. pd.DataFrame(data= 데이터들어있는 변수) 파라미터 안에 데이터가 저장된 변수를 넣으면 import pandas as pd # We create a dictionary of Pandas Series items = {'Bob' : pd.Series(data = [245, 25, 55], index = ['bike', 'pants', 'watch']), 'Alice' : pd.Series(data = [40, 110, 500, 45], index = ['book', 'glasses', 'bike', 'pants' 여기서 맨왼쪽은 인덱스 맨위쪽은 컬럼 데이터는 value를 의미 type을 알고싶을땐 . info를 사용한다 ..

파이썬 라이브러리12 pandas 1차원 : pandas Seires/액세스/연산

기본 Allows the use of labels for rows and columns 기본적인 통계데이터 제공 NaN values 를 알아서 처리함. 숫자 문자열을 알아서 로드함. 데이터셋들을 merge 할 수 있음. It integrates with NumPy and Matplotlib import pandas as pd 판다스를 import 하고 앞으로 모든 판다스 함수는 pd로 표현 pandas 데이터 판다스의 1차원 데이터를 의미 pd.Series(data = 변수 ) Seires에서 사용하는 data란 파라미터를 의미하며 이 Seires 함수 안에서 사용 ※변수를 의미는것이 아님 판다스에서 인덱스란 행 제일 왼쪽에 붙는 글자로 데이터 관리를 쉽게 볼 수있게 해줌 ※일반적으로 사용했던 컴퓨터가 ..

파이썬(라이브러리11) 넘파이 boolean/연산/브로드캐스트

boolean 1)기본 X > 70 array([[False, False, False, False, True], [ True, False, False, False, False], [False, False, False, False, False], [False, False, False, True, True]]) 이런식으로 False 와 True로 인식 2) 갯수 세기 True와 False 는 1과 0으로 컴퓨터는 인식하므로 (X >70).sum() 4 이렇게 트루인 데이터를 더하므로써 갯수를 셀수 있게 되는것 3)그 데이터만 추출 액세스를 위해 [ ] 대괄호를 통해 X[ X> 70 ] array([80, 91, 87, 84]) 두개의 데이터를 비교 억세스 1)두가지의 조건모두 충족 & 2)두자기중 한가지만 ..

파이썬(라이브러리10) 넘파이 인덱스: 데이터 액세스/copy

액새스 일차원에선 리스트랑 똑같이 작동 다차원에선 넘파이변수[ 행 , 열 ] X[1,2] 58 슬라이싱 역시나 1차원에선 리스트와 똑같이 동작 2차원에선 연속된 수 가저올때 넘파이변수[ 행 , 열 ] x[ 0 : 2+1 , 0 : 1+1 ] 행(0,1,2) 열(0,1) 연속되지 않는 열을 가저올때 넘파이변수[ [가저올부분] , [가저올부분] ] X[[0,2] , 2 : -1+1 ] array([[49, 42, 80], [16, 37, 66]]) 슬라이싱 주의 사항 / 카피 슬라이싱 한 부분을 변수로 저장하여 데이터 변경을하면 기존에 슬라이싱하려고 가져왔던 데이터 내용도 바뀌게 된다. 이때 데이터 활용을 하고 싶으면 변수 = 슬라이싱.copy() 액세스 넘파이변수[ 행 , 열 ] 슬라이싱 넘파이변수[ 행 ..

파이썬(라이브러리9) 넘파이 응용2: 함수 모음 (max,min,sum,median ,unique)

데이터 분석 함수 넘파이로 만든 데이터를 변수에 넣은후 손쉽게 데이터 분석하는 함수 1)데이터분석 함수 np.random.randint(1,100,(4,5)) array([[97, 24, 25, 54, 55], [64, 51, 94, 73, 70], [67, 34, 54, 94, 56], [45, 61, 86, 79, 30]]) 이데이터를 X에 넣은후 함수)최대값 X.max() 91 함수)최소값 X.min() 2 함수)합계 X.sum() 924 X.mean() 46.2 함수)표준편차 X.std() 26.173650872585583 함수)중앙값 np.median(X) 43.0 이때 변수에다가 직접할경우 2차원이기때문에 중앙값을 인식을 못해서 함수에다가 직접 해야한다. 2) 행별로 열별로 데이터 행 .mea..

파이썬(라이브러리8) 넘파이 응용: np.randint/ random.seed

랜덤값으로 배열 채우기 1)실수 함수) np.random.random( shape) 이 shape에 1차원 혹은 2차원의 값을 넣어주면 된다 1차원 np.random.random(3) array([0.96395608, 0.09766085, 0.68840949]) 2차원 np.random.random( (3,4) ) array([[0.26737553, 0.5201271 , 0.2904214 , 0.56670374], [0.55558152, 0.63535376, 0.27001881, 0.73592874], [0.40348166, 0.98328218, 0.55856758, 0.45135355]]) 2)randint 활용/ 정수 함수) np.random.randint(시작범위, 끝범위,shpae) np.rand..

PYTHON PROGRAMMING(라이브러리7) 넘파이 행렬

0,1로 이루어진 행렬 만들기 1)숫자 0으로 이루어진 1차원 배열, 2차원 행렬 만들기 함수)1차원 배열 np.zeros(데이터갯수) 함수)2차원 행렬 np.zeros( (행,렬) ) 2)숫자 1로 이루어진 행렬 만들기 함수)1차원 np.ones(갯수) 함수)2차원 np.ones( (행,렬) ) 3)특정 숫자로 이루어진 1,2차원 함수) np.full( 데이터shape , 들어갈 숫자) 정수와 실수의 배열 1)정수의 연속된 배열 n ~ xn 식의 어떤 숫자로 부터 어떤 숫자까지 배열을 표시하고 싶다면 함수) range(데이터 갯수) 함수) np.arrange( start , stop , step) 2)실수 함수) np.linspace(시작 , 끝 , n개의 점) 이 함수는 시작수와 끝수 사이에 균일한 ..

PYTHON PROGRAMMING(라이브러리6) 넘파이 개념

NUMPY BASICS(넘파이) NumPy는 다차원 배열을 처리할 수 있는 선형대수학(Linear Algebra) 라이브러리입니다. 다음이 실행이 안되면 아나콘다프롬프트에서 conda install numpy 를 실행하여 설치합니다. 넘파이 라이브러리란: 데이터를 효율적으로 저장할 수 있는 데이터스트럭쳐를 의미하며 쉽게 데이터의 활용이 가능해진다 import numpy import numpy as np 이걸 사용하는건 넘파이 함수를 쓸때 numpy.~~ 가 너무 길어 서 np로 줄여쓸수 있음 넘파이로 1차원 데이터 만들기 일차원의 배열은 백터라 부르고 변수로 사용시 소문자로 표현을 한다 함수) np.array(리스트) 활용) .mean() → 평균 .std() → 표준편차 .sum() → 합계 .min(..

PYTHON PROGRAMMING(라이브러리5) 시간계산

문자열을 날짜로 바꾸기 텍스트파일에 2019.07.23 이라든가, 2019-07-23 등 문자열로 들어있는 날짜를, 무슨요일인지 등 파악할 수 있도록 하자 아래 import 가 안되면, pip install pyton-dateutil 실행 문자열 자체를. 파이썬이 처리하는 날짜 형식으로 변환하는 방법 from dateutil .parser import parse date_str은 날짜 데이터가 아니고 그냥 cpu입장에선 'str'이라는것. 그러기에 weekday를 사용할수없다 함수) parse(변수) 특정일로부터 원하는 날짜 계산하기 from dateutil.relativedelta import relativedelta 1)현재로부터 n일후 함수) today + relativedelta(days= +n)..

PYTHON PROGRAMMING(라이브러리4) 시간과 일시

시간 from datetime import time 시간(시 분 초) 를 그대로 데이터화 시켜서 저장할수있음 1.시각 1)시간 데이터 time(시 ,분, 초) 를입력할시 저장되는 데이터의 형태는 datetime.time(시분초) 2)시간데이터 함수 시간의 데이터를 변수로 저장한후 시간,분,초만 따로 확인 가능하다 변수.hour 변수.minute 변수.second 당연히 똑같이 표현 가능 일시다루기 from datetime import datetime 시간과 날짜를 전부 다룰수 있는 라이브러리 1)기본형 datetime(년 , 월, 일, 시, 분, 초) 로 표현 2)현재 시간을 가져올땐 datetime.today() 시각 다루기 import time 1)utc 현재시각 time.gmtime() 2)loca..