어떠한 결과를 도출해내기 위한 머신러닝을 위해
도출해내려는 값y
학습시킬 데이터를 x로 표현하는데
머신러닝을 돌렸을때 학습용만 데이터가 있다면 나중에 결과값이 정확하지 않는경우가 있음
그래서 테스트용과 트레이닝용으로 값을 나눠준다
from sklearn.model_selection import train_test_split
머신러닝을 위해 준비한 데이터는 x값이든 y값이든 트레이닝용 데이터와 테스트용 데이터 준비
train_test_split(X,y, test_size = 0.n , random_state=n)
테스트 사이즈는 0.n => 준비된 데이터의 n%
랜덤 스테이트 n은 random으로 돌릴값 sedd라고 생각
각각 순서대로 첫번째 array는 x데이터 학습
두번째는 x데이터 테스트용
3번째는 y데이터 학습
4번재는 y데이터 테스트
from sklearn.model_selection import train_test_split train_test_split(X,y, test_size = 0.n , random_state=n) |
'인공지능 > 머신러닝' 카테고리의 다른 글
[머신러닝2] 범주형 변수예측: Logistic Regression (0) | 2022.12.02 |
---|---|
[머신러닝1] 수치예측: regression (0) | 2022.12.01 |
[머신러닝0] 머신러닝의 기초(총정리) (0) | 2022.12.01 |
문자 수치화,데이터분리: OneHotEncoder (0) | 2022.12.01 |
문자의 수치화,데이터분리 : LableEncoder (0) | 2022.12.01 |