머신러닝을 통한 학습으로 새로운데이터를 얻으려고 할때
기존데이터를 방정식에 대입하기 위해서는 모든데이터가 숫자로 되어 이썽야한다.
문자열 데이터는 숫자로 바궈줘야 하는데 그때 사용하는것이 LableEncoder
from sklearn.preprocessing import LabelEncoder
sklearn은 아나콘다에 기본으로 설치가 되어있음
이렇게 카테고리컬 데이터가 3개일경우
'France' => 0
'Germany' => 1
'Spain' => 2
정렬해서, 순서대로, 0부터 시작하는 숫자로 바꿔준다 => Label Encoding
fit_transform(바꿔줄 컬럼 )
레이블인코더를 변수에 넣어주고 이때 fit_transform(바꿔줄 컬럼 ) 통해 레이블링을 해줌
from sklearn.preprocessing import LabelEncoder 변수명 = LabelEncoder() 인코더변수.fit_transform(바꿔줄 컬럼 ) |
'인공지능 > 머신러닝' 카테고리의 다른 글
[머신러닝2] 범주형 변수예측: Logistic Regression (0) | 2022.12.02 |
---|---|
[머신러닝1] 수치예측: regression (0) | 2022.12.01 |
[머신러닝0] 머신러닝의 기초(총정리) (0) | 2022.12.01 |
Dataset traing, test set으로 나누기 (0) | 2022.12.01 |
문자 수치화,데이터분리: OneHotEncoder (0) | 2022.12.01 |