카데고리컬 데이터가 3개이상이면 머신러닝의 효율이 떨어지는데 레이블인코딩은 이런점에서 취약하다 그럴때 사용하는 방식은 원핫 인코딩하는것 원핫 인코딩이란 3개이상의 카테고리컬 데이터를 전부 컬럼화 시켜서 하나의 1과 0으로 표현하는것 가령 컨트리라는 컬럼에 프랑스 독일 스페인이 있다면 France Germany Spain 1 0 0 0 1 0 0 0 1 각 각에 해당되는 데이터에 1을 배당해서 컬럼화 시킴 이런식으로 Hot(1)이 one개 있다는 뜻 원핫인코딩을 위해선 from sklearn.preprocessing import OneHotEncoder from sklearn.compose import ColumnTransformer ColumnTransformer( [ ('인코더이름',OneHotEnco..