파이썬/데이터분석

데이터프레임안 nan대신 0으로 채워저 있을때 : pandas replace

공부짱짱열심히하기 2022. 12. 2. 11:50

머신러닝 작업하기위해 데이터를 수집하는 단계에서

데이터프레임안 NaN데이가 있는지 판단하기 위해 

df.isna().sum()을 사용할때

이런식으로 nan데이터는 없다고 나오지만

디스크라이브를 통해 분석을 해보면

나이나 피부 등등 0이 나올수 없는 값이 0이 나오는경우가 있다.

이런경우 데이터프레임에 nan대신 0을 집어 넣었다는 이야기가 된다.

 

이런경우 

판다스 데이터프레임 함수 replace를 활용하면 좋다

df.loc[ :,컬럼].replace(바꾸기전 내용, 바꿀 내용)

저 데이터에선

df.loc[ :,'Plas':'age'].replace(0, np.nan)

이렇게 하면

0을 nan데이터로 바꿔버릴수 있음

 

 

df.loc[ :,컬럼].replace(바꾸기전 내용, 바꿀 내용)