Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
Tags
- disgusting
- 엑셀
- post man
- 이변량 분석
- 예측
- sql
- KNNImputer
- 전처리
- contrasts can be applied only to factors with 2 or more levels
- R
- 선형성
- 기본가정
- 회귀모형
- 분류
- cook's distance
- 언어분석
- by oneself
- 다중공선성
- VIF
- 회귀분석
- 정규성
- 디시전트리
- 코딩테스트
- 이상치
- 워홀
- 등분산성
- 오류
- 기술통계분석
- 자기상관
- 등분산검정
Archives
- Today
- Total
목록PYTHON (1)
excelsu의 공부 기록 블로그

KNN imputer 를 사용하여 데이터 사이에 NA값을 채워주는 코드이다. KNN은 간단하게 설명하면 NA값의 가장가까운 주변 k개의 평균을 NA값으로 대체하는 알고리즘이다. 간단하게 코드로 작성해볼 수 있다. from sklearn.impute import KNNImputer #임퓨터 선언(5개의 평균으로 계산하겠다) imputer=KNNImputer(n_neighbors=5) #임퓨터를 사용하여 filled_train으로 저장 이후 같은 임퓨터를 사용할때는 imputer.transform()으로 사용하면됨 filled_train=imputer.fit_transform(train) #사용하면 array값으로 나오기때문에 dataframe으로 바꿔주고 컬럼을가져옴 filled_train=pd.DataF..
파이썬/전처리
2022. 6. 24. 15:31