Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
Tags
- 분류
- cook's distance
- 등분산검정
- 선형성
- disgusting
- 기술통계분석
- 기본가정
- 오류
- 언어분석
- 정규성
- KNNImputer
- R
- post man
- 코딩테스트
- contrasts can be applied only to factors with 2 or more levels
- by oneself
- 회귀모형
- 워홀
- 회귀분석
- 예측
- 전처리
- 엑셀
- 등분산성
- 다중공선성
- 디시전트리
- 이상치
- 이변량 분석
- VIF
- sql
- 자기상관
Archives
- Today
- Total
excelsu의 공부 기록 블로그
[머신러닝] 군집(Clustering ) VS 분류(Classification) 본문

분류와 군집의 차이는 사진 하나로 간단하게 설명할 수 있다.
*분류(classification)는 정답(label)가 있는 지도학습이며 학습하여 new data가 어느분류인지 맞추는 방법이다.
*군집(clustering)은 정답(label)가 없는 비지도학습이다. 그렇기때문에 어떠한 기준이나 규칙에 의해 임의로 나누어 묶어보는것이다.
대표적으로 분류기법에는 knn이 있고, 군집기법에는 k-means알고리즘이 있다.
*knn은 new data의 최근접 k개를 참조하여 new data의 label을 정하는 방법
*k-means알고리즘은 k개 임의의 군집 중심점끼리의 거리합이 최소가 될때까지 이동하여 묶는 방법
'통계' 카테고리의 다른 글
| [통계값] CV(coefficient of variation)값 (0) | 2022.07.08 |
|---|---|
| [기초통계] 상관분석/교차분석 (0) | 2022.06.27 |
| [기초통계] 빈도분석/기술통계분석 (0) | 2022.06.27 |
| [기초통계] 분산분석(평균검증) t-test, anova (0) | 2022.06.22 |
| [회귀분석] 회귀모형 실증분석 (논문예시) (0) | 2022.06.22 |