excelsu의 공부 기록 블로그

[머신러닝] 군집(Clustering ) VS 분류(Classification) 본문

통계

[머신러닝] 군집(Clustering ) VS 분류(Classification)

excelsu 2022. 6. 24. 10:22

분류와 군집의 차이는 사진 하나로 간단하게 설명할 수 있다.

 

*분류(classification)는 정답(label)가 있는 지도학습이며 학습하여 new data가 어느분류인지 맞추는 방법이다.

 

*군집(clustering)은 정답(label)가 없는 비지도학습이다. 그렇기때문에 어떠한 기준이나 규칙에 의해 임의로 나누어 묶어보는것이다.

 

대표적으로 분류기법에는 knn이 있고, 군집기법에는 k-means알고리즘이 있다.

 

*knn은 new data의 최근접 k개를 참조하여 new data의 label을 정하는 방법

 

*k-means알고리즘은 k개 임의의 군집 중심점끼리의 거리합이 최소가 될때까지 이동하여 묶는 방법

 

 

 

사진 출처 : http://www.datamarket.kr/xe/board_BoGi29/9880