
[머신러닝] 3분 만에 이해되는 K-Means 클러스터링
·
ML
K-Means Clustering이란?머신러닝에서 가장 대중적인 비지도학습 군집화 알고리즘 중 하나로, 군집의 중심점을 이동하며 전체 데이터를 K개의 Cluster로 묶는 방법입니다.Cluster는 하나의 그룹, 집합, 군집 정도로 생각해 주시면 됩니다. 먼저, 데이터를 생성하기 위해 (0,0) (2,2) (-3,3) 주변으로 랜덤하게 100개의 포인트를 만들었습니다. 그다음, 이렇게 랜덤하게 세 개의 점으로 중심점들을 선언해 줍니다.이후 모든 데이터에 대해 각 중심점과의 거리를 계산하고, 가장 가까운 중심점의 클러스터에 해당 데이터를 할당합니다. 그럼 이렇게 초기 군집이 형성이 됩니다. 좌측에 빨간 별로 표시한 데이터 하나를 예시로 보겠습니다.빨간 점까지의 거리가 1.0979로 가장 짧아 검은색 클러..