빅데이터 분석/데이터 분석 알고리즘
[빅데이터 분석] K-평균 (K-Means) 분석 : 데이터를 효과적으로 그룹화하는 머신러닝 분석 기법
1. 개요 데이터 분석을 하다 보면 비슷한 특성을 가진 데이터를 그룹화하는 클러스터링(Clustering)이 필요한 경우가 많습니다. 그 중에서도 K-평균(K-Means) 알고리즘은 가장 널리 사용되는 비지도 학습(Unsupervised Learning) 방법 중 하나입니다. 이번 포스팅에서는 K-평균(K-Means)의 개념부터 알고리즘, 분석 절차, 실제 적용 사례, 그리고 파이썬을 이용한 간단한 구현까지 살펴보도록 하겠습니다. 2. K-평균 알고리즘 개념 및 장단점 K-평균 알고리즘은 각 클러스터의 중심(centroid)과 해당 클러스터 내의 데이터 간의 거리 차이의 제곱을 최소화하는 방식으로 데이터를 클러스터링합니다. 다시 말해, 각 데이터를 가장 가까운 클러스터에 할당하고, 그 다음에는 클러스터의..
2023. 7. 10.