본문으로 이동

계층적 군집화

위키백과, 우리 모두의 백과사전.

계층적 군집화(Hierarchical clustering, 계층적 클러스터 분석, 위계적 군집화, hierarchical cluster analysis, HCA)은 데이터 마이닝통계학에서 클러스터 계층을 구축하려는 클러스터 분석 방법이다. 계층적 군집화 전략은 일반적으로 두 가지 범주로 나뉜다.

  1. 응집형/병합(agglomerative): 이것은 "상향식" 접근 방식이다. 각 관찰은 자체 클러스터에서 시작하고 클러스터 쌍은 하나가 계층 구조 위로 이동할 때 병합된다.
  2. 분할(divisive): 이는 "하향식" 접근 방식이다. 모든 관찰은 하나의 클러스터에서 시작하고 계층 구조 아래로 이동함에 따라 분할이 반복적으로 수행된다.

일반적으로 병합과 분할은 탐욕적인 방식으로 결정된다. 계층적 군집화의 결과는 일반적으로 덴드로그램(dendrogram)[1]으로 표시된다.

같이 보기[편집]

각주[편집]