Phƣơng phỏp này xõy dựng một phõn cấp dựa trờn cơ sở cỏc đối tƣợng dữ liệu đang xem xột. Đú là việc sắp xếp một tập dữ liệu đó cho thành một cấu trỳc hỡnh cõy, cõy phõn cấp này đƣợc xõy dựng theo kỹ thuật đệ quy. Cú hai cỏch tiếp cận phổ biến của kỹ thuật này là hoà nhập nhúm (thƣờng gọi là tiếp cận bottom-up) và phõn chia nhúm (thƣờng gọi là tiếp cận top-down).
Kỹ thuật tiếp cận bottom-up: Bắt đầu xuất phỏt với mỗi đối tƣợng dữ liệu đƣợc khởi tạo tƣơng ứng với cỏc cụm riờng biệt và sau đú tiến hành hoà
nhập nhúm cỏc đối tƣợng theo cựng một độ đo tƣơng tự (nhƣ khoảng cỏch giữa hai trung tõm của nhúm), quỏ trỡnh này đƣợc thực hiện cho đến khi tất cả cỏc nhúm đƣợc hoà nhập vào một nhúm (mức cao nhất của cõy phõn cấp) hoặc cho đến khi cỏc điều kiện kết thỳc thoả món. Cỏch tiếp cận này sử dụng chiến lƣợc ăn tham trong quỏ trỡnh phõn cụm.
Kỹ thuật tiếp cận top-down: Bắt đầu với tất cả cỏc đối tƣợng dữ liệu đƣợc sắp xếp trong cựng một cụm và kỹ thuật này tiến hành chia nhỏ cỏc cụm. Mỗi vũng lặp thành cụng, một cụm đƣợc tỏch ra thành cỏc cụm nhỏ hơn theo giỏ trị của một phộp đo tƣơng tự nào đú cho đến khi mỗi đối tƣợng dữ liệu là một cụm riờng biệt hoặc cho đến khi điều kiện dừng thoả món. Cỏch tiếp cận này sử dụng chiến lƣợc chia để trị.
Hỡnh 2.4. Cỏc chiến lƣợc phõn cụm phõn cấp
Trong thực tế, cú rất nhiều trƣờng hợp ỏp dụng cả hai phƣơng phỏp phõn cụm phõn hoạch và phõn cụm phõn cấp, nghĩa là kết quả thu đƣợc của phƣơng phỏp phõn cấp cú thể đƣợc cải tiến thụng qua bƣớc phõn cụm phõn hoạch. Phõn cụm phõn hoạch và phõn cụm phõn cấp là hai phƣơng phỏp phõn
cụm dữ liệu cổ điển, hiện nay đó cú rất nhiều thuật toỏn cải tiến dựa trờn hai phƣơng phỏp đƣợc ỏp dụng rộng rói trong lĩnh vực khai phỏ dữ liệu.