Phương phỏp phõn cụm cú dữ liệu ràng buộc

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 35 - 38)

CHƯƠNG 2 CÁC KỸ THUẬT PHÂN CỤM

2.3. NHỮNG KỸ THUẬT TIẾP CẬN TRONG PHÂN CỤM DỮ LIỆU

2.3.6. Phương phỏp phõn cụm cú dữ liệu ràng buộc

Sự phỏt triển của PCDL khụng gian trờn CSDL lớn đó cung cấp nhiều cụng cụ tiện lợi cho việc phõn tớch thụng tin địa lý, tuy nhiờn hầu hết cỏc thuật toỏn này cung cấp rất ớt cỏch thức cho người dựng để xỏc định cỏc ràng buộc trong thế giới thực cần phải thoả món trong quỏ trỡnh phõn cụm. Để PCDL khụng gian hiệu quả hơn, cỏc nghiờn cứu bổ sung cần được thực hiện để cung cấp cho người dựng khả năng kết hợp cỏc ràng buộc trong thuật toỏn phõn cụm.

Cú một số cỏch phõn chia cụm phổ biến như sau:

- Phõn chia phẳng theo ranh giới - Phõn chia hỡnh cầu

- Phõn chia xỏc suất - Phõn chia hỡnh cõy

Hỡnh 2.6. Một số cỏch phõn chia cụm

Hiện nay, cỏc phương phỏp phõn cụm trờn đó và đang được phỏt triển, ỏp dụng nhiều trong cỏc lĩnh vực khỏc nhau và đó cú một số nhỏnh nghiờn cứu được phỏt triển trờn cơ sở cỏc phương phỏp đú như:

Phõn cụm thống kờ: Dựa trờn cỏc khỏi niệm phõn tớch hệ thống, nhỏnh

nghiờn cứu này sử dụng cỏc độ đo tương tự để phõn hoạch cỏc đối tượng nhưng chỳng chỉ ỏp dụng cho cỏc dữ liệu cú thuộc tớnh số.

Phõn cụm khỏi niệm: Cỏc kỹ thuật phõn cụm được phỏt triển ỏp dụng cho dữ liệu hạng mục, chỳng phõn cụm cỏc đối tượng theo cỏc khỏi niệm mà chỳng xử lý.

Phõn cụm mờ: Sử dụng kỹ thuật mờ để PCDL, trong đú một đối tượng dữ liệu cú thể thuộc vào nhiều cụm dữ liệu khỏc nhau. Cỏc thuật toỏn thuộc loại này chỉ ra lược đồ phõn cụm thớch hợp với tất cả cỏc hoạt động đời sống hàng ngày, chỳng xử lý cỏc dữ liệu khụng chắc chắn. Thuật toỏn mờ quan trọng nhất là FCM (Fuzzy c-means).

Phõn cụm Kohonen: Loại phõn cụm này dựa trờn khỏi niệm của cỏc mạng nơron. Mạng Kohonen cú cỏc tầng nơron vào và cỏc tầng nơron ra. Mỗi

nơron của tầng vào tương ứng với mỗi thuộc tớnh của bản ghi, mỗi một nơron vào kết nối với tất cả cỏc nơron của tầng ra. Mỗi liờn kết được gắn liền với một trọng số nhằm xỏc định vị trớ của nơron tầng ra tương ứng [7][13].

Túm lại, cỏc kỹ thuật PCDL trỡnh bày ở trờn đó được sử dụng rộng rói trong thực tế, thế nhưng hầu hết chỳng chỉ ỏp dụng cho tập dữ liệu với cựng một kiểu thuộc tớnh. Vỡ vậy, việc phõn cụm dữ liệu cú kiểu hỗn hợp là một vấn đề đặt ra trong KPDL giai đoạn hiện nay.

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 35 - 38)

Tải bản đầy đủ (PDF)

(118 trang)