KPDL BẰNG KỸ THUẬT PHÂN CỤM

Một phần của tài liệu 28024_171220200197788LUANVAN (Trang 39 - 40)

5. Bố cục của luận văn

1.3. KPDL BẰNG KỸ THUẬT PHÂN CỤM

1.3.1. Giới thiệu

Phân cụm là kỹ thuật quan trọng trong KPDL, có nhiều định nghĩa khác nhau về kỹ thuật này, nhưng về bản chất thì phân cụm là quy trình tìm cách nhóm các đối tượng đã cho vào các cụm, sao cho các đối tượng trong cùng

Overcas Outlook rain Humidity >7.75 7.75 Sunny Wind Strong Weak Yes No Yes Yes No

một cụm tương tự nhau và các đối tượng khác cụm thì không tương tự nhau. Mục đích của phân cụm là tìm ra bản chất bên trong các nhóm của dữ liệu. Tuy nhiên, không có tiêu chí nào được xem là tốt nhất để đánh giá hiệu quả của phân cụm. Nó phụ thuộc vào mục đích của phân cụm như: data reduction, “natural clusters”, “useful” clusters, outlier detection. [15]

Ứng dụng của phân cụm dữ liệu trong các lĩnh vực:

 Kinh doanh: Xác định các nhóm khách hàng (khách hàng tiềm năng, khách hàng giá trị, phân loại và dự đoán hành vi khách hàng,…) sử dụng sản phẩm hay dịch vụ của công ty để giúp công ty có chiến lược kinh doanh hiệu quả hơn,…

 Sinh học: Phân nhóm động vật và thực vật dựa vào các thuộc tính....  Địa lý: nhận ra các vùng đất giống nhau dựa vào CSDL quan sát trên Trái Đất, phân nhóm nhà,...

 Bảo hiểm, tài chính: Nhận dạng các nhóm công ty có chính sách bảo hiểm với chi phí đền bù trung bình cao, phân nhóm các đối tượng sử dụng bảo hiểm và các dịch vụ tài chính, dự đoán xu hướng (trend) của khách hàng, phát hiện gian lận tài chính (identifying frauds),…

 Website: Phân loại tài liệu (document classification); phân loại người dùng web (clustering weblog),…

 Một công cụ độc lập để xem xét phân bố dữ liệu.  Làm bước tiền xử lý cho các thuật toán khác.

Một phần của tài liệu 28024_171220200197788LUANVAN (Trang 39 - 40)

Tải bản đầy đủ (PDF)

(96 trang)