Kết quả thử nghiệm với giải thuật Kmeans

Một phần của tài liệu (LUẬN văn THẠC sĩ) các kỹ thuật phân cụm trong khai phá dữ liệu sử dụng tính toán tiến hóa (Trang 41 - 42)

Nhn xét:

Dựa vào kết quả của bảng 3.3, ta thấy:

- Với số cụm là 1 thì tổng khoảng cách từ trọng tâm cụm tới các điểm dữ liệu đạt giá trị lớn nhất. Vì phải tính tổng khoảng cách của tất cả các điểm trong 1 cụm tới trọng tâm cụm

- Với số cụm là 12 thì tổng khoảng cách từ trọng tâm cụm tới các điểm dữ liệu đạt giá trị nhỏ nhất. Vì lúc này mỗi điểm cũng chính là trọng tâm cụm của chính nó, do đó tổng khoảng cách của tất cả các điểm bằng 0.

- Với số cụm càng lớn thì tổng khoảng cách của tất cả các điểm trong cụm tới trọng tâm cụm càng nhỏ.

- Kết quả của các lần phân cụm là khác nhau hay không thống nhất, trừ trường hợp số cụm bằng 1 (số cụm ít nhất) và số cụm bằng 12 (số cụm nhiều nhất)

3.2.1.2. Thí nghim gii thut Genetic Kmean

Với bộ dữ liệu tự sinh, thực hiện test lần lượt với số cụm thay đổi từ 1 đến 12; số thế hệ test là 10; số cá thể của quần thể là 6; và thực hiện test với số lần là 10. Sau khi test xong, thu được kết quả như bảng 3.4.

Trong đó, giao giữa Trung bình 10 lần chạy trong 2 trường hợp và Số cụm là trung bình tổng khoảng cách từ trọng tâm cụm tới các điểm dữ liệu trong 10 lần chạy thử nghiệm. Trung bình 10 ln chy S cm 1 2 3 4 5 6 7 8 9 10 11 12 Trường hợp 1 134,44 75.89 57.72 47.82 37.23 30.47 23.29 17.22 12.51 7.63 3.38 0 Trường hợp 2 134,44 71.95 52.82 43.22 35.42 28.53 22.26 16.28 11.20 6.97 3.16 0

Một phần của tài liệu (LUẬN văn THẠC sĩ) các kỹ thuật phân cụm trong khai phá dữ liệu sử dụng tính toán tiến hóa (Trang 41 - 42)

Tải bản đầy đủ (PDF)

(51 trang)