Nhận xét:
Dựa vào kết quả của bảng 3.3, ta thấy:
- Với số cụm là 1 thì tổng khoảng cách từ trọng tâm cụm tới các điểm dữ liệu đạt giá trị lớn nhất. Vì phải tính tổng khoảng cách của tất cả các điểm trong 1 cụm tới trọng tâm cụm
- Với số cụm là 12 thì tổng khoảng cách từ trọng tâm cụm tới các điểm dữ liệu đạt giá trị nhỏ nhất. Vì lúc này mỗi điểm cũng chính là trọng tâm cụm của chính nó, do đó tổng khoảng cách của tất cả các điểm bằng 0.
- Với số cụm càng lớn thì tổng khoảng cách của tất cả các điểm trong cụm tới trọng tâm cụm càng nhỏ.
- Kết quả của các lần phân cụm là khác nhau hay không thống nhất, trừ trường hợp số cụm bằng 1 (số cụm ít nhất) và số cụm bằng 12 (số cụm nhiều nhất)
3.2.1.2. Thí nghiệm giải thuật Genetic Kmean
Với bộ dữ liệu tự sinh, thực hiện test lần lượt với số cụm thay đổi từ 1 đến 12; số thế hệ test là 10; số cá thể của quần thể là 6; và thực hiện test với số lần là 10. Sau khi test xong, thu được kết quả như bảng 3.4.
Trong đó, giao giữa Trung bình 10 lần chạy trong 2 trường hợp và Số cụm là trung bình tổng khoảng cách từ trọng tâm cụm tới các điểm dữ liệu trong 10 lần chạy thử nghiệm. Trung bình 10 lần chạy Số cụm 1 2 3 4 5 6 7 8 9 10 11 12 Trường hợp 1 134,44 75.89 57.72 47.82 37.23 30.47 23.29 17.22 12.51 7.63 3.38 0 Trường hợp 2 134,44 71.95 52.82 43.22 35.42 28.53 22.26 16.28 11.20 6.97 3.16 0