6. Cấu trúc luận văn
2.4. MINH HỌA SỰ PHÂN CỤM ĐỐI VỚI THUẬT TOÁN FCM MỞ RỘNG
Đối với thuật toán FCM mở rộng, chúng ta có thể thực hiện bằng nhiều cách khác nhau với mục tiêu nhằm xác định được các điểm thuộc cụ thể vào cụm nào. Tuy nhiên ở ví dụ thực hiện trên mà tác giả đã trình bày, thì chúng ta có thể thấy được rằng để thuật toán FCM mở rộng thực thi việc phân cụm với tập điểm dữ liệu đầu vào được thì chúng ta phải định nghĩa được các tham số đầu vào và cụ thể bao gồm những tham số như số cụm phân hoạch c, số mũ mờ m và cuối cùng đó chính là dung sai kết thúc 𝜀. Riêng đối với thuật toán FCM mở rộng thực chất nó dựa trên cơ sở của thuật toán FCM bởi giáo sư Bezdek, và ở cách thực hiện thứ hai mà tác giả giới thiệu bên dưới chúng ta cũng có thể hình dung sự phân cụm này cụ thể hơn chính là với một tập dữ liệu gồm 140 điểm đầu vào và mỗi điểm chính là một tọa độ được thể hiện trong một mảng 2 chiều sẽ phân hoạch thành 2 cụm dưới sự hỗ trợ của môi trường Matlab. Như vậy, để FCM thực thi thì nó thực thi dựa vào file fcmdata.dat. Kết quả sẽ phân hoạch thành 2 cụm trong đó, cụm 1 các điểm ký hiệu chữ 0 và tương ứng với màu xanh, còn cụm 2 thì mỗi điểm ký hiệu chữ x và tương ứng với màu đỏ và minh họa bởi đoạn mã sau:
Hình 2.2. Mã thuật toán FCM mở rộng
0,83 0,87 0,05 0,04
Trong đó, với câu lệnh
[𝑐𝑒𝑛𝑡𝑒𝑟, 𝑈, 𝑜𝑏𝑗_𝑓𝑐𝑚] = 𝑓𝑐𝑚(𝑓𝑐𝑚𝑑𝑎𝑡𝑎, 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑛)
Với center: Biến dùng để thể hiện ma trận biểu diễn tọa độ của các cụm trung tâm. Cụ thể, dữ liệu minh họa bởi 2 cụm.
U: là ma trận phân hoạch tức là ma trận U chứa các giá trị thành viên. obj_fcm: Chứa giá trị lịch sử của hàm mục tiêu mà mỗi lần thực hiện. fcmdata: Tập điểm dữ liệu nhằm phân hoạch trong không gian.
cluster_n: Số cụm phân hoạch.
Kết quả thực thi đối với thuật toán FCM bởi đoạn mã ở hình trên cụ thể như sau:
Hình 2.3. Số lần thực thi đối với thuật toán FCM
Như vậy, đối với thuật toán FCM thì sự lặp lại chỉ với 12 lần. Chúng ta có thể hình dung thông qua sự thống kê sau để thấy rằng sự tối ưu của việc phân hoạch.
Hình 2.4. Tối ưu hàm mục tiêu đối với thuật toán FCM
0 2 4 6 8 10 0 2 4 6 8 10 12 14 o bject_ fcm Iteration count
Và chúng ta được kết quả phân hoạch đối với thuật toán FCM mở rộng như sau.
Hình 2.5. Kết quả phân cụm của thuật toán FCM với số lượng 2 cụm
Hình 2.6. Kết quả phân cụm của thuật toán FCM với số lượng 5 cụm
thuật toán FCM mở rộng dựa trên cơ sở của thuật toán FCM bởi giáo sư Bezdek. Đồng thời, sử dụng phần mềm Matlab để mô phỏng nhằm so sánh về thời gian hội tụ cũng như sự tối ưu đối với thuật toán phân cụm FCM mở rộng với dữ liệu ban đầu ngẫu nhiên và tập dữ liệu đã được thiết lập và cho kết quả như trên. Như vậy, đối với sự phân cụm dữ liệu của thuật toán FCM khá mềm dẻo khi xét một đối tượng thuộc một cụm nào đó theo độ thuộc của đối tượng đó vào cụm. Tuy nhiên, FCM lại xem tất cả các thuộc tính của đối tượng đều có vai trò như nhau, vì vậy nhằm khắc phục nhược điểm này với rất nhiều thuật toán được nghiên cứu chẳng hạn phân cụm dựa trên toán tử 𝐿𝑝 Norm (Keller, 1993) [32], thuật toán FCM và thuật toán FCM cải tiến sẽ được tiếp tục nghiên cứu trong thời gian tới [33].
CHƯƠNG 3
MÔ PHỎNG VÀ ĐÁNH GIÁ