Cài đặt thuật toán

Một phần của tài liệu Khóa luận tốt nghiệp toán học: Tính toán mờ trong mạng Kohonen và ứng dụng phân cụm dữ liệu (Trang 32 - 36)

6. Cấu trúc của đề tàị

4.3.Cài đặt thuật toán

4.3.1. Cài đặt thuật toán

Trƣớc khi tiến hành cài đặt thuật toán bởi ngôn ngữ lập trình, đầu tiên ta đi xét cách tạo ma trận trọng số. Đây là bƣớc đầu tiên và có thể ảnh hƣởng đến tốc độ phân

33

cụm. Ta có thể tạo ngẫu nhiên ma trận trọng số. Đây là cách làm đơn giản dễ thực hiện, nhƣng việc tạo ngẫu nhiên ma trận trọng số có thể khiến cho thuật toán hoạt động lâu hơn. Do khi tạo ngẫu nhiên, có thể trọng số sinh ra ở xa và thuật toán phải mất nhiều vòng lặp hơn để ma trận trọng số hội tụ. Ngoài việc tạo ma trận mẫu nhiên, ta có thể tạo ma trận ngẫu nhiên theo kinh nghiệm. Có nghĩa là, ta tạo ra ngẫu nhiên ma trận trong số nhƣ có kiểm soát. Theo kinh nghiệm ta thấy, thƣờng 1 số mờ tam giác tạo bởi 3 số a, b, c với giá trị tăng dần. Trên cùng 1 trục số, b của số thứ 1 có thể là a của số thứ 2. Việc tạo ngẫu nhiên theo kinh nghiện sẽ giúp thuật toán thực thi nhanh hơn, nhƣng cũng đòi hỏi ngƣời lập trình viên có kinh nghiệm cũng nhƣ kỹ thuật và tƣ duy lập trình tốt. Với chƣơng trình này để đơn giản tôi chọn cách tạo ngẫu nhiên ma trận trọng số.

Để phân cụm, ta cần tính khoảng cách (hay độ tƣơng tự), với ứng dụng này tôi chọn sử dụng cách tính khoảng cách theo khoảng cách Euclidẹ Khoảng cách Euclide có ƣu điểm là dễ hiểu, dễ tính toán, dễ mở rộng cho nhiều bài toán.

Các hình ảnh minh họa cài đặt thuật toán, giả sử chọn số cụm k=3:

34

Hình 16: Sau khi phân cụm hoàn tất

35

Hinh 18: Kết quả phân cụm - Cụm 1

36

Hinh 20: Kết quả phân cụm - Cum 3

Một phần của tài liệu Khóa luận tốt nghiệp toán học: Tính toán mờ trong mạng Kohonen và ứng dụng phân cụm dữ liệu (Trang 32 - 36)