L ỜI CAM Đ OAN
2.1. Giải thuật phân cụm trong tính toán tiến hóa
Giải thuật di truyền là tìm kiếm ngẫu nhiên và các kỹ thuật tối ưu hóa theo các nguyên tắc của sự tiến hóa và di truyền tự nhiên, có một lượng lớn số song song tiềm ẩn. Giải thuật di truyền thực hiện tìm kiếm trong mô hình rộng, phức tạp và cung cấp các giải pháp gần tối ưu cho các đối tượng hoặc hàm thích nghi của một giải pháp tối ưu. Trong giải thuật di truyền, các thông số của không gian tìm kiếm được mã hóa dưới dạng chuỗi (được gọi là nhiễm sắc thể). Một tập hợp chuỗi như vậy được gọi là một quần thể. Ban đầu, một quần thể ngẫu nhiên được tạo ra, trong đó đại diện cho các điểm khác nhau trong không gian tìm kiếm. Hàm mục tiêu và hàm thích nghi được kết hợp với mỗi chuỗi đại diện cho mức độ thích hợp của chuỗi. Dựa trên nguyên tắc tồn tại cho sự thích hợp nhất, một vài chuỗi được lựa chọn và được gán một số bản sao mà sẽ dùng để lai ghép. Các phép toán lai ghép sinh học như điểm lai ghép và đột biến được sử dụng cho các chuỗi để tạo ra các chuỗi trong thế hệ mới. Quá trình lựa chọn, lai ghép và đột biến vẫn tiếp tục cho một số thế hệ nhất định hoặc cho đến khi thỏa mãn điều kiện dừng. Các bước cơ bản của giải thuật di truyền cho phân cụm dữ bao gồm khởi tạo đại diện cá thể và quần thể, tính toán độ thích nghi, lựa chọn, lai ghép và đột biến. Mỗi cá thể đại diện cho một đặc điểm không gian nhỏ. Độ thích nghi của nó đại diện cho kết quả phân cụm mà có liên quan đến cá thể đại diện. Độ thích nghi lớn hơn, dữ liệu dày đặc hơn và kết quả phân cụm sẽ tốt hơn [8].