Điều chỉnh giữa sự học tăng cường và sự khám phá- 123docz.net

Các thuật toán metaheuristic muốn có hiệu quả tốt thì cần có sự điều chỉnh phù hợp giữa việc sử dụng kinh nghiệm tìm kiếm với việc khám phá các không gian tìm kiếm mới. Các thuật toán ACO điều chỉnh được sự cân bằng giữa chúng thông qua qua việc điều chỉnh cập nhật các vệt mùi sao cho phù hợp.

Tác dụng của các vệt mùi là đưa ra một sự phân bố xác suất lựa chọn trên không gian tìm kiếm, nó cho phép ta xác định được các phần nào trong không gian tìm kiếm mà tập trung nhiều giải hơn, cũng tức là có nhiều khả năng cho lời giải tối ưu ở đó. Khi đó nếu tập trung tìm kiếm trên các phần không gian này thì ta có quá trình học tăng cường tức là chỉ tập trung tìm kiếm trên các lời giải tốt hay nói cách khác là trên các cạnh có nhiều thông tin vệt mùi.

Để sử dụng kinh nghiệm tìm kiếm của các con kiến ta có thể sử dụng một thủ tục kiểm tra hiệu suất của mỗi lời giải trong suốt quá trình cập nhật mùi. Một cách để tăng khả năng học tăng cường trong quá trình xây dựng lời giải bằng cách áp dụng luật chuyển trạng tháinhư trong thuật toán ACS, khi đó các con kiến sẽ tập trung nhiều hơn vào các lời giải tốt ở bước trước hơn so với thuật toán AS. Mặt trái của quá trình này là khả năng khám phá của các con kiến giảm đi vì chúng chỉ tập trung vào một phần nhỏ của không gian tìm kiếm.

Để tăng khả năng khám phá cho các con kiến thì rõ ràng là ta cần mở rộng không gian tìm kiếm lên bằng các phương pháp khác nhau. Quá trình này vừa có tác dụng giảm bớt sự tập trung quá nhiều vào các lời giải được cho là tốt, vừa có tác dụng đưa ra nhiều khả năng tìm kiếm cho các con kiến. Mở rộng không gian tìm kiếm trong

ACO chính là các thủ tục xây dựng lời giải ngẫu nhiên của các con kiến. Xem xét khi thuật toán ACO không sử dụng thông tin heuristic (bằng cách đặt tham số  0). Trong trường hợp này, quá trình cập nhật mùi sẽ gây ra sự thay đổi từ không gian tìm kiếm mẫu cố định ban đầu thành một không gian mẫu khác và ở không gian này sự lựa chọn các phương án chỉ phụ thuộc vào cường độ các vết mùi. Việc mở rộng không gian tìm kiếm sẽ tốt hơn trong các vòng lặp ban đầu của thuật toán và sẽ giảm thiểu được sự tính toán.

Để điều chỉnh sự tăng cường và khám phá người ta thường điều chỉnh các tham số  và , ảnh hưởng đến các vết mùi còn  ảnh hưởng đến các thông tin

heuristic. MMAS sử dụng một phương pháp đó là giới hạn cận dưới của các cường độ vệt mùi sao khi đó không gian tìm kiếm được điều chỉnh không trở nên thu hẹp quá mức. Khi mà bài toán đi vào bế tắc MMAS tức là với không gian tìm kiếm hiện tại không thể phát triển thêm lời giải thi nó khởi tạo lại các vệt mùi đồng nghĩa với việc tăng trở lại không gian tìm kiếm. Việc khởi tạo lại các vệt mùi kết hợp với các cải tiến lựa chọn cập nhật vệt mùi giúp MMAS tìm kiếm trên nhiều vùng không gian khác nhau.

Điều chỉnh giữa sự học tăng cường và sự khám phá

Kết hợp tìm kiếm địa phương

Các phương pháp giải bài toán DTSP