Tham số bay hơi

Một phần của tài liệu Phương pháp tối ưu đàn kiến và ứng dụng (Trang 50 - 51)

Ở mỗi vòng lặp, khi xây dựng được lời giải tốt (sử dụng tìm kiếm cục bộ hoặc thông tin heuristic mạnh), tham số bay hơi sẽ được xác lập có giá trị lớn, điều này giúp kiến quên đi những lời giải đã xây dựng, tập trung công việc tìm kiếm xung quanh lời giải tốt mới được xây dựng. Trong trường hợp ngược lại, ở mỗi vòng lặp, khả năng kiến tìm được lời giải tốt không cao thì tham số bay hơi phải được thiết lập với giá trị nhỏ.

2.5. Kết luận chương

Phương pháp ACO là một phương pháp metaheuristic được sử dụng rộng rãi để giải các bài toán TƯTH khó, hiệu quả nổi trội của nó đã được chứng tỏ bằng thực nghiệm. Phương pháp này mô phỏng cách tìm đường đi của kiến tự nhiên, trong đó lời giải chấp nhận được của bài toán được các con kiến xây dựng nhờ thủ tục bước ngẫu nhiên trên đồ thị cấu trúc. Việc tìm kiếm đỉnh mới của đường đi dựa trên kết hợp thông tin heuristic và thông tin học tăng cường biểu thị bởi vết mùi.

Khi áp dụng phương pháp này, ba yếu tố sau đây có vai trò quan trọng: 1) Xây dựng đồ thị cấu trúc;

2) Xác định thông tin heuristic; 3) Chọn quy tắc cập nhật mùi.

trong đó hai yếu tố đầu phụ thuộc vào từng bài toán cụ thể, còn yếu tố thứ ba có nhiều đề xuất và nghiên cứu cải tiến, nhưng vẫn còn có thể được nghiên cứu sâu hơn nhằm đưa ra các cải tiến hiệu quả.

53

Chương 3. TÍNH BIẾN THIÊN CỦA VẾT MÙI VÀ CÁC THUẬT TOÁN MỚI

Như đã trình bày trong chương trước, Gutjahr [36-38], Stützle và Dorigo [65] đã xét tính hội tụ theo xác suất tới lời giải tối ưu của MMAS, ACS và sự hội tụ của cường độ vết mùi cho các biến thể của thuật toán MMAS. Các tác giả chưa chưa khảo sát sự hội tụ của cường độ vết mùi đối với ACS.

Tuy nhiên, trong các bài toán tối ưu tổ hợp do số phương án là hữu hạn, nên kết quả xác suất tìm thấy lời giải hội tụ về 1 khi số lần lặp dần ra vô hạn là không có nhiều ý nghĩa. Trong chương này, luận án phân tích chi tiết hơn về các đặc tính biến thiên của vết mùi trong các thuật toán ACO thông dụng và xem xét các quy tắc cập nhật mùi theo cách nhìn học tăng cường (reinforcement learning), trên cơ sở đó đề xuất các quy tắc cập nhật mùi mới. Kết quả thực nghiệm trên các bài toán TSP và UBQP cho thấy ưu điểm của các đề xuất này.

Trước khi phân tích toán học, ta biểu diễn lại thuật toán dưới dạng dễ khảo sát hơn.

Một phần của tài liệu Phương pháp tối ưu đàn kiến và ứng dụng (Trang 50 - 51)