Hàm thích nghi và sự chọn lọc

Một phần của tài liệu CNTT1002 (Trang 34 - 36)

Hàm thích nghi ñịnh nghĩa tiêu chuẩn ñể xếp hạng các giả thuyết tiềm ẩn và ñể chọn lọc chúng theo xác suất ñể ñưa vào quần thể thế hệ kế tiếp. Nếu tác vụ là học các luật phân loại, thì hàm thích nghi thông thường có một thành phần cho ñiểm ñộ chính xác phân loại của luật trên tập mẫu huấn luyện ñược cho. Thường các tiêu chuẩn khác có thể ñược bao hàm, chẳng hạn nhưñộ phức tạp và mức ñộ tổng quát của luật. Một cách tổng quát hơn, khi giả thuyết chuỗi bit ñược hiểu như là một thủ tục phức tạp (ví dụ, khi chuỗi bit thể hiện tập chọn lọc, các luật if-then sẽñược móc xích với nhau, ñể ñiều khiển thiết bị robot), hàm thích nghi có thểño hiệu suất tổng của thủ tục kết quả hơn là hiệu suất của các luật riêng biệt.

http://etrithuc.vn

Trong thuật giải GA mẫu ñược chỉ trong bảng 3.1, xác suất ñể một giả thuyết ñược chọn ñược cho bởi tỉ số của ñộ thích nghi của nó với ñộ thích nghi của các thành viên khác của quần thể hiện tại, nhưñã thấy trong phương trình tính giá trị thích nghi. Phương pháp này thỉnh thoảng thường ñược gọi là sự chọn lọc tỉ lệ ñộ thích nghi, hoặc sự chọn lọc vòng roulette. Các phương pháp khác dùng ñộ thích nghi ñể chọn lọc các giả thuyết cũng sẽ ñược ñề xuất. Ví dụ, sự chọn lọc kiểu vòng thi ñấu, hai giả thuyết ñầu tiên ñược chọn ngẫu nhiên từ quần thể hiện tại. Với một vài xác suất pñược ñịnh nghĩa trước hai cá thể này càng phù hợp càng ñược chọn và với xác suất (1 – p) giả thuyết càng ít phù hợp càng ñược chọn. Sự chọn lọc theo vòng thi ñấu thường tạo ra quần thể khác nhau nhiều hơn so với sự chọn lọc tỉ lệ với ñộ thích nghi (Goldberg và Deb 1991). Trong phương pháp sự chọn lọc theo hạng, các giả thuyết trong quần thể hiện tại ñầu tiên sẽ ñược sắp xếp theo ñộ thích nghi. Xác suất ñể giả thuyết sẽ ñược chọn tỉ lệ với hạng của nó trong danh sách ñã sắp xếp hơn là ñộ thích nghi của nó.

http://etrithuc.vn

Chương 4: Minimax probability machine

4.1. Gii thiu

Xuất phát từ bài toán phân lớp, giả sử cho tập dữ liệu trong ñó các thuộc tính của các phần tử là các triệu chứng của bệnh nhân bị bệnh ung thư chẳng hạn. Nhiệm vụ chính là phân biệt ñược người bị bệnh và người không bị bệnh. Ở ñây gọi lớp x là lớp người không bị bệnh và lớp y là lớp người bị bệnh.

Minimax probability machine là một thuật toán phân hai lớp dữ liệu, cung cấp một giới hạn cho xác suất phân loại sai trong trường hợp xấu nhất dựa trên những ñánh giá

ñáng tin cậy về giá trị trung bình và ma trận hiệp phương sai của các lớp trong tập dữ liệu huấn luyện.

Một phần của tài liệu CNTT1002 (Trang 34 - 36)