MÔ TẢ THUẬT TOÁN

Một phần của tài liệu Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu (Trang 33 - 34)

Thuật toán Candidate-Elimination tính version space chứa tất cả những giả thiết phù hợp với tập các ví dụ huấn luyện. Bắt đầu bằng việc khởi tạo version space để chứa tất cả những giả thiết trong H, khởi tạo G là tập các giả thiết tổng quát nhất trong H

Go  {<?,?,?,?,?,?>} và khởi tạo S là tập các giả thiết cụ thể nhất

So  {<Ø, Ø, Ø, Ø, Ø, Ø >}

Hai tập G, S này bao đóng toàn bộ giả thiết, bởi vì mỗi giả thiết trong H đều tổng quát hơn So và đặc thù hơn Go. Với mỗi ví dụ huấn luyện, S và G sẽ được tổng quát hóa và đặc thù hóa để loại bỏ từ version space bất kỳ những giả thiết nào tìm thấy là không phù hợp. Sau tất cả những ví dụ, version space đã tính sẽ bao đóng tất cả những giả thiết phù hợp với những ví dụ huấn luyện và chỉ với những ví dụ huấn luyện này. Thuật toán Candidate Elimination được viết dưới dạng mã giả như sau:

G  các giả thiết tổng quát nhất trong H S  các giả thiết đặc thù nhất trong H Với mỗi ví dụ huấn luyện d, thực hiện:

1/ Nếu d là một positive example

- Xóa từ trong G tất cả các giả thiết inconsistent với d

- Đối với mỗi giả thiết s trong S mà inconsistent với d

• Xóa s trong S

• Thêm vào S tất cả các giả thiết h được tổng quát hóa tối thiểu từ s, sao cho:

a/ h consistent với d, và

b/ Một số giả thiết trong G tổng quát hơn h.

• Xóa từ S bất kỳ giả thiết nào tổng quát hơn các giả thiết khác trong S. 2/ Nếu d là một negative example

- Xóa trong S bất kỳ giả thiết nào inconsistent với d.

- Đối với mỗi giả thiết g trong G mà inconsistent với d

• Xóa g trong G.

• Thêm vào G tất cả các giả thiết h được đặc thù hóa tối thiểu từ g, sao cho: a/ h consistent với d, và

b/ Một số giả thiết trong S đặc thù hơn h.

• Xóa trong G tất cả các giả thiết nào ít tổng quát hơn các giả thiết khác trong G.

Một phần của tài liệu Nghiên cứu và cài đặt các thuật toán phân lớp dữ liệu (Trang 33 - 34)

Tải bản đầy đủ (DOCX)

(42 trang)
w