Tìm kiếm theo kinh nghiệm qua xếp hạng thuộc tính

Một phần của tài liệu (LUẬN án TIẾN sĩ) kỹ thuật học máy phối hợp và tiền xử lý dữ liệu trong việc nâng cao chất lượng phân lớp của các hệ thống phát hiện xâm nhập mạng (Trang 28 - 29)

Input

D - Tập dữ liệu

F - Tập hợp tất cả các thuộc tính trong tập dữ liệu D U - Tiêu chí đo lường

W - Bộ phân lớp

Output

BestSubset - Tập M thuộc tính thỏa tiêu chí khơng ổn định

Begin

1: Initialize: L = {}

2: For each fi ∈ F do

3: S(i) = compute (fi, U)

4: Đặt fi vào L tùy theo giá trị của S(i) 5: End for

6: BestClassification = 0

7: BestSubset = 

8: For each fi ∈ L do

9: TempSubset = BestSubset ∪ fi

10: TempClassification = WrapperClassification (TempSubset, D, W)

11: If (TempClassification > BestClassification) then

12: BestSubset = TempSubset 13: BestClassification = TempClassification 14: End if 15: End for 16: Return BestSubset End c) Tìm kiếm xác suất

Cĩ thể nĩi rằng các thuật tốn tìm kiếm xác suất là kết quả của việc các nhà nghiên cứu tiếp tục theo đuổi mục đích tìm kiếm tập con tối ưu mà khơng muốn thực hiện việc tìm kiếm tồn bộ trong khơng gian tìm kiếm. Khơng giống như hai thuật tốn tìm kiếm theo kinh nghiệm và tìm kiếm tồn bộ được trình bày ở trên, các thuộc tính khơng tuần tự được loại bỏ/thêm vào từ một tập các thuộc tính cho trước. Thuật tốn tìm kiếm theo xác śt cho phép tìm kiếm các tập con thuộc tính mà ở đĩ các tập con này được tạo ra một cách ngẫu nhiên.

Thuật tốn lựa chọn thuộc tính LVF (Las Vegas Filter) được Liu và Setiono đưa ra vào năm 1996, thuật tốn LVF bao gồm một thủ tục cĩ thể tạo ra các tập con thuộc tính một cách ngẫu nhiên và một thủ tục nhằm đánh giá xem mỗi tập con được tạo ra cĩ thỏa mãn tiêu chuẩn lựa chọn hay khơng. Dưới đây thể hiện mã giả của thuật tốn LVF (Thuật tốn 2.4):

Một phần của tài liệu (LUẬN án TIẾN sĩ) kỹ thuật học máy phối hợp và tiền xử lý dữ liệu trong việc nâng cao chất lượng phân lớp của các hệ thống phát hiện xâm nhập mạng (Trang 28 - 29)