Tìm kiếm theo kinh nghiệm qua xếp hạng thuộc tính- 123docz.net

Input

D - Tập dữ liệu

F - Tập hợp tất cả các thuộc tính trong tập dữ liệu D U - Tiêu chí đo lường

W - Bộ phân lớp

Output

BestSubset - Tập M thuộc tính thỏa tiêu chí khơng ổn định

Begin

1: Initialize: L = {}

2: For each fi ∈ F do

3: S(i) = compute (fi, U)

4: Đặt fi vào L tùy theo giá trị của S(i) 5: End for

6: BestClassification = 0

7: BestSubset = 

8: For each fi ∈ L do

9: TempSubset = BestSubset ∪ fi

10: TempClassification = WrapperClassification (TempSubset, D, W)

11: If (TempClassification > BestClassification) then

12: BestSubset = TempSubset 13: BestClassification = TempClassification 14: End if 15: End for 16: Return BestSubset End c) Tìm kiếm xác suất

Cĩ thể nĩi rằng các thuật tốn tìm kiếm xác suất là kết quả của việc các nhà nghiên cứu tiếp tục theo đuổi mục đích tìm kiếm tập con tối ưu mà khơng muốn thực hiện việc tìm kiếm tồn bộ trong khơng gian tìm kiếm. Khơng giống như hai thuật tốn tìm kiếm theo kinh nghiệm và tìm kiếm tồn bộ được trình bày ở trên, các thuộc tính khơng tuần tự được loại bỏ/thêm vào từ một tập các thuộc tính cho trước. Thuật tốn tìm kiếm theo xác śt cho phép tìm kiếm các tập con thuộc tính mà ở đĩ các tập con này được tạo ra một cách ngẫu nhiên.

Thuật tốn lựa chọn thuộc tính LVF (Las Vegas Filter) được Liu và Setiono đưa ra vào năm 1996, thuật tốn LVF bao gồm một thủ tục cĩ thể tạo ra các tập con thuộc tính một cách ngẫu nhiên và một thủ tục nhằm đánh giá xem mỗi tập con được tạo ra cĩ thỏa mãn tiêu chuẩn lựa chọn hay khơng. Dưới đây thể hiện mã giả của thuật tốn LVF (Thuật tốn 2.4):

Tìm kiếm theo kinh nghiệm qua xếp hạng thuộc tính

Lựa chọn thuộc tính LVF

Kỹ thuật tăng mẫu SMOTE