Dựa trên thuật tốn điều chỉnh sự quá khớp và quá khái quát dữ liệu trên mặt phẳng hai chiều, chương trình demo đã được cài đặt bằng ngơn ngữ Java, cơng nghệ Applet trên mơi trường JBuider8. Sau khi được biên dịch chương trình cĩ thể chạy trực tiếp bằng trình duyệt Internet Explorer, giao diện như sau:
Hình 4-1: Giao diện chương trình Demo
Trên giao diện này, bao gồm các thành phần như sau:
+ Textbox Threshold : nhập giá trị ngưỡng khoảng cách sử dụng trong thuật tốn tìm các Positive Clauses.
+ Textbox Coefficient : nhập giá trị cho hệ số sử dụng ở thuật tốn mở rộng Homogenous Clauses.
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING
+ Button Positive Clauses: tìm các Positive Clauses. + Button Homogenous: tìm các Homogenous Clauses. + Button Expand: mở rộng các Homogenous Clauses.
+ Tọa độ ở gĩc trái thanh Status: vị trí con trỏ chuột trên màn hình, gốc tọa độ (0,0) là gĩc trái dưới của nàm hình.
Trong mặt phẳng hai chiều của giao diện này:
+ Chiều ngang biểu diễn giá trị thuộc tính thứ nhất. + Chiều dọc biểu diễn cho giá trị thuộc tính thứ hai. + Mỗi ơ vuơng nhỏ sẽ đại diện cho một mẫu.
Chương trình này sử dụng minh họa cho thuật tốn, để đơn giản chỉ xét trường hợp giá trị thuộc tính nguyên dương, giá trị nhỏ nhất là 0 được tính từ gĩc trái dưới của màn hình. Thơng tin mỗi mẫu gồm cĩ giá trị hai thuộc tính và một lớp mà mẫu này thuộc về, giả sử lớp positive hoặc negative. Cách nhập dữ liệu cho chương trình như sau:
+ Di chuyển con trỏ chuột trên giao diện sao cho con số ở gĩc trái dưới của giao diện hiển thị đúng với giá trị hai thuộc tính của mẫu.
+ Click trái chuột: đặt một mẫu positive tại vị trí con trỏ chuột, biểu thị bằng dấu “+“.
+ Click phải chuột: đặt một mẫu negative tại vị trí con trỏ chuột, biểu thị bằng dấu “-“.
Sau khi đã nhập thơng tin của tất cả các mẫu cho chương trình thực hiện lần lượt các bước sau:
+ Click button Positive Clauses: kết quả là các Positive Clauses được biểu thị bằng các hình chữ nhật.
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING
+ Click button Homogenous: kết quả là các Homogenous Clauses cho mỗi Positive Clauses, được biểu thị bằng các hình trịn bên trong hình chữ nhật.
+ Click button Expand: kết quả là các Homogenous Clauses đã được mở rộng.
Kết quả cĩ được là các Homogenous Clauses đã được mở rộng, biểu thị là các hình trịn màu đỏ. Từ đây, muốn dự đốn lớp cho một mẫu mới, ta chỉ việc di chuyển con trỏ chuột trên màn hình giao diện tương tự như khi nhập dữ liệu, sao cho con số ở gĩc trái dưới màn hình bằng với giá trị hai thuộc tính của mẫu cần dự đốn lớp, nếu con trỏ chuột nằm trong vùng hình trịn biểu thị cho Homogenous Clauses thì mẫu này thuộc lớp positive ngựơc lại mẫu này thuộc lớp negative.
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING Mẫu Thuộc tính 1 Thuộc tính 2 Lớp x1 9 8 negative x2 10 6 positive x3 11 8 negative x4 11 7 positive x5 11 6 positive x6 11 5 positive x7 12 7 positive x8 12 6 positive x9 13 7 negative x10 13 5 negative x11 15 7 negative x12 15 6 negative x13 16 8 positive x14 16 4 positive x15 17 7 positive x16 17 6 positive x17 17 5 positive x18 18 7 negative x19 18 6 positive x20 19 7 positive x21 19 5 negative x22 20 6 positive Bảng 4-1: Ví dụ một tập mẫu hai chiều
Bước 1: Sau khi nhập tồn bộ dữ liệu trên vào chương trình, mẫu positive là dấu “+”, mẫu negative là dấu “-”, màn hình giao diện như sau:
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING
Hình 4-2: Giao diện chương trình sau khi nhập dữ liệu
Bước 2: Với giá trị Threshold =3, click button Positive Clauses ta sẽ cĩ các Positive Clauses là các hình chữ nhật trong giao diện của chương trình như sau:
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING
Hình 4-3: Giao diện chương trình sau khi tìm các Positive Clauses
Chương trình đã tìm được 4 Positive Clauses.
Bước 3: Click button Homogenous để tìm các Homogenous Clauses cho mỗi Positive Clauses, kết quả tìm được như sau:
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING
Hình 4-4: Giao diện chương trình sau khi tìm các Homogenous Clauses
Bước 4: Mở rộng các Homogenous Clauses, chọn hệ số Coefficient =4, sau đĩ click button Expand. Kết quả của bước này như sau:
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING
Hình 4-5: Giao diện chương trình sau khi mở rộng Homogenous Clauses
Ta đã cĩ các Homogenous Clauses được mở rộng, biểu diễn bằng các hình trịn, các hình trịn này dùng để dự đốn lớp cho các mẫu mới. Giả sử, bây giờ ta cần dự đốn lớp cho hai mẫu sau y1 (12, 5) và y2 (14, 6), ta thấy y1 nằm trong vịng trịn lớn nhất bên trái, nên y1 được dự đốn thuộc lớp positive. Cịn mẫu y2 (14, 6) khơng nằm trong bất kỳ một vịng trịn nào nên dự đốn lớp cho mẫu y2 thuộc về là negative.
CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING