Bài toán: Xét một tập dữ liệu chứa m mẫu ( ,x yi i)mi1 trong đó d i
xR và
1, 2,...,
i
y k là nhãn của mẫu thứ i và k2, mục đích cần phải tìm k siêu phẳng
T
i i
a zb(a, z Rn, a 0, b R,i=1,2…,k) chia dữ liệu ra làm k tập có cùng thuộc tính.
Mô hình bài toán :
Hình 3.1.Mô hình mới dựa trên GA và SVM
Trainning Data
Tham số của Kernel
MSVM - (SVM + OAA) Thuật toán GA Tham số MSVM (Tốt nhất) MSVM (SVM + OAA) Testing Data Lỗi nhỏ nhất Tham số cho MSVM Validation Data
+Dữ liệu được chia thành các tập dữ liệu huấn luyện(Trainning Data) và tập dữ liệu kiểm thử (Testing Data.)
+Giải thuật GA thực thi việc “tìm kiếm” bộ tham số của kernel với tập dữ liệu huấn luyện sao cho lỗi của đa phân lớp (SVM + OAA ) là nhỏ nhất
+ Sử dụng bộ tham số vừa tìm được thực thi kiếm thử, đánh giá mô hìnhvới tập dữ liệu Testing
Như vậy thuật toán thực thi của mô hình như sau:
Đầu vào là tập dữ liệu chứa m mẫu ( ,x yi i)mi1 trong đó d i
xR và yi1, 2,...,k là nhãn của mẫu thứ i và k2.
Bƣớc 1: Phân tách dữ liệu 70% là tập Train và 30% là tập Test
Bƣớc 2: Từ tập Train chia 70% là tập Training và 30% là tập Validation.
Bƣớc 3: +Tìm kiếm hàm Kernel thích hợp từ mô hình tạo bởi hai tập là Training và Validation.
+ Tìm kiếm Kernel thích hợp được thực thi bởi việc tìm kiếm tham số tốt nhất của Kernel dựa vào GA sao cho lỗi phân lớp dựa trên One against all và SVM đối với Trainning và Validation là nhỏ nhất.
+ Lỗi của phân lớp:
1 1 N i i TongErr Err N
với Erri là lỗi của lớp thứ i
Bƣớc 4 : Kiểm tra, đánh giá mô hình với tập Test bằng hàm Kernel thích hợp Đầu ra là tổng trung bình lỗi
1 1 N i i TongErr Err N
trong quá trình học với tập Test.
Như vậy kết quả lỗi cuối cùng để đánh giá mô hình.