L ời cam đ oan iii
4.3.2. Thực nghiệm tạo tập huấnluyện cho SVM-kNN 40
Việc tạo tập huấn luyện cho SVM-kNN được thực hiện dựa trên phân cụm HAC kết hợp ngưỡng α. Chúng tơi thực nghiệm trên 5 giá trị ngưỡng α. Sau đĩ, lấy ra những cụm khơng đơn và tính độ chính xác của những mẫu đã được đưa vào cụm, kết quả thu được như bảng 4.
Giá trị α Số cụm thu được Tổng số mẫu trong cụm
Độ chính xác
0.3 20 88 60.08%
0.4 14 72 86.98%
41
0.6 7 34 100%
0.7 5 22 100%
Bảng 4. Kết quả thực nghiệm thuật tốn HAC với 5 giá trị ngưỡng α
Nhận xét: Tại ngưỡng α = 0.4, α = 0.5, α = 0.6, α = 0.7 thì độ chính xác đạt được là 100%. Tuy nhiên, để cĩ được tập huấn luyện tốt cho phân lớp bán giám sát SVM-kNN, thì ngồi độ chính xác cao cần cĩ số lượng tập huấn luyện tốt. Do vậy, giá trị ngưỡng α là 0.5 với số mẫu thu được là 51, là phù hợp làm tập dữ liệu huấn luyện cho phân lớp SVM- kNN.
9 cụm thu được với giá trị ngưỡng α= 0.5 được thể hiện trong bảng 5. Đây cũng là 9 cụm mà khĩa luận sử dụng làm tập dữ liệu đã gán nhãn để huấn luyện SVM-kNN. Tuy nhiên, việc gán nhãn cho lớp cho kết quả chưa tốt (ví dụ cụm 9, tên cụm là thẻ nhớ, chưa bao quát được các thể hiện trong cụm).
STT Tên cụm Các thể hiện đặc trưng
1 Giá Tiền, giá, giá thành
2 Ảnh Camera, chụp hình, hình ảnh, hình, máy ảnh, ảnh, chụp ảnh
3 Nhạc Tai nghe, âm thanh, nghe nhạc, nhạc, loa, loa ngồi
4 Ứng dụng Symbian, hệđiều hành, ứng dụng, tính năng, nhắn tin
5 Bàn phím Phím, bàn phím, navi, phím navi, phím điều khiển, phím quang học, quang học 6 Hình thức Kiểu dáng, màu, màu sắc, mẫu mã, kiểu
42
7 Màn hình Điện dung, điện trở, màn hình, cảm ứng
8 Mạng Mạng, internet, gprs, gps
9 Thẻ nhớ Thẻ nhớ, thẻ, phụ kiện, usb, phần cứng, cấu hình
10 Phim Phim, xem phim
Bảng 5. Các thể hiện đặc trưng cùng các cụm khơng đơn tương ứng