Sau quá trình chuyển đổi từ MIML thành SIML, luận văn tiếp tục áp dụng phương pháp chuyển đổi nhị phân cho tập dữ liệu đa nhãn trên. Phương pháp nhị phân là phương pháp xây dựng |L| bộ phân lớp nhị phân: * + cho L nhãn khác nhau. Dữ liệu trong mỗi bộ phân lớp được gán nhãn l1 nếu nó thuộc lớp L1, các dữ liệu
20
khác được gán nhãn – . Phương pháp này là phương pháp hiểu quả nhất để sử dụng bộ phân lớp nhị phân vào phân lớp đa nhãn. Hình 6, biểu diễn bốn tập dữ liệu kết quả thu được khi sử dụng phương pháp chuyển đổi nhị phân. Theo [11], nhiều công trình nghiên cứu của Boutell (2004) , Goncalves và Quaresma (2003) , Lauser và Hotho (2003) , Li và Ogihara (2003) đã chứng tỏ rằng phương pháp này có tính hiệu quả.
Hình 3.2 : Bốn tập dữ liệu được tổ chức phân lớp theo chuyển đổi nhị phân
Áp dụng phương pháp chuyển đổi nhị phân trên đây cho việc phân lớp miền dữ liệu khách sạn ở 1000 khách sạn ở Việt Nam, luận văn tiến hành xây dựng tập các nhãn (lớp) trên lĩnh vực này như sau :
Sự phục vụ của nhân viên : Dữ liệu thuộc lớp này bao gồm:
o Những đánh giá về thái độ phục vụ của nhân viên khách sạn bao gồm : lễ tân, dọn phòng, bảo vệ, quản lý, nhân viên nhà hàng, ...
o Các dịch vụ phục vụ đi kèm
Chất lượng phòng, khách sạn : Bao gồm các đánh giá dưới hình thức sau : o Nhận xét cảm tưởng chung về khách sạn
o Nhận xét về chất lượng phòng ốc
Chất lượng đồ ăn : Bao gồm các đánh giá về chất lượng đồ ăn, bữa ăn. Vị trí và giá cả : Dữ liệu lớp này bao gồm :
21
o Những đánh giá về vị trí, không gian, mức độ thuận lợi mà khách sạn mang lại cho khách hàng
o Những đánh giá về giá cả phòng, giá đồ ăn và giá các dịch vụ đi kèm. Trang thiết bị : Bao gồm các đánh giá về trang thiết bị, nội thất của khách sạn.