Kỹ thuật sinh ra bộ từ vựng ý kiến

Một phần của tài liệu Phân tích ý kiến chủ quan của người dùng từ dữ liệu web (Trang 39)

Trong các phần trước, chúng ta đã thấy rằng các từ ý kiến được triển khai trong rất nhiều nhiệm vụ phân loại. Giờ chúng ta sẽ xem xét cách tạo ra chúng. Từ ý kiến tích cực được dùng để thể hiện trạng thái thỏa mãn, trong khi từ ý kiến tiêu cực dùng để thể hiện trạng thái khơng mong muốn. Ví dụ các từ tích cực như: đẹp, tuyệt, tốt, hồn hảo.., các từ tiêu cực là xấu, chán, tệ… Ngồi các từ riêng, cũng cĩ các cụm từ hay thành ngữ khác… chúng được gọi chung là từ vựng ý kiến. Chúng là cơng cụ để phân tích ý kiến.

Trong thực tế, các từ ý kiến cĩ thể được chia thành hai loại, loại cơ bản và loại so sánh. Tất cả các ví dụ ở trên là loại cơ bản. Các từ ý kiến thuộc loại so sánh để thể hiện các ý kiến so sánh hơn và so sánh nhất. Khơng giống như các từ ý kiến loại cơ bản, các từ loại so sánh khơng thể hiện một chiều hướng tình cảm về đối tượng, mà nĩ so sánh giữa hai đối tượng với nhau, như “Xe x tốt hơn xe y”. Câu này khơng thể hiện ý kiến là xe nào tốt, xe nào dở, mà chỉ nĩi rằng trong so sánh với xe y, xe x tốt hơn, và so sánh với xe x, xe y tệ hơn. Do đĩ, mặc dù chúng ta vẫn cĩ thể gán một từ so sánh thành tích cực hay tiêu cực, chúng ta khơng thể dùng cách giống với từ ý kiến loại cơ bản.

Để thu thập danh sách từ ý kiến, 3 phương pháp chính đã được nghiên cứu: thủ cơng, dựa trên từ điển, và dựa trên văn bản. Phương pháp thủ cơng rất tốn thời gian và do dĩ thường khơng được dùng riêng mà được kết hợp với một phương pháp tự động nào đĩ như bước kiểm tra cuối cùng vì các phương pháp tự động cĩ thể gây ra lỗi. Sau đây chúng ta bàn về hai phương pháp tự động.

Một phần của tài liệu Phân tích ý kiến chủ quan của người dùng từ dữ liệu web (Trang 39)

Tải bản đầy đủ (PDF)

(65 trang)