Một số nghiên cứu phân tích ý kiến đã cĩ

Một phần của tài liệu Phân tích ý kiến chủ quan của người dùng từ dữ liệu web (Trang 25 - 27)

Nghiên cứu về khai phá ý kiến bắt đầu với việc xác định các từ thể hiện ý kiến (hoặc cảm nhận) như: tốt, tuyệt, tuyệt vời, chán, dở … Rất nhiều nhà nghiên cứu đã làm việc khai phá các từ như vậy và xác định xu hướng ngữ nghĩa của chúng (tích cực hay tiêu cực). Trong [9], các tác giả xác định một vài quy tắc ngữ pháp cĩ thể dùng để xác định các từ chỉ ý kiến và xu hướng ngữ nghĩa của chúng từ một tập dữ liệu lớn. Phương pháp này đã được áp dụng, mở rộng và cải thiện trong [7,15,26]. Trong [12,17], phương pháp bootstrapping được đưa ra, sử dụng một tập

20

nhỏ các từ mang ý kiến để tìm để tìm từ đồng nghĩa và trái nghĩa với chúng trong WordNet.

Sự phát triển tiếp theo là phân loại cảm nhận các nhận xét về sản phẩm ở mức văn bản [6,22,32]. Mục tiêu của nhiệm vụ này là phân loại mỗi bài phê bình xem chúng thể hiện cảm nhận tích cực hay tiêu cực về một đối tượng nào đĩ (như một bộ phim, một máy ảnh, hay một chiếc xe).

Một vài nhà nghiên cứu cũng thực hiện việc phân loại cảm nhận ở mức câu [17,37,39] xem mỗi câu thể hiện tình cảm tích cực hay tiêu cực. Một số mơ hình khai phá ý kiến dựa trên đặc tính sản phẩm và tổng quát hĩa được đưa ra trong [12,20]. Mơ hình này đưa ra một cơng thức hồn thiện hơn cho vấn đề khai phá ý kiến. Nĩ xác định những mẫu thơng tin chính cĩ thể khai phá và mơ tả cách một bản tổng kết ý kiến cĩ cấu trúc cĩ thể được tạo ra từ các văn bản khơng cấu trúc. Vấn đề khai phá dữ liệu từ các câu so sánh được giới thiệu trong [9,13].

Tất cả những nghiên cứu trên đây đều thử nghiệm áp dụng cho Tiếng Anh. Những nghiên cứu dành cho tiếng Việt cịn rất ít. Trong chương 2 và 3 của luận văn, em sẽ trình bày một số phương pháp cĩ thể áp dụng cho tiếng Việt, và tiến hành kiểm thử chúng trên tập dữ liệu ý kiến tiếng Việt để đánh giá được khả năng phân tích ý kiến chủ quan của các phương pháp đĩ.

21

Chƣơng 2 - CÁC PHƢƠNG PHÁP PHÂN TÍCH Ý KIẾN SỬ DỤNG KỸ THUẬT PHÂN LOẠI VÀ XỬ LÝ NGƠN NGỮ TỰ NHIÊN

Cách tiếp cận chủ yếu trong nhiều ứng dụng khai phá ý kiến hiện nay là dựa trên kỹ thuật phân loại văn bản. Nội dung của chương 2 bao gồm một số kỹ thuật phân tích ý kiến dựa trên các phương pháp phân loại: phân loại ý kiến ở mức văn bản, mức câu, và kỹ thuật sinh bộ từ vựng ý kiến dùng để phân tích ý kiến.

Một phần của tài liệu Phân tích ý kiến chủ quan của người dùng từ dữ liệu web (Trang 25 - 27)

Tải bản đầy đủ (PDF)

(65 trang)