Quan hệ giữa các thành phần tháo luận

Một phần của tài liệu Phân tích ý kiến chủ quan của người dùng từ dữ liệu web (Trang 44 - 45)

Một điều thú vị trong phân tích ý kiến là khi các văn bản được phân tích tạo thành một phần của một một cuộc bàn luận, như trong trường hợp các lượt trong tranh luận chính trị, các bài viết trên diễn đàn tranh luận, hay các nhận xét trong mỗi bài viết của cá nhân. Điểm hấp dẫn ở đây chính là nguồn thơng tin dồi dào được lấy ra từ nhưng đoạn văn bản đĩ, vì những thơng tin như vậy cĩ thể được dùng cho việc gán nhãn phân loại tập các văn bản tốt hơn. Việc sử dụng các quan hệ này cĩ thể đặc biệt hữu ích vì rất nhiều văn bản trong các trường hợp chúng ta đã nĩi cĩ thể rất phức tạp, và do đĩ rất khĩ phân loại, nhưng chúng ta cĩ thể dễ dàng phân loại một văn bản phức tạp nếu chúng ta tìm được trong đĩ các từ chỉ báo về sự đồng tình với một văn bản chỉ rõ xu hướng tích cực hay tiêu cực.

Dựa trên phân tích thủ cơng 100 phản hồi trong các nhĩm thảo luận về 3 chủ đề khác nhau cĩ thể gây tranh luận (sự phá thai, quản lý sử dụng súng, và vấn đề nhập cư), Agrawal trong [1] quan sát thấy rằng quan hệ giữa hai phản hồi thì dường như là đối nghịch nhau – 74% phản hồi đối nghịch nhau, trong đĩ chỉ 7% phản hồi là ủng hộ nhau. Như vậy, giả sử các kết nối phản hồi ám chỉ sự khơng đồng tình, chúng phân loại người dùng một cách hiệu quả thành các phe đối lập theo các phương pháp phân chia đồ thị phụ thuộc duy nhất vào thơng tin nguyên văn trong một văn bản cụ thể.

Tương tự, Mullen và Malouf [21] phân tích hành động trích dẫn giữa những người dùng của diễn đàn bàn luận politics.com – một người dùng cĩ thể tham chiếu đến một bài viết của người dùng khác bằng cách trích dẫn một phần bài viết đĩ hoặc bằng cách chỉ ra tên người viết – người đã được phân loại là tự do hay bảo thủ. Các nhà nghiên cứu thấy rằng … Để thực hiện phân loại xu hướng chính trị, người dùng được phân cụm sao cho người nào cĩ xu hướng trích dẫn cùng một bài viết được đặt cùng một cụm.

39

Thay vì giả sử rằng việc trích dẫn luơn thể hiện sự đồng tình hay bất đồng tình bỏ qua ngữ cảnh, [33] xây dựng một bộ phát hiện sự đồng tình cho nhiệm vụ phân tích các bản ghi các cuộc tranh luận ở quốc hội, trong đĩ bộ phân loại phân loại các tham chiếu tới người khác thể hiện sự đồng tình (như “Tơi hồn tồn ủng hộ quan điểm của ơng A”) hoặc khơng đồng tình. Sau đĩ họ mã hĩa bằng chứng của khả năng cao là đồng tình giữa hai người thành một quan hệ ràng buộc giữa các phát biểu được đưa ra bởi những người này, và phân loại tập thể các phát ngơn riêng xem họ ủng hộ hay phản đối sử dụng một cơng thức minimun-cut cho vấn đề phân loại như đã nĩi. [2] cố gắng làm hồn thiện hơn việc sử dụng thơng tin bất đồng tình.

Một phần của tài liệu Phân tích ý kiến chủ quan của người dùng từ dữ liệu web (Trang 44 - 45)

Tải bản đầy đủ (PDF)

(65 trang)