:Trích xuất quan điểm

Một phần của tài liệu TỔNG HỢP QUAN ĐIỂM DỰA TRÊN MÔ HÌNH THỐNG KÊ VÀ ỨNG DỤNG VÀO KHAI PHÁ QUAN IỂM TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT (Trang 29 - 30)

Thuật tốn: thuật tốn thực hiện trên một tài liệu thuộc về một chủ đề riêng biệt.

Khơng thực hiện cho trích trọn quan điểm trên nhiều tài liệu. Hệ thốngtập trung vào truy vấn, với các bước thuật tốn thực hiện như sau:

Bước 1: Các câu truy vấn được phân tích để trích xuất ra tên trong câu truy

vấn. Những tên này sẽ hình thành từ khĩa tìm kiếm. Ngồi ra, các từ trong câu truy vấn sẽ được kết hợp với danh sách từ nhận định để tìm ra loại quan

điểm đang được người dùng truy vấn. Trong trường hợp khơng cĩ từ nào

trong danh sách từ quan điểm phù hợp thì các từ sẽ được chuyển qua WordNet và lấy ra các từ đồng nghĩa và lại tiến hành tìm từ phù hợp trong danh sách từ.

30

Bước 3: với mỗi câu, tìm sự xuất hiện của từ khĩa truy vấn w. Giả sử vị trí

của w là vị trí từ i

Bước 4: Kiểm tra tất cả các từ ở vị trí từ i-6 đến i+6. Nếu cĩ một từ nhận định trong khoảng đĩ, đánh dấu đĩ là một câu quan điểm về từ w. Nếu

khơng thì quay lại bước 2.

Bước 5: nếu từ quan điểm xuất hiện ở vị trí thứ k, kiểm tra các từ ở vị trí (k-

2) đến (k+2). Nếu cĩ từ ở trong khoảng này nằm trong danh sách từ phủ định thì tiến hành đảo ngược quan điểm của câu.

Bước 6: Từ danh sách trọng số, tính tốn trọng số của từ nhận định. Việc

tính tốn này được lưu lại để đảo chiều quan điểm khi cân. Ví dụ một từ cĩ trọng số là +1, nếu đảo lại thì sẽ cĩ trọng số là -1. Tiếp theo tính độ phân cực trung bình của câu bằng cách chia cho tổng số từ nhận định tìm thấy. • Bước 7: Phân cực quan điểm của câu được chia như sau: (gọi S là phân cực

trung bình)

o S>1 =>quan điểmrất tích cực

o 0,3<S<1 =>quan điểmtích cực

o -0,3<S<0.3=>quan điểmtrung tính

o -1<S<-0,3 =>quan điểm tiêu cực

o S<-1 =>quan điểmrất tiêu cực

Bước 8: Trở về bước 2.

Các tác giả đã tiến hành thực nghiệm và cho thấy vị trí các từ quan điểm thường xuất hiện ở vị trí trong khoảng i-6 đến i+6 với i là vị trí của từ khĩa tìm kiếm. Kết quả

đánh giá thực nghiệm cũng cho thấy độ hồi tưởng và độ chính xác là đạt kết quả cao nhất.

Một phần của tài liệu TỔNG HỢP QUAN ĐIỂM DỰA TRÊN MÔ HÌNH THỐNG KÊ VÀ ỨNG DỤNG VÀO KHAI PHÁ QUAN IỂM TRONG VĂN BẢN TIN TỨC TIẾNG VIỆT (Trang 29 - 30)