2.2 .Phương pháp sử dụng quan hệ ngữ nghĩa và ngữ pháp
2.2.1. Tổng quan về mơ hình
Mơ hình tổng quát của phương pháp được trình bày trong Hình 2.2.1. Cho một câu s và ws là một nhãn cảm xúc. Đặt e là tập gồmm nhãn cảm xúc, trong đóe={e1, e2, ..., em}. Mục tiêu là gán nhãn cảm xúcws tốt nhất cho câu s, trong
đó ws ∈ {e1, e2, ..., em}.
Mơ hình bao gồm bốn thành phần chính: Tiền xử lý, phân tích ngữ nghĩa, phân tích cú pháp, phân tích câu.
• Mơ-đun tiền xử lý: Cho câu đầu vào s, thực hiện bước tiền xử lý như phân tích câu, gán nhãn từ loại, phân tích cú pháp phụ thuộc. Kết quả nhận được từ quá trình này là trích rút được tập từ mang thơng tin chính là tập NAVA (Noun, Adjective, Verb, Adverb) bao gồm các từ có từ loại danh từ, tính từ, động từ và trạng từ, đồng thời xem xét các cú pháp phụ thuộc
Hình 2.1: Tổng quan về mơ hình. giữa chúng.
• Mơ-đun ngữ nghĩa: Thực hiện phân tích ở mức từ, tính véc-tơ cảm xúc cho mỗi từ trong tập từ NAVA với các khái niệm cảm xúc bằng cách sử dụng cách tính trọng số quan hệ tương hỗ ngữ nghĩa giữa chúng (trọng số PMI). Kết quả là các véc-tơ cảm xúc tương ứng của từng từ trong tập NAVA.
• Mơ-đun cú pháp: Đầu vào là véc-tơ cảm xúc của từng từ trong tậpNAVA được tính ở mơ-đun ngữ nghĩa, mơ-đun ngữ pháp thực hiện phân tích ở mức cụm từ bằng cách sử dụng cú pháp phụ thuộc để điều chỉnh các véc-tơ cảm xúc của mỗi từ được tính ở mơ-đun ngữ nghĩa. Đầu ra là véc-tơ cảm xúc mới đã được điều chỉnh của mỗi từ trong NAVA nếu có cú pháp phụ thuộc.
• Mơ-đun phân tích câu: Đầu vào là véc-tơ cảm xúc của các từ trong tập từ NAVA đã thực hiện ở mô-đun ngữ nghĩa, và được điều chỉnh ở mơ-đun ngữ pháp (nếu có quan hệ cú pháp phụ thuộc). Mơ-đun phân tích câu thực thiện ở mức câu bằng cách tính véc-tơ trung bình của tất cả các từ trong NAVA, từ đó xác định nhãn cảm xúc của câu.