Tổng quan về mơ hình đề xuất

Một phần của tài liệu Phân tích ý kiến người dùng theo khía cạnh bằng phương pháp học sâu (Trang 38 - 39)

Đề tài sẽ đề xuất bốn mơ hình học sâu như mơ hình học sâu CNN, LSTM để huấn luyện theo từng khía cạnh, sau đó là kết hợp mơ hình CNN-LSTM cho phân tích quan điểm theo khía cạnh. Cuối cùng là kết hợp nhiều mơ hình CNN-LSTM để giải quyết hai nhiệm vụ xác định khía cạnh và phân tích quan điểm cho khía cạnh đó. Nghĩa là hai pha sẽ được huấn luyện độc lập, đầu ra của pha thứ nhất sẽ được lấy ngưỡng để thu được vector khía cạnh, sau đó khi huấn luyện pha thứ hai thì đề tài sử dụng vector khía cạnh này kết hợp với đặc trưng trích xuất được trong pha thứ hai thành đặc trưng mới để thực hiện phân loại quan điểm theo khía cạnh. Mơ hình MultiCNN-LSTM là mơ hình tương tự tuy nhiên, đề tài xây dựng chung một mơ hình để giải quyết hai nhiệm vụ xác định khía cạnh và phân tích quan điểm theo khía cạnh chứ khơng tách ra thành hai mơ hình độc lập.

Mơ hình đề xuất của chúng tơi gồm hai phần lớn: Huấn luyện mơ hình và ứng dụng web.

- Huấn luyện mơ hình: từ CSDL là tập dữ liệu chứa các bình luận đã phân loại khía cạnh và ý kiến, chúng tơi bắt đầu làm sạch dữ liệu, bỏ đi các dấu câu, ký tự đặc biệt cũng như các từ không liên quan rồi tiến hành tiền xử lý dữ liệu trích xuất đặc trưng bằng phương pháp TF-IDF. Sau đó tiến hành xây dựng và áp dụng huấn luyện mơ hình trên tập dữ liệu đã tiền xử lý. Cuối cùng đánh giá kết quả và lưu mơ hình đã huấn luyện.

- Ứng dụng web: Ứng dụng web nhận vào văn bản cần nhận dạng, áp dụng các

phương pháp chuẩn hóa dữ liệu đã xây dựng. Sau đó đưa vào mơ hình đã huấn luyện sẵn, tiến hành nhận dạng các khía cạnh, phân loại ý kiến và hiển thị kết quả.

37

Hình 3. 1: Tổng quan mơ hình đề xuất

Một phần của tài liệu Phân tích ý kiến người dùng theo khía cạnh bằng phương pháp học sâu (Trang 38 - 39)

Tải bản đầy đủ (PDF)

(76 trang)