Mơ hình Dependency-Sentiment-LDA

Một phần của tài liệu Vu trong hoa EXTRACTING ASPECT IN OPINIO (Trang 41 - 43)

Ở mơ hình Dependency-Sentiment-LDA, các tác giả bỏ đi giả thiết độc lập của tầng quan điểm so với mơ hình Sentiment-LDA. Họ dựa vào quan sát rằng quan điểm được thể hiện trong câu theo một cách mạch lạc, hay nĩi cách khác quan điểm của các từ trong câu là cĩ liên quan. Trong mơ hình này, quan điểm của các từ được biểu diễn dạng chuỗi Markov, ở đĩ quan điểm của các từ phụ thuộc vào quan điểm của từ trước nĩ.

1. Với mỗi văn bản d, chọn một phân bố chủ đề , chọn một phân bố  là phân bố của các giá trị quyết định. Giá trị quyết định cho biết sự ảnh hưởng của

𝑤𝑖−1 tới 𝑤𝑖

2. Với mỗi chủ đề z, trong văn bản d, chọn phân bố quan điểm  ,𝑧

3. Với mỗi từ wi trong văn bản d

3.1. Chọn một chủ đề zi từ Multinomial ()

3.2. Chọn một giá trị quyết định xi từ Multinomial()

3.3. Chọn một nhãn quan điểm 𝑙𝑖 cho từ 𝑤𝑖 phụ thuộc vào giá trị của 𝑥𝑖 3.4. Chọn một từ 𝑤𝑖 từ xác suất trên các từ được định nghĩa bởi 𝑧𝑖 và

nhãn quan điểm 𝑙𝑖, 𝑧𝑖,𝑙𝑖

3.1.2. Mơ hình của Zhao Wayne Xin vào cộng sự

Zhao Wayne Xin và cộng sự, 2010 [21] đề xuất mơ hình đồng thời trích xuất các khía cạnh và quan điểm bằng cách kết hợp mơ hình LDA và Maximum Entropy. Cụ thể, họ giả thiết cĩ tất cả T khía cạnh trong tập dữ liệu, và mỗi văn bản đánh giá sẽ chứa một tập kết hợp các khía cạnh. Mỗi câu trong văn bản sẽ được gán với một khía cạnh (thay vì một từ gán với một chủ đề). Giả thiết về quá trình sinh văn bản được các tác giả đưa ra như sau:

1. Chọn ra một số phân bố: mơ hình nền, mơ hình khía cạnh chung, mơ hình quan điểm chung. Tất cả đều là các phân bố đa thức trên các từ.

2. Với mỗi văn bản d, chọn ra phân bố chủ đề  như trong LDA chuẩn.

3. Với mỗi câu trong 𝑑, gán cho nĩ một khía cạnh 𝑧 từ . Với mỗi từ trong câu này, cĩ một số sự lựa chọn cho nĩ: từ đĩ cĩ thể mơ tả khía cạnh chi tiết (waiter, staff), hoặc khía cạnh GENERAL, hoặc quan điểm chung chung (good, great), hoặc

quan điểm cụ thể (friendly), hoặc từ nền. Để phân biệt các lựa chọn này họ đưa ra thêm một số biến biểu thị.

Khĩa luận tốt nghiệp Vũ Trọng Hĩa

30

Một phần của tài liệu Vu trong hoa EXTRACTING ASPECT IN OPINIO (Trang 41 - 43)

Tải bản đầy đủ (PDF)

(70 trang)