Cỏc phương phỏp kết hợp văn bản trong túm tắt đa văn bản

Một phần của tài liệu Luận án tiến sĩ nghiên cứu, phát triển một số phương pháp tóm tắt văn bản sử dụng kĩ thuật học sâu (Trang 31 - 33)

Đối với bài toỏn túm tắt đa văn bản, vấn đề đặt ra đầu tiờn là việc kết hợp cỏc văn bản trong tập văn bản nguồn này như thế nào?

19

Hỡnh 1.2. Phương phỏp xử lý túm tắt từng đơn văn bảntrong túm tắt đa văn bản

Hiện nay cú hai phương phỏp thường được sử dụng để giải quyết vấn đề này là: - Phương phỏp thứ nhất: Kết hợp tất cả cỏc văn bản đầu vào thành một văn bản duy nhất gọi là siờu văn bản, rồi thực hiện túm tắt đối với siờu văn bản này để sinh ra bản túm tắt cuối cựng. Phương phỏp này đưa bài toỏn túm tắt đa văn bản trở thành bài toỏn túm tắt đơn văn bản và cú thể sử dụng cỏc kỹ thuật túm tắt đơn văn bản để sinh ra bản túm tắt cuối cựng.

- Phương phỏp thứ hai: Trước hết, từng văn bản của tập đa văn bản được túm tắt để sinh ra văn bản túm tắt tương ứng. Sau đú, cỏc văn bản túm tắt này sẽ được kết hợp lại thành một văn bản túm tắt tổng hợp. Sau đú, văn bản túm tắt tổng hợp này sẽ được xử lý túm tắt bằng cỏc kỹ thuật túm tắt đơn văn bản để sinh ra văn bản túm tắt cuối cựng, đõy cũng chớnh là bản túm tắt kết quả của tập đa văn bản nguồn cần túm tắt. Hỡnh 1.2 biểu diễn ý tưởng của phương phỏp xử lý túm tắt từng đơn văn bản trong túm tắt đa văn bản.

Phương phỏp tiếp cận thứ nhất dễ nắm bắt được cỏc thụng tin mới lạ hơn so với phương phỏp tiếp cận thứ hai. Phương phỏp tiếp cận thứ hai thực hiện túm tắt từng văn bản trước làm cho độ dài văn bản đầu vào của mụ hỡnh túm tắt đa văn bản giảm nờn bản túm tắt cuối cựng sẽ cú độ chớnh xỏc cao.

20

Một phần của tài liệu Luận án tiến sĩ nghiên cứu, phát triển một số phương pháp tóm tắt văn bản sử dụng kĩ thuật học sâu (Trang 31 - 33)

Tải bản đầy đủ (PDF)

(181 trang)