Kết luận chương 1

Một phần của tài liệu Luận án Tiến sĩ Tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 59 - 60)

Trong chương này, luận án đã trình bày các kiến thức liên quan khi giải bài toán trích rút tóm tắt bằng ngôn ngữ từ một cơ sở dữ liệu dựa trên lý thuyết tập mờ.

Phương pháp trích rút tóm tắt bằng ngôn ngữ (Linguistic Summarization Method -

LSMd) được coi là một công cụđể khai phá tri thức diễn đạt bằng ngôn ngữ từ tập dữ liệu. Cấu trúc câu tóm tắt có chứa từlượng hóa được sử dụng có hiệu quả trong nhiều ứng dụng thực tế. Trong các LSMd dựa trên lý thuyết tập mờ để sinh ra các câu tóm tắt diễn đạt bằng ngôn ngữ tự nhiên, việc phân hoạch mờ miền tham chiếu bởi các tập mờ đóng trong đầu vào đóng vai trò quyết định đến tập câu tóm tắt ở đầu ra và tri thức được truyền tải qua nội dung thông tin của các câu tóm tắt này. Một số vấn đề hạn chế còn tồn tại trong các LSMd dựa trên lý thuyết tập mờ sẽ được giải quyết trong luận án dựa trên phương pháp luận của lý thuyết ĐSGT. Do

đó, các kiến thức cơ bản trong lý thuyết ĐSGT đã được trình bày ở phần cuối

chương.

Các kiến thức cơ sở trong chương 1 sẽ được sử dụng trong trình bày đề xuất cho phương pháp mới giải bài toán trích rút tóm tắt bằng ngôn ngữ dựa trên lý thuyết ĐSGT.

CHƯƠNG 2.VẤN ĐỀ NỘI DUNG THÔNG TIN CÂU TÓM TẮT VÀ BIỂU DIỄN TẬP MỜ CỦA MIỀN NGÔN NGỮ THUỘC TÍNH

Đầu ra của bài toán trích rút tóm tắt bằng ngôn ngữ từ tập dữ liệu là các câu diễn đạt bằng ngôn ngữ tự nhiên theo một mẫu câu được chọn trước. Người dùng giải nghĩa nội dung thông tin các câu tóm tắt dựa trên ngữ nghĩa vốn có của các hạng từ đã được gán cho chúng bởi cộng đồng. Trong khi đó, các hạng từ được chọn vào câu tóm tắt là kết quả tính toán dựa trên các hàm thuộc của các tập mờ được thiết kế để biểu diễn ngữ nghĩa của chúng. Do đó, cần có một phương pháp

luận làm cơ sở đảm bảo tính đúng đắn của việc gán các hạng từ ngôn ngữ cho các tập mờ, khi đó mới đảm bảo người dùng nhận được nội dung thông tin đúng đắn về

tập dữ liệu thông qua câu tóm tắt được sinh ra từ thuật toán tương tác với các tập mờ. Trong chương này, luận án trình bày vấn đề nội dung thông tin của câu tóm tắt;

cơ sở phương pháp luận để giải quyết vấn đề này dựa trên khái niệm giải nghĩa được trong logic của Tarski [44]; ý tưởng giải quyết dựa trên lý thuyết ĐSGT. Sau

đó, tác giả trình bày các cơ sở phương pháp luận để đề xuất thủ tục HA-TFS-MG xây dựng các tập mờ hình thang từ bộ tham số định lượng của một cấu trúc ĐSGT. Các tập mờnày được chứng minh bảo toàn các quan hệ ngữnghĩa vốn có của các từ

gán cho chúng. Hơn nữa, chúng cũng có khảnăng mở rộng tương thích với tính mở

rộng được của tập hạng từ ngôn ngữ của miền hạng từ thuộc tính.

2.1. Vai trò của khung nhận thức trong bài toán trích rút tóm tắt bằng ngôn ngữ dựa trên lý thuyết tập mờ

Một phần của tài liệu Luận án Tiến sĩ Tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 59 - 60)

Tải bản đầy đủ (PDF)

(148 trang)