Kết luận chương 1

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 63 - 64)

Trong chương này, luận án đã trình bày các kiến thức liên quan khi giải bài toán trích rút tóm tắt bằng ngôn ngữ từ một cơ sở dữ liệu dựa trên lý thuyết tập mờ. Phương pháp trích rút tóm tắt bằng ngôn ngữ (Linguistic Summarization Method -

LSMd) được coi là một công cụ để khai phá tri thức diễn đạt bằng ngôn ngữ từ tập dữ liệu. Cấu trúc câu tóm tắt có chứa từ lượng hóa được sử dụng có hiệu quả trong nhiều ứng dụng thực tế. Trong các LSMd dựa trên lý thuyết tập mờ để sinh ra các câu tóm tắt diễn đạt bằng ngôn ngữ tự nhiên, việc phân hoạch mờ miền tham chiếu bởi các tập mờ đóng trong đầu vào đóng vai trò quyết định đến tập câu tóm tắt ở đầu ra và tri thức được truyền tải qua nội dung thông tin của các câu tóm tắt này. Một số vấn đề hạn chế còn tồn tại trong các LSMd dựa trên lý thuyết tập mờ sẽ được giải quyết trong luận án dựa trên phương pháp luận của lý thuyết ĐSGT. Do đó, các kiến thức cơ bản trong lý thuyết ĐSGT đã được trình bày ở phần cuối chương.

Các kiến thức cơ sở trong chương 1 sẽ được sử dụng trong trình bày đề xuất cho phương pháp mới giải bài toán trích rút tóm tắt bằng ngôn ngữ dựa trên lý thuyết ĐSGT.

TIEU LUAN MOI download : skknchat@gmail.com

56

CHƯƠNG 2. VẤN ĐỀ NỘI DUNG THÔNG TIN CÂU TÓM TẮT VÀ BIỂU DIỄN TẬP MỜ CỦA MIỀN NGÔN NGỮ THUỘC TÍNH

Đầu ra của bài toán trích rút tóm tắt bằng ngôn ngữ từ tập dữ liệu là các câu diễn đạt bằng ngôn ngữ tự nhiên theo một mẫu câu được chọn trước. Người dùng giải nghĩa nội dung thông tin các câu tóm tắt dựa trên ngữ nghĩa vốn có của các hạng từ đã được gán cho chúng bởi cộng đồng. Trong khi đó, các hạng từ được chọn vào câu tóm tắt là kết quả tính toán dựa trên các hàm thuộc của các tập mờ được thiết kế để biểu diễn ngữ nghĩa của chúng. Do đó, cần có một phương pháp luận làm cơ sở đảm bảo tính đúng đắn của việc gán các hạng từ ngôn ngữ cho các tập mờ, khi đó mới đảm bảo người dùng nhận được nội dung thông tin đúng đắn về tập dữ liệu thông qua câu tóm tắt được sinh ra từ thuật toán tương tác với các tập mờ. Trong chương này, luận án trình bày vấn đề nội dung thông tin của câu tóm tắt; cơ sở phương pháp luận để giải quyết vấn đề này dựa trên khái niệm giải nghĩa được trong logic của Tarski [44]; ý tưởng giải quyết dựa trên lý thuyết ĐSGT. Sau đó, tác giả trình bày các cơ sở phương pháp luận để đề xuất thủ tục HA-TFS-MG xây dựng các tập mờ hình thang từ bộ tham số định lượng của một cấu trúc ĐSGT. Các tập mờ này được chứng minh bảo toàn các quan hệ ngữ nghĩa vốn có của các từ gán cho chúng. Hơn nữa, chúng cũng có khả năng mở rộng tương thích với tính mở rộng được của tập hạng từ ngôn ngữ của miền hạng từ thuộc tính.

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 63 - 64)

Tải bản đầy đủ (DOCX)

(157 trang)
w