Kết luận chương 2

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 86 - 88)

Trong chương này, luận án đã trình bày vấn đề về nội dung thông tin câu tóm tắt và thiết kế tập mờ biểu diễn ngữ nghĩa cho các hạng từ trong khung nhận thức ngôn ngữ (LFoC) của thuộc tính dựa trên phương pháp luận ĐSGT. Để đảm bảo tính đúng đắn của nội dung thông tin khi người dùng sử dụng các câu tóm tắt trong giải bài toán thực tế, theo khái niệm giải nghĩa trong logic của Tarski, các tập mờ biểu diễn ngữ nghĩa cho các từ ngôn ngữ phải là ảnh đẳng cấu ngữ nghĩa của miền hạng từ các thuộc tính. Dựa trên lý thuyết ĐSGT, luận án đã chỉ ra hai kết luận về khung nhận thức bằng ngôn ngữ (LFoC) ℱA của thuộc tính A: (1) ℱA là một cấu trúc đa ngữ nghĩa dựa trên quan hệ thứ tự ngữ nghĩa và quan hệ tính chung – riêng dựa trên ngữ nghĩa vốn có của các hạng từ trong ngôn ngữ tự nhiên; (2) ℱA có tính mở rộng được bằng bổ sung thêm các hạng từ có tính riêng lớn hơn, đây là tính chất cần thiết trong nhận thức thế giới thực bằng ngôn ngữ của con người. Sau đó, luận án đề xuất thủ tục HA-TFS-MG xây dựng các tập mờ hình thang ở dạng cấu trúc đa thể để biểu diễn ngữ nghĩa cho các hạng từ trong LFoC của mỗi thuộc tính A. Các định lý đã chứng minh rằng các tập mờ hình thang này tạo thành một cấu trúc bảo toàn các quan hệ ngữ nghĩa (quan hệ thứ tự và quan hệ chung - riêng) và tính mở rộng được của LFoC tương ứng. Tức là, các hình thang là ảnh đẳng cấu ngữ nghĩa của các hạng từ tương ứng.

Các nội dung trình bày trong chương 2 đã giải được vấn đề nội dung thông tin câu tóm tắt. Đây là vấn đề cốt yếu trong bài toán trích rút câu tóm tắt bằng ngôn

ngữ tự nhiên. Các tập mờ được sản sinh bởi thủ tục HA-TFS-MG được đề xuất trong chương này sẽ được sử dụng trong phương pháp mới trích rút câu tóm tắt dựa trên lý thuyết ĐSGT ở các chương tiếp theo. Các nội dung trình bày trong chương 2 đã được công bố trong công trình [CT3, CT6].

CHƯƠNG 3.PHƯƠNG PHÁP TRÍCH RÚT CÂU TÓM TẮT NGÔN NGỮ DỰA TRÊN ĐẠI SỐ GIA TỬ

Trong chương này, luận án trình bày đề xuất một phương pháp mới dựa trên lý thuyết Đại số gia tử để giải bài toán trích rút tóm tắt ngôn ngữ từ cơ sở dữ liệu. Trong thành phần đầu vào của phương pháp đề xuất có các cấu trúc ĐSGT của các thuộc tính, sau đó các tập mờ được sản sinh bởi thủ tục HA-TFS-MG đã được trình bày trong chương 2. Do đó, phương pháp trích rút tóm tắt được đề xuất có thể đảm bảo sinh ra các câu tóm tắt truyền tải đúng nội dung thông tin trong tập dữ liệu và có thể mở rộng tập câu tóm tắt thu được khi tập hạng từ của miền hạng từ ngôn ngữ được mở rộng. Luận án trình bày các thực nghiệm theo nhiều kịch bản khác nhau trên bộ dữ liệu Bank Marketing. Từ phân tích kết quả thực nghiệm đã chứng tỏ những ưu điểm của phương pháp trích rút tóm tắt dựa trên lý thuyết Đại số gia tử.

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 86 - 88)

Tải bản đầy đủ (PDF)

(148 trang)