Tính mở rộng được của phương pháp đề xuất

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 93 - 94)

Tập các câu tóm tắt đã được trích rút được xem như cơ sở tri thức của con người về tập dữ liệu D, ký hiệu là KBD, nên tập này có khả năng mở rộng. Do đó, phương pháp đề xuất Mlscũng phải có khả năng xử lý sự tăng trưởng của LFoC của các thuộc tính (chính là tập từ vựng) và cơ sở tri thức KBD của D. Tức là khi kích thước của một số LFoC tăng lên, các câu tóm tắt đã được trích rút từ D bởi Mls vẫn được bảo toàn ngữ nghĩa. Khi đó, phương pháp trích rút tóm tắt được gọi là có khả năng mở rộng. Tính chất này được khẳng định thông qua định lý sau:

Định lý 3.1: Nếu sử dụng giá trị đúng đắn của câu tóm tắt để xác định xem câu tóm tắt có là đầu ra của phương pháp trích rút, tức là chỉ phụ thuộc vào độ hỗ trợ của cơ sở dữ liệu cho trước đối với các tập mờ biểu diễn ngữ nghĩa của các hạng từ trong LFoC của các thuộc tính, thì phương pháp trích rút tóm tắt đề xuất Mls có khả năng mở rộng.

Chứng minh

Tính đúng đắn của định lý là hệ quả trực tiếp của khẳng định (ii) trong Định lý 2.3. Tức là, khi các tập mờ biểu diễn ngữ nghĩa cho các từ đã có trong các LFoC không bị thay đổi khi bổ sung thêm các từ có tính riêng lớn hơn, thì độ hỗ trợ của cơ sở dữ liệu đối với các tập mờ đã có không thay đổi. Theo giả thiết của định lý, độ đo giá trị đúng đắn của các câu tóm tắt đã được trích rút cũng không thay đổi. Tức là chúng vẫn được coi là đầu ra của quá trình trích rút tóm tắt. □

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 93 - 94)

Tải bản đầy đủ (PDF)

(148 trang)