Mục tiêu thực hiện thí nghiệm

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 95 - 97)

Mục đích thực hiện các thí nghiệm sau đây để chứng tỏ khả năng thực thi được của phương pháp trích rút tóm tắt được đề xuất Mls và làm rõ một số điểm khác biệt với các phương pháp đã có. Một trong những điểm khác biệt chính là

phương pháp đề xuất có khả năng tương tác trực tiếp với ngữ nghĩa của các hạng từ thông qua tính giải nghĩa được của các tập mờ hình thang được xây dựng theo thủ tục HA-TFS-MG trong mục 2.5.1. Hơn nữa, các thí nghiệm muốn chứng tỏ tính chất mở rộng được của LFoC sẽ tạo ra cơ hội để mở rộng tập các câu tóm tắt thu được chứa các câu tóm tắt có khả năng cung cấp nhiều thông tin về tập dữ liệu. Tập hợp các câu tóm tắt này được coi là tạo thành cơ sở tri thức của con người (human knowledge base) về cơ sở dữ liệu D, ký hiệu là KBD. Theo định lý 3.1, khi mở rộng LFoC của các thuộc tính thì KBDcũng được mở rộng.

Mục tiêu 1: Thí nghiệm chứng tỏ con người có nhu cầu và có khả năng sử dụng khung nhận thức với số lượng từ lớn hơn ngưỡng 7  2 để hình thành tri thức bằng ngôn ngữ. Số lượng từ lớn còn có thể tạo điều kiện, cơ hội để con người diễn đạt tri thức một cách rõ ràng hơn và mang đến nhiều thông tin hơn về thế giới thực được lưu trữ trong cơ sở dữ liệu.

Mục tiêu 2: Giả sử tại thời điểm t, cơ sở tri thức về cơ sở dữ liệu D được tạo bởi các câu tóm tắt là KBD,t. Khi mở rộng LFoC của các thuộc tính từ mức tính riêng

κ lên mức κ’ = κ + 1, KBD,t được mở rộng thành KBD,t’ bằng thêm các câu tóm tắt chứa các hạng từ ở mức tính riêng κ’ mà không làm thay đổi ngữ nghĩa của các câu tóm tắt đã có trong KBD,t. Quá trình này minh họa việc hình thành tri thức của con người từ việc khảo sát cơ sở dữ liệu và khả năng sử dụng ngôn ngữ để biểu diễn nhiều thông tin, nhiều tri thức hơn về cơ sở dữ liệu.

Mục tiêu 3: Phương pháp đề xuất Mlscó thể sản sinh một phân phối ngôn ngữ của các nhóm mờ đối với các thuộc tính khác của cơ sở dữ liệu. Phân phối ngôn ngữ này cũng hữu ích tương tự như phân phối thể hiện bằng số thông thường. Hơn nữa, khi người dùng yêu cầu một phân phối chính xác hơn nữa, phương pháp đề xuất Mls

có thể thực hiện bằng việc tăng tính riêng của LFoC để bổ sung thêm các câu tóm tắt chứa các hạng từ có mức tính riêng lớn hơn mà vẫn duy trì ngữ nghĩa vốn có của các câu tóm tắt đã có.

Trong các phần tiếp theo, luận án trình bày ba thí nghiệm để thực hiện ba mục tiêu nói trên.

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 95 - 97)

Tải bản đầy đủ (PDF)

(148 trang)