Kết quả thực nghiệm

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 138 - 140)

Trong Hình 4.2 biểu diễn sự thay đổi của giá trị hàm đánh giá Fit lớn nhất của cá thể tốt nhất trong thế hệ qua mỗi vòng lặp. Từ đó, cho thấy giá trị này có sự tăng dần và sẽ hội tụ đến một giá trị ở những lần lặp cuối. Điều đó chứng tỏ kết quả phản ánh có sự tiến hóa qua các lần lặp.

TIEU LUAN MOI download : skknchat@gmail.com

130

Hình 4.2: Độ đo Fit của cá thể tốt nhất trong quần thể qua 100 lần tiến hóa Kết quả thực nghiệm của Hybird-GA trong bài báo của Donis-Diaz và cộng sự [38] là trung bình 10 lần chạy Hybird-GA. Để khách quan trong so sánh kết quả, thuật toán Greedy-GA được chạy 10 lần và tính kết quả trung bình 10 lần chạy với những số liệu cần so sánh. Bảng 4.2 là kết quả trung bình sau 10 lần chạy của giải thuật Greedy-GA và Hybird-GA: (1) hàm đánh giá Fit; (2) trung bình cộng giá trị chân lý T của các câu tóm tắt; (3) số câu tóm tắt có từ lượng hóa có thứ tự ngữ nghĩa lớn hơn ‘a half’; (4) số câu tóm tắt có giá trị chân lý T > 0.8; (5) số câu tóm tắt có giá trị chân lý T = 0 (tương ứng với trường hợp không có bản ghi nào thỏa điều kiện lọc o(Fq)). Mô hình Hybrid-GA đã được đánh giá là tốt hơn mô hình GA cơ bản (Classical-GA) và GA cơ bản kết hợp với toán tử Cleaning (Classcial + Cleaning- GA) để loại bỏ các câu tóm tắt có giá trị chân lý T = 0. Từ Bảng 4.2 cho thấy, mô hình Greedy-GA trong nghiên cứu này so với mô hình Hybrid-GA có một số ưu điểm:

o Tập câu tóm tắt tối ưu có giá trị hàm Fit lớn hơn. Chứng tỏ, Greedy- GA sẽ cho phương án tối ưu hơn.

o Số lượng câu có từ lượng hóa có thứ tự ngữ nghĩa lớn hơn ‘a half’

nhiều hơn. Đây là kết quả của việc sử dụng chiến lược tham lam khi lựa chọn từ lượng hóa có thứ tự ngữ nghĩa lớn nhất có thể trong các câu tóm tắt có

cùng thành phần lọc o(Fq).

o Số lượng câu có giá trị chân lý T > 0.8 trong kết quả của Greedy-GA đạt tối đa là 30 câu, cao hơn kết quả 27 câu kết quả của Hybrid-GA trong [38]. Kết quả này do Greedy-GA sử dụng tập từ lượng hóa với số lượng 17 từ và các hình thang biểu diễn ngữ nghĩa cho các từ lượng hóa có cấu trúc đa thể. Điều này chứng tỏ ưu điểm của biểu diễn ngữ nghĩa bằng hình thang như được xây dựng dựa trên lý thuyết ĐSGT trong chương 2 và ý nghĩa của

TIEU LUAN MOI download : skknchat@gmail.com

131

khả năng mở rộng LFoC trong ứng dụng thực tế. Cụ thể, khi tăng số lượng từ lượng hóa bằng việc sử dụng thêm các từ có mức tính riêng lớn sẽ làm tăng khả năng diễn đạt bằng từ lượng hóa cho bất cứ tỷ lệ nào trong khoảng [0, 1]. Kết quả trong thực nghiệm cho thấy, khi LFoC của Q gồm 3 mức sẽ luôn chọn được từ lượng hóa cho các câu tóm tắt mà đạt được giá trị chân lý lớn hơn 0.8.

o Trong kết quả của Greedy-GA không có câu tóm tắt có giá trị chân lý T = 0. Như đã phân tích ở cuối mục 4.4, tất cả các câu tóm tắt trong quá trình

thực hiện giải thuật di truyền đều được sinh ra bởi hàm Random-Greedy- LS. Trong đó có sử dụng điều kiện đối với độ đo hỗ trợ supp(Fq) > 0.1 trong thủ tục Random-Greedy-LS nên sẽ không làm xuất hiện các câu tóm tắt có T = 0 trong quá trình thực hiện mô hình Greedy-GA.

Bảng 4.2: Kết quả trung bình 10 lần chạy mô hình Greedy-GA và kết quả thực nghiệm mô hình Hybrid-GA trong [38]

Mô hình GA

Hybrid-GA [38] Greedy-GA

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 138 - 140)

Tải bản đầy đủ (DOCX)

(157 trang)
w