Liên hệ giữa luật kết hợp ngônngữ và câu tóm tắt bằng ngônngữ

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 118 - 119)

Xét một luật kết hợp ngôn ngữ một điều kiện, một kết luận có dạng như sau:

NếuAi = xthìAj = y (độ hỗ trợ α; độ tin cậy β) (4.1) Trong đó: xy là các hạng từ ngôn ngữ trong miền hạng từ Dom(Ai) và Dom(Aj) của hai thuộc tính AiAj. Giả sửx,y lần lượt là hàm thuộc của hai tập mờ biểu diễn ngữ nghĩa cho xy. Độ hỗ trợ α và độ tin cậy β được tính theo công thức (4.2) [91-93]. Trong đó, là ký hiệu cho phép giao mờ, thông thường

x y (oi )) . x(o i ) y (o i )n = x (oi )y (oi ) = i=1n x (oi )n i=1 (4.2) Ví dụ xét trong cơ sở dữ liệu về công nhân có thuộc tính TUỔI và LƯƠNG. Một luật kết hợp ngôn ngữ được trích rút từ cơ sở dữ liệu là: “Nếu công nhân tuổi trẻthì công nhân nhận lương thấp” ( = 0.4, = 0.9). Trong công thức tính độ tin cậy , tử số là lực lượng công nhân thỏa hai điều kiện ‘LƯƠNG = ‘thấp’’ và ‘TUỔI = ‘trẻ’’, mẫu số là lực lượng công nhân thỏa một điều kiện ‘TUỔI = ‘trẻ’’. Do đó, từ giá trị độ tin cậy = 0.9 suy ra rằng tỷ lệ công nhân thỏa ‘LƯƠNG = ‘thấp’’ trong nhóm công nhân thỏa điều kiện ‘TUỔI = ‘trẻ’’ là 0.9. Như vậy, luật kết hợp này tương ứng với câu tóm tắt có định lượng rõ là “90% công nhân tuổi trẻ nhận lương thấp”. Khi định lượng 90% được chuyển thành từ lượng hóa ‘hầu hết’ với ’hầu hết’(0.9) = 1, thì câu tóm tắt tương ứng có định lượng bằng ngôn ngữ là “Hầu hết công nhân tuổi trẻ nhận lương thấp” (T = 1.0).

So sánh giữa công thức tính giá trị độ tin cậy trong (4.2) với công thức tính độ đúng đắn T trong (1.7), chúng ta thấy rằng có mối liên hệ giữa luật kết hợp ngôn ngữ dạng (4.1) với câu tóm tắt dạng (1.3) (Q F y are S) như sau: giá trị chính là độ hỗ trợ cho phần thân câu tóm tắt (F y are S); thành phần lọc F tương ứng là điều kiện “Ai = x”; thành phần kết luận S tương ứng là kết luận “Aj = y”. Trong bài toán trích rút luật kết hợp ngôn ngữ, điều kiện để một luật được đưa vào tập luật kết quả là độ hỗ trợ phải lớn hơn ngưỡng minSupport và độ tin cậy phải lớn hơn ngưỡng

TIEU LUAN MOI download : skknchat@gmail.com

111

hiện mối liên hệ có tính quy luật giữa các thuộc tính. Các câu tóm tắt mà có từ lượng hóa Q diễn đạt tỷ lệ lớn như ‘nhiều’ hoặc ‘hầu hết’ cũng diễn đạt các tri thức có tính quy luật như luật kết hợp. Do đó, về khía cạnh diễn đạt tri thức trích rút từ cùng một cơ sở dữ liệu, cùng một cách phân hoạch mờ miền tham chiếu các thuộc tính, tập luật kết hợp ngôn ngữ tương ứng với một tập con các câu tóm tắt ngôn ngữ chứa từ lượng hóa. Trong tập các câu tóm tắt, từ lượng hóa Q có thể là bất kỳ từ ngôn ngữ nào để diễn đạt cho một tỷ lệ bất kỳ trong khoảng [0, 1]. Trong thực tế, câu tóm tắt với Q diễn đạt cho một tỷ lệ rất nhỏ như ‘rất ít’, ‘không có’ cung cấp những tri thức rất có ý nghĩa. Nghiên cứu của Duraj và cộng sự [66] đã sử dụng các câu tóm tắt với Q {‘very few’, ‘few’} trong hệ thống thông minh để phát hiện các thông tin ngoại lai.

Một phần của tài liệu (Luận án tiến sĩ) tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 118 - 119)

Tải bản đầy đủ (DOCX)

(157 trang)
w