chuyên gia
3.2. Một số độ đo lựa chọn thuộc tính
Tr−ớc hết ta nhận thấy rằng, việc xác định mức phụ thuộc giữa các nhóm thuộc tính khác nhau là một trong số các vấn đề chính trong việc phân tích, phát hiện các quan hệ nhân quả trong dữ liệu của các hệ thống “giá trị_thuộc tính”. Trong ch−ơng 1, ta đã đ−a ra khái niệm độ đo tin t−ởng đo mức độ tin t−ởng về khả năng xuất hiện của một sự kiện A ⊆ Ω, trong đó Ω là tập tham chiếu. Đó là một độ đo mang tính tổng quát. Trong ch−ơng này, ta sẽ giới thiệu một số độ đo thông dụng trong thực tế, đo độ tin t−ởng mức độ phụ thuộc giữa các nhóm thuộc tính khác nhau của một tập các đối t−ợng.
Định nghĩa 3.6
Giả sử O là một tập các đối t−ợng. E ⊆ O ìO là một quan hệ t−ơng đ−ơng trên O. Hai đối t−ợng o1, o2 ∈ O đ−ợc gọi là không phân biệt đ−ợc trong E nếu chúng thoả mãn quan hệ t−ơng đ−ơng E (hay o1Eo2).
Định nghĩa 3.7
Giả sử O là một tập các đối t−ợng, E ⊆ O ìO là một quan hệ t−ơng đ−ơng trên O, X ⊆ O. Khi đó các tập E*(X) và E*(X) đ−ợc định nghĩa nh− sau:
E*(X) = { o∈O| [o]E⊆ X } (3.1)
E*(X) = { o∈O| [o]E∩X≠∅ } (3.2)
(trong đó [o]E ký hiệu lớp t−ơng đ−ơng của các đối t−ợng không phân biệt đ−ợc với o theo quan hệ t−ơng đ−ơng E). E*(X) và E*(X) theo thứ tự đ−ợc gọi là các xấp xỉ d−ới và xấp xỉ trên t−ơng ứng.
Gọi Ω là tập các thuộc tính, P là tập con của Ω xác định một quan hệ t−ơng đ−ơng trên O và chia O thành các lớp t−ơng đ−ơng, mỗi lớp chứa đựng các đối t−ợng có cùng các giá trị trên tất cả các thuộc tính của P.