Định nghĩa 3.1. (Hàm phân biệt)
Cho DSU C, d là bảng quyết định và B C. Hàm phân biệt trong bảng quyết định DS làhàm disc: C Z+ (Z+ ký hiệu tập các số nguyên không âm) được định nghĩa như sau :
: ( ) ( , ) | ( ( ) ( )) b B( ( ) ( ))
B C disc B x y U U d x d y b x b y
Trong [55], Hung Son Nguyen đề nghị một cách tiếp cận để đánh giá thuộc tính (hoặc tập thuộc tính) dựa trên số lượng các cặp đối tượng có nhãn khác nhau, các cặp đối tượng này được phân biệt bởi một thuộc tính (hoặc tập thuộc tính) và số lượng của tập các thuộc tính để phân biệt cặp đối tượng được gọi là hàm phân biệt mở rộng. Tác giả đưa ra giải pháp đối với bài toán rút gọn thuộc tính dựa trên hai đại lượng vùng dương và vùng biên. Theo ý tưởng này, luận án đưa ra khái niệm hàm phân biệt mở rộng trong bảng quyết định giá trị tập như một khái niệm cơ sở cho các kỹ thuật rút gọn thuộc tính.
Chương 2 đã giới thiệu về khái niệm ma trận phân biệt trong hệ thông tin giá trị tập (Định nghĩa 2.9). Tiếp sau đây, Định nghĩa 3.2 giới thiệu về ma trận phân biệt cho bảng quyết định giá trị tập, còn Định nghĩa 3.3. giới thiệu về hàm phân biệt mở rộng cho bảng quyết định giá trị tập.
Định nghĩa 3.2. (Ma trận phân biệt)
Cho bảng quyết định giá trị tập DS U C, d . Ma trận phân biệt của DS, ký hiệu là MDS= n
j , i ij
m 1 là một ma trận vuông cỡ n |U| với giá trị phần tử mij được
xác định theo công thức sau:
mij = { aC: ( ,u ui j)Ta ngược lại nếu d(ui) = d(uj)
Định nghĩa 3.3. (Hàm phân biệt mở rộng)
Cho DSU C, d là bảng quyết định giá trị tập với quan hệ dung sai TB trên
2C. Hàm phân biệt mở rộng của bảng quyết định giá trị tập discern: 2C Z+
được định nghĩa như sau:
: ( ) | ( , ) | ( ( ) ( )) b B( , ) b |
B C discern B x y U U d x d y x y T
(1). Trong bảng quyết định giá trị tập DS U C, d và aC, giá trị của hàm phân biệt mở rộng discern(a) chính là số lần xuất hiện của thuộc tính
a trong ma trận phân biệt MDS: discern a( )a a| MDS.
( 2). Hàm phân biệt mở rộng có tính đơn điệu tăng theo nghĩa sau đây:
B B1, 2 C nếu B1B2 thì discern B( 1)discern B( 2).
(3). Cho DSU C, d là bảng quyết định giá trị tập, B B1, 2 C, B1 B2. Khi đó discern B( 1)discern B( 2) nếu
1 2
2
( , )x y U : ( , )x y TB ( , )x y TB.