Lý thuyết tập thô truyền thống do Pawlak [12] đề xuất là công cụ hiệu quả để giải quyết các bài toán rút gọn thuộc tính và trích lọc luật trên các hệ thông tin đơn trị. Với các hệ thông tin trong thực tế, giá trị một đối tƣợng tại một thuộc tính có thể là một tập giá trị. Ta hiểu nhƣ sau: ví dụ xét hệ thông tin có đối tƣợng “ Nguyễn Văn A” tại thuộc tính “Ngoại ngữ” là “Anh, Pháp, Nga”, nghĩa là Nguyễn Văn A biết ngoại ngữ tiếng Anh, hoặc tiếng Pháp, hoặc tiếng Nga. Hệ thông tin nhƣ vậy đƣợc gọi là hệ thông tin tập giá trị.
Dƣới đây là cách tiếp cận của hệ thông tin tập giá trị:
Loại thứ nhất: Với x X , a A, a(x) dùng theo nghĩa “và”. Giả sử, a là thuộc tính làm quen với các ngôn ngữ lập trình thì giá trị thuộc tính a(u) = {C++, Java, Pascal} đƣợc hiêu theo cách: u biết đƣợc cả 3 ngôn ngữ lập trình
C++, Java, Pascal.
Loại thứ hai: Với x U , a A, a(x) dùng theo nghĩa “hoặc”. Giả sử, a là thuộc tính làm quen với các ngôn ngữ lập trình thì giá trị thuộc tính a(u) =
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
{C++, Java, Pascal} đƣợc hiểu theo cách: u biết đƣợc một trong 3 ngôn ngữ
hoặc C++, Java, Pascal với giá trị thuộc kiểu số. Ví dụ thuộc tính “tuổi” có
b(x) = [20, 25] đƣợc hiểu là: đối tƣợng u trong độ tuổi 20 và 25. Hệ thông tin không đầy đủ với một số giá trị thuộc tính bị thiếu đều thuộc hệ thông tin tập giá trị.
Loại thứ ba: Kết hợp cửa hai mô hình trên, một số thuộc tính trong hệ thông tin đƣợc hiểu theo nghĩa “và” nhƣ ví dụ thuộc tính “làm quen ngôn ngữ lập trình” và một số thuộc tính hiểu theo nghĩa “hoặc” nhƣ thuộc tính “tuổi”.
Qua 3 cách tiếp cận của hệ thông tin tập giá trị trên, luận văn xây dựng theo hƣớng tiếp cận thứ hai. Với x U, a A, a(x) dùng theo nghĩa “hoặc”.
Định nghĩa 1.2.[9].
Hệ thông tin tập giá trị là một bộ tứ IS = (U, A, V, f) trong đó:
U: là tập hữu hạn khác rỗng, đƣợc gọi là tập vũ trụ các đối tƣợng
A: là tập hữu hạn khác rỗng các thuộc tính
a a A
V V với Va là tập giá trị của thuộc tính a A f: là hàm thông tin, f: U×A→2V
là ánh xạ tập giá trị
Ví dụ 1.7. Bảng 1.7 minh họa một hệ thông tin tập giá trị gồm: Đối tƣợng U = {u1, u2, u3, u4, u5, u6, u7, u8, u9, u10}
Các tập thuộc tính A = {Nghe, Ngôn ngữ nói, Đọc, Viết} V = {E, F, G}
Bảng 1. 7. Hệ thông tin tập giá trị
U Nghe (A) Ngôn ngữ nói (S) Đọc (R) Viết (W)
u1 {E} {E} {F, G} {F, G}
u2 {E, F, G} {E, F, G} {F, G} {E, F, G}
Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
u4 {E, F } {E, G} {F, G} {F}
u5 {F, G} {F, G} {F, G} {F}
u6 { F } {F} {E, F} {E, F}
u7 {E, F, G} {E, F, G} {E, G} {E, F, G}
u8 {E, F} {F, G} {E, F, G} {E, G}
u9 {F, G} {G} {F, G} {F, G}
u10 {E, F} {E, G} {F, G} {E, F}