3. Kết luận chƣơng
2.1.1 Những khái niệm cơ bản trong lý thuyết tập thô
Hệ thông tin là công cụ biểu diễn tri thức dƣới dạng một bảng dữ liệu gồm p cột ứng với p thuộc tính và n hàng ứng với n đối tƣợng.
Định nghĩa 1.1. Hệ thông tin là một bộ tứ IS=(U,A,V,f) trong đó U là một tập hữu hạn, khác rỗng các đối tƣợng, A là một tập hữu hạn, khác rỗng các thuộc tính, V=
a A a
tin, a∈ A, u∈U f(u, a)∈ Va.
Với mọi u∈U, a∈A ta ký hiệu giá trị thuộc tính a tại đối tƣợng u là a(u) thay vì f(u,a). Nếu B={b1,b2, ...,bk}⊆ A là một tập con các thuộc tính thì ta ký hiệu bộ các giá trị bi(u) bởi B(u). Nhƣ vậy, nếu u và v là hai đối tƣợng, thì ta viết B(u)=B(v),
nếu bi(u)=bi(v) với mọi i = 1,...,k.
Cho hệ thông tin IS=(U,A,V,f), nếu tồn tại u∈U và a∈A sao cho a(u) thiếu giá trị (missing value) thì IS đƣợc gọi là hệ thông tin không đầy đủ, trái lại IS
đƣợc gọi là hệ thông tin đầy đủ. Ta tự hiểu hệ thông tin đầy đủ đƣợc gọi tắt là hệ thông tin.
Xét hệ thông tin IS=(U,A V,f). Mỗi tập con các thuộc tính P⊆ A xác định một quan hệ hai ngôi trên U, ta ký hiệu IND(P), xác định bởi IND(P)={(u,v)∈ U x U
a ∈ P, a(u)=a(v)}. IND(P) là quan hệ P – không phân biệt được. Dễ thấy rằng IND (P) là một quan hệ tƣơng đƣơng trên U. Nếu (u,v)∈ IND(P) thì hai đối tƣợng u và v
không phân biệt đƣợc bởi các thuộc tính trong P. Quan hệ tƣơng đƣơng IND(P) xác định một phân hoạch U/P chứa đối tƣợng u là [u]p, khi đó [u]p={v∈ U/(u,v)∈
IND(P)}.
Định nghĩa 1.2. [2] Cho hệ thông tin IS=(U,A,V,f), và P, Q⊆A.
1) Phân hoạch U/P và phân hoạch U/Q là nhƣ nhau (viết U/P=U/Q), khi và chỉ khi
u∈ U, [u]P =[u]Q.
2) Phân hoạch U/P mịn hơn phân hoạch U/Q là nhƣ nhau (viết U/Pp U/Q), khi và chỉ khi u∈ U, [u]P⊆ [u]Q.
Tính chất 1.1 [2] Xét hệ thông tin IS=( U,A,V,f ) và P, Q⊆A.
1) Nếu P⊆Q thì U/Q ≤ U/P, mỗi lớp của U/P là một lớp hoạch hợp của một số lớp thuộc U/Q.
2) Với mọi u∈U ta có [u]P∪Q=[u]p ∩[u]Q.