Hệ thống thông tin

Một phần của tài liệu Khai phá dữ liệu văn bản bằng lý thuyết tập thô (Trang 28 - 30)

thức dưới dạng một bảng dữ liệu gồm p cột ứng với p thuộc tắnh và n hàng ứng với n đối tượng. Từ đầu những năm 80 Pawlak đã định nghĩa một khái niệm mới là hệ thông tin (infomation system) dựa trên khái niệm bảng truyền thống như sau [8,18,22,23]:

Định nghĩa 1: Hệ Thống thông tin là một cặp S = (U, A) Trong đó:

Số hóa bởi Trung tâm Học liệu Ờ Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

U : là một tập hữu hạn khác rỗng các đối tượng. A : là một tập hữu hạn khác rỗng các thuộc tắnh.

a: U → Va với mọi a ∈ A. Tập Va được gọi là tập giá trị của thuộc tắnh a.

Vắ dụ 1.1 Bảng 1.1 biểu diễn tập các loại sơn nhà U u u1, 2,...,u10,

Các loại sơn có màu sắc khác nhau (Xanh lam, Trắng, Hồng, Vàng), của hãng sản xuất khác nhau (Dulux, Nippon, Cova) và co dung tắch khác nhau (100 lắt, 50 lắt, 20 lắt, 5 lắt).

Hệ thống thông tin S = (U, A ) biểu diễn tri thức như sau: A = {Hãng sản xuất, Màu sắc, dung tắch}.

Vhãng sản xuất= (Dulux, Nippon, Cova)

VMàu sắc = (Xanh lam, Trắng, Hồng, Vàng) VDung tắch = (100 lắt, 50 lắt, 20 lắt, 5 lắt).

U Hãng sản xuất Màu sắc Dung tắch

Dulux Xanh lam 100 lắt

Nippon Xanh lam 100 lắt

Cova Trắng 50 lắt

Cova Hồng 20 lắt

Dulux Vàng 5 lắt

Dulux Xanh lam 50 lắt

Nippon Hồng 20 lắt

Nippon Hồng 20 lắt

Cova Vàng 100 lắt

Dulux Xanh lam 50 lắt

Số hóa bởi Trung tâm Học liệu Ờ Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Định nghĩa 2: Với một hệ thông tin bất kỳ S = (U,A) và một tập không rỗng các thuộc tắnh B⊆A định nghĩa một hàm thông tin B như sau:

InfB = {(a, a(x)): a ∈ B} với mọi x ∈ A.

Trường hợp đặc biệt B=A, khi đó tập {InfA(x): x ∈ A} được gọi là tập thông tin A, viết tắt là INF(A).

Một phần của tài liệu Khai phá dữ liệu văn bản bằng lý thuyết tập thô (Trang 28 - 30)