Một tập dữ liệu thể hiện dưới dạng bảng, trong đú mỗi dũng thể hiện cho một trường hợp, một sự kiện, một bệnh nhõn hay đơn giản là một đối tượng. Mỗi cột của bảng thể hiện một thuộc tớnh (là một giỏ trị, một quan sỏt, một đặc điểm …) được “đo lường” cho từng đối tượng. Ngoài ra giỏ trị của thuộc tớnh cũng cú thể được cung cấp bởi chuyờn gia hay bởi người sử dụng. Một bảng như vậy được gọi là mộthệ thụng tin (information system).
Một cỏch hỡnh thức, hệ thụng tin là một cặp A = (U,A) trong đú U là tập hữu hạn khỏc rỗng cỏc đối tượng và được gọi là tập vũ trụ, A là tập hữu hạn khỏc rỗng cỏc thuộc tớnh sao cho a: U→Vavới mọi aA. Tập Va được gọi là tập giỏ trị của thuộc tớnh a.
Vớ dụ 4-1 : Bảng 4-1dưới đõy cho ta hỡnh ảnh về một hệ thụng tin đơn giản
Age LEMS x1 16 – 30 50 x2 16 – 30 0 x3 31 – 45 1 – 25 x4 31 – 45 1 – 25 x5 46 – 60 26 – 49 x6 16 – 30 26 – 49 x7 46 – 60 26 – 49
Bảng 4- 1.Một hệ thụng tin đơn giản
Ta dễ dàng nhận thấy trong bảng trờn, cỏc cặp đối tượng x3, x4 cũng như x5,
x7 cú giỏ trị bằng nhau với cả hai thuộc tớnh. Trường hợp này ta núi rằng cỏc
đối tượng này khụng phõn biệt từng đụi đối với tập thuộc tớnh {Age, LEMS}.
Trong nhiều ứng dụng, tập vũ trụ được phõn chia thành cỏc tập đối tượng con bởi một tập cỏc thuộc tớnh phõn biệt được gọi là tập thuộc tớnh quyết định. Núi cỏch khỏc tập vũ trụ đó được phõn lớp bởi thuộc tớnh quyết định. Hệ thụng tin trong trường hợp này được gọi là một hệ quyết định. Như vậy hệ quyết định là một hệ thụng tin cú dạng: A = (U,C D) trong đú A C D, C và D lần lượt được gọi là tập thuộc tớnh điều kiện và tập thuộc tớnh quyết định của hệ thụng tin.
Vớ dụ 4-2 : Bảng 4-2 dưới đõy thể hiện một hệ quyết định, trong đú tập thuộc tớnh {walk} được thờm vào nhận hai giỏ trị kết xuất là Yes và No [10].
Age LEMS Walk x1 16 – 30 50 Yes x2 16 – 30 0 No x3 31 – 45 1 – 25 No x4 31 – 45 1 – 25 Yes x5 46 – 60 26 – 49 No x6 16 – 30 26 – 49 Yes x7 46 – 60 26 – 49 No
Bảng 4- 2. Một bảng quyết định đơn giản
Một lần nữa ta thấy rằng, cỏc cặp đối tượng x3, x4 và x5, x7 vẫn cú giỏ trị như nhau tại hai thuộc tớnh điều kiện, nhưng cặp thứ nhất {x3, x4}thỡ cú giỏ trị kết xuất khỏc nhau (tức giỏ trị tại thuộc tớnh quyết định khỏc nhau), trong khi đú cặp thứ hai {x5, x7} thỡ bằng nhau tại thuộc tớnh quyết định.
Từ bảng trờn cú thể rỳt ra được một luật: “Nếu Age là 16-30 và LEMS là 50 thỡ Walk là Yes”. Tớnh tối thiểu của cỏc thuộc tớnh điều kiện trong tập cỏc luật cú được từ hệ quyết định là một trong những vấn đề rất quan trọng.