2.8.10 .Giải thuật di truyền
3.4. Khai phỏ luật kết hợp đa mức
3.4.1. Luật kết hợp đa mức
Trong nhiều ứng dụng, khú cú thể tỡm đƣợc luật kết hợp mạnh trong cỏc mục dữ liệu ở mức trừu tƣợng gốc bởi tớnh thƣa thớt của dữ liệu trong cỏc khụng gian đa chiều. Khỏm phỏ cỏc luật kết hợp mạnh ở mức khỏi niệm cao cú thể miờu tả tri thức cú nghĩa phổ thụng. Tuy nhiờn, cỏc luật tỡm đựoc đú cú thể là tầm thƣờng với ngƣời này nhƣng lại mới lạ, quan trọng đối với ngƣời khỏc. Do vậy, cỏc hệ thống khai phỏ dữ liệu nờn cung cấp khả năng để khai phỏ cỏc luật kết hợp ở nhiều mức trừu tƣợng khỏc nhau.
TID CÁC MỤC ĐÃ MUA
1 Mỏy tớnh để bàn IBM, mỏy in Sony đen trắng
2 Phần mềm giỏo dục, phần mềm quản lý tài chớnh Misa
3 Chuột Logitech
4 Mỏy tớnh để bàn IBM, phần mềm quản lý tài chớnh Misa
5 Mỏy tớnh để bàn IBM
… …
Giả sử bảng trờn cho biết tỏc vụ bỏn hàng của một cửa hàng mỏy tớnh: Cỏc mục bỏn đƣợc trong tỏc vụ cựng định danh tỏc vụ TID. Khỏi niệm phõn cấp cho cỏc mục đƣợc chỉ ra trong hỡnh sau:
Khỏi niệm phõn cấp đƣợc xỏc định tuần tự từ mức thấp đến mức cao, đến khỏi niệm tổng quỏt hơn. Trong hỡnh trờn, khỏi niệm phõn cấp thành 4 mức: 0,1,2,3. Ta quy ƣớc cỏc mức đỏnh số từ trờn xuống, bắt đầu từ mức 0 ở nỳt gốc cho tất cả (mức tổng quỏt nhất). Mức 1 bao gồm: mỏy tớnh, phần mềm, mỏy in, phụ kiện. Mức 2 bao gồm: Mỏy tớnh để bàn, mỏy tớnh laptop, mỏy in màu, mỏy in đen trắng,… Mức 3 là mức cụ thể, riờng biệt nhất của phõn cấp này.
Cỏc mục trong bảng dữ liệu cho ban đầu là mức thấp nhất của khỏi niệm phõn cấp trong hỡnh trờn. Khú cú thể tỡm cỏc mẫu mua đỏng quan tõm trong mức nguyờn
Tất cả
Mỏy tớnh Phần mềm Mỏy in Phụ kiện
Để bàn Laptop Giỏo dục Tài chớnh Màu Đen trắng Chuột
Logitech Sony HP Misa … … …
thủy này. Chẳng hạn: mỏy tớnh để bàn IBM hoặc mỏy in Sony đen trắng mỗi chỳng chỉ xuất hiện trong một phần rất nhỏ của cỏc tỏc vụ thỡ khú cú thể tỡm cỏc luật kết hợp bao gồm chỳng. Tuy nhiờn, nếu tổng quỏt ―Mỏy in Sony đen trắng‖ dễ hơn là ―mỏy tớnh để bàn IBM‖ và ―Mỏy in Sony đen trắng‖.
Cỏc luật đƣợc sinh ra từ khai phỏ luật kết hợp với khỏi niệm phõn cấp là cỏc luật kết hợp nhiều mức hay đa mức (vỡ chỳng để cập đến hơn một mức khỏi niệm).