Dàn giá trị thuộc tính

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu rút gọn tập thuộc tính trong hệ quyết định giá trị tập (Trang 64 - 67)

Dàn (latice) trong toán học được biểu diễn bởi một tập các phần tử có thứ tự bộ phận, mỗi cặp phần tử thuộc dàn đều có phần tử cận trên chung và phần tử cận dưới

1

a 

chung thuộc dàn. Dàn có thể được biểu diễn bằng đồ thị có hướng G( , )V E , với V là tập các đỉnh và E là tập các cạnh. Các phần tử của dàn được biểu diễn thành các đỉnh. Cặp hai phần tử (vi, vj) thuộc quan hệ thứ tự bộ phận nói trên và không tồn tại phần tử u

để cho (vi, u) và (u, vj) đồng thời thuộc quan hệ bộ phận thì (vi, vj) được biểu diễn thành

cạnh ( ,v vi j)E. Cấu trúc này được áp dụng để lưu trữ các giá trị của thuộc tính.

Định nghĩa 3.11. (Dàn giá trị thuộc tính)

Cho DSU C,  d  là bảng quyết định giá trị tập. Với aCVa là miền giá trị của thuộc tính a. Dàn biểu diễn giá trị của thuộc tính (latticeof an attribute) a, ký hiệu là Latt(a), là một tập có thứ tự Latt( a ) (V ,r ),a với 2Va 2Va

r  là thứ tự bộ phận được định nghĩa như sau: {( , ) 2Va 2 :Va }.

rX Y   XY

Dàn Latt(a) được biểu diễn bằng một đồ thị có hướng với tập đỉnh là các tập giá trị thuộc Va, cung nối hai đỉnh nếu có quan hệ thứ tự bộ phận r như đã nói. Trong dàn

Latt(a), phần tử nhỏ nhất là tập rỗng  còn phần tử lớn nhất chính là Va. Trong nhiều

trường hợp biểu diễn một dàn, tập rỗng và tập Va không xuất hiện.

Tập của tất cả các dàn liên quan tới tất cả thuộc tính được ký hiệu Latt(C).

Nhận xét 5: Mọi bảng quyết định giá trị tập DS ( ,U C d ) đều có thể chuyển được thành bảng quyết định có cấu trúc SDTS( ,U Latt C( )d).

Cấu trúc giá trị của thuộc tính qua mô hình dàn được minh họa tại Hình 3.1.

Chúng ta nhận thấy rằng lớp dung sai của tất cả các nút của Latt a( )có thể xác định qua hai hướng quét của dàn: từ dưới lên và từ trên xuống. Như vậy một lớp dung sai của một nút ở mức thấp nhất chứa ít nhất là một phần tử. Xét mô hình quét dàn từ dưới lên, tại mỗi nút biểu diễn tập hợp danh sách của lớp dung sai là những nút con. Xét mô hình quét dàn từ trên xuống những nút cha sẽ chia thành các nhánh chứa tập hợp danh sách các lớp dung sai con.

Hình 3.1. Cấu trúc dàn của bảng quyết định giá trị tập

Nhận xét 6: Cho thuộc tính aC, độ phức tạp của thuật toán tính lớp dung sai của các nút trong Latt a( ) được tính dựa vào đường biên và bằng sana, với sa là số lần xuất hiện giá trị của thuộc tính ana là số các nút của lưới ((na |U IND a/ ( ) |).

Khi có Latt a( ), với aC ta có thể tính được bảng TCTB.

Nhận xét 7: Cho Latt(C) là tập dàn định nghĩa bởi tập thuộc tính điều kiện C. Giả sử mỗi một lớp dung sai Latt a( ) thì mỗi nút có thể tính toán được như sau. Cho tập thuộc tính BC, độ phức tạp thời gian của thuật toán tính bảng ngẫu nhiên dung sai

B

TCT từ bảng CTB dựa vào Latt(C)O n( B), với nB là số bản ghi trong bảng ngẫu nhiên cơ bản CTB.

Các nhận xét trên đây chính là cơ sở lập luận để phát triển các kỹ thuật rút gọn thuộc tính trong bảng quyết định giá trị tập.

3.2. Thuật toán tìm tập rút gọn thuộc tính trong bảng quyết định giá trị tập 3.2.1. Thuật toán 3.1. tìm tập rút gọn thuộc tínhGMDSDT

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu rút gọn tập thuộc tính trong hệ quyết định giá trị tập (Trang 64 - 67)

Tải bản đầy đủ (PDF)

(123 trang)