Thuật toán tìm tập tất cả các thuộc tính rút gọn của bảng quyết định nhất quán

Một phần của tài liệu Nghiên cứu một số thuật toán liên quan đến tập rút gọn trên bảng quyết định nhất quán (Trang 53 - 54)

quán

2.4.1. Đặt vấn đề

Bảng quyết định trong các bài toán thực tế thƣờng chứa một số thuộc tính dƣ thừa thực sự, là những thuộc tính mà việc loại bỏ chúng không ảnh hƣởng gì đến việc phân lớp tập đối tƣợng. Sự có mặt của các thuộc tính này làm cho độ phức tạp tính toán của bài toán khai phá dữ liệu tăng lên rất lớn. Việc loại bỏ các thuộc tính này trƣớc khi thực hiện các nhiệm vụ khai phá dữ liệu có ý nghĩa thực tiễn cao trong bối cảnh dữ liệu ngày càng lớn, ngày càng đa dạng và phức tạp.

Nhƣ đã trình bày trong Mục 1.4.4, trong bảng quyết định thuộc tính dƣ thừa thực sự là thuộc tính không xuất hiện trong bất kỳ tập rút gọn nào và thuộc tính rút

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

gọn là thuộc tính xuất hiện trong một tập rút gọn nào đó. Khi đó, bài toán tìm tập tất cả các thuộc tính dƣ thừa thực sự tƣơng đƣơng với bài toán tìm tập tất cả các thuộc tính rút gọn. Để giải quyết bài toán này, phƣơng pháp tiếp cận thông thƣờng là tìm họ tất cả các tập rút gọn của bảng quyết định, sau đó tìm phép hợp giữa các tập rút gọn. Tuy nhiên, cách tiếp cận này không khả thi với các bảng dữ liệu kích thƣớc lớn vì độ phức tạp thời gian của thuật toán tìm họ tất cả các tập rút gọn của bảng quyết định là hàm mũ đối với số thuộc tính điều kiện.

Trong phần này, chúng tôi trình bày một thuật toán tìm tập tất cả các thuộc tính rút gọn của bảng quyết định nhất quán có độ phức tạp thời gian là đa thức. Các kết quả trong phần này đã đƣợc tác giả công bố trong tài liệu  10 .

Một phần của tài liệu Nghiên cứu một số thuật toán liên quan đến tập rút gọn trên bảng quyết định nhất quán (Trang 53 - 54)