Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 145 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
145
Dung lượng
1,42 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Đỗ Thị Lan Anh KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN MÔ HÌNH DỮ LIỆU DẠNG KHỐI LUẬN ÁN TIẾN SĨ MÁY TÍNH Hà Nội – Năm 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Đỗ Thị Lan Anh KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN MÔ HÌNH DỮ LIỆU DẠNG KHỐI Chuyên ngành: Khoa học máy tính Mã số: 9 48 01 01 LUẬN ÁN TIẾN SĨ MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: 1 PGS TS Trịnh Đình Thắng Hà Nội – Năm 2020 i LỜI CẢM ƠN Lời đầu tiên, cho phép tác giả xin bày tỏ lòng biết ơn sâu sắc và chân thành tới PGS TS Trịnh Đình Thắng, người thầy đã tận tình hướng dẫn, chỉ bảo cho tác giả trong suốt quá trình học tập, nghiên cứu và hoàn thành luận án này Tác giả xin chân thành cảm ơn tới tập thể các thầy cô giáo, các nhà khoa học thuộc: Viện Công nghệ Thông tin – viện Hàn lâm Khoa học và Công nghệ Việt Nam, Khoa Công nghệ Thông tin – Học viện Khoa học và Công nghệ, viện Công nghệ Thông tin – trường Đại học Sư phạm Hà Nội 2 đã giúp đỡ về chuyên môn và tạo điều kiện thuận lợi cho tác giả trong suốt thời gian học tập và nghiên cứu Cuối cùng, tác giả xin gửi tới gia đình, người thân, bạn bè lời cảm ơn chân thành nhất vì đã ủng hộ, đồng hành, là chỗ dựa vững chắc và là động lực giúp tác giả hoàn thành luận án này Tác giả luận án Đỗ Thị Lan Anh ii LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của tôi dưới sự hướng dẫn khoa học của PGS TS Trịnh Đình Thắng Các kết quả được viết chung với các đồng tác giả đã được sự chấp thuận của các tác giả trước khi đưa vào luận án Các kết quả nêu trong luận án là trung thực và chưa từng được công bố trong bất kỳ công trình nào khác Tác giả luận án Đỗ Thị Lan Anh iii MỤ Danh mục các ký hiệu, các chữ viết tắt Danh mục các bảng, hình vẽ MỞ ĐẦU CHƯƠNG 1: MỘT SỐ KIẾN THỨC CƠ SỞ 1.1 Khai phá dữ liệu 1.1.1 Định nghĩa khai phá dữ liệu 1.1.2 Một số kỹ thuật khai phá dữ liệu 1.2 Khai phá luật quyết định 1.2.1 Hệ thông tin 1.2.2 Quan hệ không phân biệt được 1.2.3 Bảng quyết định 1.2.5 Luật quyết định 1.3 Mô hình dữ liệu dạng khối 1.3.1 Khối, lược đồ khối 1.3.2 Lát cắt 1.3.3 Đại số quan hệ trên khối 1.4 Kết luận chương 1 CHƯƠNG 2: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI DỮ LIỆU CÓ GIÁ TRỊ THUỘC TÍNH THAY ĐỔI 2.1 Một số khái niệm xây dựng trên khối 2.1.1 Khối thông tin 2.1.2 Quan hệ không biệt được 2.1.3 Khối quyết định 2.1.4 Luật quyết định trên khối và lát cắ 2.2 Thuật toán khai phá luật quyết định trên khối và trên lát cắt (MDLB) 2.3 Khai phá luật quyết định trên khối có giá trị thuộc tính thay đổi 2.3.1 Làm mịn, thô các lớp tương đương 2.3.2 Làm mịn, thô các lớp tương đương 2.3.3 Làm mịn cảm sinh hoàn toàn thuộc 2.3.4 Thuật toán khai phá luật quyết địn iv thay đổi (MDLB_VAC) 2.4 Độ phức tạp của các thuật toán tính ma trận Sup trên khối và lát cắt 2.5 Ví dụ minh họa 2.5.1 Minh họa bài toán sinh luật quyết định trên khối 2.5.2 Minh họa bài toán sinh luật quyết định trên khối khi làm mịn, thô giá trị thuộc tính chỉ số 2.6 Kết luận CHƯƠNG 3: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI CÓ TẬP ĐỐI TƯỢNG THAY ĐỔI 3.1 Mô hình bổ sung, loại bỏ các đối tượng trên khối và lát cắt 3.2 Tính toán gia tăng Acc và Cov khi bổ sung, loại bỏ đối tượng trên kh 3.2.1 Bổ sung đối tượng x vào khối quyết định 3.2.2 Loại bỏ phần tử x ra khỏi khối quyết định 3.3 Thuật toán sinh luật quyết định bằng phương pháp tính gia tăng ma tr Acc và Cov sau khi bổ sung, loại bỏ các phần tử (MDLB_OSC1) 3.4 Độ phức tạp của các thuật toán MDLB_OSC1 3.5 Tính toán gia tăng Sup khi bổ sung, loại bỏ đối tượng trên khối và lát 3.6 Thuật toán sinh luật quyết định bằng phương pháp tính gia tăng ma tr Sup sau khi bổ sung và loại bỏ các đối tượng (MDLB_OSC2) 3.7 Độ phức tạp của các thuật toán MDLB_OSC2 3.8 So sánh hai phương pháp tính gia tăng 3.9 Ví dụ minh họa 3.10 Thực nghiệm 3.11 Kết luận KẾT LUẬN DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ TÀI LIỆU THAM KHẢO v DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT Kí hiệu, chữ viết tắt Acc Cov Sup IND(P) id id’ P(r) F(r) rs IB = (U, A, V, f) DB=(U,C D) U/C U/D U/C x U/D x vi DANH MỤC CÁC BẢNG Bảng 1.1 Bảng Bệnh nhân Bảng 1.1 Một ví dụ về hệ thông tin Bảng 1.2 Bảng quyết định về bệnh Bảng 2.1 Bảng biểu diễn khối thôn Bệnh viện Bạch Mai cơ sở 2 Bảng 3.1 Bảng so sánh hai phương Bảng 3.2 Các thông tin cơ bản về vii DANH MỤC CÁC HÌNH VẼ Hình 1.1 Ví dụ Khối Bệnh nhân Hình 1.2 Ví dụ về khối Khách hàng Hình 1.3 Minh họa lát cắt khối Khá Hình 2.1 Minh họa một khối thông tin bệnh nhân bị sốt virut tại Khoa Nhi A – Bệnh viện Bạch Mai cơ sở 2 Hình 2.2 Minh họa khối quyết định Bệnh nhân sốt vi rút Hình 3.1 Menu của chương trình Hình 3.2 Tìm các lớp tương đương điều kiện, quyết định Hình 3.3 Ma trận Sup, Acc, Cov tìm được Hình 3.4 Luật quyết định tìm được trên khối Hình 3.5 Mối quan hệ giữa số lượng luật kết quả và ngưỡng min_acc, min_cov Hình 3.6 Chọn giá trị làm mịn Hình 3.7 Tính các ma trận Sup, Acc Hình 3.8 Chọn giá trị thuộc tính làm Hình 3.9 Tính các ma trận Sup, Acc Hình 3.10 Luật quyết định tìm được sau khi làm thô, mịn giá trị thuộc tính Hình 3.11 Chọn đối tượng bị loại bỏ Hình 3.12 Nhập đối tượng bổ sung vào khối Hình 3.13 Kết quả chương trình tính gia tăng ma trận Acc, Cov và luật quyết định thu được Hình 3.14 được Kết quả chương Hình 3.15 Thời gian chạy 1 MỞ ĐẦU 1 Lý do chọn đề tài Khai phá dữ liệu vẫn đang là lĩnh vực nhận được rất nhiều sự quan tâm nghiên cứu của các nhà khoa học trên thế giới Hội nghị quốc tế về khai phá dữ liệu KDD lần thứ 26 được tổ chức tại California, Mỹ vào tháng 8 năm 2020 là một trong những hội nghị lớn và nổi tiếng hàng đầu trong lĩnh vực khai phá dữ liệu và quy tụ hàng trăm nhà khoa học tham gia [1], [2] Một số các hội nghị về khai phá dữ liệu nổi tiếng được tổ chức thường niên hàng năm trên thế giới được kể đến như: hội nghị KDD, ICDE, IEEE ICDM, CIKM, SIAM SDM, PKDD, PAKDD… Nhóm bài toán thường được nghiên cứu trong khai phá dữ liệu gồm có: Phân lớp, dự đoán, luật kết hợp và phân cụm [3], [4], [5] Khai phá luật quyết định là một kĩ thuật nằm trong nhóm bài toán phân lớp đối tượng Đây là một trong những kĩ thuật khai phá dữ liệu khá phổ biến và đã được nhiều chuyên gia trong và ngoài nước nghiên cứu trên mô hình cơ sở dữ liệu quan hệ và một số mô hình mở rộng của mô hình dữ liệu quan hệ như mô hình datacube, mô hình nhà kho dữ liệu, mô hình dữ liệu đa chiều ….[6], [7], [8], [9], [10], [11] Năm 1998, các tác giả Nguyễn Xuân Huy, Trịnh Đình Thắng đã đề xuất mô hình dữ liệu dạng khối, một mở rộng của mô hình quan hệ [9] Mô hình này đã được xây dựng cả về lý thuyết và cài đặt thực nghiệm Với việc đưa thêm một trục id cho phép theo dõi được sự thay đổi dữ liệu theo quá trình, cụ thể có thể là theo thời gian, giai đoạn, khoảng cách [12], [13], [14], [15], [16], [17], [18], [19] Kết quả của bài toán khai phá luật trên mô hình quan hệ sẽ cho ta các luật hữu ích nhưng chỉ tại một thời điểm nào đó Tuy nhiên, trong thực tế với một số vấn đề đặc thù như chuẩn đoán bệnh, theo dõi quá trình mua bán hàng trong siêu thị hay quá trình quản lí cán bộ của một cơ quan, Việc tìm ra các mối quan hệ (các luật) của các đối tượng trong cơ sở dữ liệu theo một quá trình sẽ giúp ích cho các chuyên gia đưa ra các quyết định chính xác hơn Ví dụ: trong bảng quyết định Bệnh nhân dưới đây Thuật toán tính gia tăng ma trận Sup để phát hiện các luật quyết định khi bổ sung, loại bỏ đối tượng ra khỏi khối dữ liệu xét trên lát cắt tại x id có cùng kết quả với thuật toán tính gia tăng ma trận Acc và ma trận Cov khi chạy trên cùng tập dữ liệu xét trên lát cắt tại x id Việc chứng minh định lý này cũng hoàn toàn tương tự như chứng minh của định lý 3.1 ở trên 96 3.7 Độ phức tạp thuật toán của các thuật toán MDLB_OSC2 Mệnh đề 3.9 Độ phức tạp thời gian của thuật toán tính gia tăng ma trận Sup khi bổ sung N đối tượng là O(N|U|) Chứng minh: Từ thuật toán tính gia tăng ma trận Sup ta thấy: để kiểm tra một đối tượng x được bổ sung thuộc vào lớp điều kiện hay lớp quyết định nào ta cần m’+h’ phép tính (m’, h’ là kích thước ma trận tại thời điểm trước khi bổ sung) Tiếp theo, để cập nhật Sup(Ci*, Dj*) chỉ mất một số phép gán và 1 phép cộng Mặt khác, ta cũng có thể coi m’=m+p, n’=n+q, đồng thời m, n |U| Do đó, khi bổ sung một đối tượng, thuật toán có độ phức tạp là O(|U|) Suy ra, khi bổ sung N đối tượng thì thuật toán có độ phức tạp là O(N|U|) Mệnh đề 3.10 Độ phức tạp thời gian của thuật toán tính gia tăng ma trận Sup khi loại bỏ M đối tượng là O(M|U|) Chứng minh: Lập luận tương tự như ở mệnh đề 3.9 ta suy ra độ phức tạp của thuật toán tính gia tăng ma trận Sup khi loại bỏ M đối tượng là O(M|U|) Từ các mệnh đề 3.9 và 3.10 về độ phức tạp thời gian của các thuật toán tính gia tăng ma trận Sup khi bổ sung và loại bỏ đối tượng ta có mệnh đề sau: Mệnh đề 3.11 Độ phức tạp thời gian của thuật toán tính gia tăng ma trận Sup để trích rút 2 các luật quyết định có ý nghĩa khi bổ sung, loại bỏ các đối tượng là O(|U| ) Đối với hai thuật toán tính gia tăng ma trận Sup khi bổ sung hay loại bỏ các đối tượng ra khỏi khối dữ liệu xét trên lát cắt của khối tại điểm x id ta cũng có kết quả tương tự thể hiện ở hai mệnh đề dưới đây Mệnh đề 3.12 Độ phức tạp thời gian của thuật toán tính gia tăng ma trận Sup khi bổ sung N đối tượng xét trên lát cắt của khối tại điểm x id là O(N|U|) Mệnh đề 3.13 97 Độ phức tạp thời gian của thuật toán tính gia tăng ma trận Sup khi loại bỏ M đối tượng xét trên lát cắt của khối tại điểm x id là O(M|U|) 3.8 So sánh hai phương pháp tính gia tăng Hai phương pháp tính gia tăng để phát hiện các luật quyết định cùng sử dụng mô hình bổ sung, loại bỏ đối tượng ra khỏi khối dữ liệu với yêu cầu và giả thiết bài toán như nhau; cùng sử dụng cách tiếp cận gia tăng theo tiếp cận tập thô; cùng xét trên khối quyết định đầy đủ với các giá trị thuộc tính đã được rời rạc hóa; cùng chọn cả độ chính xác và độ phủ của luật để đánh giá mức độ mô tả của các luật quyết định có ý nghĩa được trích rút và cho cùng một kết quả khi chạy trên cùng một khối dữ liệu Tuy nhiên sự khác nhau của chúng được thể hiện ở bảng dưới đây: Phương pháp thực hiện Tính ma trận Acc và Cov khi bổsung /loại bỏ một đối tượng Độ phức tạp tính toán Bảng 3.1 Bảng so sánh hai phương pháp tính gia tăng Trên cơ sở bảng so sánh trên, ta thấy thuật toán tính gia tăng Sup được đề xuất thực hiện tốt hơn so với thuật toán tính gia tăng Acc và Cov 3.9 Ví dụ minh họa Với cùng khối quyết định đã cho ở ví dụ 2.2 Giả sử xảy ra hai trường hợp như sau: Trường hợp 1: Loại bỏ ra khỏi khối dữ liệu 45 đối tượng (O3) có các giá trị thuộc tính là: O3 (45) 98 Trường hợp 2: Bổ sung 75 đối tượng có các giá trị thuộc tính chỉ số dưới đây vào bảng dữ liệu O12 Phương pháp 1: Tìm luật quyết định trên khối khi tập đối tượng thay đổi theo phương pháp tính gia tăng ma trận độ chính xác, độ phủ Ma trận độ chính xác của khối dữ liệu lúc ban đầu là: Acc(C,D) = Ma trận độ phủ lúc ban đầu là: Cov(C,D) = - Trường hợp 1: Loại bỏ ra khỏi khối dữ liệu 45 đối tượng (O3) có các giá trị thuộc tính là: O3 (45) Khi loại bỏ 45 đối tượng (O3), ta có O3 C3 và O3 D5 Vì vậy thay đổi chỉ ảnh hưởng đến dòng 3 và cột 5 trong ma trận (3.1), (3.2) Khi đó, ta có: Acc(C’3,D’5) = 0 và Cov(C’3,D’5) = 0 Acc(C’3,D’j) = 0 và Cov(C’3,D’j) = 0 (j ≠ 5) Acc (C’i,D’5) = Acc (Ci,D5) và Cov (C’i,D’5) = (|Ci D5|)/(|D5| - 45) với i ≠ 3 99 Khi đó, trong trường hợp 1 ma trận độ chính xác và ma trận độ phủ được thay đổi thành: Acc(C’,D’) = Cov(C’,D’) = - Trường hợp 2: Bổ sung 75 đối tượng có các giá trị thuộc tính chỉ số dưới đây vào bảng dữ liệu O13 Khi bổ sung 75 đối tượng có giá trị thuộc tính chỉ số như bảng trên là đối tượng mới, kí hiệu o13 Khi đó, O13 hình thành thêm lớp tương đương điều kiện mới, kí hiệu là C6 Còn o13 được bổ sung vào lớp tương đương quyết định D4 và |D’4| = | o12| + 75 = 165 Vì vậy, hai ma trận (3.3) và (3.4) sẽ được bổ sung thêm một dòng mới là dòng thứ 6, đồng thời cột số 4 sẽ bị thay đổi Khi đó, ta có: + Acc(C’6,D’4) = 1; Cov (C’6,D’4) = 75 / (|D4|+75) + Với j ≠ 4 có: Acc(C’6,D’j) = Cov (C’6,D’j) = 0 + Với i ≠ 6 có: Acc(C’i,D’4) = Acc (Ci,D4) và Cov(C’i,D’4) = (|Ci D4|)/(|D4| +75) 100 Cuối cùng, ta thu được ma trận độ chính xác trong trường hợp 2 này là: Acc(C’’,D’’) = Và ma trận độ phủ sau trường hợp 2 là: Cov(C’’,D’’) = Ta thấy, trong các ma trận (3.5), (3.6), các giá trị cảu các phần tử tại dòng thứ 3 có toàn giá trị 0 Vậy, thực hiện việc xóa bỏ dòng này trước khi tiến hành sinh luật, và ta thu được hai ma trận mới như sau: Cov(C’’,D’’) =0.538 101 Từ hai ma trận (3.7), (3.8) nếu chọn ngưỡng độ chính xác và độ phủ =0.6 và = 0.5 ta có các luật quyết định tìm được là: C3 → D1, C4 → D5 Phương pháp 2: Tìm luật quyết định trên khối khi tập đối tượng thay đổi theo phương pháp tính gia tăng ma trận độ hỗ trợ Ta có ma trận độ hỗ trợ ban đầu là: Sup(C,D) = - Trường hợp 1: Loại bỏ ra khỏi khối dữ liệu 45 đối tượng (O3) có các giá trị thuộc tính là: O3 (45) Khi loại bỏ 45 đối tượng (O3), ta có O3 C3 và O3 D5 Lúc này ta có: Sup (C’3, D’5) = Sup(C3, D5) – 45 Khi đó ma trận (3.9) được cập nhật thành: Sup(C’,D’) = - Trường hợp 2: Bổ sung 75 đối tượng có các giá trị thuộc tính chỉ số dưới đây vào bảng dữ liệu 102 O13 (75) Khi bổ sung 75 đối tượng có giá trị thuộc tính chỉ số như bảng trên là đối tượng mới, kí hiệu O13 Khi đó, O13 hình thành thêm lớp tương đương điều kiện mới, kí hiệu là C6 Do vậy, ma trận (3.10) được bổ sung thêm dòng mới với giá trị ban đầu của tất cả các phần tử trên dòng này được gán bằng 0 Đồng thời, O13 được bổ sung vào lớp tương đương quyết định D4 suy ra ảnh hưởng đến cột số 4 của ma trận (3.10) Do đó: Sup(C6, D4) = Sup(C6, D4) + 75 Ma trận độ chính xác sau trường hợp 2 là: Sup(C’’,D’’) = 0 Ta thấy, các giá trị của các phần tử tại dòng thứ 3 của ma trận (3.11) có toàn giá trị 0 Vậy, thực hiện việc xóa bỏ dòng này trước khi tiến hành sinh luật, và ta thu được ma trận độ hỗ trợ mới như sau: 103 Áp dụng mệnh đề 2.2, ta tính được ma trận độ chính xác và ma trận độ phủ là: Acc(C,D) = Cov(C,D) = Từ hai ma trận (3.13), (3.14) nếu chọn ngưỡng độ chính xác và độ phủ =0.6 và = 0.5 ta có các luật quyết định tìm được là: C3 → D1, C4 → D5 3.10 Thực nghiệm 3.10.1 Mục tiêu thực nghiệm (1) Đánh giá tính thực thi của các thuật toán tìm luật kết hợp trên khối và thuật toán gia tăng tìm luật trên khối trong trường hợp khối có giá trị thuộc tính thay đổi (2) Đánh giá tính thực thi và hiệu quả thời gian thực hiện của thuật toán tính gia tăng ma trận độ chính xác, ma trận độ phủ so với thuật toán tính gia tăng ma trận độ hỗ trợ để tìm ra luật quyết định trên khối khi tập đối tượng thay đổi 3.10.2 Dữ liệu thử nghiệm Việc thử nghiệm được thực hiện trên 3 tập dữ liệu lấy từ khoa Nhi A, B của Bệnh viện Bạch Mai cơ sở 2 từ ngày 10/03/2020 đến ngày 14/03/2020 Dữ liệu được thu thập và đã qua quá trình tiền xử lí với mỗi bộ dữ liệu đều gồm 3 thuộc tính chỉ số điều kiện là các triệu chứng bệnh gồm sốt, ho, sổ mũi và 2 thuộc tính chỉ số quyết định là phác đồ điều trị và mức độ sốt vi rút theo dõi qua 4 ngày Số phần tử của các bộ dữ liệu là: 104 Tên CSDL Số đối tượng Bảng 3.2: Các thông tin cơ bản về cơ sở dữ liệu thực nghiệm 3.10.3 Công cụ và môi trường thử nghiệm Công cụ thực hiện lập trình các thuật toán là ngôn ngữ Java Môi trường thử nghiệm là máy tính PC với cấu hình Intel(R) Core™ i5 2.5Ghz, RAM 4G, Windows 7 OS 3.10.4 Kết quả thực nghiệm Sau khi chạy 3 thuật toán trên các bộ dữ liệu ta thu được các kết quả như sau: - Với bài toán 1: tìm luật quyết định trên khối và lát cắt của khối (thuật toán MDLB) Ta có, kết quả của chương trình: Hình 3.1: Menu của chương trình 105 Hình 3.2: Tìm các lớp tương đương điều kiện, quyết định Hình 3.3 Ma trận Sup, Acc, Cov tìm được 106 Hình 3.4: Luật quyết định tìm được trên khối Number of rules Khi thay đổi acc và cov thì số lượng luật thu được cũng thay đổi: rule Coverage Cov = 0.65 Cov = 0.7 Number of Cov = 0.75 Cov = 0.8 Cov = 0.85 2 0 0.15 0.2 0.25 0.3 Accuracy 0.35 0.4 Hình 3.5: Môi quan hệ giữa số lượng luật kết quả với ngưỡng min_acc, min_cov - Với bài toán 2: tìm luật quyết định trên khối và lát cắt của khối khi làm mịn, làm thô giá trị thuộc tính (thuật toán MDLB_VAC) Ta có, kết quả của chương trình: 107 Hình 3.6: Chọn giá trị làm mịn Hình 3.7: Tính các ma trận Sup, Acc, Cov trước và sau khi làm mịn 108 Hình 3.8: Chọn giá trị thuộc tính làm thô Hình 3.9: Tính các ma trận Sup, Acc, Cov trước và sau khi làm thô 109 Hình 3.10: Luật quyết định tìm được sau khi làm mịn, thô giá trị thuộc tính - Với bài toán 3: tìm luật quyết định trên khối và lát cắt của khối khi bổ sung, loại bỏ phần tử (Thuật toán MDLB_OSC1 và MDLB_OSC2) Ta có, kết quả của chương trình với 2 phương pháp tính: tính gia tăng ma trận Acc, Cov (thuật toán MDLB_OSC1) và tính gia tăng ma trận Sup (thuật toán MDLB_OSC2) Hình 3.12: Chọn đối tượng bị loại bỏ ... xây dựng khối 2.1.1 Khối thông tin 2.1.2 Quan hệ không biệt 2.1.3 Khối định 2.1.4 Luật định khối lát cắ 2.2 Thuật toán khai phá luật định khối lát cắt (MDLB) 2.3 Khai phá luật định khối có giá... SỞ 1.1 Khai phá liệu 1.1.1 Định nghĩa khai phá liệu 1.1.2 Một số kỹ thuật khai phá liệu 1.2 Khai phá luật định 1.2.1 Hệ thông tin 1.2.2 Quan hệ không phân biệt 1.2.3 Bảng định 1.2.5 Luật định 1.3... khái niệm mơ hình liệu dạng khối: khối, lát cắt khối điểm, đại số quan hệ khối Những kiến thức sở cho vấn đề trình bày chương luận án 22 CHƯƠNG 2: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI DỮ LIỆU CÓ GIÁ