Luận án Tiến sĩ Máy tính: Khai phá luật quyết định trên mô hình dữ liệu dạng khối

129 21 0
Luận án Tiến sĩ Máy tính: Khai phá luật quyết định trên mô hình dữ liệu dạng khối

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đề tài nghiên cứu nhằm tìm các luật quyết định trên khối và trên lát cắt; tìm các luật quyết định giữa các nhóm đối tượng trên khối khi có sự thay đổi giá trị thuộc tính, cụ thể là khi làm mịn, hoặc làm thô giá trị thuộc tính; tìm các luật quyết định giữa các nhóm đối tượng trên khối khi bổ sung, loại bỏ phần tử của khối.

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Đỗ Thị Lan Anh KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN MƠ HÌNH DỮ LIỆU DẠNG KHỐI LUẬN ÁN TIẾN SĨ MÁY TÍNH Hà Nội – Năm 2020 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Đỗ Thị Lan Anh KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN MƠ HÌNH DỮ LIỆU DẠNG KHỐI Chun ngành: Khoa học máy tính Mã số: 48 01 01 LUẬN ÁN TIẾN SĨ MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS Trịnh Đình Thắng Hà Nội – Năm 2020 i LỜI CẢM ƠN Lời đầu tiên, cho phép tác giả xin bày tỏ lòng biết ơn sâu sắc chân thành tới PGS TS Trịnh Đình Thắng, người thầy tận tình hướng dẫn, bảo cho tác giả suốt trình học tập, nghiên cứu hoàn thành luận án Tác giả xin chân thành cảm ơn tới tập thể thầy cô giáo, nhà khoa học thuộc: Viện Công nghệ Thông tin – viện Hàn lâm Khoa học Công nghệ Việt Nam, Khoa Công nghệ Thông tin – Học viện Khoa học Công nghệ, viện Công nghệ Thông tin – trường Đại học Sư phạm Hà Nội giúp đỡ chuyên môn tạo điều kiện thuận lợi cho tác giả suốt thời gian học tập nghiên cứu Cuối cùng, tác giả xin gửi tới gia đình, người thân, bạn bè lời cảm ơn chân thành ủng hộ, đồng hành, chỗ dựa vững động lực giúp tác giả hoàn thành luận án Tác giả luận án Đỗ Thị Lan Anh ii LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu tơi hướng dẫn khoa học PGS TS Trịnh Đình Thắng Các kết viết chung với đồng tác giả chấp thuận tác giả trước đưa vào luận án Các kết nêu luận án trung thực chưa cơng bố cơng trình khác Tác giả luận án Đỗ Thị Lan Anh iii MỤC LỤC Trang Danh mục ký hiệu, chữ viết tắt v Danh mục bảng, hình vẽ vi MỞ ĐẦU CHƯƠNG 1: MỘT SỐ KIẾN THỨC CƠ SỞ 1.1 Khai phá liệu 1.1.1 Định nghĩa khai phá liệu 1.1.2 Một số kỹ thuật khai phá liệu 1.2 Khai phá luật định 10 1.2.1 Hệ thông tin 10 1.2.2 Quan hệ không phân biệt 11 1.2.3 Bảng định 13 1.2.5 Luật định 14 1.3 Mơ hình liệu dạng khối 16 1.3.1 Khối, lược đồ khối 16 1.3.2 Lát cắt 18 1.3.3 Đại số quan hệ khối 18 1.4 Kết luận chương 21 CHƯƠNG 2: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI DỮ LIỆU CÓ GIÁ TRỊ THUỘC TÍNH THAY ĐỔI 22 2.1 Một số khái niệm xây dựng khối 22 2.1.1 Khối thông tin 22 2.1.2 Quan hệ không biệt 25 2.1.3 Khối định 26 2.1.4 Luật định khối lát cắt 28 2.2 Thuật toán khai phá luật định khối lát cắt (MDLB) 31 2.3 Khai phá luật định khối có giá trị thuộc tính thay đổi 34 2.3.1 Làm mịn, thơ lớp tương đương điều kiện khối lát cắt 40 2.3.2 Làm mịn, thô lớp tương đương định khối lát cắt 44 2.3.3 Làm mịn cảm sinh hồn tồn thuộc tính số lát cắt 2.3.4 Thuật toán khai phá luật định khối có giá trị thuộc tính 48 iv thay đổi (MDLB_VAC) 50 2.4 Độ phức tạp thuật tốn tính ma trận Sup khối lát cắt 60 2.5 Ví dụ minh họa 62 2.5.1 Minh họa toán sinh luật định khối 62 2.5.2 Minh họa toán sinh luật định khối làm mịn, thơ giá trị thuộc tính số 63 2.6 Kết luận 66 CHƯƠNG 3: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI CÓ TẬP ĐỐI TƯỢNG THAY ĐỔI 67 3.1 Mơ hình bổ sung, loại bỏ đối tượng khối lát cắt 67 3.2 Tính toán gia tăng Acc Cov bổ sung, loại bỏ đối tượng khối 74 3.2.1 Bổ sung đối tượng x vào khối định 74 3.2.2 Loại bỏ phần tử x khỏi khối định 77 3.3 Thuật tốn sinh luật định phương pháp tính gia tăng ma trận Acc Cov sau bổ sung, loại bỏ phần tử (MDLB_OSC1) 78 3.4 Độ phức tạp thuật tốn MDLB_OSC1 83 3.5 Tính toán gia tăng Sup bổ sung, loại bỏ đối tượng khối lát cắt 86 3.6 Thuật toán sinh luật định phương pháp tính gia tăng ma trận Sup sau bổ sung loại bỏ đối tượng (MDLB_OSC2) 88 3.7 Độ phức tạp thuật toán MDLB_OSC2 96 3.8 So sánh hai phương pháp tính gia tăng 97 3.9 Ví dụ minh họa 97 3.10 Thực nghiệm 103 3.11 Kết luận 112 KẾT LUẬN 113 DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ 114 TÀI LIỆU THAM KHẢO 115 v DANH MỤC CÁC KÍ HIỆU, CÁC CHỮ VIẾT TẮT Kí hiệu, chữ viết tắt Diễn giải Acc Accuracy (Độ xác) Cov Coverage (Độ phủ) Sup Support (Độ hỗ trợ) IND(P) Quan hệ khơng phân biệt id  id’ Tích rời rạc hai tập số id id’ P(r) Phép chiếu khối r lược đồ P F(r) Phép chọn khối r theo biểu thức Boole F r  s Phép kết nối hai khối r s IB = (U, A, V, f) Khối thông tin DB = (U, CD) Khối định U/C Tập lớp tương đương điều kiện khối U/D Tập lớp tương đương định khối U/Cx Tập lớp tương đương điều kiện lát cắt điểm x U/Dx Tập lớp tương đương định lát cắt điểm x  Ngưỡng độ xác tối thiểu  Ngưỡng độ phủ tối thiểu vi DANH MỤC CÁC BẢNG Trang Bảng 1.1 Bảng Bệnh nhân Bảng 1.1 Một ví dụ hệ thơng tin 11 Bảng 1.2 Bảng định bệnh cúm 14 Bảng 2.1 Bảng biểu diễn khối thông tin Bệnh nhân bị sốt virut khoa Nhi A Bệnh viện Bạch Mai sở 25 Bảng 3.1 Bảng so sánh hai phương pháp tính gia tăng 98 Bảng 3.2 Các thơng tin CSDL thực nghiệm 104 vii DANH MỤC CÁC HÌNH VẼ Hình 1.1 Ví dụ Khối Bệnh nhân Hình 1.2 Ví dụ khối Khách hàng 19 Hình 1.3 Minh họa lát cắt khối Khách hàng điểm x = 3/2019 20 Hình 2.1 Minh họa khối thông tin bệnh nhân bị sốt virut Khoa Nhi A – Bệnh viện Bạch Mai sở 24 Hình 2.2 Minh họa khối định Bệnh nhân sốt vi rút 28 Hình 3.1 Menu chương trình 105 Hình 3.2 Tìm lớp tương đương điều kiện, định 105 Hình 3.3 Ma trận Sup, Acc, Cov tìm 106 Hình 3.4 Luật định tìm khối 106 Hình 3.5 Mối quan hệ số lượng luật kết ngưỡng min_acc, min_cov 107 Hình 3.6 Chọn giá trị làm mịn 107 Hình 3.7 Tính ma trận Sup, Acc, Cov trước sau làm mịn 108 Hình 3.8 Chọn giá trị thuộc tính làm thơ 108 Hình 3.9 Tính ma trận Sup, Acc, Cov trước sau làm thô 109 Hình 3.10 Luật định tìm sau làm thơ, mịn giá trị thuộc tính 109 Hình 3.11 Chọn đối tượng bị loại bỏ 110 Hình 3.12 Nhập đối tượng bổ sung vào khối 110 Hình 3.13 Kết chương trình tính gia tăng ma trận Acc, Cov luật định thu 111 Hình 3.14 Kết chương trình tính gia tăng ma trận Sup luật định thu 111 Hình 3.15 Thời gian chạy (mili giây) trung bình hai thuật tốn 112 MỞ ĐẦU Lý chọn đề tài Khai phá liệu lĩnh vực nhận nhiều quan tâm nghiên cứu nhà khoa học giới Hội nghị quốc tế khai phá liệu KDD lần thứ 26 tổ chức California, Mỹ vào tháng năm 2020 hội nghị lớn tiếng hàng đầu lĩnh vực khai phá liệu quy tụ hàng trăm nhà khoa học tham gia [1], [2] Một số hội nghị khai phá liệu tiếng tổ chức thường niên hàng năm giới kể đến như: hội nghị KDD, ICDE, IEEE ICDM, CIKM, SIAM SDM, PKDD, PAKDD… Nhóm tốn thường nghiên cứu khai phá liệu gồm có: Phân lớp, dự đoán, luật kết hợp phân cụm [3], [4], [5] Khai phá luật định kĩ thuật nằm nhóm tốn phân lớp đối tượng Đây kĩ thuật khai phá liệu phổ biến nhiều chuyên gia ngồi nước nghiên cứu mơ hình sở liệu quan hệ số mô hình mở rộng mơ hình liệu quan hệ mơ hình datacube, mơ hình nhà kho liệu, mơ hình liệu đa chiều ….[6], [7], [8], [9], [10], [11] Năm 1998, tác giả Nguyễn Xuân Huy, Trịnh Đình Thắng đề xuất mơ hình liệu dạng khối, mở rộng mơ hình quan hệ [9] Mơ hình xây dựng lý thuyết cài đặt thực nghiệm Với việc đưa thêm trục id cho phép theo dõi thay đổi liệu theo q trình, cụ thể theo thời gian, giai đoạn, khoảng cách [12], [13], [14], [15], [16], [17], [18], [19] Kết tốn khai phá luật mơ hình quan hệ cho ta luật hữu ích thời điểm Tuy nhiên, thực tế với số vấn đề đặc thù chuẩn đốn bệnh, theo dõi q trình mua bán hàng siêu thị hay q trình quản lí cán quan, Việc tìm mối quan hệ (các luật) đối tượng sở liệu theo q trình giúp ích cho chuyên gia đưa định xác Ví dụ: bảng định Bệnh nhân 106 Hình 3.4: Luật định tìm khối Khi thay đổi acc cov số lượng luật thu thay đổi: Number of rules 60 50 Acc =0.1 40 Acc =0.2 30 Acc =0.3 20 Acc =0.4 10 Acc =0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Acc =0.6 Number of rule Coverage 16 14 12 10 Cov = 0.65 Cov = 0.7 Cov = 0.75 Cov = 0.8 Cov = 0.85 0.15 0.2 0.25 0.3 0.35 0.4 Accuracy Hình 3.5: Mơi quan hệ số lượng luật kết với ngưỡng min_acc, min_cov - Với toán 2: tìm luật định khối lát cắt khối làm mịn, làm thơ giá trị thuộc tính (thuật tốn MDLB_VAC) Ta có, kết chương trình: 107 Hình 3.6: Chọn giá trị làm mịn Hình 3.7: Tính ma trận Sup, Acc, Cov trước sau làm mịn 108 Hình 3.8: Chọn giá trị thuộc tính làm thơ Hình 3.9: Tính ma trận Sup, Acc, Cov trước sau làm thơ 109 Hình 3.10: Luật định tìm sau làm mịn, thơ giá trị thuộc tính - Với tốn 3: tìm luật định khối lát cắt khối bổ sung, loại bỏ phần tử (Thuật toán MDLB_OSC1 MDLB_OSC2) Ta có, kết chương trình với phương pháp tính: tính gia tăng ma trận Acc, Cov (thuật tốn MDLB_OSC1) tính gia tăng ma trận Sup (thuật tốn MDLB_OSC2) Hình 3.12: Chọn đối tượng bị loại bỏ 110 Hình 3.12: Nhập đối tượng bổ sung vào khối + Kết chương trình tính gia tăng ma trận Acc, Cov (thuật tốn MDLB_OSC1): Hình 3.13: Kết thuật toán MDLB_OSC1 luật định thu 111 + Kết chương trình tính tính gia tăng ma trận Sup (thuật tốn MDLB_OSC2): Hình 3.14: Kết thuật toán MDLB_OSC2 luật định thu Ta thấy phương pháp cho kết tập luật với tập Time (ms) nguồn, khác thời gian thực hiện: 9000 8000 7000 6000 5000 4000 3000 2000 1000 Thuật toán MDLB_OSC1 Thuật toán MDLB_OSC2 BVBM2KNA Kid Patient Fever Virus BVBM2KNB Hình 3.15: Thời gian chạy (mili giây) trung bình hai thuật tốn 3.11 Kết luận Từ mơ hình bổ sung loại bỏ đối tượng khối định lát cắt đề xuất, số tính chất ma trận Acc Cov chứng minh Trên 112 sở đó, hai thuật tốn tìm luật định khối lát cắt đưa ra: - Thuật toán MDLB_OSC1 tính gia tăng ma trận Acc, Cov để tìm luật định có ý nghĩa khối lát cắt - Thuật tốn MDLB_OSC2 tính gia tăng ma trận độ hỗ trợ Sup để tìm luật định có ý nghĩa Cuối chương phần so sánh hai thuật toán đề xuất cài đặt thực nghiệm 113 KẾT LUẬN 1) Những kết luận án Luận án tập trung nghiên cứu toán khai phá luật định khối số trường hợp với kết sau: - Xây dựng mơ hình khai phá luật định khối với khái niệm, định lí, tính chất chứng minh - Đề xuất 03 thuật tốn tìm luật định khối trường hợp: liệu khối cố định; giá trị thuộc tính số thay đổi; trường hợp tập đối tượng thay đổi Các kết nghiên cứu với mục đích tìm tri thức có ý nghĩa khối định để giúp ích cho nhà quản lí, nhà hoạch định, kinh doanh việc theo dõi, quản lí, định… thực tế cơng việc 2) Hướng phát triển luận án - Tiếp tục nghiên cứu vấn đề khai phá luật định khối có thuộc tính thay đổi đồng thời, liệu không đầy đủ… - Khai phá luật định có ý nghĩa chuỗi khối định liên kết với (tương đồng với công nghệ blockchain) 114 DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ CT1 Trịnh Đình Thắng, Trần Minh Tuyến, Đỗ Thị Lan Anh, “Khai phá luật định khối liệu có giá trị thuộc tính thay đổi”, Kỷ yếu Hội thảo Quốc gia lần thứ XIX: Một số vấn đề chọn lọc Công nghệ thông tin truyền thông, Hà Nội, 01- 02/10/2016, Tr 163 – 169 CT2 Trịnh Đình Thắng, Trần Minh Tuyến, Đỗ Thị Lan Anh, Nguyễn Thị Quyên, “Một số kết khai phá luật định khối liệu có giá trị thuộc tính thay đổi”, Kỷ yếu Hội nghị Khoa học Công nghệ Quốc gia lần thứ X: Nghiên cứu ứng dụng công nghệ thông tin, Đà Nẵng, 17-18/08/2017, Tr 623 – 632 CT3 Trịnh Đình Thắng, Đỗ Thị Lan Anh, “Một số thuật toán xác định ma trận độ hỗ trợ khối liệu có giá trị thuộc tính thay đổi”, Kỷ yếu Hội thảo Quốc gia lần thứ XXI: Một số vấn đề chọn lọc Công nghệ thông tin truyền thơng, Thanh Hóa, 27- 28/07/2018, Tr 216 – 225 CT4 Thang Trinh Dinh, Anh Do Thi Lan, “Some properties about smoothing, roughen the values of the index attribute on the decision block”, International Journal of Advanced Research in Computer Science, Volume 10 issue March – April 2019 CT5 Đỗ Thị Lan Anh, Trịnh Đình Thắng, “Một phương pháp gia tăng để tính độ xác độ phủ luật định khối liệu có tập đối tượng thay đổi”, Chun san cơng trình nghiên cứu phát triển Công nghệ thông tin truyền thơng, Tạp chí thơng tin Khoa học cơng nghệ Bộ Thông tin truyền thông, Tập 2019 số 1, 2019, Tr – 10 CT6 Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến, Cao Hồng Huệ, “Phương pháp gia tăng ma trận độ hỗ trợ khối liệu lát cắt có tập đối tượng thay đổi”, Kỷ yếu Hội nghị Khoa học Công nghệ Quốc gia lần thứ XII: Nghiên cứu ứng dụng công nghệ thông tin, Huế, 7-8/06/2019 115 TÀI LIỆU THAM KHẢO [1] https://www.kdd.org/kdd2019/ [2] https://www.kdd.org/kdd2020/ [3] Lê Văn Phùng, Quách Xuân Trưởng (2010), Khai phá liệu – Data Mining, Nhà xuất thông tin truyền thông [4] Nguyễn Thanh Thủy (2001), Khai phá liệu – kỹ thuật ứng dụng, Hà Nội [5] Jiawei Han, Micheline Kamber, Jian Pei (2011), Data mining: concepts and techniques, Elsevier publisher [6] Akrivi Vlachou, Christos Doulkeridis, Kjetil Norvag, Yannis Kotidis, Peer-toPeer Query Processing over Multidimensional Data (SpringerBriefs in Computer Science) Paperback, Springer; 2012 edition, 2012 [7] Brian Ciampa, The Data Warehouse Workshop: Providing Practical Experience to the Aspiring ETL Developer Paperback, CreateSpace Independent Publishing Platform, 2014 [8] Christian S.Jensen, Torben Bach Pedersen, Christian Thomsen (2010), Multidimensional Databases and Data Warehousing (Synthesis Lectures on Data Management) Paperback, Morgan and Claypool Publishers; edition [9] Haiping Lu, Konstantinos N Plataniotis, Anastasios Venetsanopoulos (2013), Multilinear Subspace Learning: Dimensionality Reduction of Multidimensional Data (Chapman & Hall/Crc Machine Learning & Pattern Recognition) Hardcover, Chapman and Hall/CRC; edition [10] Krish Krishnan (2013), Data Warehousing in the Age of Big Data (The Morgan Kaufmann Series on Business Intelligence), Paperback, Morgan Kaufmann; edition [11] Ladjel Bellatreche, Mukesh K Mohania (2014), Data Warehousing and Knowledge Discovery, 16th International Conference, DaWaK 2014, Munich, Germany, September 2-4, 2014 Proceedings (Lecture Notes Applications, incl Internet/Web, and HCI) Paperback, Springer; 2014 edition [12] Trần Minh Tuyến, Trịnh Ðình Thắng (2014), Phụ thuộc Boole dương tổng quát mô hình liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ XVII "Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông", Buôn Ma Thuột, tr 274279 116 [13] Trịnh Đình Thắng, Mơ hình liệu dạng khối, NXB Lao động, 2011 [14] Trịnh Đình Thắng, Một số kết bao đóng, khóa phụ thuộc hàm mơ hình liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ IV “Một số vấn đề chọn lọc Công nghệ Thơng tin”, (245-251), Hải Phịng 05-07/06/2001 [15] Trịnh Đình Thắng, Trần Minh Tuyến, Ánh xạ đóng phép dịch chuyển lược đồ khối, Kỷ yếu Hội nghị quốc gia lần thứ VI Nghiên cứu ứng dụng Công nghệ Thông tin (FAIR), (174-179), Thừa Thiên–Huế 20-21/6/2013 [16] Trịnh Đình Thắng, Trần Minh Tuyến, Trịnh Ngọc Trúc, Phụ thuộc boolean dương đa trị mơ hình liệu dạng khối, Kỷ yếu Hội nghị quốc gia lần thứ IX FAIR, Nghiên cứu ứng dụng Công nghệ Thơng tin, (602-609), Cần Thơ 04-05/08/2016 [17] Trịnh Đình Thắng, Trịnh Đình Vinh (2008), Phụ thuộc đa trị mơ hình liệu dạng khối, Kỷ yếu Hội thảo quốc gia lần thứ 11 "Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông", Huế, tr 321-328 [18] Trinh Dinh Thang, Tran Minh Tuyen, Trinh Ngoc Truc, Pham Thi Phuong (2020), Some properties of multivalued positive Boolean dependencies in the database model of block form, Indian Journal of Science and Technology, volume 13(25), pp 2509-2519 [19] Trinh Dinh Thang, Trinh Ngoc Truc, Tran Minh Tuyen, Nguyen Nhu Son (2020), Multivalued positive boolean dependencies by groups in the database model of block form, International Journal of Advanced Research in Computer Science, Volume 11 [20] Z Pawlak (2002), Rough sets and intelligent data analysis, Information Sciences, 147, pp 1-12 [21] Shan N., Ziarko, W (1995), Data–based acquisition and incremental modification of classification rules, Computational Intelligentce, 11, pp 357-370 [22] Bian, X (1998), Certain rule learning of the inconsistent data, Journal of East China Shipbuilding Institute, 12(1), pp 25-30 (In Chinese) [23] Tong, L An (2002), Incremental learning of decision rules based on rough set theory, Proceedings of the World Congress on Intellighent Control and Automation 117 (WCIC2002), pp/ 420-425) [24] Liu, D., Li, T., Ruan, D., Zou, W (2009), An incremental approach for inducing knowledge from dynamic information systems, Fundam Inform., (94), pp 245–260 [25] Chen, H., Li, T., Qiao S., Ruan D (2010), A Rough Set based dynamic maintenance approach for approximations in coarsening and refining attribute values, International journal of intelligent systems, (25), pp 1005-1026 [26] Asma Lamani, Brahim Erraha, Malika Elkyal, Abdallah Sair (2019), Data mining techniques application for prediction in OLAP cube, International Journal of Electrical and Computer Engineering (IJECE) Volume 9, pp 2094 – 2102 [27] C.K.H Lee, K.L Choy, G.T.S Ho, K.S Chin, K.M.Y.Law, Y.K.Tse (2013), A hybrid OLAP-association rule mining based quality management system for extracting defect patterns in the garment industry, Expert Systems with Applications, Volume 40, pp 2435 – 2466 [28] H C Tjioe and D Taniar, Mining Association Rules in Data Warehouses, International Journal of Data Warehousing and Mining, 28–62, 2005 [29] Holger Gunzel, Jens Albrecht, Wolfgang Lehner (1999), Data Mining in a Multidimensional Environment, Advances in Databases and Information Systems, Springer Publisher, pp 191 – 204 [30] H Zhu, On-Line Analytical Mining of Association Rules Master’s thesis, Simon Fraser University, Burnaby, British Columbia, Canada, December 1998 [31] J Han and Y Fu, Discovery of Multiple-Level Association Rules from Large Databases, In Proceedings of the 21st International Conference on Very Large Data Bases (VLDB 1995), pages 420–431, Zurich, Switzerland, September 1995 Morgan Kaufmann [32] Jigna J Jadav, Mahesh Panchal (2012), Association Rule Mining Method On OLAP Cube, International Journal of Engineering Research and Applications, Vol 2, pp.1147-1151 [33] Alina A.von Davier, Park Chung Wong, , The argument for a “Data cube” for large – scale Spychometric data [34] Omar Boutkhoum, Mohamed Hanine (2017), An integrated decision-making prototype based on OLAP systems and multicriteria analysis for complex decision- 118 making problems, Applied Informatic, Stringer, 2017 edition [35] Riadh Ben Messaoud, Sabine Loudcher Rabas´eda (2006), Enhanced Mining of Association Rules from Data Cubes [36] Salvatore Greco, Benedetto Matarazzo, Roman Slowinski, Decision Rule Approach, Multiphle Criteria Decision Analysis, International Series in Operations Research & Management Science, volume 223, pp 497 – 552 [37] S Nestorov and N Juki´c Ad-Hoc, Association-Rule Mining within the Data Warehouse In Proceedings of the 36th Hawaii International Conference on System Sciences (HICSS 2003), pages 232–242, Big Island, Hawaii, USA, January 2003 IEEE Computer Society [38] M Kamber, J Han, and J Chiang, Metarule-Guided Mining of MultiDimensional Association Rules Using Data Cubes, In Proceedings of the rd International Conference on Knowledge Discovery and Data Mining (KDD 1997), pages 207–210, Newport Beach, CA, USA, August 1997 The AAAI Press [39] H Zhu, On-Line Analytical Mining of Association Rules Master’s thesis, Simon Fraser University, Burnaby, British Columbia, Canada, December 1998 [40] Q Chen, U Dayal, and M Hsu, An OLAP-based Scalable Web Access Analysis Engine, In Proceedings of the nd International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2000), Lecture Notes in Computer Science, pages 210–223, London, UK, September 2000 Springer-Verlag [41] S Nestorov and N Juki´c Ad-Hoc, Association-Rule Mining within the Data Warehouse In Proceedings of the 36th Hawaii International Conference on System Sciences (HICSS 2003), pages 232–242, Big Island, Hawaii, USA, January 2003 IEEE Computer Society [42] H C Tjioe and D Taniar, Mining Association Rules in Data Warehouses, International Journal of Data Warehousing and Mining, 28–62, 2005 [43] Riadh Ben Messaoud, Sabine Loudcher Rabas´eda (2006), Enhanced Mining of Association Rules from Data Cubes [44] Wolfram Hopken, Volker Meyer, Matthias Fuchs, Maria Lexhagen (2015), Integration of data mining results into multi-dimensional data models, Information and Communication Technologies in Tourism, pp 155 – 168 [45] Omar Boutkhoum, Mohamed Hanine (2017), An integrated decision-making 119 prototype based on OLAP systems and multicriteria analysis for complex decisionmaking problems, Applied Informatic, Stringer, 2017 edition [46] Viktor Putrenko, Nataliia Pashvnska, Data Mining of Network Events with Space-Time Cube Application, 2018 IEEE Second International Conference on Data Stream Mining & Processing (DSMP) [47] Hanen Brahmi (2019), Post-Mining of Generalized Association Rules from Data Cubes, 2019 International Conference on Information Networking (ICOIN), IEEE Publisher [48] Nguyễn Hữu Trọng (2008), Phát triển số thuật toán khai phá luật kết hợp sở liệu gia tăng, Luận án Tiến sĩ Toán học [49] Nguyễn Long Giang (2012), Nghiên cứu số phương pháp khai phá liệu theo tiếp cận lí thuyết tập thơ, Luận án Tiến sĩ Tốn học [50] Nguyễn Quang Khanh (2012), Khai phá luật định bảng liệu động, Luận án Tiến sĩ Tốn học [51] Cao Chính Nghĩa (2017), Nghiên cứu phương pháp rút gọn thuộc tính sinh luật định theo tiếp cận tập thô mờ, Luận án Tiến sĩ Toán học [52] J Han and Y Fu, Discovery of Multiple-Level Association Rules from Large Databases, In Proceedings of the 21st International Conference on Very Large Data Bases (VLDB 1995), pages 420–431, Zurich, Switzerland, September 1995 Morgan Kaufmann [53] Bharati M Ramageri, (2019) Data mining techniques and applications, Indian Journal of Computer Science and Engineering Vol No 301-305 [54] Zdzislaw Pawlak (1982), Rough sets, International Journal of Computer and Information Sciences, 11 (5), pp 341-356 [55] L Sumalathai, P Sanraki, B Sujatha (2016), Rough set based decision rule generation to find behavioural patterns of customers, Vol 41, No 9, September 2016, pp 985–991 Indian Academy of Sciences [56] Kryszkiewicz, M (1999), Rule in complete information systems, Information Science, (113), pp 271 - 292 [57] Apostolos Benisis, Business Process Management: A Data Cube To Analyze Business Process Simulation Data For Decision Making Paperback, VDM Verlag Dr Müller, 2010 120 [58] Christian S.Jensen, Torben Bach Pedersen, Christian Thomsen (2010), Multidimensional Databases and Data Warehousing (Synthesis Lectures on Data Management) Paperback, Morgan and Claypool Publishers; edition [59] Z Pawlak (2002), Rough sets and intelligent data analysis, Information Sciences, 147, pp 1-12 [60] Tsumoto, S (2002), Accuracy and coverage in rough set rule induction, RSCTC2002, LNAI, 2475, pp 373-380 ... Luật định 14 1.3 Mơ hình liệu dạng khối 16 1.3.1 Khối, lược đồ khối 16 1.3.2 Lát cắt 18 1.3.3 Đại số quan hệ khối 18 1.4 Kết luận chương 21 CHƯƠNG 2: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI DỮ LIỆU... khái niệm mơ hình liệu dạng khối: khối, lát cắt khối điểm, đại số quan hệ khối Những kiến thức sở cho vấn đề trình bày chương luận án 22 CHƯƠNG 2: KHAI PHÁ LUẬT QUYẾT ĐỊNH TRÊN KHỐI DỮ LIỆU CĨ GIÁ... dựng khối 22 2.1.1 Khối thông tin 22 2.1.2 Quan hệ không biệt 25 2.1.3 Khối định 26 2.1.4 Luật định khối lát cắt 28 2.2 Thuật toán khai phá luật định khối lát cắt (MDLB) 31 2.3 Khai phá luật định

Ngày đăng: 27/02/2021, 09:19

Tài liệu cùng người dùng

Tài liệu liên quan