Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
1,26 MB
Nội dung
Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ QUỲNH TRANG KHAI PHÁ LUẬT KẾT HỢP MỜ ĐA CẤP VÀ ỨNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Footer Page of 126 Header Page of 126 Công trình hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS Trƣơng Ngọc Châu Phản biện 1: TS Nguyễn Trần Quốc Vinh Phản biện 2: PGS.TS Lê Mạnh Thạnh Luận văn bảo vệ trước hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật Đại học Đà Nẵng vào ngày 16 tháng 11 năm 2013 Có thể tìm hiểu luận văn tại: Trung tâm Thông tin Học liệu, Đại học Đà Nẵng Footer Page of 126 Header Page of 126 MỞ ĐẦU Tính cấp thiết đề tài Hơn thập niên trở lại đây, khai phá liệu trở thành hướng nghiên cứu lĩnh vực khoa học máy tính công nghệ tri thức Hàng loạt nghiên cứu, đề xuất đời thử nghiệm ứng dụng thành công vào đời sống [1] Khai phá liệu trình khám phá thông tin ẩn tìm thấy sở liệu, giai đoạn quan trọng tiến trình khai phá tri thức từ sở liệu, hay gọi trình trích rút tri thức từ liệu, tri thức hỗ trợ việc định khoa học kinh doanh Nhận biết tầm quan trọng lĩnh vực nên số hệ thống quản trị sở liệu tích hợp khám phá công cụ khai phá liệu [5] Khai phá liệu theo hướng tiếp cận luật kết hợp số vấn đề quan trọng lĩnh vực khai phá liệu Mục đích tìm luật tiềm ẩn sở liệu Luật kết hợp (association rules) dạng luật biểu diễn tri thức dạng đơn giản dễ hiểu Hướng tiếp cận ứng dụng nhiều lĩnh vực khác như: kinh doanh, y học, tin sinh học, giáo dục, viễn thông, tài thị trường chứng khoán, Trong thời kỳ đầu, luật kết hợp đơn giản khám phá diện mẫu A dẫn đến xuất mẫu B Sau luật kết hợp phát triển để khám phá quan hệ có tính số lượng mẫu, luật gọi luật kết hợp số lượng Những nghiên cứu luật kết hợp gần tập trung xây dựng thuật toán khai phá luật kết hợp mới, hiệu cải tiến, phát triển thuật toán hiệu từ thuật toán có Footer Page of 126 Header Page of 126 Trong thời gian gần đây, lý thuyết tập mờ áp dụng để xử lý liệu số lượng khám phá liệu Nguyên nhân việc áp dụng lý thuyết tập mờ hạn chế tập cổ điển (tập rõ) việc rời rạc giá trị số lượng Hơn lý thuyết tập mờ cung cấp công cụ cần thiết để thực tính toán cấu trúc liệu khác Việc sử dụng logic mờ mô hình quan hệ cung cấp cách hiệu để xử lý liệu số với thông tin không xác, không chắn Một số nguyên cứu chứng minh hiệu suất vượt trội logic mờ khai phá liệu kho liệu Nắm bắt lĩnh vực nguyên cứu có nhiều triển vọng, chọn hướng nguyên cứu “ Khai phá luật kết hợp mờ đa cấp ứng dụng” làm đề tài luận văn Mục tiêu nghiên cứu Trên sở nghiên cứu lý thuyết khai phá luật kết hợp; Khai phá luật kết hợp mờ; Khai phá luật kết hợp đa cấp; Kiến thức tảng khai phá liệu; Lý thuyết tập mờ; Khai phá luật kết hợp mờ Nắm vững ngôn ngữ lập trình hệ quản trị sở liệu Về lý thuyết: - Tìm hiểu khai phá liệu khai phá luật kết hợp mờ - Tìm hiểu khai phá luật kết hợp đa cấp - Nghiên cứu mô hình thuật toán khai phá luật kết hợp mờ đa cấp Về thực tiễn: Đề tài đề xuất mô hình thuật toán khai phá luật kết hợp mờ đa cấp, áp dụng khai phá vào nhiều liệu nhiều lĩnh vực khác đời sống Footer Page of 126 Header Page of 126 3 Đối tƣợng phạm vi nghiên cứu a, Đối tượng nghiên cứu - Khai phá luật kết hợp mờ đa cấp - Ngôn ngữ lập trình C# - Hệ quản trị sở liệu SQL - Một số báo luận văn tốt nghiệp khoá trước b, Phạm vi nghiên cứu Trong khuôn khổ luận văn thực nghiệm, giới hạn việc cài đặt mô thuật toán khai phá luật kết hợp mờ đa cấp kho liệu củ thể Phƣơng pháp nghiên cứu Phương pháp nghiên cứu dựa sở tài liệu sách, báo, luận văn, trang web có liên quan đến khai phá liệu, lý thuyết tập mờ, sử dụng ngôn ngữ lập trình để cài đặt, cài đặt thực nghiệm (mô phỏng) hệ quản trị sở liệu cụ thể Bố cục đề tài Dựa mục tiêu đề ra, luận văn xây dựng với cấu trúc sau: Chƣơng 1: Luật kết hợp mờ vấn đề liên quan tìm hiểu kiến thức luật kết hợp: tập mục, giao tác, luật kết hợp, độ hỗ trợ, độ tin cậy, phân loại luật kết hợp Tìm hiểu khai phá luật kết hợp đa cấp thuật toán liên quan, khái niệm tập mờ, mờ hóa liệu việc áp dụng tập mờ khai phá liệu Chƣơng 2: Xây dựng thuật toán khai phá luật kết hợp mờ đa cấp trình bày thuật toán khai phá luật kết hợp mờ đa Footer Page of 126 Header Page of 126 cấp từ liệu định lượng Sau xây dựng ví dụ cụ thể minh họa thuật toán Chƣơng 3: Chƣơng trình ứng dụng cài đặt thuật toán khai phá luật kết hợp mờ đa cấp dựa kho liệu cụ thể Footer Page of 126 Header Page of 126 CHƢƠNG LUẬT KẾT HỢP MỜ VÀ CÁC VẤN ĐỀ LIÊN QUAN 1.1 LUẬT KẾT HỢP Luật kết hợp giúp tìm mối liên quan mục liệu (items) sở liệu(CSDL) [12] Luật kết hợp dạng đơn giản mang lại nhiều hiệu 1.1.1 Các khái niệm a Luật kết hợp [1] Cho tập I = {I1, I2, , Im} gồm m mục (Item) Tập X ⊆ I gọi tập mục (itemset) Ví dụ 1.1: Xét hệ thống bán hàng thực phẩm: Bảng 1.1 Hệ thống bán hàng thực phẩm đơn giản Các giao tác Tên mặt hàng T1 Thịt, trứng, sữa T2 Thịt, cá, tôm T3 Cá, tôm T4 Bơ, trứng Ví dụ 1.2: cho sở liệu (dạng giao dịch): I={A, B, C, D, E} T={1, 2, ,4 ,5 ,6} Bảng 1.2 CSDL D dạng giao tác TID Tập mục A BD E B CE A BE ABC E A BD E BD Footer Page of 126 Header Page of 126 Một luật kết hợp R có dạng X =>Y Trong X, Y tập mục X, Y ⊆ I X ∩Y=∅ X gọi tiên đề Y gọi hệ luật Có hai độ đo quan trọng luật kết hợp: Độ hỗ trợ (support) độ tin cậy (confidence) Độ hỗ trợ độ tin cậy Định nghĩa 1.1: Độ hỗ trợ tập hợp X sở liệu D tỷ lệ ghi T ⊆ D có chứa tập X tổng số ghi D (hay phần trăm ghi D có chứa tập hợp X), ký hiệu Support(X) hay Supp(X) (1.1) Định nghĩa 1.2: Độ hỗ trợ luật kết hợp X =>Y tỷ lệ số lượng ghi chứa tập hợp X ∪Y với tổng số ghi D - Ký hiệu Supp(X =>Y ) (1.2) Định nghĩa 1.3: Độ tin cậy luật kết hợp X=> Y tỷ lệ số lượng ghi D chứa X ∪Y với tổng số ghi D có chứa X Ký hiệu độ tin cậy luật Conf(r) Ta có ≤ Conf (r) ≤ Conf (X =>Y ) = Supp(X ∪ Y ) / Supp(X ) (1.3) 1.1.2 Một số hƣớng tiếp cận khai phá luật kết hợp [2] - Luật kết hợp nhị phân (binary association rule) - Luật kết hợp có thuộc tính số thuộc tính hạng mục (quantitative and categorial association rule Footer Page of 126 Header Page of 126 - Luật kết hợp tiếp cận theo hướng tập thô (mining association rules base on rough set) - Luật kết hợp nhiều mức (multi-level association rules) - Luật kết hợp mờ (fuzzy association rules) - Luật kết hợp với thuộc tính đánh trọng số (association rule with weighted items) - Luật kết hợp song song (parallel mining of association rule) 1.1.3 Thuật toán khai phá luật kết hợp Những thuật toán để khai phá luật kết hợp phát triển Agrawal cộng ông [1] Thuật toán biết đến nhiều Apriori “Mọi tập tập item phổ biến tập item phổ biến” 1.2 KHAI PHÁ LUẬT KẾT HỢP ĐA CẤP Luật kế hợp đa cấp hay gọi Luật kết hợp nhiều mức (multilevel association rules) dạng luật tổng quát hóa theo nhiều mức khác 1.2.1 Luật kết hợp đa cấp Có thể nói việc khai phá luật kết hợp đa cấp mở rộng khai phá luật kết hợp mức độ đơn với cấu trúc phân cấp phân lớp (taxonomy) liệu lưu trữ 1.2.2 Phƣơng pháp để khai phá luật kết hợp đa cấp [3] Xem xét số phương pháp tiếp cận dựa độ hỗ trợ độ tin cậy Đi từ mức khái niệm đến mức thấp hơn, xác định tập mục phổ biến mức, không tìm thấy tập mục phổ biến Một tất tập mục phổ biến mức tìm thấy, tập mục phổ biến mức tìm thấy, lặp tiếp tục mức Đối với cấp, thuật Footer Page of 126 Header Page 10 of 126 toán để phát tập mục phổ biến sử dụng, chẳng hạn Apriori hay biến thể 1.2.3 Thuật toán khai phá luật kết hợp đa cấp Thuật toán Apriori tìm tất dạng luật có dạng X → Y thỏa mãn ngưỡng độ hỗ trợ độ tin cậy cho trước Tuy nhiên nhiều ứng dụng thuật toán Apriori không dễ dàng tìm luật kết hợp mạnh mục liệu trừu tượng mức thấp liệu thưa thớt không gian đa chiều Nhiều thuật toán đề xuất khai phá luật kết hợp đa cấp, số thuật toán khai phá luật kết hợp đa cấp từ tập mục phổ biến nguyên thủy cụ thể thuật toán FP-Tree [3] 1.3 KHAI PHÁ LUẬT KẾT HỢP MỜ ĐA CẤP 1.3.1 Luật kết hợp mờ a Mờ hóa liệu Các thuật toán khai phá luật kết hợp nhị phân áp dụng sở liệu quan hệ có thuộc tính nhị phân sở liệu dạng giao dịch, áp dụng trực tiếp cho sở liệu có thuộc tính số thuộc tính hạng mục Do đó, phải tiến hành mờ hóa liệu cho thuộc tính số thuộc tính hạng mục để chuyển chúng dạng thuộc tính nhị phân [2] Để mờ hóa liệu phải xác định hàm thành viên biểu diễn giá trị ngôn ngữ cho biến mà điều lại không thuộc hẳn nhiệm vụ nghiên cứu lý thuyết tập mờ b Những ưu điểm việc áp dụng tập mờ để rời rạc hóa liệu [6] - Giải vấn đề “điểm biên gãy” nhờ tập mờ phân khoảng mịn nhờ vào “độ trơn” hàm thuộc Footer Page 10 of 126 Header Page 12 of 126 10 (1.9) d Thuật toán khai phá luật kết hợp mờ [3] Thuật toán xây dựng dựa thuật toán Apriori, Apriori nhị phân số thay đổi cài đặt thực tế nhằm cải thiện thời gian tìm luật Thuật toán khai phá luật kết hợp mờ đƣợc mô tả cụ thể nhƣ sau: Input: - Cơ sở liệu D với tập thuộc tính I ghi T - Ngưỡng hàm thuộc wf - Độ hỗ trợ tối thiểu fminsup - Độ tin cậy tối thiểu fminconf - Toán tử T-norm (⊗) Output: - Tập tất luật kết hợp mờ tin cậy Thuật toán: Begin (DF, IF, TF) = Mờ_hóa_dữ_liệu(D, I, T); L1 = Tạo_L1(DF, IF, TF, fminsup, wf); //tạo tập phổ biến thuộc tính L = Ø ; FR = Ø ; k = 2; While ( Lk- ≠ Ø ) { Ck = Tạo_L_k(Lk-1); Lk = Tính_Support_K(Ck, DF, fminsup, wf); Footer Page 12 of 126 Header Page 13 of 126 11 FRk = Tìm_luật(L, Lk, fminconf); L=L Lk ; FR= FR FRk ; k= k +1; } End 1.3.2 Khai phá luật kết hợp mờ đa cấp a Luật kết hợp mờ đa cấp Việc sử dụng mô hình khai phá luật kết hợp mờ đa cấp nhằm khám phá tri thức tiềm ẩn lưu trữ giá trị định lượng giao dịch Nó sử dụng độ hỗ trợ khác cấp giống hàm thành viên khác tập mục Bằng cách kết hợp khái niệm mờ, công nghệ khai phá liệu, phân loại đa cấp hỗ trợ tối thiểu khác để tìm luật kết hợp mờ đa cấp liệu giao dịch Cụ thể trình bày phần 1.3.1, hướng tiếp cận để xử lý thuộc tính số lượng áp dụng lý thuyết tập mờ Việc chuyển từ tập bình thường sang tập mờ phân giá trị thuộc tính số lượng khắc phục điểm hạn chế tập cổ điển (tập rõ) Đó vấn đề đường biên “nhọn” b Phương pháp để khai phá luật kết hợp mờ đa cấp Một phương pháp đưa áp dụng với độ hỗ trợ khác cho cấp, tiếp cận sâu sắc từ xuống để tìm tập phổ biến lớn, kết hợp áp dụng lý thuyết tập mờ kết cuối tìm luật kết hợp mờ từ phân cấp liệu Có thể tóm tắt trình khai phá luật kết hợp mờ đa cấp theo mô hình sau: Footer Page 13 of 126 Header Page 14 of 126 12 Hình 1.8 Mô hình khai phá luật kết hợp mờ đa cấp 1.4 KẾT LUẬN CHƢƠNG Footer Page 14 of 126 Header Page 15 of 126 13 CHƢƠNG XÂY DỰNG THUẬT TOÁN KHAI PHÁ LUẬT KẾT HỢP MỜ ĐA CẤP 2.1 THUẬT TOÁN KHAI PHÁ LUẬT KẾT HỢP MỜ ĐA CẤP TỪ DỮ LIỆU ĐỊNH LƢỢNG 2.1.1 Giới thiệu Luật khai phá kết hợp giới thiệu Agrawal, khai phá luật kết hợp tìm kết hợp thú vị tìm mối liên hệ tương quan số tập mục liệu lớn Phát sinh luật kết hợp từ sở liệu giao dịch thường mục tiêu khai phá liệu Những nghiên cứu trước hầu hết tập trung vào hiển thị liệu giao dịch có giá trị nhị phân Tuy nhiên, liệu giao dịch ứng dụng thực tế lại bao gồm giá trị định lượng [4] Lý thuyết tập mờ sử dụng nhiều hệ thống thông minh Thuật toán khai phá luật kết hợp mờ đa cấp xây dựng nhằm trích xuất kiến thức tiền ẩn từ giao dịch lưu trữ giá trị định lượng Phương pháp đưa là: Tiếp cận sâu sắc từ xuống để tìm tập phổ biến lớn 2.1.2 Thuật toán * [9] Các bước để khai phá luật kết hợp mờ đa cấp sau: Input: Cơ sở liệu giao tác (n giao tác); Tập mờ hàm thành viên định nghĩa cho tập mờ; Cấu trúc phân lớp định nghĩa trước; Minsupp α minconf λ; Footer Page 15 of 126 Header Page 16 of 126 14 Output: Tập luật kết hợp mờ đa cấp; Method: Bước 1: Mã hóa phân cấp sử dụng dãy số ký hiệu “ * ”, với t-thứ đại diện cho số cành item mức t Bước 2: Đổi tên item liệu giao dịch theo quy định chương trình mã hóa Bước 3: Đặt k =1, với k sử dụng để lưu trữ cấp độ xử lý Bước 4: Nhóm item với mức k giống mốc giao dịch Di; Tính số nhóm giao dịch loại bỏ nhóm có số lượng < α; ký hiệu j-thứ tổng mức k giao dịch Di vijk Bước 5: Chuyển item thành item mờ Với giao tác Di (i = đến n) chuyển đổi giá trị số lượng vijk item mở rộng Ijk vào tập mờ fijk thể (fij1k/Rj1k + fij2k/Rj2k + + fijhk/Rjhk) thông qua sử dụng hàm thành viên cung cấp, h số vùng mờ cho Ijk, Rjlk vùng mờ thứ l Ijk, ≤ l ≤ h, fij1k giá trị thành viên mờ vijk vùng Rjlk Bước 6: Tính số lượng vùng mờ Rjlk giao tác: Bước 7: Tìm max-countjk = maxl=1 hjk(countkjl), j = mk, với hjk là số vùng mờ Ijk mà mk số tập mục (nút) mức k Cho max-Rjk vùng với max-countjk cho item Ijk, sử dụng để thể tính chất mờ item Ijk tiến trình khám phám giai đoạn sau Footer Page 16 of 126 Header Page 17 of 126 15 Bước 8: Kiểm tra xem giá trị max-countjk vùng max-Rjk (j = mk) xem có lớn giá trị minsupp α định nghĩa trước hay không Nếu vùng max-Rjk thỏa điều kiện lớn hay giá trị minsupp đưa chúng vào tập item phổ biến có item (L1k) mức k Đó là: Bước 9: Nếu L1k = Null đặt k=k+1, quay lại Bước Ngược lại, ta thực bước Bước 10: Phát sinh ứng viên cho tập C2k từ L11, L12, , L1k để tìm tập phổ biến lớn “vượt cấp” Mỗi 2-itemset C2k phải có 1-item L1k item khác nút cha phân cấp Hay nói cách khác, 2-itemset C2k chứa hai item mà có quan hệ nút cha nút phân cấp Bước 11: Với ứng viên 3-itemset với item (s1, s2) C2k ta thực hiện: Tính giá trị mờ s giao tác Di fis = fis1˄ fis2, fisj giá trị thành viên Di vùng sj Nếu toán tử sử dụng cho phần giao giá trị fis = min(fis1, fis2) Tính số đếm vô hướng s giao tác liệu theo: Tính counts lớn minsupp α, đưa s vào L2k Footer Page 17 of 126 Header Page 18 of 126 16 Bước 12: Thiết lập r = 2, r sử dụng để thể cho số item lưu trữ tập item phổ biến hành Bước 13: Nếu Lrk = Null, đặt k = k +1 quay lại bước 4, ngược lại thực bước Bước 14: Khởi tạo ứng viên tập Ckr+1 từ Lkr cách thức tương tự thuật toán Apriori Đầu tiên thuật toán thực việc nối Lkr Lkr giả sử r – item tập itemset item lại khác Do có itemset Ckr+1 có r itemset chứa Lkr Bước 15: Với hình thức (r + 1) itemset s với item (s1, s2, …, sr+1) Ckr+1, thực hiện: Tính giá trị mờ s giao tác Di fis = fis1˄ fis2˄ … fisr+1 , fisj giá trị thành viên Di vùng sj Nếu toán tử sử dụng cho phần giao giá trị fis = minj=1r+1fisj Tính số đếm vô hướng s giao tác liệu theo: Tính counts lớn minsupp α, đưa s vào Lkr+1 Bước 16: Đặt r = r +1 quay lại bước 13 Bước 17: Tạo luật kết hợp mờ cho tất large q-itemset s chứa item (s1, s2, , sq), với q ≥ 2, Footer Page 18 of 126 Header Page 19 of 126 17 Tính toán độ tin cậy tất luật kết hợp thông qua công thức sau: Bước 18: Giữ lại luật với giá trị tin cậy lớn ngưỡng λ định nghĩa trước Xuất luật thỏa hai ngưỡng minsupp minconf luật thú vị * Đánh giá thuật toán: Các luật đầu sau bước 18 dùng tri thức siêu cấp liên quan tới giao tác Như thuật toán khai phá thông thường, thông số α λ xác định người sử dụng tùy thuộc vào yêu cầu họ Nhưng giá trị nhỏ so với đưa thuật toán khai phá thông thường mà tính mờ item giao tác nhỏ Những mô tả thuật toán: + Bước 5: sử dụng hàm thành viên để chuyển giá trị định lượng vào tập mờ ngôn ngữ Tập trạng thái rời rạc giảm + Ngoài tri thức thu từ bước 18 biểu diễn ngôn ngữ tập mờ, dễ hiểu cho người + Trong bước 7: Mỗi item sử dụng tập thuật ngữ với tập hợp tối đa trình khai phá sau Sử dụng số vùng mờ để xử lý giống số lượng item ban đầu Do đó, thuật toán tập trung vào thuật ngữ quan trọng làm giảm độ phức tạp theo thời gian Footer Page 19 of 126 Header Page 20 of 126 18 + Từ bước thứ đến 18: Qúa trình khai phá sử dụng tính mờ để khai phá phân cấp nhằm tìm tập phổ biến lớn mờ luật kết hợp đa cấp mờ 2.2 VÍ DỤ MINH HỌA Trong phần này, ví dụ cụ thể đưa để minh họa cho thuật toán với liệu đề xuất Với việc áp dụng tập mờ để rời rạc giá trị số sở liệu giao tác Đây ví dụ đơn giản nhằm thể thuật toán sinh luật kết hợp từ giao tác định lượng dựa phân cấp Qua ví dụ minh họa thực việc áp dụng lý thuyết tập mờ việc khai phá luật kết hợp Cơ sở liệu để khai phá bao gồm thuộc tính thể loại thuộc tính số lượng Đây hai thuộc tính phổ biến sở liệu quan hệ Việc kết hợp cấu trúc phân cấp liệu mặt hàng xử lý phân cấp mờ thuộc tính số lượng cho phép khai phá luật kết hợp mờ đa cấp 2.3 THUẬT TOÁN KHAI PHÁ 2.3.1 Cây tiền tố item mờ [2] Phần trình bày cấu trúc liệu áp dụng để cải tiến trình khai phá liệu cải tiến trình lưu trữ Dữ liệu nút tiền tố item mờ, ta gọi tiền tố tiền tố item mờ 2.3.2 Xây dựng tiền tố item mờ Trong phần xây dựng tiền tố để khám phá mẫu phổ biến bảng liệu ví dụ cho cụ thể Footer Page 20 of 126 Header Page 21 of 126 19 2.3.3 Thuật toán Phần thuật toán trình phát sinh itemset ứng cử viên cấp k phần duyệt sở liệu lần để tính độ hỗ trợ tất itemset tập ứng viên k phần tử Qúa trình kết thúc tiền tố không phát triển nữa, tức không phát sinh thêm itemset phổ biến Một thuật toán tìm kiếm tiền tố item mờ sử dụng để xác định tập itemset phổ biến Cuối phát sinh luật từ itemset phổ biến khai phá Hình 2.9 Mô hình thuật toán khai phá liệu từ tiền tố item mờ 2.4 KẾT LUẬN CHƢƠNG Footer Page 21 of 126 Header Page 22 of 126 20 CHƢƠNG CHƢƠNG TRÌNH ỨNG DỤNG 3.1 MÔI TRƢỜNG ỨNG DỤNG Chương trình FMRMiner cài đặt nhằm thực thuật toán khai phá luật kết hợp mờ đa cấp từ liệu định lượng Chương trình viết ngôn ngữ Visual C# MS.NET Frameword 5.0, kết nối sở liệu SQL Sever 2005 Cấu hình máy chạy thử nghiệm Laptop HP Intel ® Core ™ Duo CPU 2.00Ghz, 1GB RAM Hệ điều hành Window XP 3.2 CHƢƠNG TRÌNH 3.2.1 Mô tả liệu Dữ liệu thử nghiệm liệu bán hàng siêu thị Cấu trúc giao tác liệu: Bảng giao tác bao gồm thông tin: Mã giao tác (TID), mặt hàng (item), số lượng (SL) Danh mục hàng Cấu trúc phân lớp áp dụng cho khai phá luật đa cấp Tập mờ hàm thành viên Thuật toán phát sinh itemset ứng viên cấp thứ k duyệt sở liệu để tính độ hỗ trợ tất itemset tập ứng viên k phần tử Footer Page 22 of 126 Header Page 23 of 126 21 3.2.2 Giao diện chƣơng trình Trong phần minh họa số hình chương trình FMRMiner Chương trình thiết kế theo bước thực tiến trình khai phá luật kết hợp mờ đa cấp Các bước thực hay nói nhiệm vụ thực trình bày theo sơ đồ tiến trình hình 3.6 Trong bước sau không thực người dùng chưa thực bước trước Hình 3.6 Màn hình chương trình FMRMiner Hình 3.7 thể hai hình kết nối liệu sở liệu quản lý SQL Server Người dùng chọn tên SQL Server để chương trình kết nối Khi kết nối với SQL Server danh sách sở liệu phép truy cập xuất danh sách sở liệu Lúc người dùng chọn vào sở liệu để làm việc Sau chọn sở liệu làm việc bước chọn bảng liệu cụ thể để khai phá Chức hình cho phép người dùng đến với hình Footer Page 23 of 126 Header Page 24 of 126 22 Ở hình chọn bảng liệu chọn bảng liệt kê danh sách để khai phá Sau có bảng liệu để khai phá, bước ta định nghĩa cấu trúc phân lớp liệu bảng khai phá Cấu trúc phân lớp nhập trực tiếp từ hình nhập cấu trúc phân lớp khai báo cách gián tiếp thông qua bảng liệu chứa cấu trúc định nghĩa trước Việc khai báo cho phép chương trình có khả khai phá luật đa cấp Phần khai báo thứ hai tập mờ hàm thành viên để phân lớp mờ thuộc tính số lượng bảng liệu 3.3.3 Phân tích đánh giá Kết cuối thực chương trình hoàn toàn trùng khớp với kết thực nghiệm nghiên cứu chương 3.4 KẾT LUẬN CHƢƠNG Footer Page 24 of 126 Header Page 25 of 126 23 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN KẾT LUẬN Việc khai phá luật kết hợp mờ đa cấp thể luận văn cách cụ thể từ khái niệm, định nghĩa ví dụ minh họa thuật giải khám phá Luận văn hướng người đọc bước đầu từ khái niệm khai phá liệu đến khai phá luật kết hợp đa cấp.Nắm mục đích áp dụng lý thuyết tập mờ việc rời rạc giá trị số lượng Ứng dụng tập mờ khai phá liệu Đề xuất mô hình thuật toán khai phá luật kết hợp mờ đa cấp từ liệu định lượng Xây dựng ví dụ cụ thể để minh chứng cho thuật toán Phần ứng dụng khai phá luật kết hợp mờ đa cấp sở liệu bán hàng siêu thị Kết khai phá mối quan hệ có tính định lượng thuộc tính sở liệu ứng dụng Kết cho phép nhà phân tích thị trường kinh doanh có thông tin mối quan hệ mua hàng khách hàng để có chiến lược kinh doanh phù hợp Mặc dù thân nỗ lực nghiêm túc trình thực đề tài, nhiên luận văn gặp số hạn chế sau: + Dữ liệu ứng dụng hạn chế, chưa thể hết mục đích thuật toán + Chương trình cài đặt ứng dụng dạng Demo sơ sài Footer Page 25 of 126 Header Page 26 of 126 24 + Giao diện chưa chăm để thân thiện cho người sử dụng HƢỚNG PHÁT TRIỂN Lĩnh vực khai phá luật kết hợp mờ đa cấp mẻ, có số đề nghị sau: Nâng cao hỗ trợ cho người dùng việc định nghĩa vùng mờ hàm thành viên Mở rộng khai phá luật kết hợp mờ nhiều sở liệu nhiều lĩnh vực khác Xây dựng mô hình khai phá luật kết hợp mờ đa cấp sở liệu phân tán xử lý song song Hướng phát triển đề tài: + Thu thập kho liệu thực tế để kết chương trình có độ xác cao + Cải tiến thuật toán để giải mã hóa mặt hàng từ liệu thực + Cải tiến chương trình từ ngôn ngữ đến giao diện để thích ứng với người sử dụng Footer Page 26 of 126 ... Trên sở nghiên cứu lý thuyết khai phá luật kết hợp; Khai phá luật kết hợp mờ; Khai phá luật kết hợp đa cấp; Kiến thức tảng khai phá liệu; Lý thuyết tập mờ; Khai phá luật kết hợp mờ Nắm vững ngôn... THUẬT TOÁN KHAI PHÁ LUẬT KẾT HỢP MỜ ĐA CẤP 2.1 THUẬT TOÁN KHAI PHÁ LUẬT KẾT HỢP MỜ ĐA CẤP TỪ DỮ LIỆU ĐỊNH LƢỢNG 2.1.1 Giới thiệu Luật khai phá kết hợp giới thiệu Agrawal, khai phá luật kết hợp... biến” 1.2 KHAI PHÁ LUẬT KẾT HỢP ĐA CẤP Luật kế hợp đa cấp hay gọi Luật kết hợp nhiều mức (multilevel association rules) dạng luật tổng quát hóa theo nhiều mức khác 1.2.1 Luật kết hợp đa cấp Có