1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu

77 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 2,11 MB

Nội dung

Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM - PHẠM VĂN KHANH ỨNG DỤNG LÝ THUYẾT GIÀN GIAO TRONG KHAI THÁC DỮ LIỆU LUẬN VĂN THẠC SỸ Chuyên ngành: Công nghệ Thông tin Mã số ngành: 60480201 TP HỒ CHÍ MINH, tháng 09 năm 2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM - PHẠM VĂN KHANH ỨNG DỤNG LÝ THUYẾT GIÀN GIAO TRONG KHAI THÁC DỮ LIỆU LUẬN VĂN THẠC SỸ Chuyên ngành: Công nghệ Thông tin Mã số ngành: 60480201 CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS TSKH NGUYỄN XUÂN HUY TP HỒ CHÍ MINH, tháng 09 năm 2014 i LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng Các số liệu, kết nêu Luận văn trung thực chưa công bố cơng trình khác Tơi xin cam đoan giúp đỡ cho việc thực Luận văn cảm ơn thơng tin trích dẫn Luận văn rõ nguồn gốc Học viên thực Luận văn Phạm Văn Khanh ii LỜI CẢM ƠN Trong suốt trình học tập hồn thành luận văn này, tơi nhận hướng dẫn, giúp đỡ quý báu q thầy cơ, gia đình, bạn bè đồng nghiệp Với lịng kính trọng biết ơn sâu sắc tơi xin bày tỏ lời cảm ơn chân thành tới: Khoa Cơng Nghệ Thơng Tin, Phịng quản lý khoa học - Đào tạo sau đại học trường Đại Học Công Nghệ Thành Phố Hồ Chí Minh tạo điều kiện thuận lợi giúp đỡ tơi q trình học tập hoàn thành luận văn Thầy hướng dẫn Phó giáo sư - Tiến sĩ Khoa học Nguyễn Xuân Huy, thầy truyền đạt kiến thức bổ ích cho tơi q trình học tập, hết lịng tạo điều kiện giúp đỡ tơi q trình hồn thành luận văn Phó giáo sư - Tiến sĩ Lê Hoài Bắc, thầy truyền đạt kiến thức bổ ích cho tơi q trình học tập, thầy hết lịng giúp đỡ cung cấp cho tài liệu nghiên cứu cần thiết liên quan đến luận văn Thầy Cao Tùng Anh, thầy hết lòng giúp đỡ, bảo, động viên tạo điều kiện thuận lợi cho suốt q trình học tập hồn thành luận văn Tồn thể q thầy nhiệt tình giảng dạy truyền đạt kiến thức bổ ích cho tơi suốt khóa học vừa qua Cuối xin cảm ơn đến tất người thân gia đình, bạn bè đồng nghiệp giúp đỡ tơi suối q trình học tập thực luận văn Phạm Văn Khanh iii MỤC LỤC  MỞ ĐẦU Chương TỔNG QUAN VỀ KHÁM PHÁ TRI THỨC VÀ KHAI THÁC DỮ LIỆU 1.1 Khám phá tri thức khai thác liệu 1.2 Quá trình khám phá tri thức 1.3 Quá trình khai thác liệu 1.4 Các phương pháp khai thác liệu 1.5 Các lĩnh vực ứng dụng thực tiễn khai thác liệu 10 1.6 Các phương pháp, kỹ thuật áp dụng khai thác liệu 11 1.7 Các thách thức – khó khăn khám phá tri thức khai thác liệu 13 1.8 Khai thác tập phổ biến, luật kết hợp tương quan 15 1.8.1 Bài toán kinh điển dẫn đến việc khai thác luật kết hợp 15 1.8.2 Tập phổ biến luật kết hợp 18 1.8.3 Các phương pháp khai thác tập phổ biến 19 1.9 Khai thác liệu bảo đảm tính riêng tư 26 1.9.1 Bài toán khai thác liệu bảo đảm tính riêng tư 26 1.9.2 Phân loại phương pháp PPDM 27 1.9.3 Các phương pháp giấu liệu nhạy cảm 30 1.9.3.1 Làm xáo trộn (Perturbation) 30 1.9.3.2 Ngăn chặn (Blocking) 30 1.9.3.3 Gom trộn (Aggregation / Merging) 30 1.9.3.4 Đổi chỗ (Swapping) 30 1.9.3.5 Lấy mẫu 32 Chương ÁNH XẠ ĐÓNG VÀ GIÀN GIAO ÁNH XẠ ĐÓNG 37 2.1 Ánh xạ đóng 37 2.1.1 Các khái niệm tính chất ánh xạ đóng 37 iv 2.1.2 Phép hạn chế ánh xạ đóng 39 2.2 Các phép tốn hội hợp thành ánh xạ đóng 39 2.2.1 Phép toán hội 40 2.2.2 Phép hợp thành ánh xạ đóng 40 2.3 Giàn giao ánh xạ đóng 45 2.3.1 Điểm bất động 45 2.3.2 Giàn giao ánh xạ đóng 45 Chương ẨN CÁC TẬP MỤC NHẠY CẢM 49 3.1 Giàn giao AXĐ toán ẩn tập mục nhạy cảm 49 3.2 Phát biểu toán 50 3.3 Giàn giao 52 3.4 Các tính chất tập mục thường xuyên 53 3.5 Thuật toán ẩn tập mục nhạy cảm 56 3.6 Ví dụ minh họa cho thuật toán 57 Chương CHƯƠNG TRÌNH THỰC NGHIỆM 61 4.1 Giới thiệu 61 4.2 Các chức chương trình 62 KẾT LUẬT 66 TÀI LIỆU THAM KHẢO 68 v DANH MỤC CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT  KPDL Khai thác liệu KPTT Khám phá tri thức PPDM (Privacy Data Mining) Preserving Khai thác liệu đảm bảo tính riêng tư AXĐ Ánh xạ đóng CSDL Cơ sở liệu LĐQH Lược đồ quan hệ PTH Phụ thuộc hàm  Thuộc  Không thuộc  Là tập  Chứa tập \ Phép trừ tập hợp  Phép giao tập hợp  Phép hợp tập hợp  Tương đương  Khác  Với LS(f) Tập vế trái luật sinh f RS(f) Tập vế phải luật sinh f  Tập rỗng vi DANH MỤC CÁC BẢNG  Bảng 1.1 Dấu liệu phương pháp đổi chỗ 36 Bảng 3.1 Bảng trị T tập mục thường xuyên theo ngưỡng 56 Bảng 3.2 Các tập mục thường xuyên theo ngưỡng 62 Bảng 3.3 Sửa giá trị E chứa ADE 64 Bảng 3.4 Sửa giá trị E chứa ABE 65 vii DANH MỤC CÁC HÌNH MINH HOẠ  Hình 1.1 Quá trình khám phá tri thức 12 Hình 1.2 Quá trình khai thác liệu 14 Hình 2.1 Ví dụ thuật toán Apriori 29 Hình 2.2 Ví dụ thuật tốn Apriori 30 Hình 3.1 Đồ thị giàn tập mục thường xuyên P 58 Hình 3.2 Giàn giao đầy đủ Poset(ABE) 59 Hình 4.1 Giao diện chương trình 63 Hình 4.2 Giao diện chương trình tính độ hỗ trợ tất tập mục 64 Hình 4.3 Giao diện chương trình tìm tất tập mục thường xuyên 65 Hình 4.4 Giao diện chương trình hiển thị tập mục thường xuyên 66 MỞ ĐẦU Ngày nay, liệu chứa thông tin người dùng lưu trữ lại thông qua nhiều hoạt động ngày giao dịch, mua hàng, khám bệnh, tìm kiếm thơng tin, truy cập web,… Các liệu đóng vai trị ngày quan trọng phát triển xã hội làm đầu vào cho q trình phân tích tìm thơng tin hữu ích cho hệ hỗ trợ định, phát dịch bệnh hay hoạch định kế hoạch kinh doanh,… Tuy nhiên, thơng tin hữu ích rút trích từ tập liệu lớn trình thu thập liệu lớn từ đầu khó khăn Chính vậy, chia sẻ liệu đóng vai trị quan trọng q trình phát triển xã hội Tuy nhiên, chia liệu vơ tình làm tiết lộ thơng tin nhạy cảm người dùng gây nguy hại cho cá nhân, tổ chức xã hội Một vấn đề thường gặp cung cấp liệu cho trung tâm khai thác tri thức, số sở, cá nhân không muốn công bố luật vi phạm đến tính riêng tư cá nhân doanh nghiệp Thí dụ, X tập mục thương hiệu xe máy Honda, Y tập mục số vụ tai nạn xe máy việc cơng bố tương quan X Y mang đến bất lợi cho việc kinh doanh xe máy Honda Các tập mục X Y gọi tập mục nhạy cảm Một lẽ đương nhiên sở cung cấp liệu phải loại bỏ hai tập mục nhạy cảm X Y khỏi danh mục cần cung cấp Tuy nhiên, việc làm lại vi phạm luật cung cấp thông tin Giải pháp thứ hai thường sở lách luật chọn công bố đầy đủ tập mục tìm cách sửa tần suất xuất tập mục nhạy cảm xuống ngưỡng thường xuyên  Khi tập mục nhạy cảm trở thành tập mục khơng thường xun chúng khơng thể trở thành thành phần luật Giải pháp thứ hai gọi ẩn tập mục nhạy cảm (và thường xuyên) Vậy, hướng nghiên cứu luận văn cần thiết cho trường hợp cần bảo vệ bí mật tính riêng tư tình hợp pháp, đồng thời phát giả mạo, lách luật tình cần ngăn chặn 54 Mệnh đề 2: P giàn giao Chứng minh Giả sử X, Y  P, Z = X  Y Ta có Z  X, (Z)  (X)   Vậy Z  P Mệnh đề cho phép vận dụng tính chất giàn giao xử lý tập mục thường xuyên Cụ thể cần ẩn tập mục nhạy cảm H ta sửa tập mục lớn chứa H giàn giao P, tức Coatom chứa H Mệnh đề 3: Với tập mục thường xuyên X P, Poset(X)  P giàn giao đầy đủ với tập Gen gồm phần tử hàng thứ Hình 3.2 Giàn giao đầy đủ Poset(ABE) Chứng minh Giả sử X  P Y  X Ta có (Y)  (X)   Từ suy Y  P, nghĩa tập X tập mục thường xuyên Do Poset(X) chứa tập X nên Poset(X) đầy đủ đương nhiên đóng với phép giao Theo mệnh đề ta thấy với mục AX, X{A} khuyết phần tử, chúng có cha Mọi tập lại Poset(X) khuyết từ hai phần tử trở lên chúng có hai cha Vậy Gen(X) bao gồm phần tử đứng hàng thứ hai đồ thị biểu diễn giàn cho 55 Do Gen(X) gồm tập khuyết phần tử X nên thuật toán xác định Gen(X) đơn giản Thuật toán Gen sau sử dụng để xác định tập sinh giàn giao đầy đủ Gen(X) Thuật toán xác định tập sinh giàn giao đầy đủ Gen(X) Algorithm Gen Input: Tập mục X  U Output: Họ tập sinh G giàn giao đầy đủ X Method G = ; for each item A in X Add X{A} to G; endfor; return G; EndGen Mệnh đề tính chất nghịch biến hàm  cho ta thấy phần tử Gen(X) có độ hỗ trợ nhỏ Poset(X){X} Nếu X  P, với mục A  X ta xét hàm L(A,X) cho giá trị nhỏ số độ hỗ trợ tập (tức tập X khác X) chứa A X, L(A,X) = {(Y) | A  Y, Y  X} Dựa vào nhận xét ta thấy tính L(A,X) thơng qua tập chứa A Gen(X) Mệnh đề 4: Nếu tập mục thường xuyên X bị ẩn tập mục thường xuyên Y chứa X bị ẩn theo 56 Chứng minh Nếu X bị ẩn (X) <  Giả sử X  Y Ta có, (Y)  (X) < , nghĩa Y bị ẩn theo Mệnh đề 5: Nếu X  P Update(A,X,d), A  X kéo theo Update(A,Y,d), Y  X, A  Y Chứng minh Để ý thao tác Update(A,X,1) xóa xuất mục A tập mục X, nghĩa thay X X{A} Từ suy tập mục chứa A X giảm số lần xuất đơn vị Các tập mục Y mô tả mệnh đề gọi tập mục chịu hiệu ứng phụ cập nhật (xóa) mục A tập mục X Mệnh đề cho thấy cập nhật mục A tập mục X cần ý đến tập mục chứa A X Nếu độ hỗ trợ chúng lớn ngưỡng  không nhiều chúng có nguy bị ẩn theo 3.5 Thuật toán ẩn tập mục nhạy cảm Dựa vào mệnh đề … 5, phần trình bày thuật toán Itemhide ẩn tập mục nhạy cảm H Việc mở rộng thuật toán để ẩn nhiều tập mục nhạy cảm dễ dàng Cho bảng T gồm N giao tác M mục, cho ngưỡng hỗ trợ  giả thiết ta xây dựng họ tập mục thường xuyên P Cho tập mục nhạy cảm H  P Khi thuật tốn ẩn tập mục H thực qua bước sau Bước 1: Xác định họ V tập mục chứa H Coatom(P) , V = {X  Coatom(P) | H  X } Bước 2: Với mục A  H với X V lượng giá xem có nên sửa mục A X khơng? Tiêu chuẩn đặt việc sửa mục A X không gây hiệu ứng phụ đến tập chứa A X Giả sử (A,X) đạt giá trị max {L(A,X) | A  H, X  V} ta gọi thủ tục Update(A, X, d), với d = {(H) – (–1), (X)} Bước lặp đến (H) =  – 57 Thuật toán Itemhide - ẩn tập mục nhạy cảm Algorithm Itemhide T  bảng trị 0/1 thể giao tác tập mục U, Input: P – họ tập mục phổ biến U,   ngưỡng hỗ trợ, H  tập mục nhạy cảm H (cần ẩn), M  P Output: bảng kết T Method s = (H); while (s >  – 1) Compute V = {X  Coatom(P) | H  X }; Let (A, X) = GetMax {L(A,X) | A  H, X  V}; Compute d = {s – (–1), (X)}; Update(A,X,d); s = s – d; endwhile end Itemhide 3.6 Ví dụ minh họa cho thuật tốn Xét CSDL bao gồm 22 giao tác sau  Bảng 3.2 Các tập mục thường xuyên theo ngưỡng 4 ABCDE ABCDE 10101 12 01011 A 10 10101 13 00110 B 11 11001 14 10011 11001 15 01101 C 01010 16 11001 D 12 00111 17 11001 E 18 10011 18 01010 AB  58 01101 19 00111 00011 20 10011 10 01000 21 01101 11 10011 22 00011 AD AE 10 BE CE DE ABE ADE Bảng T với 22 giao tác Các tập mục thường xuyên viết thành hai mảnh theo ngưỡng  = Tập mục cần ẩn M = {AE} Thuật toán thực sau: - Tập U = ABCDE - Tập phổ biến P = {A/10, B/11, C/8, D/12, E/18, AB/4, AD/4, AE/10, BE/8, CE/7, DE/9, ABE/4, ADE/4} - Gen(P) = {ABE, ADE, DE, CE, BE, AD, AB, C} - Tựa giàn tập phổ biến ngưỡng  = - Coatom(P,M) = {ABE, ADE} - Với X = ABE ta có:  Gen(A, ABE) = {AB, AE}  Xét A ABE, ta có: L(A, ABE) =  Xét E ABE, ta có: L(E, ABE) = - Với X = ADE ta có:  Gen(ADE) = {AD, AE, DE}  Xét A ADE, ta có: L(A, ADE) =  Xét E ADE, ta có: L(E, ADE) = - V = Max{4, 8, 4, 9} = 59 - Sửa giá trị E chứa ABE ADE Sửa giá trị E chứa ADE, có gạch chân bảng 3.3 - Lúc α(AE) = 10 – = > c Bảng 3.3 Sửa giá trị E chứa ADE ABCDE - ABCDE 10101 12 01011 10101 13 00110 11001 14 10011 11001 15 01101 01010 16 11001 00111 17 11001 10011 18 01010 01101 19 00111 00011 20 10011 10 01000 21 01101 11 10011 22 00011 Tiếp tục sửa giá trị E chứa ABE, có gạch chân bảng 3.4 (các dòng 3,4,16) - Sau thực sửa lần, ta có α(AE) = – = < c Lúc AE ẩn, thuật toán dừng - Tập phổ biến sau ẩn: P = {DE, CE, BE, AD, AB, A, B, C, D, E}, - Số tập mục bị ẩn nhầm: ⇒ Hiệu ứng phụ = Xét A ABE, Min(A, ABE) = Xét A ADE, Min(A, ADE) = Xét E ABE, Min(E, ABE) = Xét E ADE, Min(E, ADE) =  = Max = 60 Kết luận: Sửa E ABE ADE Bảng 3.4 Sửa giá trị E chứa ABE ABCDE Tập mục thường xuyên  10101 12 01011 A 10 10101 13 00110 B 11 11000 - 14 10010 + *C 11000 - 15 01101 D 12 01010 16 11000 - E 18/11 00111 17 11001 *AB 10010 + 18 01010 *AD 01101 19 00111 AE ! 10/3 00011 20 10010 + *BE 8/5 10 01000 21 01101 *CE 11 10010 + 22 00011 *DE 9/5 ABE ! 4/1 ADE ! 4/0 ABCDE + sửa E dòng chứa ADE, - sửa E dòng chứa ABE, ! Tập mục bị ẩn Kết 61 Chương CHƯƠNG TRÌNH THỰC NGHIỆM 4.1 Giới thiệu Trong luận văn này, học viên tập trung nghiên cứu thiết kế cài đặt phần mềm quản lý để ẩn tập mục nhạy cảm Chương trình viết ngôn ngữ C# phiên Visual Studio 2010 với chức chủ yếu ẩn tập mục nhạy cảm dựa giàn giao Cơ sở liệu lưu trữ SQL Server 2008 Việc cài đặt chương trình ứng dụng nhằm mục đích mơ kết nghiên cứu học viên thơng qua ví dụ Chương trình có tên ứng “Ẩn tập mục nhạy cảm” (Itemhide.exe) với: Dữ liệu đầu vào bao gồm:  M: độ dài tập  T: bảng trị 0/1  : ngưỡng hỗ trợ  H: tập mục nhạy cảm cần ẩn Dữ liệu đầu bao gồm: Ẩn tập mục nhạy cảm danh mục tập mục thường xuyên Bảng trị file CSDL cho trước (các cấu trúc bao gồm: mục, giao tác) nhập liệu trực tiếp từ cửa sổ chương trình, sau ghi vào CSDL để sử dụng cho lần sau 62 4.2 Các chức chương trình Dưới mơ tả hoạt động chức chương trình Hình 4.1 Giao diện chương trình  GIAO TÁC: Hiển thị tất giao tác file CSDL lên hình 63 Hình 4.2 Giao diện chương trình tính độ hỗ trợ tất tập mục  ĐỘ PHỔ BIẾN: Tính độ hỗ trợ tất tập mục 64 Hình 4.3 Giao diện chương trình tìm tất tập mục thường xuyên  ĐỘ HỖ TRỢ: Chương trình cho phép nhập độ hỗ trợ Sau tìm hiển thị tất tập mục thường xuyên 65 Hình 4.4 Giao diện chương trình hiển thị tập mục thường xuyên  TẬP MỤC ẨN: Chương trình cho phép nhập vào tập mục nhạy cảm cần ẩn Sau ẩn tập mục nhạy cảm hiển thị tập mục thường xun  Ngồi chương trình thiết kế số chức khác như: BROWSE, IMPORT, LƯU CSDL, CẬP NHẬT, XĨA, THỐT 66 KẾT LUẬN Kết đạt luận văn Ẩn tập mục nhạy cảm toán quan trọng khai thác liệu Đây công việc nhiều nhà nghiên cứu quan tâm Một vấn đề nhà nghiên cứu quan tâm giải toán giảm hiệu ứng phụ, tức ẩn nhầm tập mục phổ biến khác giảm số lần truy cập giao tác Trên sở nghiên cứu lý thuyết giàn giao hướng nghiên cứu trước đây thực để giải toán ẩn tập mục nhạy cảm, luận văn đề xuất hướng tiếp cận để giải tốn tiếp cận MaxMin dựa lý thuyết giàn giao Trên sở phân tích đặc điểm tốn, định lý, mệnh đề lý thuyết giàn giao từ liên quan tốn lý thuyết giàn giao Do đó, việc ứng dụng lý thuyết giàn giao để giải toán hồn tồn có sở tốn học đảm bảo tính đắn Từ đó, luận văn sử dụng lý thuyết giàn giao để đề xuất hai thuật tốn quan trọng: thuật tốn tìm Gen(G) thuật toán ẩn tập mục nhạy cảm M Thuật toán ẩn tập mục nhạy cảm thực việc ẩn tập mục nhạy cảm cách sửa mục tập biên tập sinh Gen cho tác động đến tập sinh Gen nhất, hiệu ứng phụ xảy CSDL kết Với số mục vừa phải, chẳng hạn 64 mục, thuật tốn cài đặt với việc quản lý mục thơng qua số ngun Ngồi ra, thuật tốn đưa cài đặt ứng dụng với bảng sở liệu có số lượng ghi vài chục ngàn Nếu lựa chọn cấu trúc liệu thích hợp, thuật tốn áp dụng cho bảng liệu lớn Hướng nghiên cứu Trên sở nghiên cứu trình trình bày luận văn, tiếp tục tìm hiểu thuật toán liên quan Cài đặt CSDL lớn chuẩn từ so sánh với thuật tốn cơng bố trước 67 Mặc dù thân cố gắng tập trung nghiên cứu tham khảo tài liệu, báo, tạp chí khoa học ngồi nước, trình độ cịn nhiều hạn chế nên khơng thể tránh khỏi thiếu sót Rất mong nhận đóng góp quý thầy cô nhà khoa học để luận văn hoàn thiện 68 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] NGUYỄN XUÂN HUY, LÊ QUỐC HẢI, NGUYỄN GIA NHƯ, CAO TÙNG ANH, BÙI ĐỨC MINH, Lý thuyết giàn ứng dụng thuật toán ẩn tập mục nhạy cảm, Báo cáo Hội thảo Quốc gia " Một số vấn đề chọn lọc CNTT truyền thông, Đồng Nai, 5-6 Tháng 8, (2009) [2] NGUYỄN XUÂN HUY, LÊ ĐỨC MINH, VŨ NGỌC LỖN, Các ánh xạ đóng ứng dụng sở liệu, Tạp chí Tin học Điều khiển học, 16, No 4, 2000, 1-6 [3] NGUYỄN XUÂN HUY, Giàn giao ánh xạ đóng, Chun san cơng trình nghiên cứu - triển khai viễn thơng cơng nghệ thông tin, số 14, 4-2005, 35-42 [4] NGUYỄN XUÂN HUY, Các phụ thuộc logic sở liệu, Viện KH&CN VN, NXB Thống kê, 2006 Tài liệu tiếng Anh [5] George V Moustakides, Vassilios S Verykios, A MaxMin Approach for Hiding Frequent Itemsets, Data & Knowledge Engineering 65, p.75-89, 2008 [6] Xingzhi Sun, Philip S.Yu, Hiding Sensitive Frequent Itemsets by a BorderBased Approach, J Computing and Engineering, Vol.1, No.1, p.74-94, 2007 [7] S.R.M Oliveira, O.R Zai ă ane, Privacy preserving frequent itemset mining, in: Proceedings of the 2002 IEEE International Conference on Privacy, Security and Data Mining (CRPITS 2002), (2002), pp 43–54 ... lĩnh vực khai thác liệu 1.9 Khai thác liệu bảo đảm tính riêng tư 1.9.1 Bài tốn khai thác liệu bảo đảm tính riêng tư Khai thác liệu phát tri thức từ sở liệu Nói chung, liệu dùng để khai thác liên... lĩnh vực ứng dụng thực tiễn khai thác liệu 10 1.6 Các phương pháp, kỹ thuật áp dụng khai thác liệu 11 1.7 Các thách thức – khó khăn khám phá tri thức khai thác liệu 13 1.8 Khai thác tập... hợp liệu bước trình khai thác liệu Đây bước khai thác sở liệu, kho liệu chí liệu từ nguồn ứng dụng Web Trích lọc liệu: Ở giai đọan liệu lựa chọn phân chia theo số tiêu chuẩn phục vụ mục đích khai

Ngày đăng: 18/04/2021, 18:08

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] NGUYỄN XUÂN HUY, LÊ ĐỨC MINH, VŨ NGỌC LOÃN, Các ánh xạ đóng và ứng dụng trong cơ sở dữ liệu, Tạp chí Tin học và Điều khiển học, 16, No. 4, 2000, 1-6 Sách, tạp chí
Tiêu đề: Tạp chí Tin học và Điều khiển học
[6] Xingzhi Sun, Philip S.Yu, Hiding Sensitive Frequent Itemsets by a Border- Based Approach, J. Computing and Engineering, Vol.1, No.1, p.74-94, 2007 Sách, tạp chí
Tiêu đề: J. Computing and Engineering, Vol.1, No.1
[7] S.R.M. Oliveira, O.R. Zai ¨ ane, Privacy preserving frequent itemset mining, in Sách, tạp chí
Tiêu đề: Privacy preserving frequent itemset mining
[1] NGUYỄN XUÂN HUY, LÊ QUỐC HẢI, NGUYỄN GIA NHƯ, CAO TÙNG ANH, BÙI ĐỨC MINH, Lý thuyết giàn và ứng dụng trong thuật toán ẩn tập mục nhạy cảm, Báo cáo tại Hội thảo Quốc gia " Một số vấn đề chọn lọc của CNTT và truyền thông, Đồng Nai, 5-6 Tháng 8, (2009) Khác
[3] NGUYỄN XUÂN HUY, Giàn giao của ánh xạ đóng, Chuyên san các công trình nghiên cứu - triển khai viễn thông và công nghệ thông tin, số 14, 4-2005, 35-42 Khác
[4] NGUYỄN XUÂN HUY, Các phụ thuộc logic trong cơ sở dữ liệu, Viện KH&amp;CN VN, NXB Thống kê, 2006.Tài liệu tiếng Anh Khác
[5] George V. Moustakides, Vassilios S. Verykios, A MaxMin Approach for Hiding Frequent Itemsets, Data &amp; Knowledge Engineering 65, p.75-89, 2008 Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w