Một cách tiếp cận mới để ẩn hoàn toàn các luật kết hợp nhạy cảm

7 11 0
Một cách tiếp cận mới để ẩn hoàn toàn các luật kết hợp nhạy cảm

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết Một cách tiếp cận mới để ẩn hoàn toàn các luật kết hợp nhạy cảm đề xuất một cải thiện của thuật toán IFHSAR (Improve fast hiding sensitive association rules). Thuật toán đề xuất mới NIFHSAR là phiên bản cải tiến tiếp theo của thuật toán IFHSAR. Thuật toán NIFHSAR mới vừa có thể ẩn hoàn toàn các luật SAR đã cho, và còn giảm thiểu việc mất luật so với thuật toán ban đầu. Các kết quả thực nghiệm cho thấy đề xuất của chúng tôi giảm thiểu được việc mất các luật không nhạy cảm so với thuật toán IFHSAR trong hầu hết các trường hợp thử nghiệm. Mời các bạn cùng tham khảo!

MỘT CÁCH TIẾP CẬN MỚI ĐỂ ẨN HOÀN TOÀN CÁC LUẬT KẾT HỢP NHẠY CẢM Phan Ngọc Bảo Khoa Công nghệ Thông tin Cao đẳng Nghề Đà Lạt Đà Lạt, Việt Nam phanngocbao@cdndalat.edu.vn Đồn Minh Kh Khoa Cơng nghệ Thơng tin Đại học Đà Lạt Đà Lạt, Việt Nam khuedm@dlu.edu.vn Abstract Trong nghiên cứu này, đề xuất phương pháp cải tiến thuật toán IFHSAR [1] để ẩn luật kết hợp nhạy cảm (SAR) Thuật toán tiến NIFHSAR khơng ẩn hồn tồn luật SAR mà giảm thiểu việc luật khơng nhạy cảm so với thuật tốn ban đầu Các kết thực nghiệm cho thầy đề xuất chúng tơi cịn hiệu mặt thời gian thực thi Hiện nay, kĩ thuật khai thác liệu phát triển ngày đa dạng số lượng lẫn chất lượng, nên việc bảo vệ tính bí mật thông tin nhạy cảm sở liệu trở nên quan trọng Lĩnh vực khai thác liệu đảm bảo riêng tư đời nhằm đáp ứng u cầu Mục đích hướng tiếp cận ẩn luật kết hợp nhạy cảm cách giảm độ hỗ trợ hay độ tin cậy luật kết hợp Điều thực cách sửa đổi giao dịch hay item nạn nhân sở liệu Tuy nhiên, việc sửa đổi tạo tác dụng không mong muốn như: ẩn thất bại, luật luật ma Điều đặt thách thức để cân việc ẩn hoàn toàn luật nhạy cảm việc sinh tác dụng phụ mức thấp Bài báo tổ chức sau: Phần phát biểu tốn Phẩn mơ tả điểm thuật toán đề xuất đưa ví dụ minh họa Phần trình bày kết thực nghiệm phương pháp đề xuất so với thuật toán gốc Phần kết luận Trong báo này, đề xuất cải thiện thuật toán IFHSAR (Improve fast hiding sensitive association rules) [1] Thuật toán đề xuất NIFHSAR phiên cải tiến thuật toán IFHSAR, thuật tốn mà tơi trình bày hội nghị ICT 2021 Thuật tốn NIFHSAR vừa ẩn hồn tồn luật SAR cho, cịn giảm thiểu việc luật so với thuật toán ban đầu Các kết thực nghiệm cho thấy đề xuất giảm thiểu việc luật không nhạy cảm so với thuật toán IFHSAR [1] hầu hết trường hợp thử nghiệm II Bảng ký hiệu sử dụng báo Độ hỗ trợ itemset S tính theo cơng thức sau: Support(S) = ||S||/|D| (1) Trong ||S|| số lượng giao dịch sở liệu chứa itemset S, |D| số lượng giao dịch sở liệu D Chúng ta có S tập phổ biến support(S) ≥ min_support Như vậy, giao dịch ti hỗ trợ S S ⊆ ti Từ khóa — Luật kết hợp, ẩn luật nhạy cảm, khai thác liệu đảm bảo riêng tư, tác dụng phụ I PHÁT BIỂU BÀI TOÁN VÀ CÁC KÍ HIỆU GIỚI THIỆU Một luật kết hợp phép kéo theo có dạng X→Y, X⊂ I, Y⊂ I X∩ Y= Ø Một luật X→Y luật mạnh nếu: Định hướng khai thác liệu xu hướng quan trọng việc khám phá mẫu tin hữu ích từ tập liệu lớn Chúng áp dụng nhiều lĩnh vực khác nhau, chẳng hạn như: thương mại điện tử, trinh sát tội phạm, chăm sóc sức khỏe phân tích nhu cầu người dùng Tuy nhiên, công nghệ đe dọa đến riêng tư liệu Phân tích luật kết hợp cơng cụ mạnh mẽ phổ biến để khám phá mối liên hệ ẩn bên tập liệu lớn Một vài thơng tin riêng tư dễ dàng bị rị rỉ cơng cụ Do đó, việc bảo vệ tính riêng tư thơng tin nhạy cảm sở liệu trở thành vấn đề cấp thiết cần giải Các nghiên cứu chia làm hai hướng: ẩn luật nhạy cảm [2-5] ẩn itemset nhạy cảm [6-8] Vassilios S Verykios et al [2] tiến hành nghiên cứu kỹ lưỡng đưa năm thuật toán để ẩn luật kết hợp nhạy cảm Shyue-Liang Wang [6] đề xuất thuật tốn ẩn item nhạy cảm thay ẩn luật kết hợp nhạy cảm Thuật tốn có số lần quét sở liệu thấp tác dụng phụ sinh cao Ali Amiri [7] đưa thuật toán heuristic để ẩn item nhạy cảm, đảm bảo tính hữu ích liệu cao với chi phí tính tốn hiệu Yi-Hung Wu et al [3] đề xuất phương pháp heuristic ẩn luật kết hợp nhạy cảm với tác dụng phụ mức giới hạn Tuy nhiên, nhiều thời gian để so sánh kiểm tra ẩn luật nhạy cảm Ngồi ra, bị thất bại ẩn vài luật nhạy cảm số trường hợp • support(X→Y) ≥ min_support • confidence(X→Y) ≥ min_confidence min_support min_confidence hai ngưỡng tối tiểu cho trước, support(X→Y) confidence(X→Y) tính theo công thức sau: support(X→Y) = ||X∪ Y|| / |D| (2) confidence(X→Y) = ||X∪ Y|| / | X | (3) Ví dụ Cho sở liệu Bảng Có item |I| = 9, năm giao dịch |D|= sở liệu Bảng cho thấy tập phổ biến sinh từ Bảng với min_support = 60% Ta thấy S = {1,4,7}, S⊆t1, S⊆t2 S⊆t3, nên ta có ||S||=3 Do đó, support(1,4,7) = ||S||/ |D| = 60% Bảng luật kết hợp sinh từ Bảng với min_support = 60% and min_confidence = 75% Ví dụ luật 1,4→7, ||{1,4}|| = ||{1,4,7}||=3, nên theo cơng thức (2) (3) ta có support(1,4→7) = 60% confidence(1,4→ 7) = 100% XXX-X-XXXX-XXXX-X/XX/$XX.00 ©20XX IEEE 12 Mục tiêu nghiên cứu ẩn hết luật SAR giảm thiểu tác dụng phụ sinh từ sở liệu lọc Hình cho thấy mối tương quan tập U, U’ SAR Như vậy, mục tiêu phải vừa đảm bảo U’∩SAR = Ø vừa giảm thiểu hai tập: U–SAR–U’ U’–U U BẢNG Luật kết hợp sinh từ Bảng 2, min_support=60% min_confidence=75% confiden rules support confid rules support ce ence 1→ 60% 75% 7→ 60% 75% U’ SAR HÌNH Mối liên hệ tập U, U’ SAR BẢNG Kí hiệu định nghĩa Kí hiệu D D’ Cơ sở liệu lọc từ D U Tập luật kết hợp sinh từ D U’ Tập luật kết hợp sinh từ D’ |.| Số lượng phần tử tập . SAR Tập luật nhạy cảm cần ẩn, SAR={SAR1, SAR2, …, SARm} SAR’ Tập luật nhạy cảm ẩn L(. ) Một itemset bên trái luật R(. ) Một itemset bên phải luật ||.|| Độ hỗ trợ itemset, nghĩa số lượng giao dịch tập dự liệu có chứa itemset PWT Bảng lưu ID trọng số wi giao dịch ti.k 60% 100% 1,4→ 60% 100% 1→ 60% 75% 1,7→ 60% 100% 5→ 60% 100% 4,7→ 60% 100% 1→ 60% 75% 1→ 4,7 60% 75% 7→ 60% 100% 4→ 1,7 60% 100% 4→ 60% 100% 7→ 1,4 60% 75% Định nghĩa I = {i1, i2, , im} Một tập item sở liệu Cơ sở liệu ban đầu D = {t1, t2, …, tn}, giao dịch ti tập I, tức ti⊆ I I 4→ III A Đề xuất cải tiến thuật tốn Phương pháp đề xuất chúng tơi phiên cải tiến thuật toán IFHSAR [1] (Doan Minh Khue, ICT 2021), hầu hết bước đề xuất tương đồng với thuật toán ban đầu, có khác chỗ chúng tơi giới hạn số lượng giao dịch hỗ trợ luật SAR Các bước thuật tốn NIFHSAR cải tiến trình bày Hình Input: D, SAR, min_support, min_confidence; Ouput: D’ (trong luật SAR ấn hết) Giai đoạn 1: For giao dịch ti D Do { For luật SARj ∈SAR Do { IF SARj ⊆ ti Then { ||SARj|| = ||SARj|| + 1; } Min_Support_Trans(); //tìm số lượng tối tiểu giao dịch hỗ trợ luật SARj } For giao dịch tk Min_Support_Trans(); { IF Có SARj hỗ trợ tk { MICi = Item_Selection ( ); wi = MICi / (|ti - 1|) Lưu ID wi tk PWT; } } } Giai đoạn 2: While SAR ≠ ∅ Do { Chọn tID từ PWT có trọng số lớn nhất; tID.k = Item_Selection ( ); IF Checking_and_Removing Item( ) == True Then { Sửa wID tID chèn ID vào lại PWT theo thứ tự trì; For SARj mà tID.k ∈ SARj Do { IF SARj⊆ tID ((tID.k)∈ R(SARj) ) Then ||SARj|| = || SARj|| – 1; IF (support(SARj) < min_support) (confidence(SARj) < min_confidence) Then Xóa bỏ SARj khỏi SAR; } Một tiem giao dịch ti BẢNG Cơ sở liệu D ID Giao dịch 1,2,4,5,7 1,4,5,7 1,4,6,7,8 1,2,5,9 6,7,8 BẢNG Các tập phổ biến sinh từ Bảng 2, min_support = 60% Itemset Độ hộ trợ 80% 60% 60% 80% 1,4 60% 1,5 60% 1,7 60% 1,4,7 60% 4,7 60% THUẬT TỐN ĐỀ XUẤT } } HÌNH THUẬT TOÁN NIFHSAR Nhận thấy rằng, các luật nhạy cảm mà item tạo nên chúng có giao dịch sở liệu ban đầu giao dịch hỗ trợ xác định theo [4] toàn giao dịch sở liệu ban đầu Điều đảm bảo 13 ẩn hết luật nhạy cảm (HF = 0) tăng nguy liệu ban đầu bị sửa đổi, từ làm tăng khả bị luật sau hoạt động lọc Do vậy, cần phải có chiến lược hiệu việc xác định số lượng giao dịch hỗ trợ nhỏ cho vửa ẩn hết luật nhạy cảm mà cịn làm giảm việc sửa đổi liệu Dựa vào nhận định trên, đề xuất phương pháp xác định số lượng tối tiểu giao dịch hỗ trợ bị sửa đổi Chi tiết trình xác định giao dịch hỗ trợ cải tiến thực sau: Với luật nhạy cảm ri RS { giao dịch là: { Chọn giao dịch Số lượng tối tiểu giao dịch có trọng số cao lựa chọn giao dịch sửa đổi trước tiên quan cao nhất: t = Chú ý kịch sửa đổi không xét việc sửa đổi giao dịch có hỗ trợ nhiều luật nhạy cảm lúc Như trình bày trên, ẩn luật nhạy cảm cách giảm độ hộ trợ MST hay độ tin cậy MCT Do đó, theo [9] tính chất sau rút = với giá trị liên –t } } HÌNH Mã giả phương pháp xác định số lượng tối tiểu giao dịch hỗ trợ tập hợp tất giao dịch có B Ví dụ minh họa Cho tập liệu ban đầu D (Bảng 2), luật nhạy cảm SAR Bảng 5, min_support = 40% min_confidence = 60% Thuật toán NIFHSAR thực thi bên hỗ trợ X → Y Để giảm độ tin cậy luật ngưỡng MCT, số lượng tối thiểu giao dịch mà cần phải sửa đổi |t hỗ trợ đầy đủ ri} For i =1 to N Với luật nhạy cảm cho trước, việc sử dụng cơng thức [9] số lượng tối thiểu giao dịch cần sửa đổi để ẩn luật nhạy cảm tương ứng đưa Thuộc tính 1: Cho = {t cần sửa đổi để ẩn luật ri, kí hiệu N_iterations • Sắp xếp giao dịch hỗ trợ theo trọng số • - Sử dụng cơng thức 4, để tính số lượng tối tiểu giao dịch • Tất giao dịch hỗ trợ hay nhiều luật nhạy cảm lọc • giao dịch có hỗ trợ đầy đủ ri Chúng ta ký hiệu tập - Lọc từ là: 〈{0},0〉 Thuộc tính 2: Cho tập hợp tất giao dịch có 〈{1},1〉 hỗ trợ X → Y Để giảm độ hỗ trợ itemset tạo luật X 〈{0},0〉 → Y MST, số lượng tối thiểu giao dịch mà cần phải sửa đổi là: 〈{2,3}, 2〉 Dựa vào thuộc tính thuộc tính 2, suy 〈{0},0〉 HÌNH Mối quan hệ giữ t1 item bên phải SAR số lượng tối thiểu giao dịch phải sửa đổi để ẩn luật Đầu tiên, ta quét sở liệu D để tìm tập giao dịch hỗ trợ cho luật nhạy cảm Kết thể Bảng Tiếp theo ta tính toán số lượng giao dịch tối tiểu để ẩn luật nhạy cảm theo công thức Cụ thể với luật SAR1 số lượng nhỏ là: Min(2-0.4 x5+1, 20.6x2+1) = Min(1, 1.8) = 1; với SAR2 là: Min(2, 2.8) = 2; với SAR3 là: Min(1, 1.2) = 1; với SAR4 là: Min(1, 1.8) = Cuối ta tập nhỏ giao dịch nhạy cảm cần sửa đổi để ẩn hết luật nhạy cảm là: D’ = {T1, T2, T3} nhạy cảm là: Mã giả phương pháp xác định số lượng tối tiểu giao dịch hỗ trợ trình bày cụ thể Hình Giai đoạn 1, tiến hành quét lại tập D để thu thập thông tin Như Bảng 7, ||SARj|| ||L(SARj)|| cho SARj kết thu từ q trình Ví dụ, SAR3: 1,5→7 hỗ trợ giao dịch t1 t2, || SAR3|| = 2, 14 L(SAR3): {1,5} hỗ trợ giao dịch t1, t2 t4, L(SAR3) = Hình thể mối tương quan giao dịch t1 item bên phải SAR thể trực quan lược đồ G Do giao dịch t1 hỗ trợ luật SAR1, SAR2 SAR3 nên nút 〈 {2, 3}, 〉 item ‘7’ t1 hỗ trợ hai luật nhạy cảm SAR2 SAR3 mà có item ‘7’ đó, cụ thể Rk = {2,3} | Rk |=2 Như thấy Hình 4, max(|Rk|) = max(1, 2) = Do vậy, ta có MIC1 = w1 = 2/16 =1/8 Tương tự với giao dịch lại sở liệu D’, ta có Bảng Bảng bảng PWT kết việc Bảng giảm dần theo trọng số w Sau đó, giao dịch PWT t2 chọn để sửa đổi Theo heuristic Hình item '7' t2 xóa bỏ Sau xóa item ‘7’ tiến hành tính lại w2 cho t2 Lúc này, ||SAR2|| ||SAR3|| giảm SAR3 xóa khỏi SAR (||SAR3|| / |D|) < min_support Tiến trình lặp lại SAR rỗng Cuối phương pháp chúng tơi xóa bỏ item ‘7’ t2, item ‘5’ item ‘7’ t1, item ‘8’ t3 IV A Tập liệu Các tập liệu sử dụng để làm thực nghiệm: Tập liệu T10I4D100K, Mushroom Chess Trong tập liệu T10I4D100K tạo từ sinh nhóm nghiên cứu IBM Almaden Quest, hai tập liệu Mushroom Chess tập liệu thực Các liệu lấy từ kho chứa Frequent Itemset Mining Implementations Repository http://fimi.ua.ac.be/data/ Đặc điểm liệu cụ thể trình bày Bảng 10 BẢNG 10 ĐẶC ĐIỂM CỦA BA TẬP DỮ LIỆU Đặc điểm Datasets SAR (X→Y) X∪Y X 1,2→5 1,2,5 1,2 1,4→7 1,4,7 1,4 1,5→7 1,5,7 1,5 6→8 6,8 SAR (X→Y) Các giao dịch hỗ trợ 1,2→5 T1, T4 1,4→7 T1, T2, T3 1,5→7 T1, T2 6→8 T3, T5 Chiều dài trung bình 100000 870 Mushroom 8124 119 23 Chess 3196 75 37 Hiding Failure (HF): cho biết số lượng luật nhạy cảm mà thuật tốn trùng khơng thể ẩn khai thác từ sở liệu làm D' Cơng thức tính tốn: (4) Trong Rs(D') số lượng luật nhạy cảm tìm thấy sở liệu làm D' Rs(D') số lượng luật nhạy cảm sở liệu gốc ban đầu D Lost Rules (LR): Cho biết số lượng luật không nhạy cảm bị hoạt động trùng (sanitization) không khai thác từ tập liệu trùng D' Cơng thức tính tốn là: BẢNG Độ hỗ trợ độ tin cậy luật SAR ||SARj|| ||L(SARj)|| support confidence SAR (X→Y) 1,2→5 2 40% 100% 1,4→7 3 60% 100% 1,5→7 60% 66.67% 6→8 2 40% 100% j Số lượng items B Các độ đo Các tiêu chí quan trọng sử dụng để so sánh thuật toán cải tiến IFHSAR so với thuật toán FHSAR bao gồm: BẢNG Tập giao dịch hỗ trợ luật nhạy cảm j Số lượng giao dịch T10I4D100K BẢNG Tập luật nhạy cảm SAR j ĐÁNH GIÁ HIỆU NĂNG (5) Trong |~Rs(D)| số lượng luật không nhạy cảm tập liệu ban đầu D |~Rs(D’)| số lượng luật không nhạy cảm tập liệu làm D' BẢNG MIC trọng số giao dịch D’ |ti| MIC wi Giao dịch Ghost Rules (GR): cho biết số lượng luật giả sở liệu gốc ban đầu D tạo hoạt động làm sanitization khai thác từ sở liệu D’ Cơng thức tính tốn: ID 1,2,4,5,7 1/8 1,4,5,7 1/4 1,4,6,7,8 1/16 (6) Trong |R’| số lượng luật khai thác từ D' |R| số lượng luật khai thác từ D BẢNG PWT STT wi ID 1/4 1/8 3 1/16 Thời gian thực thi CPU: thời gian cần thiết để thuật tốn hồn thành q trình lọc liệu 15 C Các Kết Quả Thực Nghiệm Cả hai thuật toán thực nghiệm tiến hành tảng Java Và thực máy tính PC với vi xử lý @Intel CPU core i7 2.50 GHz, RAM 16GB môi trường hệ điều hành Windows 10 (64-bit) Thực nghiệm đưa để so sánh phương pháp với thuật toán ban đầu, bao gồm: thời gian thực thi CPU, ẩn thất bại, luật luật ma Các kết so sánh hiển thị tương ứng hình từ Hình đến Hình 13 HÌNH SO SÁNH THỜI GIAN THỰC THI CPU CỦA THUẬT TỐN TRONG TẬP DỮ LIỆU THỰC MUSHROOM HÌNH SO SÁNH THỜI GIAN THỰC THI CPU CỦA THUẬT TỐN TRONG TẬP DỮ LIỆU THỰC T10I4D100K HÌNH SO SÁNH SỐ LƯỢNG MẤT LUẬT CỦA THUẬT TOÁN TRONG TẬP DỮ LIỆU THỰC MUSHROOM HÌNH SO SÁNH SỐ LƯỢNG MẤT LUẬT CỦA THUẬT TOÁN TRONG TẬP DỮ LIỆU T10I4D100K HÌNH 10 SO SÁNH SỐ LƯỢNG LUẬT MA TẠO RA CỦA THUẬT TOÁN TRONG TẬP DỮ LIỆU THỰC MUSHROOM HÌNH SO SÁNH SỐ LƯỢNG LUẬT MA TẠO RA CỦA THUẬT TOÁN TRONG TẬP DỮ LIỆU T10I4D100K 16 thấy đề xuất nhanh thuật toán IFHSAR [1] ban đầu ba tập liệu • Theo hình 7, hình 10 hình 13, đề xuất cải tiến chúng tơi so với thuật toán IFHSAR [1] ban đầu thấp chút vấn đề sinh luật ma khơng mong muốn • Cũng theo hình 6, hình hình 12, khía cạnh luật khơng nhạy cảm đề xuất cải tiến thấp thuật toán IFHSAR [1] ban đầu V KẾT LUẬN Trong báo này, đề xuất cải tiến cho thuật toán IFHSAR [1] Thuật toán cải tiến NIFHSAR ẩn hoàn toàn hết luật kết hợp nhạy cảm mà cịn giảm thiểu việc luật khơng nhạy cảm Chiến lược đề xuất giới hạn số lượng giao dịch hỗ trợ cần sửa đổi Điều vừa đảm bảo giảm nhanh độ tin cậy luật nhạy cảm SAR mà vừa gây biến đổi lên sở liệu ban đầu HÌNH 11 SO SÁNH THỜI GIAN THỰC THI CPU CỦA THUẬT TOÁN TRONG TẬP DỮ LIỆU THỰC CHESS Các kết thực nghiệm cho thấy phương pháp chúng tơi hiệu thuật tốn IFHSAR [1] ban đầu khía cạnh thời gian thực thi CPU hạn chế tác dụng phụ mặt luật Trong tương lai, tiếp tục nghiên cứu phát triển phương pháp hiệu quả, tối ưu để hạn chế việc luật luật ma tạo mức thấp Chúng tơi hi vọng đề xuất cải tiến thúc đẩy việc chia sẻ liệu tổ chức mà cần bận tâm vấn đề rị rỉ thơng tin nhạy cảm riêng tư trình trao đổi ACKNOWLEDGMENT Nghiên cứu hỗ trợ phần chi phí từ Trường Đại học Đà Lạt TÀI LIỆU THAM KHẢO HÌNH 12 SO SÁNH SỐ LƯỢNG MẤT LUẬT CỦA THUẬT TOÁN TRONG TẬP DỮ LIỆU THỰC CHESS [1] [2] [3] [4] [5] [6] HÌNH 13 SO SÁNH SỐ LƯỢNG LUẬT MA TẠO RA CỦA THUẬT TOÁN [7] TRONG TẬP DỮ LIỆU THỰC CHESS [8] Các kết thực nghiệm tóm tắt đây: • Về thời gian thực thi CPU thể hình 5, hình hình 11 Theo hình ta 17 Doan Minh Khue,Tran Thi Phuong Linh (2021), “A more efficient solution of FHSAR algorithm for data privacy preservation problem”, ICT Dalat, 2021 Vassilios S Verykios, A.K Elmagarmid, E Bertino, Y Saygin, and E Dasseni, “Association Rule Hiding,” IEEE Transactions on Knowledge and Data Engineering, vol 16, no 4, pp 434-447, 2004 Yi-Hung Wu, Chia-Ming Chiang, and Arbee L.P Chen, “Hiding Sensitive Association Rules with Limited Side Effects”, IEEE Transactions on Knowledge and Data Engineering, vol 19, issue 1, pp 29 - 42, 2007 Mahtab Hossein Afshari, Mohammad Naderi Dehkordi, Mehdi Akbari (2016), “Association rule hiding using cuckoo optimization algorithm”, Expert Systems with Applications 64, pp 340–351 Shyue-Liang Wang, Kuan-Wei Huang, Tien-Chin Wang, and TzungPei Hong, “Maintenance of discovered informative rule sets: incremental deletion”, International Conference on Systems, Man and Cybernetics, pp.170-175, 2005 Shyue-Liang Wang, “Hiding sensitive predictive association rules”, Systems, Man and Cybernetics, 2005 IEEE International Conference on Information Reuse and Integration, vol 1, pp 164-169, 2005 Ali Amiri, “Dare to share: Protecting sensitive knowledge with data sanitization", Decision Support Systems archive vol 43, issue 1, pp 181-191, 2007 Shyue-Liang Wang, Bhavesh Parikh, and Ayat Jafari, “Hiding informative association rule sets”, Expert Systems with Applications, pp.316-323, 2007 [9] Yi-Hung Wu, Chia-Ming Chiang, and Arbee L.P Chen, Senior Member, IEEE Computer Society (2007), “Hiding Sensitive Association Rules with Limited Side Effects”, IEEE TRANSACTIONS ON KNOWLEDGE ENGINEERING, Vol 19, No 1, pp 29-42 [10] http://fimi.ua.ac.be/data/ 18 AND DATA ... luật kết hợp sinh từ D U’ Tập luật kết hợp sinh từ D’ |.| Số lượng phần tử tập . SAR Tập luật nhạy cảm cần ẩn, SAR={SAR1, SAR2, …, SARm} SAR’ Tập luật nhạy cảm ẩn L(. ) Một itemset bên trái luật. .. phải sửa đổi để ẩn luật Đầu tiên, ta quét sở liệu D để tìm tập giao dịch hỗ trợ cho luật nhạy cảm Kết thể Bảng Tiếp theo ta tính toán số lượng giao dịch tối tiểu để ẩn luật nhạy cảm theo công... NIFHSAR ẩn hoàn toàn hết luật kết hợp nhạy cảm mà cịn giảm thiểu việc luật khơng nhạy cảm Chiến lược đề xuất giới hạn số lượng giao dịch hỗ trợ cần sửa đổi Điều vừa đảm bảo giảm nhanh độ tin cậy luật

Ngày đăng: 31/12/2022, 14:43

Tài liệu cùng người dùng

Tài liệu liên quan