khai thác luật kết hợp bảo đảm tính riêng tư trên dữ liệu phân tán ngang (2)

14 121 0
khai thác luật kết hợp bảo đảm tính riêng tư trên dữ liệu phân tán ngang (2)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

14 Chương CƠNG TRÌNH LIÊN QUAN Trong chương ñã phân tích tính riêng khai thác luật kết hợp liệu phân tán ngang, xác ñịnh thơng tin cần phải bảo đảm tính riêng ñưa phương pháp ñể giải Trong chương trình bày các giao thức ñề xuất ñể bảo ñảm tính riêng khai thác luật kết hợp liệu phân tán ngang, giao thức trình bày chi tiết bước thực ñồng thời ñưa nhận xét, ñánh giá 2.1 Giới thiệu chung: Đã có nhiều báo tập trung vào vấn ñề khai thác luật kết hợp bảo đảm tính riêng liệu phân tán ngang, hình 2.1 phân loại giao thức với báo liên quan (ở ñây báo điển hình) Đặc điểm chung giao thức tập trung nâng cao tính riêng tư, tiết kiệm chi phí tính tốn truyền thơng, thỏa mơ hình semi-honest, áp dụng cho mục đích ẩn liệu, sử dụng kỹ thuật mã hóa số site tham gia ≥ Semi-honest Luật kết hợp số lượng ([10], 2006) Malicious FI ([1], 2002) ([5], 2007) ([6], 2007) ([8], 2008) MFI ([2], 2003) ([4], 2006) Luật kết hợp Apriori ([3], 2004) Phân mảnh ngang Ẩn liệu FPTree ([7], 2008) Ẩn luật Ma trận tương tự ([9], 2009) Hình 2.1 – Cây phân loại thuật tốn 2.2 FI (Frequent itemset): Hướng tiếp cận FI dựa bổ đề: “Một luật có độ hỗ trợ tồn cục ≥ k% phải có độ hỗ trợ cục ≥ k% site” [7] 15 Như “một itemset phổ biến tồn cục phải phổ biến cục site” [7] Từ chọn tập itemset ứng viên toàn cục phần hợp itemset phổ biến cục site, site phát sinh itemset phổ biến cục theo thuật toán FDM (Fast Distributed Mining of association rules), sau site kết hợp tính độ hỗ trợ tồn cục ứng viên tồn cục để tìm itemset phổ biến toàn cục Như ta cần có giao thức hợp an tồn giao thức tính tổng an toàn Năm 2002, Murat Kantacioglu Chris Clifton [7] ñề xuất giao thức KCS, ñây giao thức ñầu tiên vấn ñề này, giao thức áp dụng với số site n ≥ thỏa mơ hình semi-honest khơng có thơng đồng Về tổng quan giao thức có hai giai đoạn: Giai đoạn 1: Xác định k-itemset ứng viên toàn cục (phổ biến nhiều site, k-itemset phổ biến toàn cục ⊆ k-itemset ứng viên toàn cục) E2(E3(ABC)) E2(E3(ABD)) Site ABC E1(ABC) E3(ABC) E3(ABD) ABC ABD E2(E3(E1(ABC))) Site ABD Site ABC E3(E1(ABC)) Hình 2.2 - Giai đoạn 1, tìm itemset ứng viên chung Từ hình 2.2, thành viên (site) mã hóa k-itemset phổ biến cục (phát sinh dựa vào (k-1)-itemset phổ biến toàn cục) sử dụng mã hóa giao hốn (ABC site 1) gửi cho thành viên khác, cho ñến tất thành viên mã hóa tất k-itemset Các k-itemset mã hố gửi tới thành viên chung ñể ước lượng trùng lắp giải mã (Tập 3-itemset bên trái site 1, sau site tiến hành giải mã) Tập ñược gửi cho thành viên, thành viên giải mã k-itemset Kết cuối tập k-itemset ứng 16 viên chung (ABC ABD) (Sử dụng itemset giả mạo (“fake itemset”) ñể site khác ñược số itemset phổ biến cục site.) Giai ñoạn 2: Xác ñịnh k-itemset ứng viên ñược hỗ trợ toàn cục (tức kitemset phổnh tổng KCS nên tính riêng thấp Năm 2006, Chin-Chen Chang [10] cải tiến giao thức tìm tập ứng viên tồn cục KCS cách sử dụng MFI Giao thức thực qua giai ñoạn: Giai ñoạn 1: Các site tìm MFI cục thêm vào số itemset giả mạo Sử dụng mã hố giao hốn tương tự KCS để tìm hợp MFI Giao thức cải tiến giao thức Adriano A Veloso [8] truyền thơng vòng, khơng dùng Trusted-party, giảm số ứng viên tồn cục mã hóa giảm tổng chi phí truyền thơng Giai đoạn 2: tính độ hỗ trợ tồn cục ứng viên sử dụng giao thức (có khơng có Trusted-party) có tính bảo mật KCS Giao thức A: (sử dụng Trusted-party, TA) Độ hỗ trợ vượt mức toàn cục itemset ứng viên chung X, GE: 23 GE = X.sup − sup* | DB | n −1 = ∑ (X.supi − sup* | DBi |) i=0 n −1 n −1 = ∑ X.sup i − sup * ∑ | DBi | + (Rsum − Rsum) i=0 i=0 n −1 n −1 n −1 i=0 i=0 i=0 = ∑ X.sup i − sup * ∑ | DBi | + ∑ R i − Rsum n −1 = ∑ (X.supi − sup * | DBi | + R i ) − Rsum i=0 n −1 = ∑ ri − Rsum i=0 Nếu GE ≥ 0: X phổ biến tồn cục, ngược lại X khơng phổ biến Ví dụ: xem hình 2.9, với X = {A, B} itemset ứng viên toàn cục Bước 1: TA chọn ngẫu nhiên R0 = 9, R1 = 12, R2 = Rsum = 28 Bước 2: TA gửi (9, 28), (12, 28), (7, 28) cho S0, S1, S2 theo thứ tự S0, S1, S2 tính tốn độc lập r0 = 18 – 10% * 100 + = 17, r1 = – 10% * 100 + 12 = r2 = 12 – 10% * 200 + = -1 Bước 3: Các site S0, S1, S2 theo thứ tự truyền r0, r1, r2 cho site khác Bước 4: Mỗi site tính GE = 17 + – – 28= -3 < Do đó, X khơng phổ biến tồn cục Giao thức B: (khơng sử dụng Trusted-party) GE = X.sup - sup*|DB| n −1 n −1 n −1 n −1 i=0 i=0 i=0 i=0 = ∑ X.supi − sup * ∑ | DBi | + ∑ R i − ∑ R i n −1 = ∑ (X.supi − sup* | DBi | + R i + R j ), ( j ≡ n + i -1(mod n) ) i=0 n −1 = r0 + ∑ (X.supi − sup* | DBi | + R i + R j ) i =1 n −1 = r1 +∑ (X.supi − sup* | DBi | + R i + R j ) i=2 = n −1 = rn − + ∑ (X.supi − sup* | DBi | + R i + R j ) i = n -1 = rn − 24 Nếu GE = rn – ≥ 0, X phổ biến, ngược lại, X không phổ biến Ví dụ, xem hình 2.10 Bước 1: Các site S0, S1, S2 theo thứ tự chọn số ngẫu nhiên R0 = 9, R1 = 12, R2 = S0 gửi cho S1 S1 gửi 12 cho S2, S2 gửi cho S0 Bước 2: Với S0 site khởi tạo, tính r0 = 18 – 10% * 100 + – = 10 gửi r0 S1 Bước 3: Site S1 tính r1 = r0 + (7 – 10% * 100 + 12 - 9) = 10 Sau S1gửi r1 cho S2 Cuối cùng, site S2 tính r2 = r1 + (12 – 10% * 200 + - 12) = -3 Do X khơng phổ biến tồn cục Bước 4: Site S2 thơng báo X khơng phổ biến tồn cục cho site S0 S1 Nhận xét: sử dụng MFI thay cho FI giao thức sử dụng mã hóa giao hốn phí tính tốn truyền thơng cao cao, bước tính độ hỗ trợ tồn cục khơng sử dụng mã hóa nên có chi phí truyền thơng thấp, nhiên tác giả chưa đưa ñánh giá tính riêng cho giao thức tính tổng an toàn r0 = 18 – 10%*100 + sup = 10% |DB| = 400 Site S0 AB: 18 |DB1| = 100 TA Site S2 ABC: 12 |DB2| = 200 Site S1 ABC: |DB1| = 100 r2 = 12 – 10%*200 + r1 = – 10%*100 + 12 GE = r0 + r1+ r2 - Rsum = 17 + – – 28 = -3 < AB: khơng phổ biến Hình 2.9 - Tính hỗ trợ tồn cục sử dụng Trusted-party 25 r0 = 18 – 10%*100 + - sup = 10% |DB| = 400 Site S0 AB: 18 |DB1| = 100 Site S2 ABC: 12 |DB2| = 200 r2 = r1 + 12 – 10%*200 + - 12 Site S1 ABC: |DB1| = 100 r1 = r0 + – 10%*100 + 12 - GE = r2 -3 < AB: khơng phổ biến Hình 2.10 - Tính độ hỗ trợ tồn cục khơng sử dụng Trusted-party 2.4 Apriori: Năm 2004, tác giả Mafruz Zaman Ashrafi, David Taniar Kate Smith [9] ñề xuất phương pháp tính tổng độ hỗ trợ itemset, giao thức sử dụng thuật tốn Apriori để phát sinh itemset cục không cần bảo mật itemset Các site phát sinh tất k-itemset (ứng viên) từ (k-1)-itemset phổ biến tồn cục tính độ hỗ trợ, sau site kết hợp tính độ hỗ trợ ứng viên tìm k-itemset phổ biến tồn cục Tính độ hỗ trợ tồn cục theo hai bước: (Giả sử có thành viên P1, P2, P3, P4) Bước 1, Pi tính: kết trung gian + supi + ri ngẫu nhiên Tức là, P1 gửi sup1 + r1 cho P2, P2 gửi sup1 + sup2 + r1 + r2 cho P3 Sau P1 nhận ∑ i =1 (supi + ri ) từ P4 Bước 2, Pi tính: giá trị trung gian - ri, gửi cho thành viên Cuối cùng, P1 nhận ñược tổng ∑ v , gửi giá trị cho thành viên khác i =1 i Giao thức tiếp tục với (k+1)-itemset Cuối phát sinh luật 26 Nhận xét: số itemset truyền thông lớn (do phải phát sinh tất ứng viên k = 1) khơng sử dụng mã hóa phí tính tốn truyền thơng khơng đáng kể so với phương pháp có sử dụng mã hóa, nhiên giao thức tính tổng khơng an tồn KCS 2.5 FPTree (Frequent Pattern Tree): Năm 2008, Chunhua Su Kouichi Sakurai [13] ñề xuất giao thức sử dụng FPTree, kết hợp mã hố đồng hình Paillier, mã hố dựa vào thuộc tính (Attributes based Encryption - ABE) Các site tạo FP-Tree cục (sử dụng ABE ñể mã hố tập thuộc tính) Các site gộp FP-Tree cục (Sử dụng mơ hình matching riêng tư: xem chi tiết báo) sau xây dựng FP-Tree tồn cục tính độ hỗ trợ tồn cục Cuối phát sinh luật gửi cho site Nhận xét: giao thức phức tạp, khơng có đánh giá so sánh đầy đủ, giao thức có tính riêng cao (n – 1) thành viên thơng đồng với làm tiết lộ kết 2.6 Ma trận tương tự: Năm 2009, Gui Qiong Cheng Xiao-hui [15] đề xuất giao thức kết hợp mã hố đồng hình RSA, sử dụng server CMS DMS, CMS phát sinh cặp khóa cơng khai gửi public key cho site, private key cho DMS, site phát sinh ma trận tương tự giao tác, nén, thực mã hoá với HES, gửi cho DMS DMS giải mã gộp lại dựa vào thuật toán ARBSM, cuối phát sinh luật Nhận xét: chế bảo mật khơng rõ ràng, DMS có private key nên biết ma trận tương tự cục site (ñây nhận xét cá nhân) 2.7 Luật kết hợp số lượng: Năm 2006, Weiwei Jing [16] ñề xuất giao thức hợp (dùng RSA) an tồn giao thức KCS [7] Sử dụng gom nhóm phân cấp dựa CF_Tree (Clustering Feature Tree) để góm nhóm liệu cục Chia nút n phần, gửi cho 27 thành viên khác sử dụng giao thức hợp an toàn Site kết hợp phần lại, xây dựng CF_Tree tồn cục Từ phát sinh luật dựa vào giao thức tính tổng an tồn Nhận xét: giao thức đề xuất giao thức hợp an tồn có chi phí thấp so với giao thức hợp KCS site mã hóa phần liệu (với KCS mã hóa tồn n phần) Đề xuất giao thức tính tổng dựa CF_Tree Kết chương: Đa số giao thức ñều tập trung tối ưu tìm tập ứng viên tính độ hỗ trợ tồn cục, nâng cao tính riêng tư, hạn chế thơng đồng, tiết kiệm chi phí tính tốn truyền thơng Các giao thức áp dụng cho mơ hình cơng semi-honest ... hốn phí tính tốn truyền thơng cao cao, bước tính độ hỗ trợ tồn cục khơng sử dụng mã hóa nên có chi phí truyền thơng thấp, nhiên tác giả chưa ñưa ñược ñánh giá tính riêng tư cho giao thức tính tổng... cần bảo mật itemset Các site phát sinh tất k-itemset (ứng viên) từ (k-1)-itemset phổ biến tồn cục tính độ hỗ trợ, sau site kết hợp tính độ hỗ trợ ứng viên tìm k-itemset phổ biến tồn cục Tính. .. biết ma trận tư ng tự cục site (ñây nhận xét cá nhân) 2.7 Luật kết hợp số lượng: Năm 2006, Weiwei Jing [16] ñề xuất giao thức hợp (dùng RSA) an toàn giao thức KCS [7] Sử dụng gom nhóm phân cấp dựa

Ngày đăng: 01/06/2018, 12:48

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan