Giao thức tính toán bảo mật nhiều thành viên SMC

Một phần của tài liệu 806 nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư,khoá luận tốt nghiệp (Trang 33)

2.2.1. Định nghĩa

Tính toán bảo mật nhiều thành viên (Secure multi-party computation - SMC) là một nhánh nghiên cứu của lĩnh vực mật mã học. Mục tiêu của hướng nghiên cứu này là tạo ra các phương thức cho phép nhiều thành viên cùng tính toán một hàm nào đó dựa trên dữ liệu đầu vào của họ trong khi mỗi thành viên không tiết lộ giá trị đầu vào mình nắm giữ cho các thành viên khác.

Tính toán bảo mật nhiều thành viên được đề cập lần đầu tiên vào những năm 1970 trong một trò chơi bài nhiều người tham gia (A.Shamir, R.Rivest and L.Adleman, 1981). Sau đó, bài toán tính toán bảo mật nhiều thành viên đầu tiên được phát biểu vào năm 1982 bởi nhà khoa học (Yao, 1982) mang tên “so sánh tài sản của hai nhà triệu phú”.

Ví dụ: Giả sử có ba người A, B và C với X1 ,X2,X3 là mức lương tương ứng của họ. Họ muốn tìm ra mức lương cao nhất trong ba mức lương mà không tiết lộ cho những người khác biết mức lương của mình. về mặt toán học được thể hiện bằng hàm sau:

F (x1,x2,x3) = Max (x1,x2,x3)

Tới năm 2004, cơ sở lý thuyết của SMC chính thức mới được phát triển bởi Goldreich (Oded Goldreich, 2004). Trong cơ sở này, các giao thức được xây dựng theo một trong hai mô hình: mô hình gồm các thành viên bán trung thực (semi- honest model) và mô hình gồm các thành viên không trung thực (malicious adversary model). Trong mô hình semi-honest, giả sử rằng mỗi thành viên tuân thủ quy tắc của giao thức trong khi thực thi các yêu cầu nhưng sau hi giao thức được hoàn thành các thành viên này vẫn có thể khai thác các thông tin riêng tư dựa vào nội dung các thông điệp họ nhận được trong quá trình thực hiện giao thức. Trong mô hình malicious adversary, ngoài các yêu cầu của giao thức, các bên có thể thực hiện các hoạt động tùy ý kể cả việc hai thác các thông tin riêng tư của các bên khác.

công khai Paillier đã được đề cập. Khóa công khai được Data AnaIyst chia sẻ cho

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

2.2.2. Các đặc trưng cơ b ản của m ột giao thức SMC

a. Tính riêng tư

Tính riêng tư thể hiện rằng dữ liệu cá nhân của mỗi người tham gia chỉ có người đó biết, không có thông tin nào về dữ liệu riêng tư có thể được suy ra từ các thông điệp được gửi trong quá trình thực hiện giao thức. Thông tin duy nhất có thể được suy luận ra chỉ có thể là kết quả đầu ra của hàm tính toán.

b. Tính chính xác

Kết quả đầu ra được đảm bảo chính xác tương ứng với thông tin đầu vào mà các bên cung cấp.

c. Tính hiệu quả

Tính hiệu quả được thể hiện rằng khi mỗi thành viên tham gia vào quá trình tính toán của giao thức thì chỉ phải b ỏ ra ít chi phí. Do đó, tính hiệu quả của giao thức sẽ tỷ lệ nghịch với chi phí b ỏ ra của các thành viên tham gia.

2.2.3. Giao thức tính tổng b í m ật nhiều thành viên

Giả sử có n thành viên U1,...,Un trong đó mỗi thành viên Ui nắm giữ một giá trị bí mật Xi. Mục tiêu của giao thức này là giúp cho người phân tích (ữ ata AnaIyst) tính được tổng X = ∑n= 1 Xi trong khi không ai biết được mỗi giá trị trị ngoại trừ thành viên .

Giao thức này cũng giả thiết rằng tồn tại một máy chủ (S e r V e r) làm nhiệm vụ

nhận dữ liệu từ phía n thành viên và gửi kết quả tổng hợp cho D ata AnaIyst. Để bảo vệ t nh riêng tư cho và giữ uy t n cho mình, được giả sử rằng không thông đồng với D ata AnaIyst. Tuy nhiên, Server hoàn toàn có thể thông đồng iểm soát một số thành viên.

Trước hi bắt đầu thực thi giải pháp, tạo ra một bộ hóa b mật

φ (N) và khóa công khai N của hệ mã hóa Paillier như trong phần Hệ mã hóa khóa

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

Pha 1: Mỗi người dùng Ui tính toán như sau

- Chọn số ngẫu nhiên bí mật ri∈ ( O , N) .

- Tính Ei = (N. Xi + 1 ) . rN mOd N2.

- Ui∙. Ei → Server.

Pha 2: Server tính toán như sau

- Tính E = ∏i= 1Ei mod N2

- Server ∙. E → D ata Ana Iys t.

Pha 3: Data Analyst tính toán như sau

_____ E<PW-I _____________. - Tính X = b n * φ(N)-1 Chứng minh: Ta có: E = ∏i= 1 Ei mod N2 = ∏i= 1 (N. Xi + 1). rN mOd N2 = ∏i= 1 (N.Xi + 1).(∏i= ir)N mod N2 = (N■ ∑i= 1xi + 1)(∏i= 1ri)N mod N2

De dàng nhận thấy E là bản mã của ∑=1 Xi với số ngẫu nhiên r = ∏i= 1 ri. Vì vậy, N * φ(N)1=∑i= 1Xi-

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

CHƯƠNG 3. HỆ THỐNG KHẢO SÁT NGƯỜI KINH DOANH TRÊN MẠNG XÃ HỘI CÓ ĐẢM BẢO TÍNH RIÊNG TƯ

Trong chương này, khóa luận trình bày về mô hình hệ thống (bao gồm: mô tả khái quát và định nghĩa tính chất riêng tư của các thành phần thuộc hệ thống). Đồng thời, tác giả cũng đề xuất giải pháp giúp giải quyết những khó khăn của doanh nghiệp trong việc khảo sát người kinh doanh trên mạng xã hội có bảo đảm tính riêng tư.

3.1. Mô hình hệ thống3.1.1. Mô tả hệ thống 3.1.1. Mô tả hệ thống

Hệ thống khảo sát người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư được giả sử bao gồm ba thực thể chính như sau:

- Doanh nghiệp thực hiện khảo sát ( D ata AnaIyst): Doanh nghiệp xây dựng bảng câu hỏ i khảo sát (bao gồm: những câu hỏ i không mang tính chất riêng tư, nhạy cảm và những câu hỏi có chứa thông tin riêng tư, nhạy cảm (Ví dụ: liên quan đến vấn đề doanh thu, lợi nhuận, tỷ lệ tăng trưởng...) - những câu hỏ i này tồn tại dưới dạng câu h ỏ i trắc nghiệm). Giả sử có m câu hỏ i khảo sát chứa thông tin riêng tư, nhạy cảm: Q 1 , Q2 ,. . ., Qm. Trong đó, mỗi câu

hỏ i

sẽ có ki phương án lựa chọn. Ngoài những câu hỏi thông thường, mong muốn của doanh nghiệp là thống kê số lượng phương án trả lời của từng câu hỏi khảo sát có chứa thông tin riêng tư, nhạy cảm. Từ đó, thực hiện tính toán và phân tích giúp tạo cơ sở ra quyết định phát triển sản phẩm, dịch vụ đạt hiệu quả hơn.

- Người được khảo sát (cụ thể là những khách hàng kinh doanh trên mạng xã hội). Giả sử có thành viên tham gia: . Mỗi thành viên tham gia khảo sát sẽ có một phiếu trả lời. Phiếu trả lời khảo sát được biểu diễn dưới dạng vector, trong đó giá trị của mỗi thành phần vectơ là 0 hoặc 1. Như vậy, với m câu hỏi ta có số thành phần của vector là K trong đó

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

K =

∑i= 1 k i . Để đảm bảo bí mật nội dung trả lời các câu hỏi khảo sát mang tính chất riêng tư, nhạy cảm, mỗi người được khảo sát cần mã hóa phiếu trả lời khảo sát của mình (vectơ) trước khi gửi đi.

Hình 3.1: Mô hình biểu diễn phiếu trả lời khảo sát dưới dạng vector

- Máy chủ (S e r Ver) là nhà cung cấp dịch vụ mạng xã hội của những người được khảo sát. Máy chủ có nhiệm vụ ghi nhận bảng câu hỏi khảo sátđược gửi đến từ người khảo sát. Sau đó, máy chủ sẽ gửi bảng câu hỏ i này đến những người được hảo sát cụ thể là những người inh doanh trên mạng xã hội). Người được khảo sát sau khi trả lời câu hỏi sẽ gửi phiếu trả lờikhảo sát đến cho máy chủ. Máy chủ tiếp nhận và lưu trữ các phiếu trả lời hảo sát (đã được mã hóa) từ những người được khảo sát gửi đến. Tất cả nhiệm vụ được thể hiện ở trên đã cho thấy ứng dụng của máy chủ mạng xã hội khi tham gia vào hệ thống. Trong hệ thống này, giả sử không thông đồng với D ata AnaIyst. Điều này hoàn toàn dễ hiểu bởi vì Server cần bảo vệ thông tin khách hàng của mình và giữ uy tín, trách nhiệm của một nhà cung cấp dịch vụ. Đồng thời, thông tin trao đổi giữa hai đối tượng này là

trong đó = được hiểu là không thể phân biệt được về mặt tính toán.

Nói cách khác, nếu tồn tại một thuật toán M (c ò n gọi là bộ mô phỏng) có thể mô phỏng những gì mà D ata AnaIyst và t người dùng thông đồng quan sát được trong quá trình thực hiện giao thức chỉ sử dụng kết quả đầu ra f, các giá trị bí mật của các thành viên thông đồng và các khóa công khai thì chúng ta có thể khẳng định rằng D ata AnaIyst và t người dùng thông đồng không khai thác được gì về các giá

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư độc lập và hoàn toàn bảo mật sẽ giúp cho quá trình khảo sát diễn ra an toàn, trung thực và đạt độ chính xác cao.

Sơ đồ tổng quát thể hiện cho mô hình trên được thể hiện chi tiết như sau:

Hình 3.2: Mô hình khảo sát người kinh doanh trên mạng xã hội

3.1.2. Định nghĩa về tính riêng tư

Giả sử rằng có n người dùng, trong đó mỗi người dùng sở hữu một vector bí mật ^vl. Cho f : ( { O . 1 } ∙)n → ( { O . 1 } ∙)n là một hàm số và n là giao thức nhiều thành

viên để tính f trong đó f( (ũf..... tŋ là thành phần thứ i của f (ũf.. . ., ĩ£) . Những gì mà thành viên thứ i quan sát được về V = (τ ,...,∖ ŋ trong suốt quá trình thực thi giao thức n được ký hiệu là VIhWiπ(V)OUTPUTn(V) được ký hiệu là kết quả đầu ra trong quá trình thực thi giao thức n. Chúng ta có thể nói rằng giao thức n bảo vệ sự riêng tư của mỗi người dùng chống lại và người dùng thông đồng trong mô hình bán trung thực nếu V I C { 1,2 ,...,n} mà ||I|| = t thì tồn tại một thuật toán xác suất thời gian đa thức sao cho:

{ (f.M ( ra ( ∈,.f, (V) )) }« ({ 0.1 }∙ r

i{(vlE⅛taAna∣yst.u,(, i∈)) (V).° uτpuτn(V)) ⅛1}∙)∙

Triệu Thị Trang - K18HTTTA 26 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người

trị b mật của các thành viên hông thông đồng.

3.1. Giải pháp đề xuất 3.2.1. Khởi tạo hệ thống

Trước khi bắt đầu thực thi giải pháp, D ata AnaIyst tạo ra một bộ khóa bí mật

φ (N) và khóa công khai N của hệ mã hóa Paillier. Khóa công khai được

Data AnaIyst chia sẻ cho Server và các người dùng. Ngoài ra, để nâng cao sự

hiệu quả của giải pháp đề xuất, tác giả sử dụng phương pháp mã hóa nhiều giá trị số nhỏ trong một bản mã tương tự như các nghiên cứu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001; X. Yi and Y. Zhang, 2009; Y. Aono, T. Hayashi, L. T. Phong, and L. Wang, 2017). Do đó, Data AnaIyst cần chọn thêm một tham số công khai C nhỏ nhất thỏ a mãn C > K với K = ∑m 1 ki. Ví dụ:

C = 2[l032^]+1 như được lựa chọn trong tài liệu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001).

3.2.2. Thực thi

Input: n vector (VV,...,V^) trong đó mỗi vector V(V(i,...,V( )) được giữ bởi người dùng U i với i ∈ { 1,2,..., n }.

Output: thống kê số lượng ứng với mỗi phương án trả lời của mỗi câu hỏ i. Tức là kết quả của giải pháp là một vector V = (V1, .. .,vκ) trong đó

Pha 1: Mỗi người d ù ng U i t inh toán như sau

- Tính Si = ∑= 1V∕i

∖cj

-1

- Chọn giá trị ngẫu nhiên ri∈ ( 0 , N) .

- T nh .

- Gửi Ti cho S e rv e r.

Pha 2: S erver tinh toán như sau

- Tính T = ∏iζ 1Ti mOd N2.

- Gửi T cho D a t a A n a Iys t.

Pha 3: Data Analyst tinh toán như sau

S = τM-*φ (N ) - ι. For j from 1 to K Output v j = £.-1 . S : =S- Vj. cj-1. 3.2.3. Chứng m inh tinh đúng đắn Ta có: T = ∏'L 1Ti mOd N2 = (N ∑i 1Si + 1 ) (∏L 1ri)N mOd N2

Do đó, theo quy trình giải mã hệ Paillier: S = ^T-~^—1 * φ (N) -1 = ∑n= 1 Si.

Mặt khác, ta lại có: Si = ∑i

j=1 Vj i. cj-1

Với i = 1: S1= V1( 1.c0 + V2( 1.c1 + —+ Vn( 1.cn-1

Với i = 2 :S2= v12.c0 + V2(2.c 1 + —+ Vn(2).cn-1

Triệu Thị Trang - K18HTTTA 27 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

Với i = n: Sn= V1n.c0 + v2^nλc 1 + —I- Vn(n).cn 1 Suy ra: + +...+ n v- ∣n Si = c0 ∑ ∑ Z

Vì vậy, với vòng lặp trong pha 3 của giải pháp đề xuất: Vj = ∑n= 1Vj(ŋ.

3.2.1. Phân tích tính riêng tư

Trong phần này, tác giả sẽ chỉ ra rằng giải pháp đề xuất có thể bảo vệ tính riêng tư của những người được khảo sát chống lại D ata AnaIyst và (n — 2 ) người được khảo sát thông đồng trong mô hình bán trung thực.

Không mất tính tổng quát, giả sử tập hợp các thành viên không thông đồng bao gồm {S erver,u1,u2], tương ứng { D ata AnaIyst,u3,u4, ...lUn] là những thành viên thông đồng. Tác giả sẽ chỉ ra một thuật toán t nh toán những gì mà và người được hảo sát thông đồng quan sát được trong quá trình thực thi giải pháp chỉ sử dụng {S,S3,S4,...,Sn] , khóa công khai N và một số bản mã của hệ Paillier. Dưới đây là mô phỏng tính toán của M:

∑" 3Si) + 1 )]

T1 = [ (N. (—S2) + 1 ).r1w.( N.(S —Si) + 1 )]m Od N2. Z=V+1)]

T2 = [ (N. (—S1) + 1).r2N .( N.(S —Si) + 1 )]mo d N2.

Như vậy, thuật toán M thỏ a mãn định nghĩa về tính riêng tư đã trình bày ở trên. Do đó, giải pháp đề xuất có thể bảo vệ t nh riêng tư của những người được hảo sát.

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

3.2. Thực nghiệm 3.3.1. Mô tả thực nghiệm

Theo kết quả khảo sát về tình hình kinh doanh năm 2018 được thực hiện bởi nền tảng quản lý và bán hàng đa kênh Sapo trên 5.000 cửa hàng. Doanh nghiệp đã nhận được những chia sẻ của quý khách hàng về tình hình kinh doanh của họ trong năm 2018. Dựa trên những thông tin được cung cấp từ khách hàng, doanh nghiệp tiến hành thống kê kết quả khảo sát và biểu diễn chúng dưới dạng các đồ thị. Trong sự hiểu biết và đánh giá của mình, tác giả xác định các kết quả thông kê liên quan tới những thông tin mang tính chất riêng tư và nhạy cảm như sau:

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

Hình 3.4: Biểu đồ thể hiện doanh thu bán hàng trong năm 2018

Hình 3.5: Biểu đồ thể hiện tỷ lệ doanh thu online/tổng doanh thu

STT Câu hỏi khảo sát Đáp án

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

Hình 3.6: Biểu đồ thể hiện ngân sách tiếp thị trung bình mỗi tháng trong năm 2018

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Tương ứng với các kết quả thống kê dưới dạng đồ thị kể trên, các câu hỏi yêu cầu thông tin riêng tư, nhạy cảm đối với người được khảo sát được thể hiện qua bảng câu hỏ i như sau:

1

Doanh thu bán hàng trong năm 2018 của cửa hàng quý khách đạt giá trị bao nhiêu?

Một phần của tài liệu 806 nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư,khoá luận tốt nghiệp (Trang 33)

Tải bản đầy đủ (DOCX)

(59 trang)
w