Hạ tầng mã hóa khóa công khai

Một phần của tài liệu 806 nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư,khoá luận tốt nghiệp (Trang 30)

2.1.1. Khái niệm

“Hệ mã hóa khóa phi đối xứng (hay c òn gọi là hệ mã hóa khóa công khai) là hệ mã hóa có hóa mã hóa và hóa giải mã hác nhau hi biết được hóa này thì khó có thể tính được khóa kia và ngược lại)” (Tiến, 2009).

Hệ mã hóa khóa công khai đầu tiên do Diffie và Hellman phát minh vào những năm 1970.

Hệ mã hóa hóa công hai bao gồm hai khóa:

- Khóa mã hóa công khai cho tất cả mọi người nên được gọi là khóa công khai (Public key).

- Khóa giải mã được giữ bí mật nên được gọi là khóa bí mật (Private key). Một người bất kỳ có thể dùng khóa công khai để mã hóa bản tin, nhưng chỉ duy nhất người có được khóa bí mật mới có khả năng đọc được nội dung ẩn chứa trong bản mã.

Những ưu điểm nổi bật của hệ mã hóa khóa công khai là:

- Thuật toán được viết một lần và có thể sử dụng nhiều lần cho nhiều người dùng, mỗi người dùng chỉ cần chọn các tham số cho mình.

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Tuy nhiên, hệ mã hóa khóa công khai có tốc độ mã hóa và giải mã chậm hơn hệ mã hóa đối xứng. Vì vậy, hệ mã hóa này chỉ dùng để mã hóa những bản tin ngắn (ví dụ như: mã hóa khóa bí mật của hệ mã hóa khóa đối xứng).

2.1.2. Hệ m ã hó a khó a cô ng khai Pai 11 i er

a. Giới thiệu

Hệ mã hóa mã hóa khóa công khai Paillier được phát minh và đặt tên theo tên nhà khoa học Pascal Paillier vào năm 1999 (Paillier, 1999).

b. Quy trình khởi tạo khóa

Quy trình khởi tạo khóa là bước quan trọng đầu tiên của hệ mã hóa khóa công khai Paillier.

Bước 1:

Lựa chọn hai số nguyên tố lớn Pq ngẫu nhiên và độc lập với nhau có

g Cd (p q , (p — 1 ) ( q — 1 ) ) = 1 . Đảm bảo rằng hai số nguyên tố có độ dài bằng nhau.

Bước 2:

Tính và .

Bước 3:

- Khóa công khai là N. - Khóa bí mật là φ (N).

c. Quy trình mã hóa

- Input: m là thông điệp mã hóa sao cho 0 ≤ m < N

Chọn ngẫu nhiên sao cho và bảo đảm .

- Output: bản mã C = (mN + 1 ) * rN mOd N2

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

d. Quy trình giải mã

- Input: C = (mN + 1 ) * r N mOd N2

- Output: m = ——-—— φ(N ) - 1

Thật vậy, vì C = (mN + 1 ) * rN mod N2

= > C(p(N) = (mN + W2

Theo định lý Euler và định lý nhỏ Fermat: nếu N là tích của hai số nguyên tố P

q thì φ(N2) = N . φ(N) và rφ^N mod N2 = 1.

Như vậy:

( Cφ ( N) — 1 ) (N)-I [(mN + 1 ) φ ( N) * r<ií’(N)vmod N2] — 1 (N)-I

n

= „v ỳ ÷ 1-1 φ ( N ) - 1 = m.

e. Tính chất đồng cấu của phép cộng

Hệ mã hóa Paillier có tính chất đồng cấu với phép cộng, nghĩa là nếu C1 và C2

lần lượt là bản mã của hai thông điệp m 1 và m 2 thì C = C1. C2 là bản mã của thông điệp m = m1 + m2.

Chứng minh:

C1 = (m1N + 1 ) r1v mo d N2; C2 = (m2N + 1 ) r2v m O d N2

c1c2mod N2 = (m1N + i)(m2N + l)r1wΓ2N mod N2

= (m1 m2N2 + m1N + m 2N + 1 ) (r1 r2 ) v mo d N2

= ( (m 1 + m2 ) N + 1 ) (r1 r2 ) v mo d N2

Đặt (m 1 + m2 ) = m , (r1r2 ) = r ta có:

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

2.2. Giao thức tính toán bảo mật nhiều thành viên SMC2.2.1. Định nghĩa 2.2.1. Định nghĩa

Tính toán bảo mật nhiều thành viên (Secure multi-party computation - SMC) là một nhánh nghiên cứu của lĩnh vực mật mã học. Mục tiêu của hướng nghiên cứu này là tạo ra các phương thức cho phép nhiều thành viên cùng tính toán một hàm nào đó dựa trên dữ liệu đầu vào của họ trong khi mỗi thành viên không tiết lộ giá trị đầu vào mình nắm giữ cho các thành viên khác.

Tính toán bảo mật nhiều thành viên được đề cập lần đầu tiên vào những năm 1970 trong một trò chơi bài nhiều người tham gia (A.Shamir, R.Rivest and L.Adleman, 1981). Sau đó, bài toán tính toán bảo mật nhiều thành viên đầu tiên được phát biểu vào năm 1982 bởi nhà khoa học (Yao, 1982) mang tên “so sánh tài sản của hai nhà triệu phú”.

Ví dụ: Giả sử có ba người A, B và C với X1 ,X2,X3 là mức lương tương ứng của họ. Họ muốn tìm ra mức lương cao nhất trong ba mức lương mà không tiết lộ cho những người khác biết mức lương của mình. về mặt toán học được thể hiện bằng hàm sau:

F (x1,x2,x3) = Max (x1,x2,x3)

Tới năm 2004, cơ sở lý thuyết của SMC chính thức mới được phát triển bởi Goldreich (Oded Goldreich, 2004). Trong cơ sở này, các giao thức được xây dựng theo một trong hai mô hình: mô hình gồm các thành viên bán trung thực (semi- honest model) và mô hình gồm các thành viên không trung thực (malicious adversary model). Trong mô hình semi-honest, giả sử rằng mỗi thành viên tuân thủ quy tắc của giao thức trong khi thực thi các yêu cầu nhưng sau hi giao thức được hoàn thành các thành viên này vẫn có thể khai thác các thông tin riêng tư dựa vào nội dung các thông điệp họ nhận được trong quá trình thực hiện giao thức. Trong mô hình malicious adversary, ngoài các yêu cầu của giao thức, các bên có thể thực hiện các hoạt động tùy ý kể cả việc hai thác các thông tin riêng tư của các bên khác.

công khai Paillier đã được đề cập. Khóa công khai được Data AnaIyst chia sẻ cho

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

2.2.2. Các đặc trưng cơ b ản của m ột giao thức SMC

a. Tính riêng tư

Tính riêng tư thể hiện rằng dữ liệu cá nhân của mỗi người tham gia chỉ có người đó biết, không có thông tin nào về dữ liệu riêng tư có thể được suy ra từ các thông điệp được gửi trong quá trình thực hiện giao thức. Thông tin duy nhất có thể được suy luận ra chỉ có thể là kết quả đầu ra của hàm tính toán.

b. Tính chính xác

Kết quả đầu ra được đảm bảo chính xác tương ứng với thông tin đầu vào mà các bên cung cấp.

c. Tính hiệu quả

Tính hiệu quả được thể hiện rằng khi mỗi thành viên tham gia vào quá trình tính toán của giao thức thì chỉ phải b ỏ ra ít chi phí. Do đó, tính hiệu quả của giao thức sẽ tỷ lệ nghịch với chi phí b ỏ ra của các thành viên tham gia.

2.2.3. Giao thức tính tổng b í m ật nhiều thành viên

Giả sử có n thành viên U1,...,Un trong đó mỗi thành viên Ui nắm giữ một giá trị bí mật Xi. Mục tiêu của giao thức này là giúp cho người phân tích (ữ ata AnaIyst) tính được tổng X = ∑n= 1 Xi trong khi không ai biết được mỗi giá trị trị ngoại trừ thành viên .

Giao thức này cũng giả thiết rằng tồn tại một máy chủ (S e r V e r) làm nhiệm vụ

nhận dữ liệu từ phía n thành viên và gửi kết quả tổng hợp cho D ata AnaIyst. Để bảo vệ t nh riêng tư cho và giữ uy t n cho mình, được giả sử rằng không thông đồng với D ata AnaIyst. Tuy nhiên, Server hoàn toàn có thể thông đồng iểm soát một số thành viên.

Trước hi bắt đầu thực thi giải pháp, tạo ra một bộ hóa b mật

φ (N) và khóa công khai N của hệ mã hóa Paillier như trong phần Hệ mã hóa khóa

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

Pha 1: Mỗi người dùng Ui tính toán như sau

- Chọn số ngẫu nhiên bí mật ri∈ ( O , N) .

- Tính Ei = (N. Xi + 1 ) . rN mOd N2.

- Ui∙. Ei → Server.

Pha 2: Server tính toán như sau

- Tính E = ∏i= 1Ei mod N2

- Server ∙. E → D ata Ana Iys t.

Pha 3: Data Analyst tính toán như sau

_____ E<PW-I _____________. - Tính X = b n * φ(N)-1 Chứng minh: Ta có: E = ∏i= 1 Ei mod N2 = ∏i= 1 (N. Xi + 1). rN mOd N2 = ∏i= 1 (N.Xi + 1).(∏i= ir)N mod N2 = (N■ ∑i= 1xi + 1)(∏i= 1ri)N mod N2

De dàng nhận thấy E là bản mã của ∑=1 Xi với số ngẫu nhiên r = ∏i= 1 ri. Vì vậy, N * φ(N)1=∑i= 1Xi-

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

CHƯƠNG 3. HỆ THỐNG KHẢO SÁT NGƯỜI KINH DOANH TRÊN MẠNG XÃ HỘI CÓ ĐẢM BẢO TÍNH RIÊNG TƯ

Trong chương này, khóa luận trình bày về mô hình hệ thống (bao gồm: mô tả khái quát và định nghĩa tính chất riêng tư của các thành phần thuộc hệ thống). Đồng thời, tác giả cũng đề xuất giải pháp giúp giải quyết những khó khăn của doanh nghiệp trong việc khảo sát người kinh doanh trên mạng xã hội có bảo đảm tính riêng tư.

3.1. Mô hình hệ thống3.1.1. Mô tả hệ thống 3.1.1. Mô tả hệ thống

Hệ thống khảo sát người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư được giả sử bao gồm ba thực thể chính như sau:

- Doanh nghiệp thực hiện khảo sát ( D ata AnaIyst): Doanh nghiệp xây dựng bảng câu hỏ i khảo sát (bao gồm: những câu hỏ i không mang tính chất riêng tư, nhạy cảm và những câu hỏi có chứa thông tin riêng tư, nhạy cảm (Ví dụ: liên quan đến vấn đề doanh thu, lợi nhuận, tỷ lệ tăng trưởng...) - những câu hỏ i này tồn tại dưới dạng câu h ỏ i trắc nghiệm). Giả sử có m câu hỏ i khảo sát chứa thông tin riêng tư, nhạy cảm: Q 1 , Q2 ,. . ., Qm. Trong đó, mỗi câu

hỏ i

sẽ có ki phương án lựa chọn. Ngoài những câu hỏi thông thường, mong muốn của doanh nghiệp là thống kê số lượng phương án trả lời của từng câu hỏi khảo sát có chứa thông tin riêng tư, nhạy cảm. Từ đó, thực hiện tính toán và phân tích giúp tạo cơ sở ra quyết định phát triển sản phẩm, dịch vụ đạt hiệu quả hơn.

- Người được khảo sát (cụ thể là những khách hàng kinh doanh trên mạng xã hội). Giả sử có thành viên tham gia: . Mỗi thành viên tham gia khảo sát sẽ có một phiếu trả lời. Phiếu trả lời khảo sát được biểu diễn dưới dạng vector, trong đó giá trị của mỗi thành phần vectơ là 0 hoặc 1. Như vậy, với m câu hỏi ta có số thành phần của vector là K trong đó

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư

K =

∑i= 1 k i . Để đảm bảo bí mật nội dung trả lời các câu hỏi khảo sát mang tính chất riêng tư, nhạy cảm, mỗi người được khảo sát cần mã hóa phiếu trả lời khảo sát của mình (vectơ) trước khi gửi đi.

Hình 3.1: Mô hình biểu diễn phiếu trả lời khảo sát dưới dạng vector

- Máy chủ (S e r Ver) là nhà cung cấp dịch vụ mạng xã hội của những người được khảo sát. Máy chủ có nhiệm vụ ghi nhận bảng câu hỏi khảo sátđược gửi đến từ người khảo sát. Sau đó, máy chủ sẽ gửi bảng câu hỏ i này đến những người được hảo sát cụ thể là những người inh doanh trên mạng xã hội). Người được khảo sát sau khi trả lời câu hỏi sẽ gửi phiếu trả lờikhảo sát đến cho máy chủ. Máy chủ tiếp nhận và lưu trữ các phiếu trả lời hảo sát (đã được mã hóa) từ những người được khảo sát gửi đến. Tất cả nhiệm vụ được thể hiện ở trên đã cho thấy ứng dụng của máy chủ mạng xã hội khi tham gia vào hệ thống. Trong hệ thống này, giả sử không thông đồng với D ata AnaIyst. Điều này hoàn toàn dễ hiểu bởi vì Server cần bảo vệ thông tin khách hàng của mình và giữ uy tín, trách nhiệm của một nhà cung cấp dịch vụ. Đồng thời, thông tin trao đổi giữa hai đối tượng này là

trong đó = được hiểu là không thể phân biệt được về mặt tính toán.

Nói cách khác, nếu tồn tại một thuật toán M (c ò n gọi là bộ mô phỏng) có thể mô phỏng những gì mà D ata AnaIyst và t người dùng thông đồng quan sát được trong quá trình thực hiện giao thức chỉ sử dụng kết quả đầu ra f, các giá trị bí mật của các thành viên thông đồng và các khóa công khai thì chúng ta có thể khẳng định rằng D ata AnaIyst và t người dùng thông đồng không khai thác được gì về các giá

Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư độc lập và hoàn toàn bảo mật sẽ giúp cho quá trình khảo sát diễn ra an toàn, trung thực và đạt độ chính xác cao.

Sơ đồ tổng quát thể hiện cho mô hình trên được thể hiện chi tiết như sau:

Hình 3.2: Mô hình khảo sát người kinh doanh trên mạng xã hội

3.1.2. Định nghĩa về tính riêng tư

Giả sử rằng có n người dùng, trong đó mỗi người dùng sở hữu một vector bí mật ^vl. Cho f : ( { O . 1 } ∙)n → ( { O . 1 } ∙)n là một hàm số và n là giao thức nhiều thành

viên để tính f trong đó f( (ũf..... tŋ là thành phần thứ i của f (ũf.. . ., ĩ£) . Những gì mà thành viên thứ i quan sát được về V = (τ ,...,∖ ŋ trong suốt quá trình thực thi giao thức n được ký hiệu là VIhWiπ(V)OUTPUTn(V) được ký hiệu là kết quả đầu ra trong quá trình thực thi giao thức n. Chúng ta có thể nói rằng giao thức n bảo vệ sự riêng tư của mỗi người dùng chống lại và người dùng thông đồng trong mô hình bán trung thực nếu V I C { 1,2 ,...,n} mà ||I|| = t thì tồn tại một thuật toán xác suất thời gian đa thức sao cho:

{ (f.M ( ra ( ∈,.f, (V) )) }« ({ 0.1 }∙ r

i{(vlE⅛taAna∣yst.u,(, i∈)) (V).° uτpuτn(V)) ⅛1}∙)∙

Triệu Thị Trang - K18HTTTA 26 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người

trị b mật của các thành viên hông thông đồng.

3.1. Giải pháp đề xuất 3.2.1. Khởi tạo hệ thống

Trước khi bắt đầu thực thi giải pháp, D ata AnaIyst tạo ra một bộ khóa bí mật

φ (N) và khóa công khai N của hệ mã hóa Paillier. Khóa công khai được

Data AnaIyst chia sẻ cho Server và các người dùng. Ngoài ra, để nâng cao sự

hiệu quả của giải pháp đề xuất, tác giả sử dụng phương pháp mã hóa nhiều giá trị số nhỏ trong một bản mã tương tự như các nghiên cứu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001; X. Yi and Y. Zhang, 2009; Y. Aono, T. Hayashi, L. T. Phong, and L. Wang, 2017). Do đó, Data AnaIyst cần chọn thêm một tham số công khai C nhỏ nhất thỏ a mãn C > K với K = ∑m 1 ki. Ví dụ:

C = 2[l032^]+1 như được lựa chọn trong tài liệu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001).

3.2.2. Thực thi

Input: n vector (VV,...,V^) trong đó mỗi vector V(V(i,...,V( )) được giữ bởi người dùng U i với i ∈ { 1,2,..., n }.

Output: thống kê số lượng ứng với mỗi phương án trả lời của mỗi câu hỏ i. Tức là kết quả của giải pháp là một vector V = (V1, .. .,vκ) trong đó

Pha 1: Mỗi người d ù ng U i t inh toán như sau

- Tính Si = ∑= 1V∕i

∖cj

-1

- Chọn giá trị ngẫu nhiên ri∈ ( 0 , N) .

- T nh .

- Gửi Ti cho S e rv e r.

Pha 2: S erver tinh toán như sau

- Tính T = ∏iζ 1Ti mOd N2.

- Gửi T cho D a t a A n a Iys t.

Pha 3: Data Analyst tinh toán như sau

S = τM-*φ (N ) - ι. For j from 1 to K Output v j = £.-1 . S : =S- Vj. cj-1. 3.2.3. Chứng m inh tinh đúng đắn Ta có: T = ∏'L 1Ti mOd N2 = (N ∑i 1Si + 1 ) (∏L 1ri)N mOd N2

Do đó, theo quy trình giải mã hệ Paillier: S = ^T-~^—1 * φ (N) -1 = ∑n= 1 Si.

Mặt khác, ta lại có: Si = ∑i

j=1 Vj i. cj-1

Với i = 1: S1= V1( 1.c0 + V2( 1.c1 + —+ Vn( 1.cn-1

Một phần của tài liệu 806 nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư,khoá luận tốt nghiệp (Trang 30)

Tải bản đầy đủ (DOCX)

(59 trang)
w