Giả sử rằng có n người dùng, trong đó mỗi người dùng sở hữu một vector bí mật ^vl. Cho f : ( { O . 1 } ∙)n → ( { O . 1 } ∙)n là một hàm số và n là giao thức nhiều thành
viên để tính f trong đó f( (ũf..... tŋ là thành phần thứ i của f (ũf.. . ., ĩ£) . Những gì mà thành viên thứ i quan sát được về V = (τ ,...,∖ ŋ trong suốt quá trình thực thi giao thức n được ký hiệu là VIhWiπ(V) và OUTPUTn(V) được ký hiệu là kết quả đầu ra trong quá trình thực thi giao thức n. Chúng ta có thể nói rằng giao thức n bảo vệ sự riêng tư của mỗi người dùng chống lại và người dùng thông đồng trong mô hình bán trung thực nếu V I C { 1,2 ,...,n} mà ||I|| = t thì tồn tại một thuật toán xác suất thời gian đa thức sao cho:
{ (f.M ( ra ( ∈,.f, (V) )) }« ({ 0.1 }∙ r
i{(vlE⅛taAna∣yst.u,(, i∈)) (V).° uτpuτn(V)) ⅛1}∙)∙
Triệu Thị Trang - K18HTTTA 26 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người
trị b mật của các thành viên hông thông đồng.
3.1. Giải pháp đề xuất 3.2.1. Khởi tạo hệ thống
Trước khi bắt đầu thực thi giải pháp, D ata AnaIyst tạo ra một bộ khóa bí mật
φ (N) và khóa công khai N của hệ mã hóa Paillier. Khóa công khai được
Data AnaIyst chia sẻ cho Server và các người dùng. Ngoài ra, để nâng cao sự
hiệu quả của giải pháp đề xuất, tác giả sử dụng phương pháp mã hóa nhiều giá trị số nhỏ trong một bản mã tương tự như các nghiên cứu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001; X. Yi and Y. Zhang, 2009; Y. Aono, T. Hayashi, L. T. Phong, and L. Wang, 2017). Do đó, Data AnaIyst cần chọn thêm một tham số công khai C nhỏ nhất thỏ a mãn C > K với K = ∑m 1 ki. Ví dụ:
C = 2[l032^]+1 như được lựa chọn trong tài liệu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001).
3.2.2. Thực thi
Input: n vector (VV,...,V^) trong đó mỗi vector V(V(i,...,V( )) được giữ bởi người dùng U i với i ∈ { 1,2,..., n }.
Output: thống kê số lượng ứng với mỗi phương án trả lời của mỗi câu hỏ i. Tức là kết quả của giải pháp là một vector V = (V1, .. .,vκ) trong đó
Pha 1: Mỗi người d ù ng U i t inh toán như sau
- Tính Si = ∑= 1V∕i
∖cj
-1
- Chọn giá trị ngẫu nhiên ri∈ ( 0 , N) .
- T nh .
- Gửi Ti cho S e rv e r.
Pha 2: S erver tinh toán như sau
- Tính T = ∏iζ 1Ti mOd N2.
- Gửi T cho D a t a A n a Iys t.
Pha 3: Data Analyst tinh toán như sau
S = τM-*φ (N ) - ι. For j from 1 to K Output v j = £.-1 . S : =S- Vj. cj-1. 3.2.3. Chứng m inh tinh đúng đắn Ta có: T = ∏'L 1Ti mOd N2 ∏ = (N ∑i 1Si + 1 ) (∏L 1ri)N mOd N2
Do đó, theo quy trình giải mã hệ Paillier: S = ^T-~^—1 * φ (N) -1 = ∑n= 1 Si.
Mặt khác, ta lại có: Si = ∑i
j=1 Vj i. cj-1
Với i = 1: S1= V1( 1.c0 + V2( 1.c1 + —+ Vn( 1.cn-1
Với i = 2 :S2= v12.c0 + V2(2.c 1 + —+ Vn(2).cn-1
Triệu Thị Trang - K18HTTTA 27 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Với i = n: Sn= V1n.c0 + v2^nλc 1 + —I- Vn(n).cn 1 Suy ra: + +...+ ∑ n v- ∣n Si = c0 ∑ ∑ Z
Vì vậy, với vòng lặp trong pha 3 của giải pháp đề xuất: Vj = ∑n= 1Vj(ŋ.
3.2.1. Phân tích tính riêng tư
Trong phần này, tác giả sẽ chỉ ra rằng giải pháp đề xuất có thể bảo vệ tính riêng tư của những người được khảo sát chống lại D ata AnaIyst và (n — 2 ) người được khảo sát thông đồng trong mô hình bán trung thực.
Không mất tính tổng quát, giả sử tập hợp các thành viên không thông đồng bao gồm {S erver,u1,u2], tương ứng { D ata AnaIyst,u3,u4, ...lUn] là những thành viên thông đồng. Tác giả sẽ chỉ ra một thuật toán t nh toán những gì mà và người được hảo sát thông đồng quan sát được trong quá trình thực thi giải pháp chỉ sử dụng {S,S3,S4,...,Sn] , khóa công khai N và một số bản mã của hệ Paillier. Dưới đây là mô phỏng tính toán của M:
∑" 3Si) + 1 )]
T1 = [ (N. (—S2) + 1 ).r1w.( N.(S — ∑ Si) + 1 )]m Od N2. Z=V+1)]
T2 = [ (N. (—S1) + 1).r2N .( N.(S — ∑ Si) + 1 )]mo d N2.
Như vậy, thuật toán M thỏ a mãn định nghĩa về tính riêng tư đã trình bày ở trên. Do đó, giải pháp đề xuất có thể bảo vệ t nh riêng tư của những người được hảo sát.
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
3.2. Thực nghiệm 3.3.1. Mô tả thực nghiệm
Theo kết quả khảo sát về tình hình kinh doanh năm 2018 được thực hiện bởi nền tảng quản lý và bán hàng đa kênh Sapo trên 5.000 cửa hàng. Doanh nghiệp đã nhận được những chia sẻ của quý khách hàng về tình hình kinh doanh của họ trong năm 2018. Dựa trên những thông tin được cung cấp từ khách hàng, doanh nghiệp tiến hành thống kê kết quả khảo sát và biểu diễn chúng dưới dạng các đồ thị. Trong sự hiểu biết và đánh giá của mình, tác giả xác định các kết quả thông kê liên quan tới những thông tin mang tính chất riêng tư và nhạy cảm như sau:
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Hình 3.4: Biểu đồ thể hiện doanh thu bán hàng trong năm 2018
Hình 3.5: Biểu đồ thể hiện tỷ lệ doanh thu online/tổng doanh thu
STT Câu hỏi khảo sát Đáp án
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Hình 3.6: Biểu đồ thể hiện ngân sách tiếp thị trung bình mỗi tháng trong năm 2018
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Tương ứng với các kết quả thống kê dưới dạng đồ thị kể trên, các câu hỏi yêu cầu thông tin riêng tư, nhạy cảm đối với người được khảo sát được thể hiện qua bảng câu hỏ i như sau:
1
Doanh thu bán hàng trong năm 2018 của cửa hàng quý khách đạt giá trị bao nhiêu?
1. Dưới 200 triệu đồng 2. Từ 200 - 500 triệu đồng 3. Từ 500 triệu - 1 tỷ đồng 4. Từ 1-3 tỷ đồng 5. Trên 3 tỷ đồng 2
Tỷ lệ tăng trưởng doanh thu 2018 so với năm 2017 của cửa hàng quý khách?
1. Tệ hơn năm ngoái 2. Bằng năm ngoái
3. Tăng trưởng nhẹ (<10%) 4. Tăng trưởng khá (10 - 30%) 5. Tăng trưởng tốt (trên 30%)
3
Tỷ lệ doanh thu Online/Tổng doanh thu của cửa hàng quý hách đạt giá trị bao nhiêu?
1. Không bán hàng Online 2. Dưới 10% 3. Từ 10-30% 4. Từ 30-50% 5. Từ 50-70% 6. Từ 70-100%
4
Tỷ lệ doanh thu Bán hàng trên Facebook/Tổng doanh thu của cửa hàng quý khách đạt giá trị bao nhiêu?
1. Không bán hàng trên Facebook 2. Dưới 10% 3. Từ 10-30% 4. Từ 30-50% 5. Từ 50-70% 6. Từ 70-100% 5
Thâm niên kinh doanh của cửa hàng quý khách là bao lâu?
1. Dưới 6 tháng 2. Từ 6 tháng - 1 năm 3. Từ 1-2 năm 4. Từ 2-3 năm 5. Từ 3-5 năm 6. Trên 5 năm 6
Ngân sách tiếp thị/quảng cáo của cửa hàng quý khách là đạt bao nhiêu? 1. Không tiếp thị 2. Dưới 5 triệu/tháng 3. Từ 5-10 triệu/tháng 4. Từ 10-20 triệu/tháng 5. Từ 20-50 triệu/tháng 6. Trên 50 triệu/tháng Kênh tiếp thị nào sau đây rất
hiệu quả (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ tuần) cho cửa hàng của quý
1. Không sử dụng 2. Tiếp thị tại cửa hàng
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
5. Tiếp thị trên các sàn TMĐT
8
Kênh tiếp thị nào sau đây khá hiệu quả (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ tháng) cho cửa hàng của quý khách?
1. Không sử dụng 2. Tiếp thị tại cửa hàng 3. Tiếp thị trên Website
4. Tiếp thị - quảng cáo trên Facebook 5. Tiếp thị trên các sàn TMĐT
9
Kênh tiếp thị nào sau đây mang lại hiệu quả thấp (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ quý) cho cửa hàng của quý khách?
1. Không sử dụng 2. Tiếp thị tại cửa hàng 3. Tiếp thị trên Website
4. Tiếp thị - quảng cáo trên Facebook 5. Tiếp thị trên các sàn TMĐT
10
Kênh tiếp thị nào sau đây không hiệu quả (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ năm) cho cửa hàng của quý khách?
1. Không sử dụng 2. Tiếp thị tại cửa hàng 3. Tiếp thị trên Website
4. Tiếp thị - quảng cáo trên Facebook 5. Tiếp thị trên các sàn TMĐT
Triệu Thị Trang - K18HTTTA 34 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Bảng 3.1: Bảng mô tả câu hỏi khảo sát
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Quá trình thực hiện khảo sát bao gồm số lượng lớn những người tham gia khảo sát. Tác giả giả định các trường hợp số lượng người được khảo sát khác nhau như: n = {1 0 0,5 0 0,1.0 0 0,1 0.0 0 0}.
Môi trường thực nghiệm:
- Ngôn ngữ lập trình: C#
- Môi trường phát triển: Visual Studio 2010.
- Môi trường cài đặt: Windows 10, CPU Core i7- 3450 M 3.00GHz, RAM 4.00 GB.
3.3.2. Ket quả và thảo luận
Thực hiện khảo sát với số lượng người được khảo sát được giả định là n = { 1 0 0, 5 0 0, 1.0 0 0, 1 0.0 0 0 } và số lượng đáp án trả lời là /< = 5 4 . Kết quả thực
nghiệm thu được như sau:
Đồ thị mô tả kết quả thực nghiệm
■ 10000 ■ 1000 ■ 500 ■ 100
3000
Hình 3.8: Biểu đồ mô tả kết quả thực nghiệm
(Trong đó T_USER là thời gian tham gia giao thức của người được khảo sát, T SERVER là thời gian giao thức của máy chủ mạng xã hội, TDA là thời gian
tham gia giao thức của DataAnalyst)
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Dựa vào kết quả thực nghiệm được biểu diễn tại đồ thị ở trên, tác giả nhận thấy trong các trường hợp số người dùng khác nhau, thời gian thực hiện giao thức
của Data AnaIyst và User hầu như không thay đổi. Điều này hoàn toàn dễ hiểu vì
mỗi người dùng chỉ thực hiện một phép mã hóa duy nhất, c òn đối với mỗi
D ata AnaIys t cũng chỉ thực hiện một phép giải mã duy nhất. Như vậy, thời gian
tham gia vào giao thức của hai đối tượng trên có mức chênh lệch hông đáng ể được thể hiện qua các số liệu cụ thể sau:
Với n = 1.000 ta có: T-USER = 82 6 (ms) và T-DA = 7 5 8 (ms).
Với n = 10.000 ta có: T-USER = 8 3 9 (ms) và T-DA = 763 (ms).
Đối với S erVer : cần thực hiện các phép nhân mO d N2 trong khi số lượng phép nhân phụ thuộc vào số lượng người tham gia. Vì vậy, sự chênh lệch thời gian tham gia giao thức của Server phụ thuộc vào n, ví dụ:
Với n = 500 ta có: T-SER VER = 12 2 (ms)
Với n = 1.000 ta có: T-SER VER = 249 (ms)
Với n = 10.000 ta có: T-SER VER = 2 513 (ms)
Tóm lại, giải pháp mà tác giả đề xuất có thể giúp cho công ty Sapo thống kê chính xác các chỉ số cần thiết theo nhu cầu trong khi thông tin trả lời về những câu hỏi mang tính chất riêng tư nhạy cảm của người được khảo sát vẫn được bảo vệ an toàn. Hơn thế nữa, giải pháp đề xuất cũng rất hiệu quả thể hiện qua thời gian tính toán được yêu cầu đối với người được khảo sát, Server và D ata Ana Iyst là rất nhỏ.
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
KẾT LUẬN
Trong suốt quá trình hơn ba tháng thực tập tại Công ty Cổ phần Công nghệ Sapo, tác giả đã được học hỏ i và trau dồi vốn kiến thức trong phân tích, thu thập thông tin từ quý khách hàng nhằm phục vụ cho quá trình phát triển và hoàn thiện sản phẩm.
Qua quá trình thực hiện đề tài: iiNghien cứu giải pháp khảo sát trực tuyến
người kinh doanh trên mạng xã hội có đảm bảo rỉnh riêng tữ' cho Công ty Sapo,
khóa luận đã đạt được những kết quả sau:
- Tác giả xác định được bài toán mới và mang tính thực tế cao của doanh nghiệp. Dựa trên những nghiên cứu liên quan đến khảo sát, hạ tầng mã hóa khóa công khai Paillier và cải tiến giao thức tính toán bảo mật nhiều thành viên, tác giả đề xuất giải pháp giúp tăng hiệu quả, giảm chi phí thực hiện cho mỗi người tham gia mà vẫn đảm bảo được tính riêng tư của các thông tin do người được khảo sát cung cấp.
- Tác giả đã tiến hành các thực nghiệm cần thiết. Kết quả thực nghiệm được trình bày tại chương 3 đã chứng minh rằng giải pháp đề xuất có hiệu quả và khả năng triển khai ứng dụng thực tiễn cao.
Về cơ bản khóa luận đã giải quyết được các vấn đề thực tế đặt ra, tuy nhiên, khóa luận vẫn còn tồn tại một số hạn chế như sau:
- Do trong phạm vi khuôn khổ của khóa luận cũng như thời gian nghiên cứu hạn chế, khóa luận mới chỉ xây dựng mô hình khảo sát với giả định có sự tham gia của máy chủ mạng xã hội.
- Tính riêng tư đầy đủ chưa được đảm bảo (nếu S e rver thông đồng với
D ata AnaIyst) do giải pháp đề xuất dựa trên hạ tầng mã hóa khóa công
khai Paillier.
Dựa trên những mặt hạn chế được trình bày ở trên, tác giả đề xuất hướng phát triển cho đề tài trong tương lai như sau:
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
- Bổ sung thêm các câu hỏi khảo sát mang tính chất định lượng, trên cơ sở đó giúp kết quả phân tích và đánh giá chính xác hơn.
- Tiếp tục nghiên cứu và phát triển các giải pháp khảo sát hiệu quả trong khi vẫn bảo vệ được tính riêng tư đầy đủ cho mỗi người được khảo sát.
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư
TÀI LIỆU THAM KHẢO
A.Kia Yias and M.Yung. (2002). Self-tallying elections and perfect ballot secrecy.
International Workshop on Public Key Cryptography, (trang 141-158).
A.Shamir, R.Rivest and L.Adleman. (1981). Mental Poker.
Du, W. (2001). A study of several specific secure two party computation problems.
E. Shi, H. Chan, E. Rieffel, R. Chow & D. Song. (2011). Privacy-preserving aggregation of time-series data. Annual Network and Distributed System Security Symposium (trang 1-17). Internet Society.
F. Hao, P.Y.Ryan and Z.Zielinski. (2010). Anonymous voting by two- round public discustion. IET Information Security, 62-67.
F. Wu, J. Liu and S. Zhong. (2009). An efficient protocol for private and accurate mining of support counts. Pattern Recognition Letters, 30, 80 - 86.
F.Hao, D.Clarke, B.Randell and S.F.Shahandashti. (2018). Verifiable classroom voting in practice. IEEE Security & Privacy, 72 - 81.
J.Groth. (2004). Efficient maximal privacy in broadroom voting and anony - mous