3.1.1. Mô tả hệ thống
Hệ thống khảo sát người kinh doanh trên mạng xã hội có đảm bảo tính riêng tư được giả sử bao gồm ba thực thể chính như sau:
- Doanh nghiệp thực hiện khảo sát ( D ata AnaIyst): Doanh nghiệp xây dựng bảng câu hỏ i khảo sát (bao gồm: những câu hỏ i không mang tính chất riêng tư, nhạy cảm và những câu hỏi có chứa thông tin riêng tư, nhạy cảm (Ví dụ: liên quan đến vấn đề doanh thu, lợi nhuận, tỷ lệ tăng trưởng...) - những câu hỏ i này tồn tại dưới dạng câu h ỏ i trắc nghiệm). Giả sử có m câu hỏ i khảo sát chứa thông tin riêng tư, nhạy cảm: Q 1 , Q2 ,. . ., Qm. Trong đó, mỗi câu
hỏ i
Qí sẽ có ki phương án lựa chọn. Ngoài những câu hỏi thông thường, mong muốn của doanh nghiệp là thống kê số lượng phương án trả lời của từng câu hỏi khảo sát có chứa thông tin riêng tư, nhạy cảm. Từ đó, thực hiện tính toán và phân tích giúp tạo cơ sở ra quyết định phát triển sản phẩm, dịch vụ đạt hiệu quả hơn.
- Người được khảo sát (cụ thể là những khách hàng kinh doanh trên mạng xã hội). Giả sử có thành viên tham gia: . Mỗi thành viên tham gia khảo sát sẽ có một phiếu trả lời. Phiếu trả lời khảo sát được biểu diễn dưới dạng vector, trong đó giá trị của mỗi thành phần vectơ là 0 hoặc 1. Như vậy, với m câu hỏi ta có số thành phần của vector là K trong đó
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
K =
∑i= 1 k i . Để đảm bảo bí mật nội dung trả lời các câu hỏi khảo sát mang tính chất riêng tư, nhạy cảm, mỗi người được khảo sát cần mã hóa phiếu trả lời khảo sát của mình (vectơ) trước khi gửi đi.
Hình 3.1: Mô hình biểu diễn phiếu trả lời khảo sát dưới dạng vector
- Máy chủ (S e r Ver) là nhà cung cấp dịch vụ mạng xã hội của những người được khảo sát. Máy chủ có nhiệm vụ ghi nhận bảng câu hỏi khảo sátđược gửi đến từ người khảo sát. Sau đó, máy chủ sẽ gửi bảng câu hỏ i này đến những người được hảo sát cụ thể là những người inh doanh trên mạng xã hội). Người được khảo sát sau khi trả lời câu hỏi sẽ gửi phiếu trả lờikhảo sát đến cho máy chủ. Máy chủ tiếp nhận và lưu trữ các phiếu trả lời hảo sát (đã được mã hóa) từ những người được khảo sát gửi đến. Tất cả nhiệm vụ được thể hiện ở trên đã cho thấy ứng dụng của máy chủ mạng xã hội khi tham gia vào hệ thống. Trong hệ thống này, giả sử không thông đồng với D ata AnaIyst. Điều này hoàn toàn dễ hiểu bởi vì Server cần bảo vệ thông tin khách hàng của mình và giữ uy tín, trách nhiệm của một nhà cung cấp dịch vụ. Đồng thời, thông tin trao đổi giữa hai đối tượng này là
trong đó = được hiểu là không thể phân biệt được về mặt tính toán.
Nói cách khác, nếu tồn tại một thuật toán M (c ò n gọi là bộ mô phỏng) có thể mô phỏng những gì mà D ata AnaIyst và t người dùng thông đồng quan sát được trong quá trình thực hiện giao thức chỉ sử dụng kết quả đầu ra f, các giá trị bí mật của các thành viên thông đồng và các khóa công khai thì chúng ta có thể khẳng định rằng D ata AnaIyst và t người dùng thông đồng không khai thác được gì về các giá
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư độc lập và hoàn toàn bảo mật sẽ giúp cho quá trình khảo sát diễn ra an toàn, trung thực và đạt độ chính xác cao.
Sơ đồ tổng quát thể hiện cho mô hình trên được thể hiện chi tiết như sau:
Hình 3.2: Mô hình khảo sát người kinh doanh trên mạng xã hội
3.1.2. Định nghĩa về tính riêng tư
Giả sử rằng có n người dùng, trong đó mỗi người dùng sở hữu một vector bí mật ^vl. Cho f : ( { O . 1 } ∙)n → ( { O . 1 } ∙)n là một hàm số và n là giao thức nhiều thành
viên để tính f trong đó f( (ũf..... tŋ là thành phần thứ i của f (ũf.. . ., ĩ£) . Những gì mà thành viên thứ i quan sát được về V = (τ ,...,∖ ŋ trong suốt quá trình thực thi giao thức n được ký hiệu là VIhWiπ(V) và OUTPUTn(V) được ký hiệu là kết quả đầu ra trong quá trình thực thi giao thức n. Chúng ta có thể nói rằng giao thức n bảo vệ sự riêng tư của mỗi người dùng chống lại và người dùng thông đồng trong mô hình bán trung thực nếu V I C { 1,2 ,...,n} mà ||I|| = t thì tồn tại một thuật toán xác suất thời gian đa thức sao cho:
{ (f.M ( ra ( ∈,.f, (V) )) }« ({ 0.1 }∙ r
i{(vlE⅛taAna∣yst.u,(, i∈)) (V).° uτpuτn(V)) ⅛1}∙)∙
Triệu Thị Trang - K18HTTTA 26 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người
trị b mật của các thành viên hông thông đồng.
3.1. Giải pháp đề xuất 3.2.1. Khởi tạo hệ thống
Trước khi bắt đầu thực thi giải pháp, D ata AnaIyst tạo ra một bộ khóa bí mật
φ (N) và khóa công khai N của hệ mã hóa Paillier. Khóa công khai được
Data AnaIyst chia sẻ cho Server và các người dùng. Ngoài ra, để nâng cao sự
hiệu quả của giải pháp đề xuất, tác giả sử dụng phương pháp mã hóa nhiều giá trị số nhỏ trong một bản mã tương tự như các nghiên cứu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001; X. Yi and Y. Zhang, 2009; Y. Aono, T. Hayashi, L. T. Phong, and L. Wang, 2017). Do đó, Data AnaIyst cần chọn thêm một tham số công khai C nhỏ nhất thỏ a mãn C > K với K = ∑m 1 ki. Ví dụ:
C = 2[l032^]+1 như được lựa chọn trong tài liệu (O. Baudron , P.-A. Fouque , D. Pointcheval , G. Poupard and J. Stern, 2001).
3.2.2. Thực thi
Input: n vector (VV,...,V^) trong đó mỗi vector V(V(i,...,V( )) được giữ bởi người dùng U i với i ∈ { 1,2,..., n }.
Output: thống kê số lượng ứng với mỗi phương án trả lời của mỗi câu hỏ i. Tức là kết quả của giải pháp là một vector V = (V1, .. .,vκ) trong đó
Pha 1: Mỗi người d ù ng U i t inh toán như sau
- Tính Si = ∑= 1V∕i
∖cj
-1
- Chọn giá trị ngẫu nhiên ri∈ ( 0 , N) .
- T nh .
- Gửi Ti cho S e rv e r.
Pha 2: S erver tinh toán như sau
- Tính T = ∏iζ 1Ti mOd N2.
- Gửi T cho D a t a A n a Iys t.
Pha 3: Data Analyst tinh toán như sau
S = τM-*φ (N ) - ι. For j from 1 to K Output v j = £.-1 . S : =S- Vj. cj-1. 3.2.3. Chứng m inh tinh đúng đắn Ta có: T = ∏'L 1Ti mOd N2 ∏ = (N ∑i 1Si + 1 ) (∏L 1ri)N mOd N2
Do đó, theo quy trình giải mã hệ Paillier: S = ^T-~^—1 * φ (N) -1 = ∑n= 1 Si.
Mặt khác, ta lại có: Si = ∑i
j=1 Vj i. cj-1
Với i = 1: S1= V1( 1.c0 + V2( 1.c1 + —+ Vn( 1.cn-1
Với i = 2 :S2= v12.c0 + V2(2.c 1 + —+ Vn(2).cn-1
Triệu Thị Trang - K18HTTTA 27 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Với i = n: Sn= V1n.c0 + v2^nλc 1 + —I- Vn(n).cn 1 Suy ra: + +...+ ∑ n v- ∣n Si = c0 ∑ ∑ Z
Vì vậy, với vòng lặp trong pha 3 của giải pháp đề xuất: Vj = ∑n= 1Vj(ŋ.
3.2.1. Phân tích tính riêng tư
Trong phần này, tác giả sẽ chỉ ra rằng giải pháp đề xuất có thể bảo vệ tính riêng tư của những người được khảo sát chống lại D ata AnaIyst và (n — 2 ) người được khảo sát thông đồng trong mô hình bán trung thực.
Không mất tính tổng quát, giả sử tập hợp các thành viên không thông đồng bao gồm {S erver,u1,u2], tương ứng { D ata AnaIyst,u3,u4, ...lUn] là những thành viên thông đồng. Tác giả sẽ chỉ ra một thuật toán t nh toán những gì mà và người được hảo sát thông đồng quan sát được trong quá trình thực thi giải pháp chỉ sử dụng {S,S3,S4,...,Sn] , khóa công khai N và một số bản mã của hệ Paillier. Dưới đây là mô phỏng tính toán của M:
∑" 3Si) + 1 )]
T1 = [ (N. (—S2) + 1 ).r1w.( N.(S — ∑ Si) + 1 )]m Od N2. Z=V+1)]
T2 = [ (N. (—S1) + 1).r2N .( N.(S — ∑ Si) + 1 )]mo d N2.
Như vậy, thuật toán M thỏ a mãn định nghĩa về tính riêng tư đã trình bày ở trên. Do đó, giải pháp đề xuất có thể bảo vệ t nh riêng tư của những người được hảo sát.
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
3.2. Thực nghiệm 3.3.1. Mô tả thực nghiệm
Theo kết quả khảo sát về tình hình kinh doanh năm 2018 được thực hiện bởi nền tảng quản lý và bán hàng đa kênh Sapo trên 5.000 cửa hàng. Doanh nghiệp đã nhận được những chia sẻ của quý khách hàng về tình hình kinh doanh của họ trong năm 2018. Dựa trên những thông tin được cung cấp từ khách hàng, doanh nghiệp tiến hành thống kê kết quả khảo sát và biểu diễn chúng dưới dạng các đồ thị. Trong sự hiểu biết và đánh giá của mình, tác giả xác định các kết quả thông kê liên quan tới những thông tin mang tính chất riêng tư và nhạy cảm như sau:
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Hình 3.4: Biểu đồ thể hiện doanh thu bán hàng trong năm 2018
Hình 3.5: Biểu đồ thể hiện tỷ lệ doanh thu online/tổng doanh thu
STT Câu hỏi khảo sát Đáp án
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Hình 3.6: Biểu đồ thể hiện ngân sách tiếp thị trung bình mỗi tháng trong năm 2018
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Tương ứng với các kết quả thống kê dưới dạng đồ thị kể trên, các câu hỏi yêu cầu thông tin riêng tư, nhạy cảm đối với người được khảo sát được thể hiện qua bảng câu hỏ i như sau:
1
Doanh thu bán hàng trong năm 2018 của cửa hàng quý khách đạt giá trị bao nhiêu?
1. Dưới 200 triệu đồng 2. Từ 200 - 500 triệu đồng 3. Từ 500 triệu - 1 tỷ đồng 4. Từ 1-3 tỷ đồng 5. Trên 3 tỷ đồng 2
Tỷ lệ tăng trưởng doanh thu 2018 so với năm 2017 của cửa hàng quý khách?
1. Tệ hơn năm ngoái 2. Bằng năm ngoái
3. Tăng trưởng nhẹ (<10%) 4. Tăng trưởng khá (10 - 30%) 5. Tăng trưởng tốt (trên 30%)
3
Tỷ lệ doanh thu Online/Tổng doanh thu của cửa hàng quý hách đạt giá trị bao nhiêu?
1. Không bán hàng Online 2. Dưới 10% 3. Từ 10-30% 4. Từ 30-50% 5. Từ 50-70% 6. Từ 70-100%
4
Tỷ lệ doanh thu Bán hàng trên Facebook/Tổng doanh thu của cửa hàng quý khách đạt giá trị bao nhiêu?
1. Không bán hàng trên Facebook 2. Dưới 10% 3. Từ 10-30% 4. Từ 30-50% 5. Từ 50-70% 6. Từ 70-100% 5
Thâm niên kinh doanh của cửa hàng quý khách là bao lâu?
1. Dưới 6 tháng 2. Từ 6 tháng - 1 năm 3. Từ 1-2 năm 4. Từ 2-3 năm 5. Từ 3-5 năm 6. Trên 5 năm 6
Ngân sách tiếp thị/quảng cáo của cửa hàng quý khách là đạt bao nhiêu? 1. Không tiếp thị 2. Dưới 5 triệu/tháng 3. Từ 5-10 triệu/tháng 4. Từ 10-20 triệu/tháng 5. Từ 20-50 triệu/tháng 6. Trên 50 triệu/tháng Kênh tiếp thị nào sau đây rất
hiệu quả (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ tuần) cho cửa hàng của quý
1. Không sử dụng 2. Tiếp thị tại cửa hàng
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
5. Tiếp thị trên các sàn TMĐT
8
Kênh tiếp thị nào sau đây khá hiệu quả (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ tháng) cho cửa hàng của quý khách?
1. Không sử dụng 2. Tiếp thị tại cửa hàng 3. Tiếp thị trên Website
4. Tiếp thị - quảng cáo trên Facebook 5. Tiếp thị trên các sàn TMĐT
9
Kênh tiếp thị nào sau đây mang lại hiệu quả thấp (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ quý) cho cửa hàng của quý khách?
1. Không sử dụng 2. Tiếp thị tại cửa hàng 3. Tiếp thị trên Website
4. Tiếp thị - quảng cáo trên Facebook 5. Tiếp thị trên các sàn TMĐT
10
Kênh tiếp thị nào sau đây không hiệu quả (tần suất sử dụng kênh tiếp thị đạt tối thiểu từ 1-2 lần/ năm) cho cửa hàng của quý khách?
1. Không sử dụng 2. Tiếp thị tại cửa hàng 3. Tiếp thị trên Website
4. Tiếp thị - quảng cáo trên Facebook 5. Tiếp thị trên các sàn TMĐT
Triệu Thị Trang - K18HTTTA 34 Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư
Bảng 3.1: Bảng mô tả câu hỏi khảo sát
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Quá trình thực hiện khảo sát bao gồm số lượng lớn những người tham gia khảo sát. Tác giả giả định các trường hợp số lượng người được khảo sát khác nhau như: n = {1 0 0,5 0 0,1.0 0 0,1 0.0 0 0}.
Môi trường thực nghiệm:
- Ngôn ngữ lập trình: C#
- Môi trường phát triển: Visual Studio 2010.
- Môi trường cài đặt: Windows 10, CPU Core i7- 3450 M 3.00GHz, RAM 4.00 GB.
3.3.2. Ket quả và thảo luận
Thực hiện khảo sát với số lượng người được khảo sát được giả định là n = { 1 0 0, 5 0 0, 1.0 0 0, 1 0.0 0 0 } và số lượng đáp án trả lời là /< = 5 4 . Kết quả thực
nghiệm thu được như sau:
Đồ thị mô tả kết quả thực nghiệm
■ 10000 ■ 1000 ■ 500 ■ 100
3000
Hình 3.8: Biểu đồ mô tả kết quả thực nghiệm
(Trong đó T_USER là thời gian tham gia giao thức của người được khảo sát, T SERVER là thời gian giao thức của máy chủ mạng xã hội, TDA là thời gian
tham gia giao thức của DataAnalyst)
Khóa luận tốt nghiệp Nghiên cứu giải pháp khảo sát trực tuyến người kinh doanh qua mạng xã hội có đảm bảo tính riêng tư Dựa vào kết quả thực nghiệm được biểu diễn tại đồ thị ở trên, tác giả nhận thấy trong các trường hợp số người dùng khác nhau, thời gian thực hiện giao thức
của Data AnaIyst và User hầu như không thay đổi. Điều này hoàn toàn dễ hiểu vì
mỗi người dùng chỉ thực hiện một phép mã hóa duy nhất, c òn đối với mỗi
D ata AnaIys t cũng chỉ thực hiện một phép giải mã duy nhất. Như vậy, thời gian
tham gia vào giao thức của hai đối tượng trên có mức chênh lệch hông đáng ể được thể hiện qua các số liệu cụ thể sau:
Với n = 1.000 ta có: T-USER = 82 6 (ms) và T-DA = 7 5 8 (ms).
Với n = 10.000 ta có: T-USER = 8 3 9 (ms) và T-DA = 763 (ms).
Đối với S erVer : cần thực hiện các phép nhân mO d N2 trong khi số lượng phép nhân phụ thuộc vào số lượng người tham gia. Vì vậy, sự chênh lệch thời gian tham gia giao thức của Server phụ thuộc vào n, ví dụ:
Với n = 500 ta có: T-SER VER = 12 2 (ms)
Với n = 1.000 ta có: T-SER VER = 249 (ms)
Với n = 10.000 ta có: T-SER VER = 2 513 (ms)