Chơi với Linus: Người đăng ký chơi chia sẻ dữ liệu của mình cho cộng đồng truy cập miễn phí, đồng thời được truy cập dữ liệu của hệ thống chia sẻ miễn phí.. Chơi với Bill: Người đăng
CƠ SỞ LÝ THUYẾT
Giới thiệu tình hình ngập lụt hiện nay tại thành phố Hồ Chí Minh
Hiện nay, tình hình ngập lụt, triều cường ở Thành phố Hồ Chí Minh rất nghiêm trọng, điển hình là những trận mưa, triều cường gần đây và đặc biệt là trận mưa ngày 25/11/2018 vừa qua
Ngày 9/10/2018 triều cường làm nhiều tuyến đường như Trần xuân soạn, Huỳnh Tấn Phát, Nguyễn Văn Linh (Quận 7), Nguyễn Tất Thành (Quận 4) ngập sâu như hình 2.1
Hình 2.1 Ngập nước do triều cường ngày 9/10/2018 [3]
Sáng ngày 26/11/2018 nhiều tuyến đường ở Thành phố Hồ Chí Minh vẫn còn ngập lụt rất sâu như hình 2.2 và hình 2.3
Hình 2.2 Ngập nước do mưa sáng ngày 26/11/2018 [4]
Hình 2.3 Ngập nước ở đường Phan Huy Ích quận Gò Vấp [5]
Một số hình ảnh ở trên cho thấy tình hình ngập lụt, triều cường ở Thành phố Hồ Chí Minh còn rất nhiều tuyến đường bị ngập và tình hình này vẫn còn diễn ra liên tục và lâu dài
Tình hình ngập nước, triều cường sau trận mưa ngày 25/11/2018 toàn Thành phố xảy ra ngập tại 102 tuyến đường (chi tiết ở phần phụ lục 7), chiều sâu ngập từ 10 cm đến 70 cm và rạng sáng ngày 26/11/2018 xuất hiện đỉnh triều nên địa bàn Thành phố còn 32 tuyến đường ngập (chi tiết phần phụ lục 7), chiều sâu ngập từ 10 cm đến 40 cm Thông tin do Trung tâm điều hành chương trình chống ngập nước TPHCM báo cáo
Hiện tại, Thành phố Hồ Chí Minh đã và đang thực hiện rất nhiều công trình, dự án nhằm cải thiện tình hình ngập lụt, triều cường, kẹt xe như:
- Hồ điều tiết chống ngập đầu tiên tại Việt Nam theo công nghệ Nhật Bản
- Dự án chống ngập 10.000 tỷ được khởi công xây dựng từ năm 2016 –
- Hệ thống cảnh báo ngập lụt tự động: lắp đặt các cảm biến áp suất tại các điểm ngập trên địa bàn như Quận 2, Quận 9, Quận Thủ Đức, Quận
- Hệ thống camera giao thông trực tuyến của Sở giao thông vận tải Thành phố Hồ Chí Minh
- Ứng dụng UDI Maps trên smartphone do Công ty TNHH MTV Thoát nước Đô thị TPHCM xây dựng
- Cầu Thủ Thiêm 2 nối giữa quận 1 và quận 2, được khởi xây dựng từ tháng 3 năm 2015 dự kiến đến tháng 4 năm 2018 hoàn thành
- Hầm chui An Sương khởi công xây dựng từ đầu năm 2017 dự kiến đến tháng 8/2018 hoàn thành
Thành phố Hồ Chí Minh đã và đang thực hiện rất nhiều dự án nhưng vẫn chưa cải thiện được tình hình Vì vậy, chính quyền cần phải có những giải pháp làm giảm những thiệt hại do triều cường, ngập lụt gây ra cho người dân và cần phải làm quyết liệt hơn nữa trong việc giải quyết ngập lụt, triều cường
Cơ sở lý thuyết
2.2.1 Một số nghiên cứu liên quan
Ngày nay, dữ liệu được cộng đồng chia sẻ có nguồn gốc rõ ràng đã thu hút rất nhiều sự quan tâm, nghiên cứu của nhiều tác giả Trong đó một số đề tài đã được nghiên cứu:
- Nghiên cứu về chia sẻ kiến thức trong Công ty [6] nhóm tác giả sử dụng lý thuyết game để phân tích tìm ra điểm cân bằng trong quá trình chia sẻ kiến thức Nhóm tác giả dựa trên những nghiên cứu liên quan đưa ra một số biến của mô hình và đưa ra mô hình cây khuyến khích chia sẻ kiến thức trong công ty được thể hiện với dạng hình mô tả cây trò chơi (Hình 2.4) Ở đây, tác giả xét trường hợp trò chơi có hai người chơi Trong đó, người chơi một lựa chọn đi trước và có hai chiến lược để đi đó là chiến lược chia sẻ và không chia sẻ Sau khi người chơi một đi xong, người chơi hai đi và có bốn chiến lược để đi và được thể hiện như hình 2.4 mô tả cây trò chơi giữa hai người chơi
Hình 2.4: Hình mô tả cây trò chơi giữa hai người chơi
Trong đó, tác giả đưa ra một số yếu tố như sau:
A: là biến mô tả sự thỏa mãn khi chia sẻ kiến thức
Bs: là biến mô tả về lợi ích của việc chia sẻ kiến thức
Bo: là biến mô tả về lợi ích của nhận kiến thức từ người chia sẻ khác
R1: là biến mô tả về phần thưởng của việc chia sẻ dữ liệu Phần thưởng này được mô tả như đánh giá cao
9 bởi những người khác hay được cộng đồng xã hội công nhận sự đóng góp
R2: là biến mô tả hình phạt của xã hội cho việc không chia sẻ kiến thức
C: là biến mô tả chi phí chia sẻ Khi chia sẻ tốn thời gian và nổ lực cần thiết để chia sẻ
- Trong nghiên cứu [7], [8] nhóm tác giả sử dụng lý thuyết trò chơi để phân tích, tìm điểm cân bằng và thiết kế những chiến lược của những người chơi tham gia trong quá trình chia sẻ kiến thức, dữ liệu trong Công ty Từ đó, Tác giả xây dựng mô hình khuyến khích chia sẻ kiến thức Trong [7], tác giả đưa ra một số yếu tố để khuyến khích người chơi tham gia vào việc chia sẻ kiến thức như: yếu tố phần thưởng nội tại khi chia sẻ kiến thức (phần thưởng này giống như điểm dang tiếng), chi phí chia sẻ,…
- Trong những nghiên cứu [9], [10] nhóm tác giả cũng sử dụng lý thuyết trò chơi để phân tích những chiến lược của những người chơi trong mạng xã hội Để xây dựng được các cơ chế khuyến khích những người chơi quan tâm, tham gia nhiều vào các trò chơi, tác giả đưa ra một số yếu tố như lợi ích của người khi tham gia, các chi phí khi tham gia (chi phí rõ ràng hay chi phí trong quá trình tham gia) để phân tích Ngoài ra, tác giả còn xây dựng mô hình khuyến khích người dùng chia sẻ thông tin dữ liệu bằng chi phí [11] Ở đây, tác giả đưa ra cơ chế để người dùng lựa chọn khi tham gia, những lựa chọn đó sao cho mang lại lợi ích cho mình tốt nhất
- Trong Nghiên cứu [11], nhóm tác giả nghiên cứu về vấn đề chia sẻ điểm truy cập (AP) wifi của mình với những người dùng khác (Hình 2.5) Ở đây, tác giả dựa trên chi phí để khuyến khích người sử dụng chia sẻ AP của mình Tác giả đưa ra hai cơ chế cho người dùng tham gia vào hệ thống lựa chọn:
Linus: người dùng chia sẻ AP của mình miễn phí mà không nhận tiền doanh thu tại AP của mình từ nhà
10 điều hành và có thể được sử dụng miễn phí truy cập vào AP của người khác khi đi khỏi nhà
Bill: người dùng phải trả phí sử dụng khi truy cập vào
AP của người khác nhưng cũng có thể nhận lại một phần doanh thu tại AP của mình khi người khác truy cập vào từ nhà điều hành mạng
Trong mô hình chia sẻ điểm truy cập wifi tác giả giới thiệu như sau:
Hình 2.5: Hình mô tả chia sẻ điểm truy cập wifi
Trong mô hình này, tác giả còn đề cập đến người dùng Alien Nghĩa là, người dùng Alien không sở hữu AP nên khi sử dụng truy cập bất cứ AP nào cũng phải thanh toán phí sử dụng Quá trình xây dựng mô hình, tác giả chia làm hai giai đoạn: giai đoạn 1: lựa chọn các thành viên tham gia Giai đoạn 2: người dùng quyết định thời gian truy cập mạng của mình trên một
- Trong nghiên cứu [12], nhóm tác giả đã kết hợp lý thuyết game và cơ chế khuyến khích để đạt được hiệu quả cao trong quá trình chia sẻ kiến thức trong mạng xã hội Trong bài báo này, tác giả đưa ra cơ chế khuyến khích dựa trên trò chơi tĩnh với thông tin hoàn hảo được thể hiện trong bảng sau:
Bảng 2.1: Chia sẻ kiến thức dựa trên lý thuyết game sharing not sharing sharing (b + s - c, b + s - c) (s - c, b) not sharing (b, s - c) (0,0)
Trong đó, tác giả định nghĩa các biến như sau:
b: là biến mô tả về lợi ích khi chia sẻ và b > 0
c: là biến mô tả về chi phí khi chia sẻ và c > 0
s: là biến mô tả về chi phí khuyến khích để chia sẻ kiến thức
- Nghiên cứu [13], nhóm tác giả nghiên cứu về độ tin cậy, chính xác của dữ liệu từ cộng đồng cung cấp Ở đây, tác giả nghiên cứu về tính chính xác, hợp lệ của dữ liệu do cộng đồng chia sẻ về sự cố gây tắc nghẽn trong giao thông đô thị (vị trí xảy ra sự cố, thời gian bắt đầu) và đưa ra công thức tính tổng số điểm đại diện cho độ danh tiếng (độ chính xác dữ liệu) của người dùng như sau:
S: tổng số điểm đại diện cho danh tiếng người dùng
Rs: đại diện tính tương tự cho thông tin được cung cấp của một người dùng với thông tin của người dùng khác cùng với vị trí gần đó và thời gian
Rf: đại diện cho tần suất gửi báo cáo của người dùng
Rc: đại diện mức độ tin cậy của người dùng trong đám đông, dựa trên tính hợp lý của báo cáo của họ
Rr: đại diện cho phản hồi của người khác gửi đánh giá thông tin
- Trong nghiên cứu [14], nhóm tác giả xây dựng mô hình khuyến khích các công dân trong thành phố tham gia thu thập, chia sẻ dữ liệu thời tiết trên nền tảng web Ở đây, tác giả nghiên cứu về những rào cản trong quá trình chia sẻ dữ liệu thời tiết của công dân trong thành phố Mô hình được nhóm tác giả nghiên cứu dựa trên sự kết hợp của mô hình chia sẻ dữ liệu không gian (Hình 2.6, Wehn de Montalvo, 2003b) và các yếu tố dựa trên các cuộc phỏng vấn ở các nước Anh, Ý và Hà Lan
Hình 2.6: Mô hình cơ bản chia sẻ dữ liệu không gian
- Trong nghiên cứu [15], [16] tác giả nghiên cứu về giảm thiểu những rủi ro ngập lụt trong đô thị bằng cách sử dụng dữ liệu từ cộng đồng cung cấp Ở đây, tác giả đánh giá sự tin cậy, chính xác, hợp lệ của dữ liệu bằng cách dựa trên số điểm được đánh giá bởi những người dùng trong cộng đồng và điểm danh tiếng do người dùng tích lũy trong quá trình gửi báo cáo dữ liệu
Lý thuyết trò chơi là một nhánh của Toán học ứng dụng Ngành này nghiên cứu các tình huống chiến thuật trong đó các đối thủ lựa chọn các hành động khác nhau để cố gắng làm tối đa kết quả nhận được [17],[18] Ngày nay, Lý thuyết trò chơi được áp dụng trong rất nhiều lĩnh vực như: khoa học xã hội, logic và khoa học máy tính
Lý thuyết trò chơi nghiên cứu các quyết định được đưa ra trong một môi trường trong đó các đối thủ tương tác với nhau Hay nói cách khác, Lý thuyết trò chơi nghiên cứu cách lựa chọn hành vi tối ưu khi chi phí và lợi ích của mỗi lựa chọn là không cố định mà phụ thuộc vào lựa chọn của mỗi cá nhân khác
Cân bằng Nash là một định lý trong lý thuyết trò chơi Định lý này được đặt tên theo John Forbes Nash Định lý này dùng để nghiên cứu các chiến thuật sao cho sự lựa chọn là tối ưu [19]
Trong trò chơi dạng chuẩn tắc:
S là chiến lược u là hàm lợi ích
Tổ hợp chiến lược ( ∗ , ∗ , … , ∗ ) là một cân bằng Nash nếu với mỗi một người chơi i nào đó, ∗ (tức là chiến lược do người thư i lựa chọn) là phản ứng tốt nhất của người chơi này đối với các chiến lược của (n-1) người chơi còn lại ( ∗ , ∗ , … , ( ∗ ), ( ∗ ) , … , ∗ ) (ký hiệu là ∗ ) Hay nói cách khác là ∗ ( ∗ , ∗ ) ≥ ∗ ( , ∗ )
Mô hình nghiên cứu đề xuất
Mô hình nghiên cứu đề xuất của đề tài được xây dựng dựa trên biến phụ thuộc và các biến độc lập
Hình 2.7 Mô hình nghiên cứu đề xuất
Các giả thuyết về mô hình nghiên cứu đề xuất được phát biểu như sau: Giả thuyết H1: Nhân tố “Phần thưởng” ảnh hưởng tích cực đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H2: Nhân tố “Danh tiếng” ảnh hưởng tích cực đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H3: Nhân tố “Thời gian chia sẻ” ảnh hưởng đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H 4 : Nhân tố “Chi phí chia sẻ” ảnh hưởng đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H 5 : Nhân tố “Chất lượng dữ liệu” ảnh hưởng tích cực đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H6: Nhân tố “Lợi ích xã hội” ảnh hưởng đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H7: Nhân tố “Bảo mật thông tin” ảnh hưởng tích cực đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
Giả thuyết H8: Nhân tố “Dễ sử dụng” ảnh hưởng tích cực đến sự sẵn sàng chia sẻ dữ liệu của cộng đồng
MÔ HÌNH KHUYẾN KHÍCH CỘNG ĐỒNG CHIA SẺ DỮ LIỆU DỰA VÀO LÝ THUYẾT TRÒ CHƠI
Xác định các yếu tố
Nghiên cứu các yếu tố ảnh hưởng đến việc sẵn sàng chia sẻ dữ liệu từ cộng đồng bao gồm nghiên cứu sơ bộ và nghiên cứu chính thức
Nghiên cứu sơ bộ là bước đầu tiên trong nghiên cứu Mục đích của việc nghiên cứu sơ bộ là để tìm hiểu các vấn đề cần phải nghiên cứu cũng như xác nhận lại những vấn đề nghiên cứu và những biến nghiên cứu Nghiên cứu sơ bộ thường được thực hiện thông qua nghiên cứu định tính, các kỹ thuật như thảo luận nhóm, thảo luận tay đôi, phỏng vấn, …
Phân tích tài liệu, lý thuyết liên quan nhằm tìm hiểu những vấn đề cần nghiên cứu, những vấn đề liên quan đến đề tài nghiên cứu Phân tích tổng hợp: kết hợp các phân tích tình huống, tài liệu, các nghiên cứu liên quan, các mô hình nghiên cứu đưa ra các yếu tố sơ bộ
Thực hiện phỏng vấn, thảo luận nhóm, thảo luận tay đôi, khảo sát nhóm nhỏ nhằm xác định thêm hoặc chỉnh sửa những biến, yếu tố, vấn đề liên quan đến đề tài nghiên cứu Sau khi tiến hành phỏng vấn, thảo luận nhóm và khảo sát với qui mô nhỏ xong, em tổng hợp ý kiến và điều chỉnh lại những biến, yếu tố ảnh hưởng đến vấn đề nghiên cứu Từ đó, em xây dựng bảng hỏi hoàn chỉnh và lên kế hoạch khảo sát trên tập lớn để thu thập dữ liệu và xử lý dữ liệu
Nghiên cứu chính thức thực hiện các phương pháp của nghiên cứu định lượng bằng khảo sát thu thập số liệu
Thực hiện thu thập số liệu bằng cách: in bảng hỏi ra giấy rồi tiến hành khảo sát và gửi mail để khảo sát
Khi tiến hành khảo sát xong, em nhập số liệu vào phần mềm để xử lý, mã hóa rồi chuyển qua phần mềm SPSS để tiếp tục phân tích hồi quy đa biến
Phương pháp chọn mẫu và kích cỡ mẫu:
Do giới hạn về chi phí, thời gian nên em chọn phương pháp chọn mẫu phi xác suất để thực hiện đề tài Em lấy mẫu trên một số đơn vị có khả năng đại diện cho tổng thể chung, số lượng mẫu đủ lớn để phân tích hồi qui Để phân tích hồi qui đạt kết quả tốt, công thức xác định cỡ mẫu nghiên cứu cần phải thỏa điều kiện n = 50 + 8*var (Tabachnick & Fidell (2007)) Trong đó, n là kích cỡ mẫu tối thiểu cần thiết, var là số lượng biến độc lập đưa vào mô hình hồi qui
Trong nghiên cứu đề tài này, bảng câu hỏi bao gồm 02 phát biểu về nhân tố phần thưởng, 02 phát biểu về nhân tố danh tiếng, 02 phát biểu về nhân tố thời gian chia sẻ, 02 phát biểu về nhân tố chi phí chia sẻ, 03 phát biểu về nhân tố chất lượng dữ liệu, 02 phát biểu về nhân tố lợi ích xã hội, 02 phát biểu về nhân tố bảo mật thông tin, 02 phát biểu về nhân tố dễ sử dụng Tổng cộng có 17 phát biểu Vậy số lượng mẫu tối thiểu để phân tích hồi qui tốt là lớn hơn bằng 186 mẫu
Phương pháp thu thập dữ liệu:
Xây dựng bảng câu hỏi (chi tiết ở phần phụ lục 3 bảng câu hỏi) bao gồm các câu trả lời bằng cách đánh trắc nghiệm Thang đo trả lời đánh giá các nhân tố bằng Likert 5 mức độ, mức độ tăng dần từ 1 đến 5, trong đó, chọn 1 có nghĩa là không đồng ý với phát biểu, chọn 2 có nghĩa là có phần đồng ý với phát biểu, chọn 3 có nghĩa là đồng ý với phát biểu, chọn 4 có nghĩa là khá đồng ý với phát biểu và chọn số 5 có nghĩa là rất đồng ý với phát biểu
Thu thập dữ liệu bằng cách in bảng câu hỏi ra và đi gửi trực tiếp đối tượng khảo sát, gửi email cho đối tượng khảo sát
Bảng câu hỏi sau khi thu thập được chọn lọc nhằm loại bỏ những bảng câu hỏi trả lời thiếu thông tin, không phù hợp rồi nhập vào phần mềm để xử lý, mã hóa rồi chuyển qua phần mềm SPSS 20 để tiếp tục phân tích
Kiểm định độ tin cậy Cronbach’s Alpha
Mục đích của việc kiểm định độ tin cậy Cronbach’s Alpha nhằm loại những biến quan sát rác hoặc chưa đạt yêu cầu trong quá trình nghiên cứu và đánh giá độ tin cậy của thang đo với các tiêu chí: Những biến có hệ số tương quan biến tổng (Item-total correlation) nhỏ hơn 0,3 sẽ bị loại và Những biến quan sát có giá trị hệ số Cronbach’s Alpha lớn hơn bằng 0.6 mới đạt yêu cầu
Phân tích nhân tố khám phá
Trong quá trình phân tích nhân tố khám phá, các nhân tố phải thỏa một số tiêu chí sau:
Hệ số KMO (Kaiser-Meyer-Olkin) phải thỏa điều kiện 0.5
≤ KMO ≤ 1 Kiểm định Bartlett (Bartlett’s test of sphericity) phải thỏa điều kiện sig Bartlett’s Test < 0.05
Trị số Eigenvalue phải thỏa điều kiện Eigenvalue ≥ 1
Tổng phương sai trích (Total Variance Explained) ≥ 50%
Hệ số tải nhân tố (Factor Loading) phụ thuộc vào kích thước mẫu chúng ta nghiên cứu Đặt tên nhân tố mới
Sau khi thực hiện phân tích nhân tố khám phá EFA, đặt lại tên các nhân tố mới được tạo ra
Hiệu chỉnh lại mô hình nghiên cứu và phát biểu các giả thuyết Phân tích hồi quy Sau khi phân tích nhân tố khám phá EFA, đặt lại tên nhân tố mới xong, tiến hành phân tích hồi quy đa biến.
Mô hình khuyến khích cộng đồng chia sẻ dữ liệu dựa vào lý thuyết trò chơi
Sau khi phân tích hồi quy tuyến tính ở trên phần 3.1.2, em xác định được các mức độ ảnh hưởng của các nhân tố đến việc sẵn sàng chia sẻ dữ liệu của cộng đồng Từ đây, em sẽ áp dụng lý thuyết trò chơi vào việc xây dựng mô hình chia sẽ dữ liệu ngập lụt từ những nhân tố ảnh hưởng đã được xác định ở trên
Thiết bị di động ngày càng phổ biến là động lực để xây dựng hệ thống thu hút người dùng đóng góp dữ liệu của mình để cung cấp cho người dùng khác có nhu cầu Do nhu cầu sử dụng dữ liệu khác
19 nhau nên người dùng miễn cưỡng tham gia và đóng góp thông tin Người dùng tham gia đóng góp thông tin thấp là thách thức trong việc chia sẻ thông tin cho người dùng khác có nhu cầu sử dụng thông tin của hệ thống Đây là vấn đề quan trọng để xây dựng một cơ chế như thế nào để khuyến khích nhiều người dùng tự nguyện tham gia đóng góp thông tin chính xác Chính những thách thức trên, em dựa vào lý thuyết trò chơi để đưa ra những chính sách, cơ chế nhằm khuyến khích người chơi sẽ hành động như thế nào để đạt được lợi ích tốt nhất cho họ
Chúng ta xét các tập sau:
Tập là tập những người đăng ký chơi
Tập là tập những người chưa đăng ký chơi
Tập là tập những người đăng ký chơi và không đăng ký chơi
Trước khi tham gia vào trò chơi, chúng ta có các giá trị của các tập như sau:
Tập là tập rỗng và được ký hiệu là = ∅ Tập chưa có người đăng ký chơi
Tập là tập những người không đăng ký chơi và được ký hiệu = {1, 2, 3, … , }
Tập là hợp của tập những người đăng ký chơi, không đăng ký chơi và được ký hiệu là = ∪
Trò chơi ban đầu được mô tả bao gồm các tập ở trên Sau đó, Người quản lý trò chơi đưa ra một số chính sách, cơ chế nhằm khuyến khích những người trong tập sẽ hành động như thế nào để đạt được lợi ích tốt nhất cho họ
Người quản lý trò chơi đưa ra một số loại thành viên tương ứng với chính sách, cơ chế khuyến khích những người chơi trong tập có thể lựa chọn để tham gia trò chơi nhằm đem lại lợi ích tốt nhất cho mình Những cơ chế, chính sách như sau:
Chơi với Linus: Người đăng ký chơi chia sẻ dữ liệu của mình cho cộng đồng truy cập miễn phí, đồng thời được truy cập dữ liệu của hệ thống chia sẻ miễn phí Cụ thể,
Chi phí phải trả (cost) cho việc truy cập dữ liệu của hệ thống chia sẻ bằng 0, nghĩa là, cost = 0
Phần trăm doanh thu (revenue) thu được từ việc chia sẻ dữ liệu của mình cho người chơi khác truy cập bằng 0, nghĩa là, revenue = 0
Giá trị hữu ích từ việc truy cập dữ liệu của hệ thống chia sẻ mang lại cho họ
Chơi với Bill: Người đăng ký chơi phải trả tiền cho việc sử dụng, truy cập dữ liệu của hệ thống chia sẻ, đồng thời cũng có thể nhận lại một ít tiền từ việc chia sẻ dữ liệu của mình
Chi phí phải trả (cost) cho việc truy cập dữ liệu của hệ thống chia sẻ là một số khác 0, nghĩa là, cost ≠ 0
Có thể nhận được một phần doanh thu (revenue) thu được từ việc chia sẻ dữ liệu của mình cho những người chơi khác truy cập, nghĩa là, revenue ≠ 0
Giá trị hữu ích từ việc truy cập dữ liệu của hệ thống chia sẻ mang lại cho họ
Chơi với Alien: Trong trường hợp này, người chơi không chia sẻ dữ liệu Do đó, người chơi phải thanh toán tiền cho việc sử dụng bất kỳ dữ liệu nào của hệ thống chia sẻ Cụ thể:
Chi phí phải trả (cost) cho việc truy cập dữ liệu của hệ thống chia sẻ là một số khác 0, nghĩa là, cost ≠ 0
Phần trăm doanh thu (revenue) thu được từ việc chia sẻ dữ liệu của mình cho người chơi khác truy cập bằng 0
(vì Alien không chia sẻ dữ liệu nên doanh thu không có), nghĩa là, revenue = 0
Giá trị hữu ích từ việc truy cập dữ liệu của hệ thống chia sẻ mang lại cho họ
Chúng ta xét một khoảng thời gian (ví dụ: 3 tháng) bao gồm các khung thời gian T (ví dụ: 10 phút cập nhật dữ liệu 1 lần) Nhằm đơn giản, chúng ta cho chiều dài của mỗi khung thời gian bằng 1 Những người đăng ký chơi trong tập đăng ký lựa chọn thành viên (tương ứng với cơ chế, chính sách) mà người quản lý trò chơi đưa ra để tham gia vào trò chơi và không thể thay đổi khi đã lựa chọn trong suốt thời gian đăng ký tham gia trò chơi
Một số tương tác giữa Người quản lý trò chơi với những người chơi trong tập như sau:
Người quản lý trò chơi thông báo các chính sách, cơ chế khuyến khích và giá của mỗi khung thời gian vào đầu khoảng thời gian tham gia:
Giá mỗi khung thời gian được thanh toán bởi những người chọn chơi với Bill, chọn chơi với Alien (hay những người chơi không chia sẻ dữ liệu) là p với p∈ (0, ]
Phần trăm doanh thu thu được từ việc chia sẻ dữ liệu của những người chơi chọn chơi với Bill nhận được là với
Người quản lý trò chơi đưa ra thông báo về (p, ), mỗi người đăng ký chơi ∈ chọn loại thành viên ∈{0, 1, } cho mình cho toàn bộ thời gian của những khung thời gian ∆t Trong đó: 0 tương ứng với Linus, 1 tương ứng với Bill và a tương ứng với Alien Mục tiêu của mỗi người đăng ký chơi là lựa chọn loại thành viên tốt nhất để tối đa hóa lợi nhuận của mình trong toàn bộ khoảng thời gian mà Người quản lý trò chơi đưa ra
Người quản lý trò chơi đưa ra thông báo về (p, ) và lựa chọn thành viên của những người đăng ký chơi { , ∈ }, người đăng ký chơi bao gồm những người chọn chơi với Linus, chọn chơi với Bill và chọn chơi với Alien quyết định việc truy cập dữ liệu mà người khác chia sẻ trong khung thời gian
Khi truy cập dữ liệu được chia sẻ bởi hệ thống, người đăng ký chơi truy cập dữ liệu không bị ảnh hưởng bởi những người đăng ký chơi khác truy cập dữ liệu vào cùng một thời điểm Do đó, quyết định việc truy cập dữ liệu ở khung thời gian tiếp theo của người đăng ký chơi tiếp tục hay không phụ thuộc vào chất lượng dữ liệu mà những người đăng ký chơi khác chia sẻ Chất lượng dữ liệu của người đăng ký chơi khác chia sẻ được thể hiện thông qua điểm danh tiếng được mọi người trong cùng một khu vực bình bầu
Trong bài này, Em chỉ tập trung vào quyết định của người đăng ký chơi về việc lựa chọn thành viên (chơi với Linus (Linus), chơi với Bill (Bill), chơi với Alien (Alien)) tham gia và quyết định việc truy cập dữ liệu với cơ chế khuyến khích, giá của Người quản lý trò chơi đã công bố trước đó
Sau khi đã mô tả về cơ chế trò chơi, Em bắt đầu xây dựng trò chơi bao gồm: việc lựa chọn thành viên (Linus, Bill và Alien) tham gia và quyết định việc truy cập dữ liệu của người chơi như sau:
KẾT QUẢ NGHIÊN CỨU
Mô tả mẫu
Quá trình thực hiện thu thập dữ liệu bằng cách in bảng câu hỏi ra rồi đi gửi trực tiếp cho người trả lời Tổng số bảng câu hỏi nhận lại được là 306 bảng Trong đó số bảng hợp lệ là 276 bảng, đạt tỉ lệ 90%
Một số bảng thu thập không hợp lệ chủ yếu là do đối tượng trả lời thiếu thông tin
Do đó, tổng số mẫu dùng để phân tích là 276
4.1.2 Thông tin đối tượng nghiên cứu
Kết quả thống kê cho thấy đối tượng nghiên cứu tương đối cân bằng, không chênh lệch nhiều giữa Nam và Nữ, chi tiết được mô tả ở bảng 4.1
Bảng 4.1 Thống kê giới tính
Giới tính Tần số Phần trăm
Kết quả thống kê cho thấy đối tượng nghiên cứu ở độ tuổi dưới
24 chiếm 32%, độ tuổi từ 24 đến 40 chiếm 45% và độ tưổi trên
40 chiếm 23%, chi tiết được thể hiện ở bảng 4.2
Bảng 4.2 Thống kê độ tuổi Độ tuổi Tần số Phần trăm
Kết quả thống kê cho thấy đối tượng nghiên cứu có nghề nghiệp là nhân viên văn phòng chiếm 49% so với các nghề nghiệp còn lại và được mô tả chi tiết ở bảng 4.3
Bảng 4.3 Thống kê nghề nghiệp
Nghề nghiệp Tần số Phần trăm
Tần suất sử dụng Internet
Kết quả thống kê cho thấy đối tượng nghiên cứu có tần suất sử dụng thường xuyên chiếm đa số 80% so với các tần suất khác và được thể hiện chi tiết trong bảng 4.4
Bảng 4.4 Thống kê tần suất sử dụng Internet Tần suất sử dụng Internet Tần số Phần trăm
Kiểm định thang đo
4.2.1 Kiểm định độ tin cậy Cronbach’s Alpha
Mục đích của việc kiểm định độ tin cậy Cronbach’s Alpha nhằm loại những biến quan sát rác hoặc chưa đạt yêu cầu Những biến quan sát có hệ số tương quan biến tổng lớn hơn hoặc bằng 0.3 mới đạt yêu cầu Những biến quan sát có giá trị hệ số Cronbach’s Alpha lớn hơn bằng 0.6 mới đạt yêu cầu Bảng 4.5 mô tả hệ số Cronbach’s Alpha của các nhân tố
Bảng 4.5 Kết quả hệ số Cronbach’s Alpha
Nhân tố Hệ số Cronbach’s Alpha
Trong bảng 4.5, hệ số Cronbach’s Alpha của các nhân tố đều lớn hơn 0.6 và giá trị hệ số tương quan biến tổng đều lớn hơn 0.3, chi tiết được mô tả ở phần phụ lục 4 kết quả phân tích Cronbach’s Alpha Do đó, các nhân tố đạt yêu cầu để phân tích tiếp theo
4.2.2 Phân tích nhân tố khám phá
Trong quá trình phân tích nhân tố khám phá, các nhân tố phải thỏa một số tiêu chí sau:
Hệ số KMO (Kaiser-Meyer-Olkin) phải thỏa điều kiện 0.5 ≤ KMO ≤ 1 Kiểm định Bartlett (Bartlett’s test of sphericity) phải thỏa điều kiện sig Bartlett’s Test < 0.05
Trị số Eigenvalue phải thỏa điều kiện Eigenvalue ≥ 1
Tổng phương sai trích (Total Variance Explained) ≥ 50%
Hệ số tải nhân tố (Factor Loading) phụ thuộc vào kích thước mẫu chúng ta nghiên cứu
Phân tích nhân tố biến độc lập:
Kết quả phân tích nhân tố khám phá được trình bày chi tiết ở mục phụ lục 5 kết quả phân tích EFA Kết quả như sau:
Lần 1: Có 17 biến quan sát đưa vào phân tích Theo điều kiện trị số Eigenvalue lớn hơn 1, do đó có 5 nhân tố được rút ra từ lần chạy thứ nhất Biến PT02 và LIXH02 bị loại do không đảm bảo hệ số tải 0.5 (hệ số tải 0.5 là do chúng ta lấy so với tiêu chuẩn khích thước mẫu) trở lên
Lần 2: Có 15 biến quan sát được đưa vào phân tích Kết quả phân tích được thể hiện trong bảng 4.6
Hệ số KMO = 0.742 và sig (Bartlett’s test) = 0.000 Vậy các biến ở lần chạy thứ 2 thỏa điều kiện phân tích nhân tố khám phá Trong lần chạy này, có 5 nhân tố được trích thỏa điều kiện Eigenvalue lớn hơn 1 (nhân tố có Eigenvalue nhỏ nhất Eigenvalue = 1.151) và phương sai trích bằng 75.481% thỏa điều kiện (điều kiện: phương sai trích lớn hơn bằng 50%) và các biến quan sát đều có hệ số tải lớn hơn 0.5 nên không có biến nào bị loại ở lần chạy này
Bảng 4.6 Kết quả phân tích nhân tố EFA lần 2
Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser Normalization a Rotation converged in 6 iterations
Vậy qua hai lần phân tích nhân tố độc lập, kết quả cuối cùng có
5 nhân tố và 15 biến quan sát
Nhân tố 1: CP01, CP02, TG01, TG02, PT01
Nhân tố 2: CLDL01, CLDL02, CLDL03, LIXH01
Phân tích nhân tố biến phụ thuộc
Kết quả phân tích biến phụ thuộc: Hệ số KMO = 0.716 và sig (Bartlett’s test) = 0.000 Vậy các biến thỏa điều kiện phân tích nhân tố Có một nhân tố duy nhất được trích thỏa điều kiện Eigenvalue lớn hơn 1 (Eigenvalue = 2.189) và có phương sai trích bằng 72.962% Vậy nhân tố duy nhất có 3 biến quan sát Nhân tố 6: SSCS01, SSCS02, SSCS03
4.2.3 Đặt tên các nhân tố
Sau khi thực hiện phân tích nhân tố khám phá EFA, các nhân tố mới được tạo ra Căn cứ vào các quan sát ở bảng 4.6, chúng ta đặt lại tên mới cho các nhân tố này
Nhân tố 1 bao gồm 5 biến (CP01, CP02, TG01, TG02, PT01) và được đặt lại tên “Giá trị nhận được” (GTND)
Nhân tố 2 bao gồm 4 biến (CLDL01, CLDL02, CLDL03, LIXH01) và được đặt lại tên là “Chất lượng dữ liệu” (CLDL)
Nhân tố 3 bao gồm 2 biến (DSD01, DSD02) và được đặt lại tên là
Nhân tố 4 bao gồm 2 biến (DT01, DT02) và được đặt lại tên là
Nhân tố 5 bao gồm 2 biến (BM01, BM02) và được đặt lại tên là
“Bảo mật thông tin” (BM)
Nhân tố 6 bao gồm 3 biến phụ thuộc (SSCS01, SSCS02, SSCS03) và được đặt lại tên “Sẵn sàng chia sẻ” (SSCS)
4.2.4 Hiệu chỉnh mô hình sau khi phân tích nhân tố
Sau khi phân tích nhân tố khám phá, mô hình được hiệu chỉnh lại như sau:
Mô hình nghiên cứu hiệu chỉnh còn lại 5 nhân tố ảnh hưởng đến việc chia sẻ dữ liệu của cộng đồng và được đặt lại các giả thuyết sau:
H1: Nhân tố “Giá trị nhận được” có ảnh hưởng tích cực đến yếu tố sẵn sàng chia sẻ dữ liệu của cộng đồng
H2: Nhân tố “Chất lượng dữ liệu” có ảnh hưởng tích cực đến yếu tố sẵn sàng chia sẻ dữ liệu của cộng đồng
H 3 : Nhân tố “Dễ sử dụng” có ảnh hưởng tích cực đến yếu tố sẵn sàng chia sẻ dữ liệu của cộng đồng
H4: Nhân tố “Danh tiếng” có ảnh hưởng tích cực đến yếu tố sẵn sàng chia sẻ dữ liệu của cộng đồng
Hình 4.1 Mô hình nghiên cứu hiệu chỉnh
H5: Nhân tố “Bảo mật thông tin” có ảnh hưởng tích cực đến yếu tố sẵn sàng chia sẻ dữ liệu của cộng đồng.
Phân tích hồi quy
Để phân tích hồi quy trong nghiên cứu, chúng ta đặt biến đại diện trung bình cho các biến quan sát rồi tiến hành thực hiện hồi quy
Thực hiện hồi quy ở mức ý nghĩa 5%
Giả sử chúng ta có mô hình hồi quy tuyến tính như sau:
SSCS = β1 + β2GTND + β3CLDL + β4DSD + β5DT + β6BM
Trong đó: β1, β2, β3, β4, β5, β6 là các tham số của hồi quy
GTND, CLDL, DSD, DT, BM là các nhân tố độc lập
SSCS là nhân tố phụ thuộc
Theo bảng 4.7, hệ số R 2 hiệu chỉnh bằng 0.722 phản ánh 5 biến độc lập đưa vào ảnh hưởng 72,2% sự thay đổi của biến phụ thuộc Còn lại, 27.8% là những biến ngoài mô hình và sai số ngẫu nhiên Tuy nhiên sự phù hợp này chỉ đúng với dữ liệu mẫu
Bảng 4.7 Mô tả tóm tắt thông số mô hình hồi qui
Std Error of the Estimate
1 853 a 727 722 38601 1.718 a Predictors: (Constant), BM, DT, GTND, DSD, CLDL b Dependent Variable: SSCS
Kết quả kiểm định Anova được thể hiện trong bảng 4.8 cho thấy hệ số sig bằng 0.000 < 0.05 nên đủ cơ sở để kết luận mô hình hồi qui tổng thể phù hợp với tập dữ liệu Nghĩa là, có mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc
Bảng 4.8: Kết quả kiểm định Anova
Model Sum of Squares df Mean Square F Sig
Total 147.299 275 a Dependent Variable: SSCS b Predictors: (Constant), BM, DT, GTND, DSD, CLDL
4.3.3 Kiểm định hệ số tương quan
Theo bảng 4.9, chúng ta thấy các biến độc lập đưa vào phân tích đều có hệ số sig nhỏ hơn 0.05 nên có ý nghĩa thống kê Hệ số β của các nhân tố (GTND, CLDL, DSD, DT, BM) tương ứng với các giá trị được chọn để xét sự ảnh hưởng của biến độc lập lên biến phụ thuộc Giá trị Tolerance của các nhân tố tương đối cao và giá trị VIF của các biến nhỏ hơn 10 Do đó, chúng ta kết luận không có hiện tượng đa cộng tuyến xảy ra
Bảng 4.9: Hệ số tương quan
Standardized Coefficients t Sig Collinearity Statistics
B Std Error Beta Tolerance VIF
Vậy, chúng ta viết lại phương trình hồi quy tuyến tính như sau:
SSCS = -0.425 + 0.165*GTND + 0.327*CLDL + 0.294*DSD + 0.183*DT + 0.068*BM
Các nhân tố trong mô hình hồi quy tuyến tính đều ảnh hưởng đến sự sẵn sàng chia sẻ dữ liệu Trong đó, nhân tố chất lượng dữ liệu (CLDL) có hệ số hồi quy bằng 0.327 (cao nhất) ảnh hưởng nhiều
46 nhất đến sự sẵn sàng chia sẻ dữ liệu và nhân tố dễ sử dụng (DSD) cũng ảnh hưởng nhiều đến sự sẵn sàng chia sẻ dữ liệu.
Áp dụng Lý thuyết trò chơi vào việc chia sẽ dữ liệu
Trong phần này, Em xét những người chơi cùng truy cập dữ liệu của hệ thống chia sẻ trong các khung thời gian nhất định
Giả sử, chúng ta xét chi phí p = 0.5 cho toàn bộ khung thời gian và chiến lược chơi, đánh giá sự hữu ích như bảng 4.10 bên dưới Dữ liệu thu thập được trong bảng 10.4 bằng cách phỏng vấn một số người về một số trường hợp giả lập Kết quả thu được trong bảng là những người trả lời thỏa điều kiện được phân tích trong chương 3 Mặc dù, dữ liệu thu thập được trong bảng 10.4 ít, chưa đủ độ tin cậy cao nhưng cũng thể hiện được khi chất lượng dữ liệu chia sẻ tốt, độ chính xác cao thì người chơi đánh giá sự hữu ích của dữ liệu cũng được tăng lên và chiến lược chơi của người chơi cũng tăng Một số trường hợp không thỏa mãn điều kiện ở chương 3 có thể là do người sử dụng dữ liệu chưa tin tưởng về chất lượng dữ liệu của người cung cấp (thể hiện qua điểm danh tiếng)
Bảng 4.10: Đánh giá sự hữu ích dữ liệu và chiến lược chơi
Tại khung thời gian Điểm danh tiếng người chia sẻ: Đánh giá sự hữu ích dữ liệu
Chi phí p Chiến lược chơi
Mối liên hệ giữa chiến lược ( , ) của người chơi i khi truy cập dữ liệu của hệ thống chia sẻ đồng biến với ( − ) được biểu diễn như hình 4.2 bên dưới
Hình 4.2 Mô tả mối liên hệ giữa − và ,
Theo mô hình mối liên hệ giữa trục x và trục y thể hiện, khi giá trị x tăng lên làm cho giá trị y tăng lên rất nhanh Điều này nói lên rằng, danh tiếng của người chia sẻ càng cao kéo theo đánh giá về sự hữu ích của dữ liệu càng cao Khi người chơi đánh giá sự hữu ích của dữ liệu càng cao, lúc đó chiến lược của người chơi tăng lên rất nhanh y = 0.6136x + 0.225