Đánh giá những nguy cơ trong việc sử dụng các nguồn dữ liệu lớn để sản xuất số liệu thống kê chính thức Kết quả điều tra của các bên liên quan

19 3 0
Đánh giá những nguy cơ trong việc sử dụng các nguồn dữ liệu lớn để sản xuất số liệu thống kê chính thức  Kết quả điều tra của các bên liên quan

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Ngày càng có nhiều cơ quan thống kê đang tìm hiểu việc sử dụng các nguồn dữ liệu lớn để sản xuất số liệu thống kê chính thức. Trong thời điểm hiện nay, chỉ có một vài ví dụ mà các nguồn dữ liệu này đã được tích hợp đầy đủ vào thực tế sản xuất số liệu thống kê (Thống kê Hà Lan, năm 2015). Do đó, toàn bộ các hệ lụy liên quan vấn đề này vẫn chưa được biết hết.

Đánh giá nguy việc sử dụng nguồn liệu lớn để sản xuất số liệu thống kê thức - Kết điều tra bên liên quan Tóm tắt nội dung Ngày có nhiều quan thống kê tìm hiểu việc sử dụng nguồn liệu lớn để sản xuất số liệu thống kê thức Trong thời điểm nay, có vài ví dụ mà nguồn liệu tích hợp đầy đủ vào thực tế sản xuất số liệu thống kê (Thống kê Hà Lan, năm 2015) Do đó, tồn hệ lụy liên quan vấn đề chưa biết hết Một nỗ lực để xác định nguy vấn đề xung quanh nguy liên quan đến việc sử dụng nguồn liệu lớn giai đoạn khảo sát sản xuất số liệu thống kê thức đưa báo "Xác định cấu hình nguy giải pháp việc sử dụng nguồn liệu lớn để tạo số liệu thống kê thức - Phân tích dựa nguy khung chất lượng Wirthmann cộng đưa năm 2015 Kết luận rút từ báo chứng minh khả xảy hay ảnh hưởng cách riêng lẻ "nguy liệu lớn", hai phụ thuộc nhiều vào nguồn liệu lớn loại sản phẩm thống kê Để có nhìn sâu sắc hơn, bên liên quan có điều tra cụ thể nguồn gốc nguy Những người trả lời hỏi định lượng khả xảy ảnh hưởng nguy nguồn liệu lớn họ lựa chọn (danh sách gồm tám nguồn liệu lớn đưa sẵn) để cung cấp sở cho đánh giá họ đề xuất biện pháp phịng ngừa giảm thiểu nguy Để hoàn thiện hơn, người trả lời mời đưa nguy bổ sung khảo sát sử dụng nguồn liệu lớn cho số liệu thống kê thức Impact Báo cáo phân tích trình bày kết điều tra bên liên quan, tương phản kết nghiên cứu với phân tích Wirthmann cộng năm 2015 (Karlberg, M; Kovachev B; Reis F; Di Consiglio L) Giới thiệu 1.1 Những phương pháp khảo sát liệu Đây điều tra trực tuyến nguy liệu lớn đưa cổng thông tin điện tử CROS (http://ec.europa.eu/eurostat/cros/content/stakeholder-survey-big-data-risks) Để bớt gánh nặng cho người trả lời, điều tra xây dựng cho người trả lời phải phản hồi khả xảy nguy cơ, ảnh hưởng nguy cơ, cách phòng ngừa giảm thiểu ảnh hưởng nguy nguồn liệu lớn; hoàn thành điều tra nhiều lần (một lần cho nguồn liệu lớn) Các lời mời trả lời điều tra gửi đến bên liên quan khác nhau, bao gồm người tham gia kiện ESS tổ chức gần liên quan đến liệu lớn Cuộc điều tra xem khảo sát/tự đại diện, khơng có tổng thể mục tiêu cụ thể để ngoại suy kết Trong giai đoạn từ tháng đến tháng năm 2015, có tổng cộng 62 phiếu trả lời hợp lệ Vì có lựa chọn thực nhiều lần, điều tra khơng dựa mẫu xác suất, nhóm tác giả tiến hành phân tích mức độ phản ứng thay mức độ người trả lời Thơng tin định lượng (tính tốn khả xảy ảnh hưởng nguy cơ) trình bày Hình cho tất nguồn liệu lớn Trong phân tích thơng tin định lượng này, phân tích nguồn liệu lớn: Nguồn liệu điện thoại di động; Nguỗn liệu từ phương tiện truyền thông xã hội; liệu web liệu máy quét giá Hình 1: Trung bình cộng ước lượng nguy cung cấp điều tra cho nguồn liệu khác Khả xảy Ảnh hưởng Nguy - Thiếu truy cập liệu (giai đoạn xây dựng) Nguy - Những thay đổi bất lợi môi trường pháp lý (giai đoạn sản xuất) Nguy - Mất truy cập liệu (giai đoạn sản xuất) Nguy - Vi phạm tính bảo mật liệu (giai đoạn sản xuất) Nguy - Không tuân thủ quy định liên quan pháp luật (giai đoạn xây dựng) Nguy - Vi phạm bảo mật liệu (giai đoạn sản xuất) Nguy - Thao tác nguồn liệu (giai đoạn sản xuất) Nguy 10 - Thiếu chuyên gia (giai đoạn xây dựng) Nguy - Ngược với nhận thức chung sử dụng liệu lớn theo thống kê thức(giai đoạn sản xuất) Nguy 9- Mất uy tín khơng cịn dựa quan sát (giai đoạn sản xuất) Nguy 11 - Mất chuyên gia cho tổ chức khác (giai đoạn sản xuất) Ở đây, n số câu trả lời (Điều vượt số lượng người trả lời, khảo sát cho phép người trả lời hoàn thành bảng câu hỏi cho nhiều nguồn liệu.) Nguy liên quan đến truy cập liệu 2.1 Thiếu quyền truy cập vào liệu Nguy tính với việc xây dựng sản phẩm thống kê thức dựa liệu lớn (BOSP) không nhận quyền truy cập vào nguồn liệu lớn (BDS) cần thiết Như thấy Hình 1, người trả lời khảo sát đánh giá khả xảy nguy xảy (4) liệu điện thoại di động Một người trả lời cho biết “những hệ thống pháp luật khác quốc gia khác nhau, số nước, liệu điện thoại di động truy cập dễ dàng, nước khác gần truy cập” Khả đánh giá thấp chút (trong khoảng 3.2-3.4, có nghĩa khơng thường xun) cho nguồn liệu truyền thông xã hội, liệu web- scrapable liệu quét giá Điều lý giải số phương tiện truyền thông xã hội liệu web-scrapable lưu trữ công khai liệu máy quét, người trả lời cho Cơ quan thống kê quốc gia(NSO) thiết lập quan hệ đối tác với nhà cung cấp liệu Dữ liệu có NSO ” Ảnh hưởng nguy đánh giá quan trọng (khoảng 3.7 đến 3.9) liệu điện thoại di động máy quét giá, phần thấp chút (trong phạm vi 3, khoảng 3.3) cho liệu truyền thông xã hội liệu web – scraped (trong trường hợp thống kê giá, người ta xây dựng BOSP dựa liệu máy quét, làm cho nhu cầu liệu web– scraped cấp bách hơn) Về vấn đề phòng ngừa, đề xuất phổ biến từ người trả lời liên quan đến pháp luật (ví dụ: “EU luật quốc gia buộc nhà cung cấp chia sẻ liệu với NSI Việc truy cập thủ tục phải thiết kế cho liệu cá nhân sử dụng cho mục đích thống kê”), giải pháp thắng - thắng (win-win) ("Làm cho họ hưởng lợi, ví dụ chia sẻ kết phân tích liệu họ") ("Thỏa thuận chi tiết quyền nghĩa vụ bên, bao gồm quyền truy cập liên tục bảo vệ quyền riêng tư cá nhân") Liên quan đến hoạt động giảm thiểu nguy cơ, người trả lời lưu ý họ "thay đổi tùy thuộc vào loại thay đổi, họ điều chỉnh tham số phần mềm để thay đổi hoàn toàn nguồn liệu lớn" Nếu khơng có cách để sản xuất số liệu thống kê dựa liệu lớn mà lại khơng có liệu lớn, khơng thể khắc phục thiếu truy cập, nỗ lực phải chấm dứt, số liệu thống kê dựa liệu lớn đến 2.2 Mất quyền truy cập vào liệu This risk consists of a statistical office losing a BDS underlying a BOSP Nguy nguồn liệu lớn sản xuất số liệu thống kê liệu lớn Những người trả lời đánh giá khả xảy nguy so với nguy thiếu truy cập liệu (trong khoảng 2.7-3.1 tất nguồn liệu; xem Hình 1) Một ví dụ (nguồn liệu điện thoại di động) lý đánh giá khả thấp “Khi truy cập vào liệu MNO (Nhà khai thác mạng di động) bảo mật, xác suất bị thấp” Tuy nhiên, người trả lời khác lưu ý khả “Thay đổi quyền sở hữu mơ hình kinh doanh” MNO cảnh báo “quyền truy cập hợp pháp vào tài ngun cơng ty tư nhân bị thay đổi không luật điều chỉnh” Đáng ngạc nhiên, ước tính ảnh hưởng từ người trả lời lại không cao nguy thiếu truy cập liệu; điều ngược với đánh giá Wirthmann et al (2015) "ở BOSP sản xuất, ảnh hưởng cao thường trường hợp" Đặc điểm hoạt động phịng ngừa lập pháp/hợp đồng (ví dụ “tham gia thực mối quan hệ hợp đồng lâu dài điều chỉnh”), quản lý tốt quan hệ đối tác (ví dụ: “chăm sóc tốt tích cực mối quan hệ với nhà cung cấp liệu”) đa dạng hóa (“Đó điều quan trọng phải giữ vài việc lúc Nói cách khác, Cơ quan Thống kê không nên dựa vào nguồn mà ln có hai lựa chọn thay thế” Các hoạt động giảm thiểu đề xuất bao gồm nhanh nhẹn công nghệ (“ theo dõi di chuyển kịp thời vừa tảng ứng dụng tương đương”) nỗ lực đăng đa dạng hóa (“ Sử dụng nguồn thông tin thay Xác định trang web thay -> cập nhật danh sách thường xuyên ”) quan hệ đối tác (“ thương lượng với chủ sở hữu liệu ”) 3 Nguy liên quan đến môi trường pháp lý 3.1 Không tuân thủ pháp luật có liên quan Nguy liên quan đến giai đoạn xây dựng sản phẩm thống kê dựa nguồn liệu lớn Nó liên quan đến dự án mà không đưa quy định pháp luật có liên quan để xem xét, làm cho BOSP khơng tn thủ pháp luật liên quan Điều liên quan đến nội dung pháp luật liên quan đến việc sử dụng liệu lớn cho thống kê thức, ví dụ: luật bảo vệ liệu, quy định liên quan đến xử lý liệu từ nguồn liệu lớn cụ thể, v.v Các câu trả lời từ khảo sát chun gia cho tính tốn khả xảy nguy từ 2.4 (cách xa) đến 3.4 (thỉnh thoảng) từ 2.8 (lớn) đến 3.6 (quan trọng) cho ảnh hưởng có nguy Lý để tính tốn khả xảy ra, người trả lời đưa Cơ quan Thống kê có đánh giá tính pháp lý sản phẩm thống kê nên ngăn chặn xảy nguy Ngồi ra, đề cập Cơ quan Thống kê ý thức nguy họ cẩn thận việc xác minh pháp luật có liên quan Tuy nhiên, nói pháp luật khơng rõ ràng phải diễn giải Một người trả lời khác dựa vào thực tế nhà cung cấp liệu xác minh cẩn thận tuân thủ pháp lý sản phẩm họ trước cung cấp liệu cho Cơ quan Thống kê Ngồi ra, có hoa hồng để bảo mật quan khác tổ chức mạnh mẽ xem xét cẩn thận sáng kiến có liên quan thực hành động phù hợp trường hợp không tuân thủ Liên quan đến liệu từ truyền thơng xã hội, tình xảy mục đích sử dụng liệu không tuân thủ điều khoản điều kiện cụ thể nhà cung cấp liệu Liên quan đến ảnh hưởng, cố không tuân thủ có hậu tiêu cực đến danh tiếng Cơ quan thống kê nói chung Các kết thường xuyên tuyên bố biện pháp để ngăn chặn dự án sau vi phạm phát Để giảm thiểu nguy này, người trả lời nên xem xét cẩn thận pháp luật hành, liên quan đến quan bảo vệ liệu luật sư từ bắt đầu dự án, chuẩn bị chiến lược truyền thông tốt để hạn chế sử dụng liệu cho thông tin công cộng Một số người trả lời đề cập thêm nhu cầu hài hòa cấp độ siêu quốc gia vai trị có tổ chức quốc tế cho phép truy cập vào nguồn liệu, ví dụ: từ truyền thông xã hội 3.2 Những thay đổi không thuận lợi môi trường pháp lý Nguy liên quan đến thay đổi môi trường pháp lý quy trình sản xuất áp dụng Luật khơng thuận lợi trường hợp xấu nhất, ngăn chặn việc truy cập sử dụng nguồn liệu cụ thể để tiếp tục sản xuất sản phẩm thống kê từ nguồn liệu lớn Những người trả lời xem xét khả xảy nguy xảy mức trung bình từ 1.6 (cách xa) cho liệu máy quét giá 3.2 (thỉnh thoảng) cho liệu truyền thông xã hội Ảnh hưởng nguy đánh giá 2.8 (lớn) cho việc tìm kiếm web 3.6 (quan trọng) liệu truyền thông xã hội Những động đánh giá khả xảy nguy thấp trình xây dựng hành vi pháp lý mới, thẩm quyền sàng lọc đánh giá hậu xảy Một người trả lời khác giả định việc sản xuất thống kê từ nguồn liệu lớn kích hoạt thơng qua hành động pháp lý đảm bảo tuân thủ pháp lý Mặt khác, người trả lời cho nơi động địi hỏi phải thích ứng với hành vi pháp lý Việc thực cải tiến thay đổi thái độ cơng dân, ví dụ: liên quan đến quyền riêng tư, điều kích hoạt thay đổi pháp lý Một số người hỏi cho luật giới thiệu đặc biệt cho liệu truyền thông xã hội để cân lại việc sử dụng liệu với bảo vệ liệu Người trả lời xem xét thay đổi tình hình pháp lý liên quan đến web-scraping khơng Các hậu xảy (ảnh hưởng) trường hợp thay đổi pháp lý không thuận lợi thay đổi hệ thống sản xuất, tác động đến phương pháp loại trừ nguồn liệu tương ứng khỏi trình sản xuất Ảnh hưởng chung tính tốn thấp so với tác giả dự kiến Liên quan đến giảm thiểu nguy này, người trả lời đề nghị cách tiếp cận chủ động theo dõi sáng kiến pháp lý cố gắng ảnh hưởng đến sáng kiến pháp lý nhấn mạnh lợi ích cơng cộng việc sử dụng cụ thể nguồn liệu lớn cho thống kê thức Nguy liên quan đến bảo mật an toàn liệu 4.1 Vi phạm an toàn dự liệu Đây nguy liên quan đến việc truy cập trái phép vào liệu Cơ quan thống kê nắm giữ Các bên thứ ba có liệu theo văn quy định đó, ví dụ:lịch phổ biến Đây ví dụ liệu nhà đầu tư thị trường chứng khoán kỳ vọng cao Đối với hầu hết nguồn liệu, người trả lời dường không nghĩ nguy đặc biệt có khả xảy Lý cho việc tin tưởng vào thủ tục kinh nghiệm bảo mật thiết lập việc xử lý liệu bí mật Có thể hiểu ảnh hưởng đánh giá cao cho liệu khơng thu thập từ nguồn có sẵn cơng khai số cách mức đánh giá Wirthmann et al (2015) Liên quan đến ảnh hưởng, thiệt hại danh tiếng lòng tin dường mối quan tâm Về hoạt động giảm thiểu, người trả lời ủng hộ biện pháp thủ tục an ninh CNTT phù hợp, nhận thức nhân viên đào tạo đánh giá nguy Ngồi cịn có đề xuất để hạn chế phân tích liệu tổng hợp ẩn danh Khi biện pháp giảm thiểu đề xuất, chủ yếu thấy đề xuất để xử lý thơng tin cách xác cải thiện biện pháp kỹ thuật bảo hộ phần lớn trùng với biện pháp tác giả đưa 4.2 Vi phạm bảo mật dự liệu Đây nguy mà thơng tin bí mật nhiều cá nhân từ tổng thể thống kê tiết lộ, công vào sở hạ tầng CNTT áp lực từ quan phủ khác biện pháp kiểm soát bảo mật thống kê khơng đầy đủ Nói chung với biện pháp phòng ngừa hợp lý, khả xảy giữ mức hợp lý, đánh giá khả xảy nguy trung bình từ đến 2.6 (từ cách xa đến thỉnh thoảng), với khác biệt nguồn liệu Ví dụ: nguy thấp trung bình liệu web-scraped ảnh hưởng mức thấp, liệu thu theo cách khác dễ dàng Nguy cao tính tốn cho nguồn liệu phương tiện truyền thông xã hội, liên quan đến chất nguồn liệu Các Cơ quan Thống kê có biện pháp ngăn chặn nguồn liệu họ từ cơng bên ngồi để giữ bí mật liệu mơi trường an tồn hầu hết trường hợp để bảo vệ độc lập họ khỏi quan phủ khác Ảnh hưởng vi phạm bảo mật nhìn thấy cao cho nguồn liệu di động phương tiện truyền thông xã hội, độ tin cậy Cơ quan Thống kê tác động đến thỏa thuận với nhà khai thác tư nhân Mặt khác, cải thiện hệ thống CNTT, tăng cường phương pháp đảm bảo giảm nguy tiết lộ, kiểm tra nguy tiết lộ nguồn liệu khác cuối đảm bảo tính độc lập Cơ quan Thống kê nằm danh sách biện pháp giảm thiểu nguy 4.3 Thao tác nguồn liệu Đây nguy liệu cung cấp từ bên thứ ba, ví dụ liệu mạng xã hội liệu tự nguyện đóng góp xử lý Điều thực nhà cung cấp liệu bên thứ ba Ví dụ, nhiều thơng điệp truyền thơng xã hội giả mạo tạo để đẩy số thống kê bắt nguồn từ liệu theo cách khác Đối với hầu hết nguồn liệu, đánh giá khả xảy trung bình người trả lời thay đổi mức cách xa Đối với nguồn phương tiện truyền thơng xã hội cao chút Nói chung, khơng cá nhân thao tác nguồn liệu Ngoại trừ điều này, trào lưu xã hội cố gắng thao túng, kỳ vọng trường hợp trở nên tiếng giúp Cơ quan Thống kê đối phó với tình hình Nguy cho tham gia vào thao tác xem lý cho điểm số trung bình với kỳ vọng có số liệu thống kê thị trường nhạy cảm có nguy Tính tốn ảnh hưởng trung bình cao rõ rệt so với khả xảy liệu điện thoại di động đặc biệt liệu máy quét giá Lý cho điều tin tưởng công chúng Thực tế thao tác khó phát có khả tiếp tục thời gian dài Trong Wirthmann et al (2015) tính tốn ảnh hưởng nguy thấp - nguy danh tiếng thừa nhận nhiên tin tưởng đặt tác động truyền thơng đầy đủ So sánh, có thể, liệu từ nhà cung cấp khác cách để bảo vệ Cơ quan Thống kê chống lại nguy 4.4 Nhận thức ngược lại việc sử dụng liệu lớn cho thống kê thức Nguy đề cập đến tình có nhận thức tiêu cực việc sử dụng liệu lớn cho thống kê thức, dẫn đến hạn chế bổ sung chí cản trở việc sử dụng nguồn liệu lớn định Khả xảy nguy đánh giá trung bình (cách xa) cho liệu máy quét giá 3.7 (có thể xảy ra) cho liệu truyền thông xã hội Đối với liệu điện thoại di động, khả xảy nguy coi không thường xuyên (3.1) Ảnh hưởng nguy dao động trung bình từ 2.6 (nhỏ - lớn) cho liệu quét web scraped máy quét giá tới 3.4 (lớn- quan trọng) liệu truyền thông xã hội Động lực để gán khả xảy cao nguy không tin tưởng công chúng tổ chức phủ cơng chúng không phân biệt tác nhân (doanh nghiệp quan phủ) trường hợp bị ảnh hưởng tiêu cực Nguy thấp công chúng thơng báo rộng rãi mục đích, sản phẩm thống kê cuối biện pháp bảo vệ để ngăn chặn việc lạm dụng liệu Ảnh hưởng mát chung uy tín Cơ quan Thống kê ảnh hưởng xấu đến thái độ chung người cộng tác với Cơ quan Thống kê Một ý kiến tiêu cực cơng chúng ức chế việc sử dụng nguồn liệu lớn cụ thể cho thống kê thức Lý ảnh hưởng thấp thực tế thỏa thuận việc sử dụng nguồn liệu lớn ký kết nhà cung cấp liệu Cơ quan Thống kê mà khơng có tham gia cơng chúng Để phịng ngừa nguy này, quan Thống kê cần chuẩn bị chiến lược truyền thông phù hợp trước vào sản xuất Truyền thông nên nhấn mạnh lợi ích việc sử dụng liệu lớn cho cơng dân, ví dụ: giảm gánh nặng cho người trả lời cải thiện liệu thống kê đảm bảo an toàn bảo mật liệu Chiến dịch truyền thông nên liên quan đến bên liên quan có liên quan với mục đích nâng cao nhận thức thơng báo cho cơng chúng mục đích sử dụng liệu lớn cho thống kê Trong bối cảnh này, người trả lời xem xét tính minh bạch yếu tố quan trọng chiến lược truyền thông 4.5 Mất uy tín - khơng cịn dựa quan sát Người dùng số liệu thống kê thức tin cậy cao tính xác hợp lệ liệu thống kê Điều dựa thực tế sản xuất liệu thống kê đặt khung phương pháp luận có sở cơng khai có sẵn tài liệu chất lượng sản phẩm thống kê Ngoài ra, hầu hết liệu thống kê dựa quan sát, tức có nguồn gốc từ điều tra tổng điều tra, tạo nên mối quan hệ dễ hiểu liệu thống kê quan sát Trung bình, khả xảy nguy đánh giá cách xa (khoảng 2) nguồn liệu điện thoại di động liệu máy quét giá, (gần 3) nguồn web- scraping phương tiện truyền thông xã hội Ảnh hưởng xuất nguy tương quan với khả xảy nguy cách tương ứng Các hoạt động phòng ngừa đề xuất bổ sung cho nguồn liệu lớn điều tra so sánh kết với kết từ nguồn truyền thống Nhưng số nguồn coi cơng cụ đo lường xác so với khảo sát (ví dụ: đồng hồ thơng minh) Trước tham gia vào sản xuất thống kê, BOSP công bố thử nghiệm bên liên quan khuyến khích tham gia BOSP để xác nhận tăng cường BOSP Ngoài ra, Cơ quan Thống kê nên đầu tư vào truyền thông, xây dựng chiến lược công bố phương pháp luận khoa học công nhận cộng đồng khoa học Làm giàu liệu với siêu liệu chất lượng, đảm bảo tính qn BOSP với BOSP khơng bảo tồn niềm tin cơng chúng Những nguy liên quan đến kĩ 5.1 Thiếu chuyên gia Nguy thiếu chuyên gia bao gồm nhận liệu từ nguồn liệu lớn này, Cơ quan Thống kê khả xử lý phân tích cách, nhân viên họ khơng có kỹ cần thiết Việc sử dụng liệu lớn đòi hỏi kỹ dựa mơ hình suy luận học máy, kỹ xử lý ngôn ngữ tự nhiên, xử lý tín hiệu âm xử lý hình ảnh hiểu biết tốt phương pháp tính toán phân bổ Khả xảy nguy người trả lời khảo sát, (2.6) đến mức xảy (3.7) thấp so với tác giả đưa trước mức xảy (4) đến thường xuyên (5) Khả thấp gán cho liệu máy quét giá Tuy nhiên, rõ ràng từ câu trả lời định tính cho thấy số người trả lời thừa nhận có ảnh hưởng biện pháp phòng ngừa đào tạo hợp tác Các yếu tố hạn chế thiếu hụt nguồn lực Cơ quan Thống kê khơng có khả huy động nguồn nhân lực nội có Những người khảo sát xem xét ảnh hưởng nguy này, từ lớn (2.9) đến mức quan trọng (3.5), thấp chút so với đánh giá ban đầu tác giả, đánh giá quan trọng (4) coi ảnh hưởng nguy thấp liệu máy quét giá cho nguồn khác Bên cạnh ý kiến tác giả đưa ra, biện pháp phòng ngừa ban đầu đào tạo tuyển dụng nhân viên, người trả lời khảo sát bổ sung thêm số biện pháp khác Hợp tác với học viện Cơ quan Thống kê khác, đề xuất tác biện pháp giảm thiểu, biện pháp phịng ngừa, nơi mà kiến thức chuyển giao cho nhân viên có trước thiếu kỹ trở thành vấn đề Các biện pháp tài chính, ví dụ hướng đến mức lương hấp dẫn hơn, đề xuất liên quan đến điều này, nâng cao nhận thức nhà hoạch định sách tầm quan trọng việc sử dụng nguồn liệu Về biện pháp giảm thiểu, người khảo sát đồng thuận đề xuất tác giả, hợp đồng phụ hợp tác, bổ sung tổng hợp thơng minh nguồn lực có, cách tích hợp số nhân viên với kỹ cần thiết nhóm làm việc, nguồn số lĩnh vực thống kê 5.2 Mất chuyên gia cho tổ chức khác Những người trả lời khảo sát đồng ý với đánh giá ban đầu tác giả khả xảy nguy (3.1-3.3), coi thấp chút so với kỹ liên quan đến liệu máy quét giá (2.5) Một yếu tố bổ sung xác định người trả lời làm tăng khả xảy loại sản phẩm liệu xây dựng tổ chức khác với Cơ quan thống kê, điều hấp dẫn Tuy nhiên, người hỏi xác định nguồn cung cấp ngày tăng nhà khoa học liệu hấp dẫn liệu lớn cho nhân viên có yếu tố giảm thiểu Mặc dù tác giả xem xét ảnh hưởng nguy giống việc thiếu kỹ năng, người hỏi cho thấp Ngay yếu tố ảnh hưởng ra, cụ thể phải liên tục huấn luyện nhân viên gián đoạn mà thu nhập nhân viên gây ra, hai lý cho ảnh hưởng kỹ thấp không bắt đầu, liệu lớn chuyển sang sản xuất, Cơ quan thống kê phát triển nhiều khả hệ thống sản xuất thiết lập địi hỏi chun mơn để trì xây dựng Bên cạnh biện pháp phòng ngừa tác giả xác định trước đây, cụ thể cung cấp hội học tập, mở rộng cho dự án ý tưởng thừa nhận nhân viên có khả sẵn sàng làm việc liệu lớn, người trả lời bổ sung thêm tiền lương tốt vận động để nhấn mạnh giá trị (xã hội tốt) làm việc số liệu thống kê thức Ngồi hợp đồng phụ hợp tác, trước biện pháp giảm thiểu, người trả lời xác định cải tiến thủ tục tuyển dụng nhanh đào tạo liên tục liệu lớn Các nguy khác người trả lời đề xuất Tổng cộng có thêm 13 nguy đề xuất người hỏi, đề xuất nhóm lại thành bốn nhóm Đầu tiên, có nguy liên quan đến biến động nguồn liệu Trong đó, khn khổ Wirthmann et al (2015) bao gồm nguy “Thao tác nguồn liệu”, thay đổi nguồn liệu thường diễn lý hoạt động mà khơng có thống kê Để trích dẫn người trả lời, “Vào tháng năm 2014, quan sát thấy 25% (thay đổi) số lượng tweet định vị địa lý Đây lập luận hấp dẫn cho việc thêm "biến động không chủ ý" vào nguy mở rộng "Thao tác nguồn liệu" cách xóa giới hạn mục đích độc hại Thứ hai, có vài gợi ý sở hạ tầng CNTT (“Thiếu thiết bị CNTT phù hợp để xử lý liệu đầy đủ”) Cũng kỹ khác, khung có lẽ nên mở rộng để bao gồm nguy “thiếu nguồn lực CNTT” Xem xét nguy kiện không lường trước được, cần thảo luận thêm thiếu sở hạ tầng CNTT đầy đủ cấu thành nguy vấn đề Một người trả lời đề xuất nguy liên quan đến cạnh tranh (“Cạnh tranh, bên cạnh Cơ quan Thống kê có nhà thu thập liệu khác (các ngân hàng, khác) xử lý liệu lớn mặt hàng (ví dụ, giá cả)” Thống kê thực mối đe dọa thống kê thức nói chung, trường hợp thống kê trình bày cách hấp dẫn, chất lượng - khơng thiết phải có nguy bối cảnh sản xuất thống kê thức dựa liệu lớn Cuối cùng, có đề xuất liên quan đến non nớt phương pháp luận (“cách đo độ xác liệu”, “tính quán độ tin cậy”, “lỗi liên kết EAN / PLU với COICOP”, “thay đổi chất lượng sản phẩm”) Điều coi tại, thực hiện, thách thức để giải quyết; khơng phải hiển nhiên nguy (nếu có) cho phép tăng lên Phần cuối Trong câu trả lời khảo sát cho thấy việc lựa chọn nguy Wirthmann et al (2015) có liên quan, người trả lời đề xuất thêm nguy cơ, cần xem xét cho liệu lớn dựa số liệu thống kê thức, sản phẩm tương lai Con số cao khả xảy ảnh hưởng gán cho nguy "truy cập liệu" "thiếu kỹ năng" Theo quan điểm chúng tôi, cộng đồng thống kê cần trọng vào biện pháp phòng ngừa giảm nhẹ cho nguy Các nguồn liệu mà hầu hết người trả lời chọn tự thể liệu điện thoại di động, phương tiện truyền thơng xã hội, liệu tìm kiếm web liệu máy quét giá Theo nhận xét nhận được, dường nguồn liệu thường xuyên nghiên cứu dự án liệu lớn tại; điều phù hợp với phát Consiglio et al (2016) Nhìn chung, khả xảy ảnh hưởng nguy đánh giá thấp người hỏi khảo sát so với Wirthmann cộng đưa (2015) Việc đánh giá khả xảy ảnh hưởng nguy phụ thuộc vào nguồn liệu Cả hai tính tốn dường thấp cho nguồn liệu sử dụng Cơ quan thống kê liệu máy quét so với nguồn có kinh nghiệm Ý kiến người trả lời cho Cơ quan Thống kê Quốc gia bắt đầu xác định thực biện pháp giảm thiểu phòng ngừa để quản lý nguy liên quan đến nguồn liệu tốt 8 References Daas, P., M Puts, B Buelens and P van den Hurk 2015 “Big Data as a Source for Official Statistics” Journal of Official Statistics Volume 31, Issue 2, Pages 249-262, ISSN (Online) 2001-7367, DOI: 10.1515/jos-2015-0016 Di Consiglio, L, M Karlberg, M Skaliotis and I Xirouchakis (2016; forthcoming), paper for the invited overview lecture "Overview of big data research in European statistical agencies" to be delivered at ICES V Eurostat (2014), "Accreditation procedure for statistical data from non-official sources" in Analysis of Methodologies for using the Internet for the collection of information so ciety and other statistics, http://www.cros-portal.eu/content/analysismethodologies-usinginternet-collection-information-society-and-other-statistics-1 Reimsbach-Kounatze, C (2015), “The Proliferation of “Big Data” and Implications for Official Statistics and Statistical Agencies: A Preliminary Analysis”, OECD Digital Economy Papers, No 245, OECD Publishing http://dx.doi.org/10.1787/5js7t9wqz vg8-en Reis, F., Ferreira, P., Perduca, V (2014) "The use of web activity evidence to increas e the timeliness of official statistics indicators", paper presented at IAOS 2014 conferenc, https://iaos2014.gso.gov.vn/document/reis1.p1.v1.docx Statistics Netherlands (2015), "A first for Statistics Netherlands: launching statistics based on Big Data", https://www.cbs.nl/NR/rdonlyres/4E3C7500-03EB-4C54- 8A0A753C017165F2/0/afirstforlaunchingstatisticsbasedonbigdata.pdf UNECE (2014), "How big is Big Data? Exploring the role of Big Data in Official Statistics", http://www1.unece.org/stat/platform/download/attachments/99484307/Virtua l%20Sprint% 20Big%20Data%20paper.docx? version=1&modificationDate=1395217470975&api=v2 Wirthmann A, Karlberg, M., Kovachev B., Reis F., (2015), "Structuring risks and solutions in the use of big data sources for producing official statistics – Analysis based on a risk and quality framework", http://www.unece.org/fileadmin/DAM/stats/documents/ece/ces/ge.44/2015/mtg1/ WP18Wirthmann_AD.pdf ... lại việc sử dụng liệu lớn cho thống kê thức Nguy đề cập đến tình có nhận thức tiêu cực việc sử dụng liệu lớn cho thống kê thức, dẫn đến hạn chế bổ sung chí cản trở việc sử dụng nguồn liệu lớn định... số phần mềm để thay đổi hồn tồn nguồn liệu lớn" Nếu khơng có cách để sản xuất số liệu thống kê dựa liệu lớn mà lại khơng có liệu lớn, khắc phục thiếu truy cập, nỗ lực phải chấm dứt, số liệu thống. .. sở cơng khai có sẵn tài liệu chất lượng sản phẩm thống kê Ngoài ra, hầu hết liệu thống kê dựa quan sát, tức có nguồn gốc từ điều tra tổng điều tra, tạo nên mối quan hệ dễ hiểu liệu thống kê quan

Ngày đăng: 14/05/2021, 11:22

Tài liệu cùng người dùng

Tài liệu liên quan