1. Trang chủ
  2. » Thể loại khác

DỮ LIỆU LỚN VÀ XU HƯỚNG ĐỔI MỚI SÁNG TẠO DỰA TRÊN DỮ LIỆU

66 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Tổng luận số /2015 DỮ LIỆU LỚN VÀ XU HƯỚNG ĐỔI MỚI SÁNG TẠO DỰA TRÊN DỮ LIỆU CỤC THÔNG TIN KHOA HỌC VÀ CÔNG NGHỆ QUỐC GIA Địa chỉ: 24, Lý Thường Kiệt, Hoàn Kiếm, Hà Nội Tel: (04)38262718, Fax: (04)39349127 Ban biên tập: TS Lê Xuân Định (Trưởng ban), KS Nguyễn Mạnh Quân, ThS Đặng Bảo Hà, ThS Phùng Anh Tiến Mục lục Trang Lời giới thiệu Các chữ viết tắt I ĐỔI MỚI DỰA TRÊN DỮ LIỆU - NGUỒN LỰC TĂNG TRƯỞNG VÀ PHÁT TRIỂN KINH TẾ 1.1 Dữ liệu lớn khái niệm liên quan 1.2 Giá trị liệu ngày gia tăng kinh tế 11 1.3 Đổi sáng tạo dựa liệu - nguồn lực tăng trưởng phát triển 19 II CÁC CƠNG NGHỆ VÀ CHÍNH SÁCH THÚC ĐẨY ĐỔI MỚI SÁNG TẠO DỰA TRÊN DỮ LIỆU 28 2.1 Các kênh khai thác đổi sáng tạo dựa liệu để phục vụ tăng trưởng kinh tế 28 2.2 Các công nghệ thúc đẩy đổi sáng tạo dựa liệu 39 3.3 Các vấn đề sách để khai thác đổi dựa sáng tạo liệu nguồn lực tăng trưởng 53 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 64 Lời giới thiệu Thế giới chứng kiến cách mạng công nghiệp thúc đẩy liệu số, tính tốn tự động hóa Sự giao thoa số xu hướng công nghệ kinh tế xã hội, bao gồm việc sử dụng Internet ngày tăng suy giảm chi phí thu thập, truyền tải, lưu trữ phân tích liệu, dẫn đến việc tạo khối lượng liệu khổng lồ - gọi chung "dữ liệu lớn" (Big Data), nguồn lực khai thác để thúc đẩy hình thành ngành cơng nghiệp mới, quy trình sản phẩm Các hoạt động kinh tế xã hội từ lâu dựa vào liệu Tuy nhiên đây, khối lượng, tốc độ chủng loại liệu sử dụng gia tăng mạnh mẽ phạm vi toàn kinh tế, quan trọng giá trị kinh tế xã hội lớn chúng mở hội thay đổi hướng tới mô hình kinh tế xã hội dựa liệu Trong mơ hình này, liệu tài sản cốt lõi tạo lợi cạnh tranh quan trọng, chi phối đổi sáng tạo, tăng trưởng phát triển bền vững Đổi sáng tạo dựa vào liệu có giá trị kinh tế to lớn, với doanh thu từ sản phẩm dịch vụ Dữ liệu lớn vượt 18 tỷ USD năm 2013, theo Feff Kelly (2014) giá trị đạt 50 tỷ USD vào năm 2017 Để thực hóa trọn vẹn tiềm liệu lớn, quốc gia cần có khn khổ sách quán, phù hợp thu thập, truyền tải, lưu trữ, cung cấp sử dụng liệu, đặc biệt lĩnh vực bảo vệ quyền riêng tư, tiếp cận liệu mở, kỹ việc làm, sở hạ tầng đo lường, v.v Đây nội dung thơng tin mà Tổng luận "Dữ liệu lớn xu hướng đổi sáng tạo dựa liệu" muốn cung cấp với độc giả Tài liệu biên soạn dựa báo cáo OECD vai trò tiềm liệu phân tích liệu việc tạo ưu cạnh tranh hình thành vốn tri thức, thúc đẩy đổi sáng tạo tăng trưởng bền vững Phần đầu Tài liệu cung cấp khái niệm định nghĩa công nhận rộng rãi Dữ liệu lớn, việc tạo sử dụng liệu lĩnh vực ứng dụng kinh tế Tiếp theo tài liệu mô tả cách thức khai thác liệu nguồn lực thúc đẩy tăng trưởng kinh tế phát triển bền vững, phần cuối, tài liệu đề cập đến vấn đề sách chủ yếu hoạch định sách cơng nhằm thúc đẩy đổi sáng tạo dựa vào liệu Xin trân trọng giới thiệu CỤC THÔNG TIN KH&CN QUỐC GIA Bảng chữ viết tắt API Giao diện lập trình ứng dụng BI Trí tuệ doanh nghiệp CAGR Tỷ lệ tăng trưởng tổng hợp lũy kế hàng năm DDI Đổi sáng tạo dựa vào tăng trưởng HDD Ổ đĩa cứng ICT Công nghệ thông tin - truyền thông IoT Internet kết nối vạn vật KBC Vốn tri thức M&A Mua bán sáp nhập M2M Giao tiếp máy tới máy NC&PT Nghiên cứu phát triển NoSQL Cơ sở liệu phân tán không quan hệ OECD Tổ chức hợp tác phát triển kinh tế PET Công nghệ bảo vệ quyền riêng tư PMNM Ứng dụng phần mềm nguồn mở PSI Thông tin khu vực công SHTT Sở hữu trí tuệ SMS Tin nhắn văn SSD Ổ đĩa thể rắn I ĐỔI MỚI DỰA TRÊN DỮ LIỆU - NGUỒN LỰC TĂNG TRƯỞNG VÀ PHÁT TRIỂN KINH TẾ 1.1 Dữ liệu lớn khái niệm liên quan Trong thời đại nay, liệu ngày thấm sâu vào sống người hết Chúng ta mong muốn sử dụng liệu để giải vấn đề, nâng cao phúc lợi tạo thịnh vượng kinh tế Việc thu thập, lưu trữ, phân tích liệu tuân theo quỹ đạo có xu hướng lên dường khơng có ranh giới, hoạt động thúc đẩy gia tăng lực xử lý, chi phí giảm mạnh tính tốn lưu trữ, số lượng ngày tăng công nghệ cảm biến nhúng tất loại thiết bị Vào năm 2011, số ước tính khối lượng thơng tin tạo chép lại vượt mức 1,8 zettabytes Trong năm 2013, ước tính có zettabytes liệu tạo toàn giới zettabyte (ZB) = 1021bytes Một byte tương đương với ký tự văn Có thể tưởng tượng rằng, giây, người dân Hoa Kỳ chụp ảnh số, liên tục vịng tháng Tất số ảnh đem tập hợp lại với khoảng zettabyte Mỗi ngày có 500 triệu ảnh tải lên chia sẻ mạng xã hội, với đoạn video với độ dài tổng cộng đến 200 tải lên phút Nhưng khối lượng thông tin mà người tự tạo ra, thông tin liên lạc gồm gọi thoại, email văn bản, ảnh, video âm nhạc tải lên khơng so với lượng thơng tin số tạo chúng ngày Các xu hướng tiếp diễn Hiện vào giai đoạn sơ khai gọi "Internet vạn vật" (IoT), tất thiết bị, phương tiện công nghệ "mang người" giao tiếp với Các tiến cơng nghệ làm giảm chi phí việc tạo ra, thu thập, quản lý lưu trữ thơng tin xuống cịn phần sáu chi phí tính vào năm 2005 Và kể từ năm 2005, đầu tư doanh nghiệp vào phần cứng, phần mềm, nhân lực dịch vụ tăng 50% đạt nghìn tỷ USD "Internet vạn vật" thuật ngữ dùng để mơ tả khả thiết bị giao tiếp với sử dụng cảm biến nhúng, liên kết với thông qua mạng kết nối có dây khơng dây Các thiết bị bao gồm nhiệt kế, xe chí viên thuốc mà bạn nuốt vào để bác sĩ theo dõi sức khỏe máy tiêu hóa bạn Các thiết bị kết nối sử dụng Internet để truyền, diễn giải phân tích liệu 1.1.1 Dữ liệu yếu tố thúc đẩy tạo sử dụng liệu Việc số hóa gần phương tiện truyền thơng chuyển hướng ngày tăng hoạt động kinh tế xã hội sang sử dụng Internet (thông qua dịch vụ điện tử mạng xã hội, thương mại điện tử, y tế điện tử phủ điện tử) tạo nhiều petabyte (hàng triệu gigabyte) liệu sau giây Ví dụ mạng kết nối xã hội Facebook biết có đến 900 triệu người tham gia toàn giới tạo trung bình 1500 trạng thái cập nhật giây (Hachman, 2012; Bullas, 2011) Với việc khai thác kết nối (thế giới thực) ngày tăng cảm biến thông qua mạng cố định di động (mạng cảm biến), ngày có nhiều hoạt động ngoại tuyến ghi lại kỹ thuật số, dẫn đến sóng bổ sung liệu không ngừng Nhiều tài liệu rằng, riêng năm 2010, doanh nghiệp lưu trữ tổng thể exabyte (hàng tỷ gigabyte) liệu ổ đĩa, người tiêu dùng bảo quản exabyte liệu (MGI, 2011) Điều dẫn đến lượng liệu tích lũy ước tính 1000 exabyte vào năm 2010; nhà phân tích ước tính số tăng lên gấp 40 lần vào cuối thập kỷ (IDC, 2012) Hình 1: Kho liệu ước tính phạm vi toàn giới, đơn vị exabyte (tỷ gigabyte) Nguồn: OECD dựa dự báo nghiên cứu IDC Digital Universe Tạo liệu, thu thập truyền tải Lượng liệu gia tăng cách mạnh mẽ chủ yếu bị tác động hội tụ phát triển công nghệ quan trọng, đáng ý truy cập băng thông rộng nơi phổ biến thiết bị ứng dụng ICT thông minh, dụng cụ đo thông minh, lưới điện giao thông vận tải thông minh dựa mạng cảm biến giao tiếp máy với máy (M2M) Chi phí truy cập Internet giảm mạnh vịng 20 năm qua yếu tố chi phối quan trọng Ví dụ vào năm 2011, người tiêu dùng Pháp phải trả khoảng 33 USD tháng cho kết nối băng thông rộng tốc độ 51 Mbit/s, chi phí cho kết nối quay số (với tốc độ chậm đến 1000 lần) 75 USD vào năm 1995 Điện thoại di động trở thành thiết bị thu thập liệu hàng đầu, kết hợp liệu định vị địa lý với kết nối Internet để hỗ trợ dịch vụ phạm vi rộng ứng dụng liên quan đến giao thông, môi trường y tế Nhiều dịch vụ ứng dụng dựa (hoặc tham gia vào) việc thu thập sử dụng liệu cá nhân Bổ sung cho truy cập Internet ngày gia tăng hiệu hơn, hầu hết thiết bị di động trang bị mảng giao thức gia tăng để trao đổi liệu cục (như Wifi, Bluetooth, Near Field Communications (NFC) với khả truyền liệu ngang hàng (peer-to-peer) Các thiết bị cịn quay video, chụp ảnh ghi âm (thường gắn với thơng tin định vị) Vào năm 2011, tồn giới có gần sáu tỷ thuê bao di động, khoảng 13% (780 triệu) điện thoại thơng minh có khả thu thập truyền liệu định vị địa lý (ITU, 2012; Cisco, 2012) Cũng vào năm này, thiết bị điện thoại di động tạo khoảng 600 petabyte (triệu gigabyte) liệu tháng (Cisco, 2012) Với phổ cập điện thoại di động (số thuê bao 100 dân) vượt 100% hầu OECD phổ biến băng thông rộng khơng dây đạt gần 50%, nguồn liệu gia tăng đáng kể mà điện thoại thông minh trở thành thiết bị cá nhân phổ biến Cisco (2012) ước tính lưu lượng liệu sản sinh từ điện thoại di động đạt gần 11 exabyte (hàng tỷ gigabyte) vào năm 2016, có nghĩa tăng gần gấp đơi năm (xem hình 2) Hình 2: Lưu lượng IP toàn cầu hàng tháng, 2005-16 Đơn vị: exabyte (1 exabyte = tỷ gigabyte) Nguồn: OECD dựa số liệu Cisco (2012) Sự gia tăng liệu di động không gia tăng số điện thoại di động, dự báo chiếm đến nửa tổng lưu lượng di động vào năm 2016 (Cisco, 2012) Các thiết bị thông minh khác phát triển chí cịn nhanh Ví dụ, dụng cụ đo thông minh thu thập truyền liệu thời gian thực ngày tăng (OECD, 2012), xe tơ thơng minh truyền liệu thời gian thực trạng linh kiện xe môi trường (OECD, 2012) Nhiều thiết bị thông minh số dựa sở mạng kết nối cảm biến thiết bị kèm cảm nhận tương tác với môi trường thông qua mạng di động Các cảm biến thiết bị kèm trao đổi liệu thông qua kết nối không dây "tạo khả tương tác người hay máy tính với mơi trường xung quanh" (Verdone et al., 2008) Hơn 30 triệu cảm biến kết nối tương tác triển khai phạm vi toàn giới lĩnh vực an ninh, y tế, môi trường, hệ thống giao thông vận tải hay hệ thống kiểm soát lượng, số lượng chúng tăng lên với tỷ lệ khoảng 30% năm (MGI, 2011) 1.1.2 Lưu trữ xử lý liệu Nếu phát triển công nghệ nêu chủ yếu thúc đẩy sản sinh truyền tải liệu, việc sử dụng liệu trở nên dễ dàng nhiều nhờ vào giảm mạnh chi phí lưu trữ, xử lý phân tích liệu Trước đây, chi phí lưu trữ liệu khơng khuyến khích việc giữ lại liệu khơng cịn khơng cịn cần thiết (OECD, 2011) Nhưng chi phí lưu trữ giảm đến mức thấp để lưu trữ liệu thời gian dài, chí vơ thời hạn Điều minh họa qua chi phí trung bình cho gigabyte ổ đĩa cứng (HDD), chi phí giảm từ 56 USD năm 1998 xuống 0,05 USD năm 2012, tốc độ giảm trung bình hàng năm gần 40% (xem hình 3) Với cơng nghệ lưu trữ hệ ổ đĩa thể rắn (SSD) chẳng hạn, chi phí gigabyte chí cịn giảm nhanh Hình 3: Chi phí trung bình lưu trữ liệu cho người tiêu dùng, 1998-2012 Đơn vị: USD/gigabyte Nguồn: OECD sở Pingdom (2011) Định luật Moore phát biểu tính xử lý tăng gấp đôi sau 18 tháng, liên quan đến chi phí hay độ lớn chủ yếu xác minh Điều đặc biệt đáng ý công cụ xử lý liệu, chúng ngày trở nên có tính mạnh, tinh xảo, diện nơi có giá rẻ, tạo điều kiện dễ dàng tìm kiếm liệu, kết nối truy xuất nguồn gốc, khơng phủ tập đồn lớn mà nhiều người khác thực Ví dụ lĩnh vực di truyền, máy lập trình tự gen ADN đọc khoảng 26 triệu ký tự mã di truyền người chưa đầy phút, chi phí lập trình tự gen giảm 60% năm, trung bình từ 100 triệu USD năm 2001 xuống chưa đến 10.000 USD vào năm 2012 (xem hình 4) Hình 4: Chi phí lập trình tự gen, 2001-11 Đơn vị USD (theo thang đo logarit) Nguồn: OECD dựa theo Viện nghiên cứu gen người quốc gia Hoa Kỳ (www.genome.gov/sequencingcosts/) Điện tốn đám mây đóng vai trị quan trọng việc gia tăng khả lưu trữ xử lý liệu Nó mơ tả "mơ hình dịch vụ tính tốn dựa tập hợp tài ngun máy tính truy cập theo cách thức linh hoạt, mềm dẻo theo nhu cầu với yêu cầu quản lý thấp" (OECD, 2012) Đặc biệt, doanh nghiệp vừa nhỏ (SMEs), phủ khơng thể khơng muốn thực đầu tư lớn, phải toán trước cho cơng nghệ ICT, điện tốn đám mây mang lại khả cho tổ chức chi trả cho nguồn lực siêu tính tốn theo phương thức chi tiêu tùy theo khả (pay-as-you-go) Các ứng dụng phần mềm nguồn mở (PMNM) bao gồm đầy đủ giải pháp cần thiết cho liệu lớn, chẳng hạn để lưu trữ, xử lý phân tích (bao gồm hiển thị trực quan - visualization), góp phần đáng kể vào việc làm cho phân tích liệu lớn tiếp cận đến dân số rộng lớn Nhiều công cụ liệu lớn công ty Internet phát triển ban đầu phổ biến rộng khắp kinh tế tạo hàng hóa dịch vụ dựa vào liệu Ví dụ, Hadoop, khung lập trình mã nguồn mở để quản trị liệu phân tán, lấy cảm hứng từ báo nhân viên Google, Dean Ghemawat (2004) Ban đầu Yahoo! tài trợ công ty Internet Amazon, Facebook 11, 12 LinkedIn khai thác tiếp tục phát triển, sau cung cấp nhà cung cấp sở liệu máy chủ doanh nghiệp truyền thống IBM, Oracle, Microsoft, SAP phần dòng sản phẩm họ, sử dụng rộng rãi cho hoạt động liệu chuyên sâu doanh nghiệp thuộc đủ loại Wal-Mart (bán lẻ), Chevron (năng lượng) Morgan Stanley (dịch vụ tài chính) Ngày có nhiều nhà phân tích liệu chun mơn hóa nhà mơi giới liệu chào mời liệu để sử dụng cho mục đích quảng cáo, kiểm tra lý lịch tuyển dụng việc làm, cấp tín dụng thực thi pháp luật Số doanh nghiệp chào bán liệu tăng mạnh năm gần Tại thời điểm năm 2013, tổ chức privacyrights.org liệt kê riêng Hoa Kỳ có đến 180 cơng ty mơi giới liệu trực tuyến đăng ký Các hãng môi giới liệu đa dạng, từ công ty chun mơn hóa doanh nghiệp (business-to-business) đến dịch vụ nội hóa đơn giản Có thể kể đến công ty LexisNexis tuyến bố họ tiến hành 12 triệu kiểm tra lý lịch năm, BlueKai Exchange tuyên bố thị trường liệu lớn giới cho nhà quảng cáo, công ty sở hữu liệu 300 triệu người tiêu dùng 30.000 thuộc tính liệu Theo thông tin công bố trang web mình, BlueKai Exchange cho biết họ xử lý 750 triệu kiện liệu giao dịch, thực 75 triệu bán đấu giá thông tin cá nhân ngày 1.1.3 Định nghĩa liệu lớn Có nhiều định nghĩa "dữ liệu lớn" (Big data), chúng khác tùy thuộc vào việc bạn nhà khoa học máy tính, nhà phân tích tài hay doanh nhân thuyết minh ý tưởng đầu tư mạo hiểm Nhiều tác giả mô tả đơn giản "dữ liệu lớn" kho chứa liệu lớn (Large pools of data) (McGuire et al., 2012) Loukides (2010) định nghĩa liệu mà "chính thân độ lớn liệu trở thành phần vấn đề" Viện Nghiên cứu toàn cầu McKinsey (McKinsey Global Institute - MGI) đưa định nghĩa tương tự "đó liệu có độ lớn vượt q khả cơng cụ phần mềm sở liệu tiêu biểu nắm bắt, lưu trữ, quản trị phân tích" Hầu hết định nghĩa phản ánh lực công nghệ ngày gia tăng để nắm bắt, tổng hợp xử lý khối lượng liệu với độ lớn, tốc độ đa dạng lớn chưa thấy Nói theo cách khác, "dữ liệu cung cấp nhanh hơn, độ bao phủ phạm vi 10 Giá trị trung bình cụm Số cụm c) Dịng lịch sử Dòng lịch sử kỹ thuật trực quan hóa lập biểu đồ tiến hóa tài liệu biên tập nhiều tác giả Thời gian nằm trên trục hoành, đóng góp vào văn nằm trục tung; tác giả có mã màu khác chiều dài trục tung biểu thị số lượng văn viết tác giả Bằng cách trực quan hóa lịch sử tài liệu theo cách này, hiểu biết khác dễ dàng xuất d) Dịng thơng tin khơng gian Một kỹ thuật trực quan hóa khác kỹ thuật mơ tả dịng thơng tin khơng gian Ví dụ chúng tơi có tên gọi New York Talk Exchange Nó cho thấy lượng dòng liệu giao thức Internet New York thành phố khắp giới Kích thước ánh sáng vị trí thành phố cụ thể tương ứng với tổng lưu lượng IP lưu thơng nơi TP New York; ánh sáng sáng hơn, dịng lưu thơng lớn Sự trực quang hóa cho phép xác định cách nhanh chóng thành phố kết nối chặt chẽ với New York khối lượng thông tin liên lạc chúng 52 2.2.4 Phổ biến liệu Các tổ chức, bao gồm quan phủ, thường muốn chia sẻ liệu họ với tổ chức khác Trước đây, liệu thường phổ biến thông qua phương tiện số, chẳng hạn đĩa CD, sử dụng đối tượng vật lý để phổ biến có hạn chế định khối lượng liệu hạn chế, phân bổ chậm tốn Hiện nay, liệu có trang web, thường miễn phí trực tiếp cho người sử dụng Một số tổ chức cung cấp quyền truy cập vào tập liệu thô; tổ chức khác phát triển giao diện lập trình ứng dụng để nhà phát triển khác tái sử dụng liệu họ dễ dàng Gần hơn, phần mềm chuyên dụng quản lý số lượng lớn liệu mở tổ chức xây dựng, chủ yếu từ doanh nghiệp khởi nghiệp Socrata Phần mềm tương đối phần mềm khác bắt đầu xuất gần Trong số trường hợp, tổ chức phát triển tảng phổ biến liệu mở họ nội tổ chức; ví dụ Data.gov Hoa Kỳ Những nhà sáng tạo tảng sau phổ biến phần mềm họ cho cộng đồng nguồn mở 2.2.5 Cơ sở hạ tầng liệu lớn Phân tích liệu lớn địi hỏi khơng thuật tốn liệu, mà sở vật chất, nơi lưu trữ phân tích liệu Các dịch vụ an ninh liên quan sử dụng liệu cá nhân thành phần thiết yếu sở hạ tầng Trước loại sở hạ tầng thường thuộc tổ chức lớn, phổ biến đến doanh nghiệp nhỏ cá nhân thông qua "đám mây" Khi mà phạm vi chia sẻ sở hạ tầng phần mềm mở rộng, dịch vụ sở hạ tầng bảo mật thông tin cá nhân sử dụng dễ dàng Các trung tâm liệu Một cách để nghĩ tới tảng liệu lớn sở vật chất "trung tâm liệu" Trong năm gần đây, trung tâm liệu trở thành loại hàng hóa gần đạt chuẩn Một trung tâm liệu điển hình tịa nhà lớn, giống kho chứa bê tơng kích thước vài sân bóng đá Nó đặt vị trí tiếp cận nguồn điện giá rẻ với kết nối cáp quang kết nối trực tiếp với mạng xương sống Internet, thường vùng nông thôn biệt lập Các trung tâm liệu điển hình tiêu thụ 20-40 megawatt điện (tương đương với thành phố 20.000-40.000 dân) chứa đến hàng chục ngàn máy chủ ổ đĩa cứng, với tổng số lên đến hàng chục petabytes Trên giới, có khoảng 6000 trung tâm liệu đạt quy mô này, Hoa Kỳ chiếm khoảng nửa số Các trung tâm liệu vị trí cụ thể liệu lớn với hình thức Các tập hợp liệu lớn thường chép nhiều trung tâm liệu để nâng cao tính hiệu suất độ chắn Hiện thị trường dịch vụ trung tâm liệu phát triển nhanh Công nghệ phần mềm chuyên dụng cho phép liệu nhiều trung tâm liệu 53 (và phân tán qua hàng chục ngàn vi xử lý ổ đĩa cứng) tác hợp để thực nhiệm vụ phân tích liệu, qua cho phép mở rộng quy mơ hiệu suất tốt Ví dụ, MapReduce (vốn công nghệ độc quyền Google, thuật ngữ sử dụng tổng qt) mơ hình lập trình hoạt động thực thi song song vi xử lý với số lượng gần không giới hạn; Hadoop tảng lập trình mã nguồn mở phổ biến thư viện lập trình dựa ý tưởng tương tự; NoSQL (Not Structured Query Language) tập hợp công nghệ sở liệu, tháo gỡ nhiều giới hạn sở liệu truyền thống "quan hệ", cho phép mở rộng tốt nhiều xử lý nhiều trung tâm liệu Nghiên cứu đương đại nhằm vào hệ Hadoop Đại diện nhánh Accumulo, Cơ quan An ninh Quốc gia Hoa Kỳ khởi xướng chuyển tiếp thành cộng đồng mã nguồn mở Apache Một ví dụ khác Berkeley Data Analytics Stack, tảng mã nguồn mở vượt trội Hadoop phân tích liệu từ nhiều nhớ (memory-intensive) sử dụng công ty Foursquare, Conviva, Klout, Quantifind, Yahoo, Amazon Web Services Đôi gọi "NoHadoop" (dịch chuyển từ SQL sang NoSQL), công nghệ phù hợp với xu hướng bao gồm Dremel Google, MPI (thường sử dụng siêu máy tính), Pregel (sử dụng cho đồ họa), Cloudscale (phân tích thời gian thực) Đám mây Có thể hiểu "đám mây" tập hợp tảng dịch vụ thực nhờ vào việc thơng dụng hóa vật chất trung tâm liệu Khi nói liệu nằm "trong đám mây", không đề cập đến ổ đĩa cứng cụ thể tồn (ở nơi đó) với liệu, mà sở hạ tầng phức tạp gồm chương trình ứng dụng, phần mềm lớp trung gian (middleware), giao thức mạng, mơ hình kinh doanh cho phép liệu đăng nhập, truy cập, sử dụng, tất với chi phí phân phối cạnh tranh Các tổ chức thương mại cung cấp đám mây tồn hệ sinh thái có nhiều cấp thứ bậc nhiều mơ hình giá trị gia tăng khác tồn Ở có nhiều cách chuyển giao trách nhiệm người dùng cuối trung tâm liệu cụ thể Các nhà cung cấp đám mây mang lại số lợi ích an ninh (và thơng qua đó, lợi ích bảo mật) so với trung tâm liệu thông thường doanh nghiệp trước hay máy tính doanh nghiệp nhỏ Các dịch vụ bao gồm bảo vệ giám sát tốt hơn, hỗ trợ tập trung hóa nhân lực, đào tạo, giám sát Các dịch vụ đám mây đặt nhiều thách thức an ninh, đối tượng nghiên cứu Cả lợi ích rủi ro xuất phát từ tập trung hóa nguồn lực: Thêm nhiều liệu tổ chức cụ thể nắm giữ (mặc dù phân bố nhiều máy chủ trang web), nhà cung cấp đám mây thực tốt so với trung tâm liệu tổ chức riêng biệt cách áp dụng tiêu chuẩn cao tuyển dụng quản lý người hệ thống Việc sử dụng đám mây tương tác cá nhân với (bất kể cố ý hay không) 54 dự báo tăng mạnh năm tới Sự gia tăng hai ứng dụng di động, tăng cường sử dụng điện thoại di động máy tính bảng tảng, cảm biến phân bổ rộng có liên quan với việc sử dụng ngày tăng hệ thống đám mây để lưu trữ, xử lý, tác nghiệp dựa thơng tin khác đóng góp thiết bị phân tán Mặc dù tiến môi trường di động cải thiện khả sử dụng ứng dụng đám mây di động, nhiên gây phương hại đến tính riêng tư đến mức che giấu hiệu trao đổi thơng tin từ người sử dụng Khi có thêm tính di động lõi chuyển sang đám mây, lượng lớn thông tin trao đổi, người dùng ngạc nhiên chất thơng tin khơng cịn cục hóa điện thoại di động Ví dụ, hình hiển thị (screen rendering) dựa đám mây (hoặc "màn hình ảo hóa") cho điện thoại di động có nghĩa hình ảnh hiển thị hình điện thoại di động thực tế tính tốn đám mây truyền đến thiết bị di động Điều có nghĩa tất hình ảnh hình thiết bị di động truy cập thao tác từ đám mây Kiến trúc đám mây sử dụng ngày tăng để hỗ trợ phân tích liệu lớn, doanh nghiệp lớn (như Google, Amazon, eBay) doanh nghiệp nhỏ hay cá nhân, người sử dụng đột xuất hay thường xuyên tảng đám mây công cộng (như Amazon Web Services, Google Cloud Platform, Microsoft Azure) thay cho việc mua sắm sở hạ tầng riêng Các dịch vụ truyền thông xã hội Facebook Twitter triển khai phân tích nhà cung cấp thông qua sử dụng hệ thống đám mây Các dịch vụ đại diện cho dạng dân chủ hóa phân tích, có tiềm tạo điều kiện thuận lợi cho doanh nghiệp nhiều Triển vọng tương lai bao gồm khám phá phương án hợp kết nối ứng dụng đám mây làm giảm số không đồng giao diện lập trình ứng dụng cho ứng dụng đám mây 3.3 Các vấn đề sách để khai thác đổi dựa sáng tạo liệu nguồn lực tăng trưởng 3.3.1 Các thách thức sách đặt đổi sáng tạo dựa liệu Chính phủ có vai trò quan trọng việc thúc đẩy điều kiện thuận lợi cho đổi sáng tạo dựa liệu diễn môi trường đáng tin cậy Sau thách thức sách xác định nay: Xem xét toàn vòng đời giá trị liệu Việc thiết kế sách hiệu để thúc đẩy đổi dựa liệu, giảm thiểu rủi ro, đòi hỏi hiểu biết q trình tạo giá trị Một số sách (như truy cập mở đến liệu) ảnh hưởng đến giai đoạn cụ thể vòng đời giá trị liệu sách khác (ví dụ bảo mật riêng tư) có tác động đến tồn vịng đời giá trị Việc xem xét tồn vịng đời giá trị liệu quan trọng nhiều lĩnh vực sách bổ sung cho Nói cách khác, việc tập trung vào lĩnh vực sách có tác động khơng hỗ trợ biện 55 pháp sách bổ sung Ví dụ, việc thúc đẩy truy cập mở kinh tế mà khơng thúc đẩy kỹ phân tích liệu tinh thần kinh doanh liên quan đến liệu khơng đưa đến lợi ích đầy đủ đổi sáng tạo dựa liệu phạm vi quốc gia Hình 8: Các giai đoạn vòng đời giá trị liệu vấn đề sách Dữ liệu hóa thu thập liệu Phân tích liệu Quyết định dựa liệu Mở rộng lượng liệu thu thập Tăng cường lực phân tích liệu Thúc đẩy việc định có trách nhiệm cho tăng trưởng phồn thịnh - Hạ tầng điện toán đám mây - Năng lực lĩnh vực cụ thể - Nhà khoa học liệu - Tinh thần kinh doanh - Dữ liệu mở - Tính di chuyển liệu Các vấn đề sách liên quan: Tính riêng tư, quyền sở hữu trí tuệ, cạnh tranh, thuế, thương mại Bảo vệ hiệu riêng tư quyền tự cá nhân Việc sợ quyền tự chủ tự tạo phản ứng mạnh đổi dựa liệu, dẫn đến tham gia cá nhân miễn cưỡng đóng góp liệu cá nhân, nguồn liệu cần thiết cho đổi dựa liệu Do đó, việc bảo vệ hiệu riêng tư điều kiện quan trọng để trì lịng tin vào đổi dựa liệu Chính phủ nên khuyến khích việc bảo vệ hiệu riêng tư xem xét tồn vịng đời giá trị liệu, từ sưu tập liệu, đến phân tích liệu, đến định dựa liệu Các biện pháp sau áp dụng: (i) tăng cường thực tiễn phân tích liệu minh bạch, (ii) tiếp cận tốt trao quyền cho chủ thể liệu (chủ thể liệu cá nhân mà liệu có liên quan đến họ), (iii) thúc đẩy việc sử dụng 56 liệu có trách nhiệm người kiểm soát liệu (người kiểm soát liệu người với người khác xác định mục tiêu cách thức tổ chức xử lý liệu cá nhân) (iv) thúc đẩy quản lý rủi ro quyền riêng tư bao gồm tất bên liên quan Thúc đẩy văn hóa quản lý rủi ro kỹ thuật số toàn hệ sinh thái liệu Phương pháp bảo đảm an ninh truyền thống hạn chế việc thực hóa lợi ích đổi dựa liệu Chính phủ cần thúc đẩy văn hóa quản lý rủi ro an ninh kỹ thuật số u cầu người kiểm sốt liệu nhà định hiểu cách thức để tiếp cận an ninh bối cảnh kỹ thuật số để phục vụ tốt mục tiêu kinh tế xã hội họ Việc đẩy mạnh văn hóa quản lý rủi ro thường gắn liền với hiểu biết chu trình quản lý rủi ro an ninh kỹ thuật số bao gồm bước sau: đánh giá rủi ro (bước 1) xử lý rủi ro (bước 2), tức xác định xem cần phải xử lý rủi ro (bước 3), giảm thiểu rủi ro (bước 4), chuyển cho người khác (ví dụ thơng qua hợp đồng, bảo hiểm hay thoả thuận hợp pháp khác) (bước 5) tránh rủi ro cách không thực hoạt động (bước 6) Nếu người định giảm thiểu rủi ro, việc đánh giá rủi ro giúp xác định biện pháp an ninh cần lựa chọn áp dụng đâu nào, đứng góc độ hậu kiện không chắn mục tiêu kinh tế xã hội (bước 7) Cuối cùng, rủi ro cịn lại khơng thể bỏ qua Một kế hoạch chuẩn bị (bước 8) cần thiết lập để hạn chế quản lý hậu cố chúng xảy làm giảm khả leo thang Cung cấp ưu đãi cho Internet tốc độ cao mở Sự phổ biến nhanh chóng băng thơng rộng quốc gia OECD kinh tế đối tác hỗ trợ cho đổi dựa liệu Băng thông rộng tốc độ cao, đặc biệt băng thông rộng di động, sở hạ tầng cho dòng liệu tự trao đổi thu thập từ xa thông qua ứng dụng Internet thông qua thiết bị thông minh ngày nhiều kết nối với tạo thành Internet vạn vật Hơn nữa, tính chất tồn cầu phân bổ hệ sinh thái liệu làm cho Internet mở điều kiện quan trọng cho đổi dựa liệu Chính phủ cần tiếp tục thúc đẩy băng thông rộng di động hỗ trợ mối quan tâm chung để tìm đồng thuận cách trì Internet mở sơi động Hội nghị Cấp cao OECD Nền kinh tế Internet diễn ngày 28-29/6/2011 thảo luận tính mở Internet cách tốt để đảm bảo tăng trưởng liên tục đổi kinh tế Internet Thông cáo kết dự thảo, đưa đến Khuyến nghị nguyên tắc cho hoạch định sách Internet, bao gồm số nguyên tắc cho hoạch định sách Internet với mục tiêu để đảm bảo cho Internet trì mở động, “cho phép người nói lên khát vọng dân chủ hoạch định sách liên quan đến phải thúc đẩy tính mở đặt tảng tôn trọng nhân quyền quy định pháp luật” Bốn nguyên tắc sau phù hợp cho việc sử 57 dụng liệu Điều khơng có nghĩa nguyên tắc khác không quan trọng đổi sáng tạo dựa liệu: (1) Thúc đẩy bảo vệ luồng thơng tin tự tồn cầu: Nền kinh tế Internet, khả học tập cá nhân, chia sẻ thông tin kiến thức, thể thân, tập hợp lập hội, phụ thuộc vào luồng thơng tin tự tồn cầu Để khuyến khích luồng thơng tin tự trực tuyến, làm việc để thúc đẩy khả tương thích tồn cầu tốt tập hợp đa dạng luật quy định quan trọng Trong thúc đẩy luồng thông tin tự do, phủ cần hướng tới việc bảo vệ tốt liệu cá nhân, trẻ em, người tiêu dùng, quyền sở hữu trí tuệ giải vấn đề an ninh mạng Để thúc đẩy luồng thơng tin tự do, phủ nên tơn trọng quyền (2) Thúc đẩy tính mở, chất phân tán liên kết Internet: Là mạng phi tập trung mạng máy tính, Internet đạt kết nối tồn cầu mà không thuộc phát triển chế quản lý quốc tế Sự phát triển chế quản lý thức hủy hoại phát triển Tính mở Internet thiết bị, ứng dụng dịch vụ đóng vai trị quan trọng thành cơng việc thúc đẩy đổi mới, sáng tạo tăng trưởng kinh tế Tính mở bắt nguồn từ tương tác liên tục phát triển độc lập thành phần kỹ thuật khác Internet, cho phép hợp tác đổi tiếp tục hoạt động độc lập với Sự độc lập cho phép thay đổi sách quy định số thành phần mà không cần thay đổi thành phần khác có tác động đổi hợp tác Tính mở Internet bắt nguồn từ chấp nhận toàn cầu tiêu chuẩn kỹ thuật hỗ trợ thị trường sản phẩm truyền thơng tồn cầu Việc trì tính trung lập công nghệ chất lượng phù hợp cho tất dịch vụ Internet quan trọng để đảm bảo môi trường Internet mở động Cung cấp dịch vụ truy cập Internet mở quan trọng cho kinh tế Internet (3) Thúc đẩy đầu tư cạnh tranh dịch vụ mạng tốc độ cao: Dịch vụ mạng tốc độ cao cần thiết cho tăng trưởng kinh tế tương lai, tạo việc làm, lực cạnh tranh cao để người hưởng sống tốt Các sách cơng cần thúc đẩy cạnh tranh mạnh mẽ việc cung cấp Internet băng thông rộng tốc độ cao cho người dùng với giá phải thúc đẩy đầu tư để đạt độ bao phủ địa lý lớn Internet băng thơng rộng Các sách cơng cần thúc đẩy mức đầu tư tốt cách tạo nhu cầu mạng dịch vụ băng thông rộng tốc độ cao, đặc biệt lĩnh vực nơi phủ đóng vai trị quan trọng giáo dục, y tế, phân phối lượng giao thơng vận tải Chính sách cơng giúp thúc đẩy đa dạng nội dung, tảng, ứng dụng, dịch vụ trực tuyến công cụ truyền thông người dùng khác tạo nhu cầu cho mạng dịch vụ, cho phép người dùng hưởng lợi đầy đủ từ mạng dịch vụ truy cập vào đa dạng nội dung mà phân biệt đối xử, bao gồm nội dung 58 văn hóa ngơn ngữ theo lựa chọn (4) Đẩy mạnh cho phép chuyển giao dịch vụ xuyên biên giới: Các nhà cung cấp cần có khả cung cấp dịch vụ xuyên Internet qua biên giới trung lập mặt công nghệ theo cách thúc đẩy khả tương tác dịch vụ cơng nghệ, nơi thích hợp Người sử dụng cần có khả truy cập tạo nội dung hợp pháp chạy ứng dụng theo lựa chọn họ Để đảm bảo hiệu chi phí hiệu khác, rào cản vị trí, tiếp cận việc sử dụng công cụ liệu chức xuyên biên giới cần giảm thiểu, việc cung cấp biện pháp bảo vệ liệu an ninh liệu thích hợp thực cách phù hợp phản ánh cân cần thiết tất quyền, quyền tự nguyên tắc Khuyến khích việc tiếp cận đến liệu luồng liệu tự qua biên giới quốc gia tổ chức Luồng liệu tự qua biên giới quốc gia tổ chức nhân tố hỗ trợ quan trọng cho đổi dựa liệu Chính phủ nên khuyến khích tiếp cận tốt với luồng liệu tự tồn kinh tế Điều khơng bao gồm việc tăng cường tiếp cận tái sử dụng liệu khu vực cơng, lợi ích đáng kể dự kiến thu từ việc chia sẻ liệu xuyên khu vực Điều thực thơng qua việc thúc đẩy liệu mở liệu dùng chung cách phổ thông Theo Frischmann (2012), liệu dùng chung có thể: (i) tạo điều kiện cho việc sản xuất liên doanh hợp tác với nhà cung cấp, khách hàng hay chí đối thủ cạnh tranh, (ii) hỗ trợ khuyến khích đổi dựa vào người sử dụng bao gồm hoạt động tạo giá trị người sử dụng (bao gồm người tiêu dùng công dân), (iii) tối đa hóa giá trị tùy chọn liệu đầu tư vào liệu đảo ngược có khơng chắn cao nguồn lực giá trị thị trường tương lai cuối không phần quan trọng (iv) trợ cấp (chéo) cách hiệu cho việc sản xuất hàng hóa xã hội cơng cộng mà khơng cần phải dựa vào thị trường hay phủ để “chọn người chiến thắng” Dữ liệu mở chế độ chia sẻ liệu mạnh mẽ Các chế độ khác tồn liệu mở liệu đóng, với yếu tố ảnh hưởng đến mức độ mở gồm: (i) thiết kế công nghệ (bao gồm liệu web, đọc máy khả liên kết), (ii) quyền sở hữu trí tuệ (bao gồm chế độ pháp lý quyền, hình thức sở hữu trí tuệ sở liệu bí mật thương mại) (iii) định giá Việc trao quyền cho cá nhân (người tiêu dùng) thông qua khả mang theo liệu (data portability) tiếp tục thúc đẩy luồng liệu tự qua biên giới quốc gia tổ chức Dữ liệu phân loại theo (i) liệu đóng góp (contributed data), (ii) liệu quan sát (observed data) (iii) liệu ngoai suy (inferred data) giúp nhà hoạch định sách thiết kế chế thích hợp để cân quyền cá nhân với lợi ích hợp pháp doanh nghiệp 59 Thiết lập khuôn khổ quản trị liệu cho truy cập, chia sẻ khả liên tác liệu Các chế độ quản trị liệu có tác động việc truy cập, chia sẻ tính liên tác (interoperability) liệu Chúng bao gồm thách thức mà cá nhân, doanh nghiệp nhà hoạch định sách phải đối mặt lĩnh vực, liệu sử dụng mà không phân biệt loại liệu Các chế độ quản trị liệu có tác động khuyến khích chia sẻ tiềm liệu sử dụng theo cách thức liên tác Các yếu tố xem xét cho chế độ quản trị liệu hiệu bao gồm: - Giá trị định giá liệu - Liên kết tích hợp liệu - Chất lượng xử lý liệu - Quyền sở hữu kiểm soát liệu Thúc đẩy nghiên cứu phát triển công nghệ phân tích liệu tăng cường bảo vệ quyền riêng tư Chất lượng hiểu biết dựa vào liệu phụ thuộc vào chất lượng thuật tốn sử dụng để phân tích liệu (bên cạnh việc lựa chọn thuật toán phù hợp chất lượng liệu) Đồng thời, kiến thức chế sử dụng để trích xuất thơng tin làm phong phú cho nghiên cứu chế bảo vệ kiểm soát tốt việc khai thác thơng tin Vì vậy, NC&PT phân tích liệu tiến hành đồng thời với NC&PT công nghệ bảo vệ quyền riêng tư (privacy enhancing technologies-PET) Tuy nhiên, chứng cho thấy động khuyến khích khu vực tư nhân tiến hành NC&PT phân tích liệu nhiều so với PET Ví dụ, số lượng đơn xin cấp sáng chế công nghệ PET liên quan đến bảo vệ riêng tư thấp chí giảm năm 2011, đơn xin cấp sáng chế liên quan đến phân tích liệu liên tục tăng Vì phủ cần thúc đẩy NC&PT khơng tập trung vào phân tích liệu mà cịn tập trung vào cơng nghệ PET Đảm bảo việc cung cấp phát triển kỹ lực phân tích liệu Việc gặt hái lợi ích đầy đủ liệu địi hỏi mức độ đủ cao lực phân tích liệu kinh tế xã hội Bên cạnh việc cung cấp cơng cụ điện tốn đám mây phân tích liệu, cần thiết phải nâng cao kỹ phân tích liệu (nhà khoa học liệu) Các kỹ lực cụ thể cách giải thích tận dụng tối đa kết phân tích liệu quan trọng Chính phủ cần đảm bảo việc cung cấp phát triển kỹ lực phù hợp thông qua (i) tổ chức giáo dục thức (ii) đào tạo chỗ đào tạo nghề công nghệ thơng tin truyền thơng Khuyến khích tinh thần khởi nghiệp doanh nghiệp dựa vào liệu thay đổi tổ chức toàn kinh tế Đổi dựa liệu muốn đạt mức độ lớn phải thực 60 nhà doanh nhân, họ nhận thức tiềm phân tích liệu tổ chức thị trường khác Đối với doanh nhân tổ chức, thách thức thay đổi tổ chức: Chuyển đổi từ tổ chức truyền thống sang tổ chức dựa liệu địi hỏi thay đổi văn hóa khó để thực Như Bakhshi et al (2014) nhấn mạnh: Thực thay đổi bổ sung để gặt hái lợi nhuận đầy đủ từ phân tích liệu “bao gồm thay đổi gây phá vỡ, gây tranh cãi cấu tổ chức quy trình kinh doanh” Chính phủ đóng vai trị quan trọng việc khuyến khích doanh nghiệp dựa vào liệu thay đổi tổ chức thông qua việc cung cấp thực tiễn tốt khuyến khích cung cấp vốn mạo hiểm Kết luận Khuyến nghị lĩnh vực sách cơng hỗ trợ đổi sáng tạo dựa vào liệu Cơ hội kinh tế đổi sáng tạo dựa vào liệu lớn Như OECD kết luận, "sự gia tăng độ lớn, tốc độ đa dạng liệu sử dụng toàn kinh tế, quan trọng giá trị kinh tế xã hội lớn nó, báo hiệu thay đổi hướng tới mơ hình kinh tế xã hội định hướng liệu Trong mơ hình này, liệu tài sản cốt lõi tạo lợi cạnh tranh chi phối đổi mới, tăng trưởng phát triển bền vững" Sự tăng trưởng số lượng liệu tạo sở hàng ngày đến vượt hiểu biết tiềm độ lớn Một ước tính gần đưa số 161 exabytes năm - hay tương đương với khối lượng thông tin lưu trữ 37.000 thư viện có độ lớn tương đương Thư viện Quốc hội Hoa Kỳ Với độ lớn vậy, tiềm kinh tế xã hội vơ to lớn Giá trị từ phân tích liệu tính tốn điều kiện kinh tế thực Chi tiêu cho sở hạ tầng CNTT để phân tích liệu theo ước tính Gartner đạt 37 tỉ USD vào năm 2013 Cũng báo cáo vào năm 2015, đổi sáng tạo dựa vào liệu tạo 4,4 triệu việc làm IT toàn cầu Việc hiểu giá trị nắm bắt từ đổi sáng tạo dựa vào liệu điều quan trọng thân liệu khơng có giá trị sẵn có Khối lượng liệu tạo thường gây nhầm lẫn đặt không chỗ làm chệch hướng tranh luận trọng vào vấn đề độ lớn phân tích Như Hilbert lập luận, "không phụ thuộc vào tầm cỡ độ lớn mức Peta, Exa, zettabyte, đặc điểm then chốt thay đổi mơ hình việc xử lý phân tích liệu đặt vị trí hàng đầu việc định trí tuệ" Các số liệu thống kê kinh tế đại diện cho giá trị mà đổi dựa vào liệu tạo Nhiều hiệu thông tin số nắm bắt phép đo kinh tế truyền thống GDP hay GVA Chỉ thơng qua phân tích, kết hợp sản phẩm dịch vụ làm cho núi liệu khổng lồ tạo giá trị hiệu cho xã hội 61 Giá trị từ đổi dựa vào liệu không dành riêng cho khu vực nhà nước hay tư nhân Eric Byrnjolfsson phát doanh nghiệp áp dụng việc định dựa liệu nâng cao sản lượng suất lên từ 5-6% Tương tự, phủ cải thiện dịch vụ mà họ cung cấp cho công dân cách mang đến kỹ kỹ thuật để xử lý liệu riêng Ngồi cịn có áp lực ngày tăng phủ để thực sách dựa chứng; để tuân theo quy luật "những đo đếm cải tiến" Điều địi hỏi khơng thu thập liệu bổ sung mà phải xử lý Đó khơng phải phủ có ý tưởng cách sử dụng liệu thu thập Dữ liệu giúp tiết kiệm tiền: phủ thuộc EU giảm chi phí hành 15-20%, giá trị tương đương 150-300 tỷ euroo Hiện nay, ngày có nhiều phủ cơng bố liệu mở để thúc đẩy đổi sáng tạo công chúng Cho dù việc cơng khai lịch trình giao thông công cộng nhà phát triển ứng dụng sáng tạo sản phẩm tiêu dùng hay gia tăng tính minh bạch dịch vụ công cách mở cửa liệu cho tổ chức phi phủ, hội cho tổ chức thuộc khu vực cơng có ý nghĩa quan trọng Các hội mang lại kinh tế lẫn xã hội Các bệnh viện hệ thống y tế chữa bệnh khắc phục rủi ro hệ thống thông qua đổi dựa liệu; trường học phân tích xem học sinh tương tác với tài liệu giảng dạy để nâng cao kết giáo dục; việc bố trí nguồn lực phân bổ hiệu thơng qua sử dụng phân tích liệu Thật khả vô tận, cần có tảng kỹ để phân tích kho liệu sản sinh thu thập Tất hội kinh tế xã hội tạo nguy hiểm rủi ro, chúng cần phân tích phản ứng thận trọng Thách thức đảm bảo thông tin cá nhân không bị tiết lộ dù vơ tình hay bất đắc dĩ thơng qua việc chia sẻ tập hợp liệu Những mối quan tâm cần giải rủi ro cần giảm thiểu trước nhằm trì niềm tin công chúng sử dụng dịch vụ kỹ thuật số để xã hội tận dụng lợi mà đổi sáng tạo dựa liệu mang lại Điều mang lại lợi ích cho cá nhân cho xã hội nói chung cách tiếp cận nhà hoạch định sách phải tập hợp quy định hỗ trợ cấm đoán Do khu vực tư nhân thực nhiều nỗ lực tiên phong sử dụng phân tích liệu, phủ nên hỗ trợ cho nỗ lực Đặc biệt, đổi dựa vào liệu đòi hỏi lực lượng lao động có kỹ năng, cơng nghệ tiên tiến tiếp cận liệu Các nhà hoạch định sách hỗ trợ nỗ lực cách xem xét hội sách công bối cảnh khu vực công nơi có cường độ sử dụng liệu cao kinh tế Các lĩnh vực sách công cần trọng để hỗ trợ cho đổi sáng tạo dựa liệu gồm: Nhân lực Hiện tại, giới cịn thiếu nhân lực có kiến thức, kỹ lực để hỗ trợ đổi 62 dựa vào liệu Nguồn nhân lực khơng bao gồm nhà lập trình có kỹ học máy Hadoop, mà bao gồm nhà quản lý, nhà thiết kế chun gia truyền thơng Ví dụ, năm 2012, cơng ty phân tích thị trường Gartner dự tính đến năm 2015, có phần ba số 4,4 triệu việc làm lĩnh vực liệu lớn tuyển dụng Trong số trường đại học gần bắt đầu đưa chương trình khoa học liệu, phân tích kinh doanh học máy vào chương trình đào tạo, nỗ lực khơng đáp ứng nhanh chóng nhu cầu trước mắt Các quốc gia cung cấp nhân tài làm việc lĩnh vực liên quan đến liệu có lợi kinh tế tồn cầu Các nhà hoạch định sách có hội để giúp thúc đẩy tăng trưởng số nhân lực có kiến thức liệu cách tài trợ cho khóa học mở, trực tuyến mơn học liên quan đến liệu mở rộng tuyển sinh lớp thống kê khoa học máy tính Các trường trung học hỗ trợ cách tạo yêu cầu toán linh hoạt hơn, học sinh tham dự khóa học khoa học máy tính hay thống kê Mặc dù nỗ lực chắn phải thời gian để đem lại kết chúng giúp mở hội cho người lao động mở rộng sẵn có nhân lực đa ngành có kiến thức liệu cho cơng ty dài hạn Chính phủ giúp thúc đẩy phát triển vốn nhân lực cần thiết cách trở thành người đầu, người tụt hậu, việc thực đổi dựa vào liệu Các quan phủ sử dụng liệu để tiết kiệm tiền bạc cung cấp dịch vụ tốt cho người dân Một báo cáo năm 2012 Viện Toàn cầu McKinsey ước tính cách làm vậy, quốc gia phát triển châu Âu tiết kiệm 100 tỷ euroo (149 tỷ USD) năm riêng việc cải thiện hiệu hoạt động Bằng cách trở thành quốc gia sớm áp dụng đổi dựa vào liệu, quan phủ giúp xây dựng cộng đồng am hiểu liệu (data-savvy communities) địa phương, chứng minh tính khả thi công nghệ khác thúc đẩy mối quan tâm đến đổi dựa vào liệu cơng chúng Cuối cùng, quan phủ cấp quốc gia địa phương cần tham gia trực tiếp vào cộng đồng khoa học liệu tham gia vào thi lập trình, thi mã hóa dành cho công dân kiện khác cộng đồng khoa học liệu tổ chức Công nghệ Chính phủ giúp thúc đẩy phát triển công nghệ tạo lực sử dụng liệu Năm 2012 Hoa Kỳ, quyền Obama công bố sáng kiến NC&PT liệu lớn với khoản tài trợ 200 triệu USD Các nỗ lực tài trợ cần tiếp tục mở rộng lợi ích cơng nghệ có hiệu ứng lan tỏa tích cực toàn kinh tế Như số nhà kinh tế lưu ý, đầu tư cho tín dụng thuế NC&PT tạo đôla cho nghiên cứu từ đôla thuế nộp trước Hơn nữa, quan phủ phát triển phần mềm riêng họ, họ nên phổ biến cho cộng đồng mã nguồn mở để người khác tái sử dụng dựa vào Làm giúp đảm bảo công dân phát huy tối đa lợi ích tiền thuế dùng cho nghiên cứu phát 63 triển Để đảm bảo tiền đầu tư cho nghiên cứu phủ hướng vào thách thức cấp bách khu vực cơng tư nhân, quan phủ, với ngân sách cơng lớn, nên phát triển lộ trình NC&PT chủ đề liên quan phân tích liệu, lưu trữ liệu điện toán phân tán chủ đề riêng tư bảo mật Điều đặc biệt thành cơng lĩnh vực nơi tiến cơng nghệ làm giảm rào cản để thích ứng Ví dụ, quan ngại tính riêng tư giải thông qua công nghệ phương pháp lĩnh vực xóa vết định dạng liệu, đảm bảo an tồn thơng tin trình khai thác liệu, bảo mật, xác thực đa bên khả liên tác số Các hợp tác công tư, chẳng hạn Liên hiệp Quốc gia khoa học liệu Hoa Kỳ (NCDS), giúp mang lại kiến thức chun mơn sâu rộng để thiết lập ưu tiên nghiên cứu ban hành chuẩn Cuối cùng, phủ khuyến khích việc sử dụng tái sử dụng liệu cách khuyến khích chuẩn hóa Do chuẩn liệu có thiên hướng mang lại lợi ích cho phạm vi rộng bên liên quan khu vực định, đồng thuận rộng rãi thường đạt được; nhiên số trường hợp, hỗ trợ phủ giúp đẩy nhanh trình Tại Hoa Kỳ, lãnh đạo Ủy ban Chứng khoán giao dịch (SEC) xây dựng chuẩn XBRL hồ sơ doanh nghiệp ví dụ điển hình vai trị tạo điều kiện thuận lợi phủ ban hành chuẩn liệu Hoa Kỳ tiếp tục hỗ trợ Liên minh Dữ liệu nghiên cứu quốc tế để làm cho liệu khoa học cụ phân tích tương thích tồn giới Dữ liệu Nếu khơng có liệu, đổi sáng tạo dựa vào liệu khơng thể Kết là, phủ có vai trị quan trọng khơng việc thu thập cung cấp liệu, mà việc tạo khuôn khổ pháp lý phù hợp để thúc đẩy việc chia sẻ liệu nâng cao nhận thức công chúng tầm quan trọng chia sẻ liệu Các quan phủ nên để người dùng tiếp cận liệu riêng họ cách kịp thời định dạng hữu ích Việc làm cho liệu nhận dạng đầy đủ nhất, công khai trực tuyến định dạng đọc máy kịp thời cho phép doanh nghiệp, nhà nghiên cứu, tổ chức phi lợi nhuận người dân tái sử dụng Một cách để đạt điều thơng qua sách liệu mở rõ ràng tất cấp phủ, chẳng hạn Điều lệ Dữ liệu mở 2013 G8, Chương trình nghị Dữ liệu mở Hoa Kỳ, sách liệu mở thành phố Toronto Tương tự vậy, nhà hoạch định sách cần tiếp tục theo đuổi nỗ lực phép cá nhân truy cập vào liệu cá nhân họ Hai ví dụ nỗ lực Hoa Kỳ Sáng kiến Nút bấm xanh (Green Button) khuyến khích cơng ty tiện ích tạo điều kiện thuận lợi để người tiêu dùng truy cập vào liệu sử dụng lượng nhà họ Sáng kiến Nút bấm lam (Blue Button) để cựu chiến binh truy cập hồ sơ y tế họ Bằng cách theo đuổi quy tắc “mở mặc định”, quan quyền tất cấp khuyến khích nghiên cứu thử nghiệm mở rộng quan 64 trọng để khởi phát đổi dựa vào liệu Khi công ty không tự nguyện cung cấp cho khách hàng hội truy cập vào liệu riêng định dạng điện tử, tái sử dụng, nhà hoạch định sách cần can thiệp Đây khơng phải việc bắt buộc công ty phải từ bỏ quyền sở hữu liệu, mà yêu cầu họ cố gắng cung cấp cho khách hàng liệu riêng họ Các nhà hoạch định sách cần đảm bảo họ tạo khuôn khổ pháp lý luật pháp để khuyến khích chia sẻ liệu tái sử dụng ngành công nghiệp khác Đổi sáng tạo dựa vào liệu diễn tổ chức, cá nhân thu thập, sử dụng tái sử dụng liệu cho mục đích mà họ khơng hình dung ban đầu Ví dụ, điều tra dân số Hoa Kỳ ban đầu tiến hành cho mục đích xác định đại biểu Quốc hội, liệu áp dụng cho loạt ứng dụng khu vực công tư nhân, từ tăng trưởng kinh tế đến phân tích y tế cơng cộng Để hỗ trợ cho ứng dụng không lường trước vậy, nhà hoạch định sách cần tạo khơng gian cho đổi ngẫu nhiên Điều có nghĩa khung pháp lý nên hỗ trợ di chuyển liệu cá nhân, quốc gia tổ chức Những nỗ lực số quốc gia áp đặt luật “khu trú liệu” hạn chế luồng thông tin tự tồn cầu khơng phải khuyến khích lưu thông liệu xuyên biên giới Các nhà hoạch định sách nên tránh quy định hạn chế không cần thiết thu thập chia sẻ liệu Khi hạn chế sử dụng cần thiết chúng cần thực với kiềm chế Các quy định pháp luật ngăn chặn việc sử dụng liệu dẫn đến tình gọi “bi kịch chống lại chung” Điều xảy tồn nhiều rào cản pháp lý quan liêu tạo chi phí giao dịch cao hạn chế việc sử dụng trao đổi liệu Ví dụ, khơng chắn quyền sở hữu liệu ngăn chặn công ty tạo ứng dụng dựa vào liệu hữu ích Để khơng làm giảm tính ứng dụng liệu có lợi, thảo luận sách cần tập trung giải việc liệu sử dụng nào, khơng phải việc định liệu có nên thu thập trao đổi hay không Những sử dụng đưa đến tác hại cụ thể nên bị cấm, nhà hoạch định sách cần tạo sách mở thừa nhận phạm vi rộng khơng thể dự báo trước ứng dụng dựa vào liệu tương lai, đặc biệt lĩnh vực y tế giáo dục Ở tồn hội tuyệt vời tận dụng liệu để giải vấn đề xã hội quan trọng khuyến khích tăng trưởng kinh tế, nhiên, để đạt đầy đủ tiềm đổi dựa vào liệu, nhà hoạch định sách phải tạo sở hạ tầng khung sách cần thiết Bước để làm điều phải hiểu đánh giá cao tầm quan trọng đổi dựa vào liệu khu vực công tư nhân Biên soạn: Đặng Bảo Hà Nguyễn Lê Hằng 65 Tài liệu tham khảo OECD: DATA-DRIVEN INNOVATION FOR GROWTH AND WELL-BEING: INTERIM SYNTHESIS REPORT 10/2014 OECD: EXPLORING DATA-DRIVEN INNOVATION AS A NEW SOURCE OF GROWTH: MAPPING THE POLICY ISSUES RAISED BY “BIG DATA” 6/2013 Big data: The next frontier for innovation, competition, and productivity McKinsey Global Institute, 6/2011 Market Analysis: Worldwide Big Data technology and services 2012-2015 Forecast www.idc.com White Paper: Data-Driven Innovation in South-East Europe Economics Institute, Serbia; Inženjerski biro, Croatia; Economics Institute, Bosnia and Herzegovina; Economic Program Center for the Study of Democracy, Bulgaria, 12/2014 Jeff Kelly, “Big Data Vendor Revenue and Market Forecast,” Wikibon, 12 Feb 2014 Daniel Castro & Travis Korte: Data Innovation 101: An Introduction to the Technologies and Policies Supporting Data-Driven Innovation Center for Data Innovation, 11/2013 Report to the President: BIG DATA AND PRIVACY: A TECHNOLOGICAL PERSPECTIVE The President’s Council of Advisors on Science and Technology (PCAST), 5/2014 The Future of Data-driven Innovation U S Chamber of Commerce Foundation, 10/2014 10 BIG DATA: SEIZING OPPORTUNITIES, PRESERVING VALUES Executive Office of the President , 5/2014 11 Big Data for Development: Challenges & Opportunities Global Pulse, 5/2012 12 David Abecassis, Nico Flores, Sara Montakhab: Data-driven innovation in Japan supporting economic transformation Analysys Mason Limited, 10/2014 66

Ngày đăng: 18/04/2021, 22:57

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w