Big data đã và đang là một trong những vấn đề trung tâm, nhận được nhiều sự quan tâm trong cuộc Cách mạng công nghiệp (CMCN) 4.0. Big data chính là cốt lõi để sử dụng, phát triển internet vạn vật (IoT) và trí tuệ nhân tạo (AI). Theo dự báo, CMCN 4.0 sẽ tạo ra một lượng lớn dữ liệu (đến năm 2020, lượng dữ liệu sẽ tăng gấp 50 lần hiện nay) [1]. Thông qua thu thập, phân tích và xử lý lượng dữ liệu lớn này sẽ tạo ra những tri thức mới, hỗ trợ tích cực trong quản lý, sản xuất kinh doanh và nhiều lĩnh vực của đời sống xã hội, trong đó có bảo mật thông tin.
KH&CN nước Big data ứng dụng bảo mật thơng tin ThS Lò Thị Phương Nhung, ThS Nguyễn Mai Phương Viện Thơng tin Khoa học, Học viện Chính trị quốc gia Hồ Chí Minh Big data vấn đề trung tâm, nhận nhiều quan tâm Cách mạng công nghiệp (CMCN) 4.0 Big data cốt lõi để sử dụng, phát triển internet vạn vật (IoT) trí tuệ nhân tạo (AI) Theo dự báo, CMCN 4.0 tạo lượng lớn liệu (đến năm 2020, lượng liệu tăng gấp 50 lần nay) [1] Thơng qua thu thập, phân tích xử lý lượng liệu lớn tạo tri thức mới, hỗ trợ tích cực quản lý, sản xuất kinh doanh nhiều lĩnh vực đời sống xã hội, có bảo mật thơng tin Tổng quan big data Hiện nay, có nhiều quan điểm khác khái niệm big data - “dữ liệu lớn” Theo Viện Nghiên cứu toàn cầu McKinsey (Mỹ), big data hiểu tập hợp liệu với kích thước vượt xa khả công cụ phần mềm thông thường để thu thập, hiển thị, quản lý xử lý liệu thời gian chấp nhận Nhìn từ góc độ giá trị liệu, có ý kiến cho rằng, big data khơng có nghĩa dung lượng lớn mà có nghĩa thơng qua việc tích hợp, phân tích xử lý liệu này, người phát tri thức thu giá trị mới, từ mang đến cho người tri thức, lợi nhuận phát triển lớn Để hiểu thêm khái niệm big data, cần thấy thuộc tính kỹ thuật thuộc tính xã hội Về thuộc tính kỹ thuật Dung lượng lớn Trong xã hội thông tin nay, người chủ thể tạo liệu Qua công cụ khác tin nhắn, mạng xã hội, mạng mua sắm điện tử, truyền hình hành vi thường ngày cơng việc sống cá nhân trở thành nguồn liệu Trong xã hội thông tin nay, người chủ thể tạo liệu Thiết bị di động ngày rẻ nhiều, anten, nhật ký phần mềm, thiết bị thu hình, thu thanh, đầu đọc RFID, mạng cảm biến khơng dây… góp phần đắc lực cho q trình tạo liệu Tính đa dạng Tính đa dạng liệu lớn thể phương diện: đa dạng loại (dữ liệu kết cấu liệu phi kết cấu); đa dạng nguồn gốc (tổ chức cá nhân xã hội chủ thể tạo nguồn liệu); nội dung liệu (tất lĩnh vực, khía cạnh đời sống xã hội) Tốc độ nhanh Một đặc trưng bật xã hội thơng tin tính phức tạp tính khơng xác định mức độ cao Tốc độ nhanh big data việc liệu tạo cách nhanh chóng mà thể tốc độ xử lý thơng tin nhanh Thời đại big data đòi hỏi phương thức vận hành liệu cần chuyển từ trạng thái liệu động tĩnh sang trạng thái liệu sử dụng nhằm đạt mục đích xử lý thơng tin nhanh chóng Sự tồn đan xen liệu có giá trị cao liệu có giá trị thấp Chỉ liệu phân tích, xử lý chọn lọc liệu có giá trị thật Số 12 năm 2019 57 KH&CN nước Trong thời đại big data, bên cạnh liệu có giá trị tồn liệu có ý nghĩa Về thuộc tính xã hội Thứ nhất, big data loại lực kỹ thuật Ưu thời đại big data chỗ người tiến hành phân tích, lưu trữ sử dụng nguồn liệu khổng lồ mà kỹ thuật truyền thông thực Thông qua việc phân tích nguồn liệu khổng lồ, người không tận dụng giá trị tiềm liệu mà sử dụng vào việc đổi sáng tạo Thứ hai, big data kết cấu hạ tầng Trong xã hội nông nghiệp, đất đai thủy lợi hạ tầng chủ yếu; xã hội công nghiệp, lượng, đường bộ, đường sắt, hàng không kết cấu hạ tầng chủ yếu Trong bối cảnh CMCN 4.0, thông tin trở thành nguồn lực chiến lược quan trọng; điện toán đám mây (cloud computing), trung tâm liệu, mạng di động tốc độ cao trở thành kết cấu hạ tầng quan trọng Việc xây dựng kết cấu hạ tầng vừa cần vai trò quy hoạch đầu tư nhà nước, vừa cần tham gia đầu tư doanh nghiệp Thứ ba, big data nguồn lực cốt lõi Các loại nguồn lực vật chất truyền thống đất đai, lượng nguồn lực khan hiếm, người sử dụng ảnh hưởng đến việc sử dụng người khác Nhưng đặc tính nguồn thơng tin chỗ, việc người sử dụng tiêu dùng không ảnh hưởng đến việc sử dụng người khác, không làm giảm mà làm tăng thêm giá trị Quan trọng là, q trình tiêu dùng thơng tin đồng thời q trình tạo thơng tin mới, người sử dụng tiêu dùng 58 thông tin nhiều, lượng thông tin tạo lớn Có thể nói, thời đại big data, kỹ thuật công nghệ liên quan đến big data trở thành nguồn lực cốt lõi quan trọng quốc gia [2] Thứ tư, big data phương thức tư Big data không trạng thái liệu lớn, loạt kỹ thuật thông tin tiên tiến mà quan niệm phương pháp liên ngành nhận thức cải tạo giới Nó tạo điều kiện để thực xã hội mở với mức độ cao; nhấn mạnh việc chia sẻ tương tác mặt thơng tin Chính điều góp phần vào việc đổi quan niệm, phương pháp nhận thức người giới Big data làm cho tư người trở nên biện chứng hơn, giúp nhìn nhận vấn đề việc cách đa chiều Thứ năm, big data “một thời đại” Thời đại big data lấy liệu làm nguyên tố bản, làm nguồn lực chiến lược, cần nắm liệu có lực cạnh tranh cốt lõi Trong thời đại big data, cá thể “nguồn” liệu, thông qua phương thức khác cá thể thể tiếng nói Thời đại liệu lớn có nghĩa thời đại xã hội mở, thời đại mà quyền lực trở nên phân tán hơn, đời sống xã hội trở nên tự dân chủ [3] Ứng dụng bảo mật thông tin Các nhà cung cấp giải pháp an tồn thơng tin cho doanh nghiệp nhỏ vừa xem big data yếu tố tách rời với kết phân tích nguy rủi ro hệ thống, đặc biệt hệ thống thông tin thương mại điện tử với nguồn liệu khổng lồ từ phương tiện truyền thơng xã hội Đây nhóm liệu thường Số 12 năm 2019 dùng để phân tích, xác định dự báo quan điểm, mối quan tâm, tình cảm khách hàng sản phẩm dịch vụ mà họ sử dụng Ví dụ hệ thống liệu thu thập từ nhật ký máy chủ (Log Server), hệ thống liệu từ kiện nhấp chuột website, hệ thống liệu thu thập từ máy cảm biến (Sensors), hệ thống liệu thu thập từ hệ thống thông tin địa lý (GIS)… Việc bảo đảm an toàn cho hệ thống big data doanh nghiệp nhỏ vừa quan tâm, liệu lớn mục tiêu công tội phạm công nghệ cao Sự xuất big data với công nghệ ứng dụng giúp mở rộng quy mô hệ thống liệu để sử dụng tập hợp nguồn tài nguyên phân tán với vi xử lý nhanh lưu trữ nhiều liệu hơn, giúp tận dụng tất nguồn liệu sẵn có, để cung cấp phân tích tốt nhanh việc phát công phản ứng cố Big data chuyển đổi phân tích an tồn thơng tin cách thu thập liệu quy mô lớn từ nhiều nguồn (các ghi nhật ký hệ thống đến sở liệu lỗ hổng bảo mật, liệu công mạng, liệu mã độc…), sau sử dụng với ứng dụng như: Một là, theo dõi phát Botnet Botnet mối đe dọa lớn thách thức chun gia an tồn thơng tin Việc phát Botnet đòi hỏi phải thu thập lượng lớn liệu mạng để phân tích Với việc ứng dụng big data, d ỏn nghiờn cu Botcloud nhúm ca Jerome Fraỗois đồng nghiệp Đại học Luxembourg thực sử dụng mơ hình MapReduce để phân tích lượng lớn liệu Netflow để xác định máy tính KH&CN nước ngồi Phân tích lượng lớn liệu Netflow để xác định máy tính bị lây nhiễm tham gia mạng Botnet bị lây nhiễm tham gia mạng Botnet Dự án mở nhiều hướng việc xây dựng hệ thống thông minh để phát Botnet MapReduce sử dụng cho dự án này, lượng lớn liệu Netflow thu thập cần phải phân tích 720 triệu ghi Netflow (77 GB) thu thập 23 đồng hồ BotCloud xây dựng dựa kiến trúc BotTrack Kiến trúc thiết kế để theo dõi phát Botnet việc sử dụng Netflow thuật toán PageRan, thực việc theo dõi kênh C&C (command - and - control) Botnet [4] Hai là, ứng dụng big data phát công APT* Tấn cơng APT thường đối tượng có *APT tên viết tắt Advanced Persistent Threat - thuật ngữ rộng dùng để mô tả chiến dịch công, thường nhóm sử dụng kỹ thuật cơng nâng cao để diện tồn lâu dài mạng Internet nhằm khai thác liệu có độ nhạy cảm cao Mục tiêu vụ công thường lựa chọn nghiên cứu cẩn thận Chúng thường bao gồm doanh nghiệp lớn, quan phủ Thực cơng APT đòi hỏi nhiều tài ngun cơng ứng dụng web bình thường Những kẻ phạm tội thường nhóm tội phạm mạng có kinh nghiệm có hỗ trợ tài lớn Một số cơng APT phủ tài trợ sử dụng làm vũ khí chiến tranh mạng, phục vụ cơng tác tình báo trình độ chun mơn cao thực hiện, hậu thuẫn tổ chức có tiềm lực Một thách thức việc dò tìm cơng APT việc lọc tồn số lượng liệu nhằm phát bất thường xảy Vì phân tích big data tiếp cận phù hợp việc dò tìm cơng APT Tại Phòng thí nghiệm RSA (chun nghiên cứu để giải vấn đề an ninh mạng cấp bách giới), hệ thống dò tìm cơng APT nghiên cứu có tên Beehive Các kết nghiên cứu ban đầu cho thấy, Beehive cung cấp khả để xử lý khoảng tỷ thông điệp ghi kiện nhận diện hành động vi phạm sách, lây nhiễm phần mềm độc hại Ba là, ứng dụng big data phát công Zero-day Tại Symantec, việc ứng dụng big data, kỹ sư an ninh mạng đưa tảng WINE (Worldwide Intelligence Network Enviornment) cho việc tiến hành phân tích liệu, phạm vi rộng, sử dụng liệu thu thập Nền tảng WINE sử dụng để đo thời gian 18 công Zero-day cách kết hợp hệ nhị phân tin cậy tập liệu dấu hiệu ngăn chặn mã độc từ xa, tiến hành phân tích trường liệu thu thập 11 triệu máy chủ (host) khắp giới, công kéo dài từ 19 ngày đến 30 tháng Hơn nữa, 60% lỗ hổng bảo mật xác định nghiên cứu bị khai thác cơng Zero-day mà trước chưa tìm [5]… khắp giới (dữ liệu điện thoại, email, hình ảnh, video, trạng thái trang mạng xã hội…), từ phân tích đưa cảnh báo dấu hiệu khủng bố xảy Với trợ giúp gã khổng lồ công nghệ thông tin Microsoft, Yahoo, Google, Facebook, PalTalk, AOL, Skype, YouTube, Apple với việc hợp tác với FBI để thu thập liệu điện thoại (cuộc gọi, tin nhắn, danh bạ ) quan giám sát liệu thông qua PRISM [6] ? TÀI LIỆU THAM KHẢO [1] Marek Obitko, Industry 4.0 and big data, http://www.stech.cz/Portals/0/ Konference/2015/03%20Industr y-/ PDF/03_obitko.pdf [2] Li Shuqing, Jiao Fusen, Zhang Yong, Xu Xia (2019), “Problems and changes in digital libraries in the age of big data from the perspective of user services”, Journal of Academic Librarianship, 45(1), pp.22-30 [3] Astrid Mager (2019), “The politics of big data Big data, big brother?”, Information, Communication & Society, 22(10), pp.1523-1525 [4] Alguliyev Rasim, Imamverdiyev Yadigar (2014), “Big Data: Big Promises for Information Security”, Conference Proceedings, Publisher: IEEE [5] N Miloslavskaya, A Makhmudova (2016), “Survey of Big Data Information Security”, Conference Proceedings, Publisher: IEEE [6] United States National Security Agency (2013), PRISM Collection Manager Ngồi ra, Chương trình PRISM quan tình báo Mỹ ứng dụng cơng nghệ big data để thu thập lượng thông tin khổng lồ Số 12 năm 2019 59 ... [3] Ứng dụng bảo mật thông tin Các nhà cung cấp giải pháp an tồn thơng tin cho doanh nghiệp nhỏ vừa xem big data yếu tố tách rời với kết phân tích nguy rủi ro hệ thống, đặc biệt hệ thống thông tin. .. dùng 58 thông tin nhiều, lượng thông tin tạo lớn Có thể nói, thời đại big data, kỹ thuật công nghệ liên quan đến big data trở thành nguồn lực cốt lõi quan trọng quốc gia [2] Thứ tư, big data phương... thống thông tin địa lý (GIS)… Việc bảo đảm an toàn cho hệ thống big data doanh nghiệp nhỏ vừa quan tâm, liệu lớn mục tiêu công tội phạm công nghệ cao Sự xuất big data với công nghệ ứng dụng giúp