Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.ứng dụng thông minh dựa trên chuỗi khối blockchain.Áp dụng học máy trong các ứng dụng thông minh dựa trên chuỗi khối blockchain.
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN HOÀNG VŨ ÁP DỤNG HỌC MÁY TRONG CÁC ỨNG DỤNG THÔNG MINH DỰA TRÊN CHUỖI KHỐI BLOCKCHAIN ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) TP HỒ CHÍ MINH – NĂM 2023 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG NGUYỄN HOÀNG VŨ ÁP DỤNG HỌC MÁY TRONG CÁC ỨNG DỤNG THÔNG MINH DỰA TRÊN CHUỖI KHỐI BLOCKCHAIN Chuyên ngành: Hệ thống thông tin Mã số: 8.48.01.04 ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS TRẦN CÔNG HÙNG TP.HỒ CHÍ MINH – NĂM 2023 i LỜI CAM ĐOAN Tôi cam đoan đề án tốt nghiệp thạc sĩ: “Áp dụng học máy ứng dụng thông minh dựa chuỗi khối blockchain” cơng trình nghiên cứu tơi Tơi cam đoan số liệu, kết nêu đề án trung thực chưa công bố công trình khác Khơng có sản phẩm nghiên cứu người khác sử dụng đề án mà khơng trích dẫn theo quy định TP Hồ Chí Minh, ngày 17 tháng năm 2023 Học viên thực đề án Nguyễn Hoàng Vũ ii LỜI CẢM ƠN Tôi xin chân thành cảm ơn Thầy PGS.TS Trần Cơng Hùng, người thầy kính u hết lòng giúp đỡ, hướng dẫn, động viên, tạo điều kiện cho tơi suốt q trình thực hồn thành đề án tốt nghiệp thạc sĩ Trong suốt trình học tập nghiên cứu thực đề án tốt nghiệp thạc sĩ, nỗ lực thân, tơi nhận hướng dẫn nhiệt tình q báu quý Thầy Cô, với động viên ủng hộ gia đình, bạn bè đồng nghiệp Với lịng kính trọng biết ơn sâu sắc, xin gửi lời cảm ơn chân thành tới: Ban Giám Đốc, Phòng đào tạo sau đại học quý Thầy Cô tạo điều kiện thuận lợi giúp tơi hồn thành đề án Tơi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp quan động viên, hỗ trợ tơi lúc khó khăn để tơi học tập hồn thành đề án Mặc dù có nhiều cố gắng, nỗ lực, thời gian kinh nghiệm nghiên cứu khoa học cịn hạn chế nên khơng thể tránh khỏi thiếu sót Tơi mong nhận góp ý quý Thầy Cô bạn bè đồng nghiệp để kiến thức tơi ngày hồn thiện Xin chân thành cảm ơn! TP Hồ Chí Minh, ngày 17 tháng năm 2023 Học viên thực đề án Nguyễn Hoàng Vũ iii MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN ii MỤC LỤC iii DANH SÁCH HÌNH VẼ v DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT vi PHẦN MỞ ĐẦU 1 Tính cấp thiết đề tài Tình hình nghiên cứu liên quan đến đề tài .1 Mục tiêu, ý nghĩa khoa học thực tiễn 4 Đối tượng phạm vi nghiên cứu 4.1 Đối tượng nghiên cứu .4 4.2 Phạm vi nghiên cứu Phương pháp nghiên cứu 5.1 Phương pháp nghiên cứu lý thuyết 5.2 Phương pháp nghiên cứu thực nghiệm .5 Bố cục đề án .5 CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY VÀ BLOCKCHAIN 1.1 Tổng quan công nghệ Blockchain .6 1.1.1 Khái niệm 1.1.2 Đặc điểm Blockchain 1.1.3 Cơ chế đồng thuận phân quyền 1.1.4 Chuỗi khối dịch vụ chuỗi khối 1.1.5 Hợp đồng thông minh (Smart Contract) 1.2 Tổng quan học máy (Machine Learning) 1.2.1 Khái niệm học máy 10 1.2.2 Phân loại học máy 10 1.3 Các ứng dụng điển hình Blockchain 14 iv CHƯƠNG 2: CÁC CÔNG TRÌNH LIÊN QUAN HỌC MÁY VÀ BLOCKCHAIN .20 2.1 Các cơng trình liên quan học máy Blockchain 20 2.1.1 Blockchain .20 2.1.2 Machine learning .24 2.2 Các cơng trình liên quan Blockchain học sâu 26 2.3 Các cơng trình khác liên quan cải tiến Blockchain học máy 28 CHƯƠNG 3: HỌC MÁY TRONG ỨNG DỤNG THÔNG MINH DỰA TRÊN CHUỖI KHỐI BLOCKCHAIN 32 3.1 Học máy ứng dụng thông minh chuỗi khối 32 3.2 Thuật toán áp dụng học máy ứng dụng thông minh chuỗi khối 34 3.3 Tiêu chí đánh giá 40 CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ 42 4.1 Áp dụng học máy ứng dụng thông minh dựa chuỗi khối blockchain .42 4.2 Kết áp dụng học máy ứng dụng thông minh dựa chuỗi khối blockchain 48 4.3 Kết thảo luận .55 PHẦN KẾT LUẬN 59 Kết nghiên cứu đề tài 59 Hạn chế đề tài 60 Vấn đề kiến nghị hướng nghiên cứu 61 DANH MỤC TÀI LIỆU THAM KHẢO .62 v DANH SÁCH HÌNH VẼ Hình 1.1: Cấu trúc Blockchain .9 Hình 3.1: Sơ đồ áp dụng học máy ứng dụng thông minh chuỗi khối 35 Hình 3.2: Thuật tốn cho pha mô 37 Hình 3.3: Thuật tốn pha xếp thực thi 38 Hình 3.4: Quy tắc tổng hợp dựa lỗi 40 Hình 4.1: Mơ hình chuỗi khối huấn luyện liệu 44 Hình 4.2: Tấn cơng Gaussian với ε = 0.4 liệu Wisconsin 48 Hình 4.3: Tấn cơng Gaussian với ε = 0.4 liệu Wisconsin 49 Hình 4.4: Tấn công khoảng cách thấp khoảng cách 0,75 với ε = 0,4 49 Hình 4.5: Tấn cơng khoảng cách thấp khoảng cách 0,63 với ε = 0,4 49 Hình 4.6: Tấn cơng khoảng cách thấp khoảng cách 0,48 với ε = 0,4 50 Hình 4.7: Tấn cơng khoảng cách thấp khoảng cách 0,75 với ε = 0,2 50 Hình 4.8: Tấn công khoảng cách thấp khoảng cách 0,48 với ε = 0,2 50 Hình 4.9: Tấn công khoảng cách thấp khoảng cách 0,63 với ε = 0,2 51 Hình 4.10: Tấn cơng Gaussian với ε = 0,4 liệu MNIST 52 Hình 4.11: Tấn cơng Gaussian với ε = 0,2 liệu MNIST 52 Hình 4.12: Tấn công khoảng cách thấp khoảng cách 0,75 với ε = 0,4 liệu MNIST 53 Hình 4.13: Tấn cơng khoảng cách thấp khoảng cách 0,75 với ε = 0,2 liệu MNIST 53 Hình 4.14: Thời gian tính tốn cho ba quy tắc tổng hợp 54 Hình 4.15: Độ trễ giao dịch cho hai mơ hình 54 vi DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT VIẾT TẮT NGHĨA TIẾNG ANH NGHĨA TIẾNG VIỆT AI Artificial Intelligence Trí tuệ nhân tạo BT Blockchain Technology Công nghệ chuỗi khối CNN DDoS Convolutional Neural Network Distributed Denial of Service Mạng nơ-ron hợp pháp Từ chối dịch vụ phân tán DoS Denial of Service Từ chối dịch vụ DL Deep Learning Học sâu DML Differential Privacy Machine Learning Mơ hình học máy riêng DP Differential Privacy Quyền riêng tư khác biệt IDS Intrusion Detection System Hệ thống phát xâm nhập IoT Internet Of Things Vạn vật kết nối LSTM Long short-term memory Bộ nhớ ngắn hạn dài ML Machine Learning Học máy OS Ordering Service Sắp xếp dịch vụ SC Smart Contract Hợp đồng thông minh vii SG SGD Smart Grid Stochastic Gradient Descent Lưới điện thơng minh Thuật tốn suy giảm độ dốc SVM Support Vector Machines Học máy hỗ trợ TM Trust Management Quản lý tin cậy UAV Unmanned Aerial Vehicle Phương tiện khơng người lái PHẦN MỞ ĐẦU Tính cấp thiết đề tài Trong năm gần đây, xuất Công nghệ Blockchain (Blockchain Technology – BT) trở thành công nghệ độc đáo, đột phá có xu hướng Cơ sở liệu phi tập trung BT nhấn mạnh tính bảo mật quyền riêng tư liệu Ngoài ra, chế đồng thuận đảm bảo liệu bảo mật hợp pháp Tuy nhiên, làm nảy sinh vấn đề bảo mật công số đông chi tiêu gấp đôi Để xử lý vấn đề nói trên, cần có phân tích liệu liệu an toàn dựa BT Phân tích liệu nâng cao tầm quan trọng công nghệ phát sinh Học máy (Machine Learning - ML) ML liên quan đến lượng liệu hợp lý để đưa định xác Độ tin cậy liệu chia sẻ quan trọng ML để cải thiện độ xác kết Sự kết hợp hai cơng nghệ (ML BT) mang lại kết xác cao Trong phần đề án này, tơi trình bày nghiên cứu chi tiết việc áp dụng ML để làm cho ứng dụng thơng minh dựa BT có khả chống lại cơng tốt Có nhiều kỹ thuật ML truyền thống khác nhau, chẳng hạn Máy vectơ hỗ trợ (Support Vector Machines - SVM), thuật toán phân cụm, đóng gói Học sâu (Deep Learning - DL) Mạng nơ-ron hợp pháp (Convolutional Neural Network - CNN) Bộ nhớ ngắn hạn dài (Long short-term memory - LSTM) sử dụng để phân tích công vào mạng dựa BT Đề tài sau: “Áp dụng học máy ứng dụng thơng minh dựa chuỗi khối blockchain” Tình hình nghiên cứu liên quan đến đề tài Từ vài thập kỷ qua, liệu trở thành nguồn thông minh thiết yếu mang lại hội cho vấn đề sống thực truyền thông không dây, công thức sinh học, nông nghiệp tài thơng qua ứng dụng thơng minh Các ứng dụng dựa liệu dựa tỷ lệ thơng tin chi tiết hữu 52 Hình 4.10: Tấn công Gaussian với ε = 0,4 liệu MNIST Hình 4.11: Tấn cơng Gaussian với ε = 0,2 liệu MNIST 53 Hình 4.12: Tấn cơng khoảng cách thấp khoảng cách 0,75 với ε = 0,4 liệu MNIST Hình 4.13: Tấn cơng khoảng cách thấp khoảng cách 0,75 với ε = 0,2 liệu MNIST 54 Hình 4.14: Thời gian tính tốn cho ba quy tắc tổng hợp Hình 4.15: Độ trễ giao dịch cho hai mơ hình 55 4.3 Kết thảo luận Đầu tiên, phải xem xét thuật toán riêng tư, ràng buộc chặt chẽ độ xác kết học tập bảo vệ quyền riêng tư Thứ hai, quy trình tổng hợp dựa lỗi tơi có tỷ lệ lỗi thấp phương pháp tiếp cận dựa đa số khác công Gaussian Tấn công khoảng cách thấp với bốn kịch khác Trong công Gaussian, cách tiếp cận dựa lỗi có tỷ lệ hội tụ nhanh so với sơ đồ khác, bao gồm đường sở Ngoài ra, dựa đa số phương pháp tiếp cận bị ảnh hưởng công từ khoảng cách thấp với độ xác gần 10%, điều có nghĩa cơng đơi có hại cho phương pháp dựa số đơng Ngồi ra, kết Hình 4.12 cho Tấn cơng khoảng cách thấp với 0,75 khoảng cách theo độ tương tự cosine cho thấy multi-Krum có số mật độ xác LearningChain Điều có nghĩa khơng có quy trình tổng hợp trước có độ phức tạp tính tốn độ xác học mà khơng có phương pháp tiếp cận dựa lỗi Kết tiêu thụ thời gian cho mơ hình tơi: Đặc biệt, mơ hình khơng có độ xác DML mà cịn có hiệu hệ thống số khía cạnh Hình 4.14 minh họa thời gian tính tốn cho ba quy tắc tổng hợp Ngồi ra, Hình 4.15, tơi so sánh độ trễ giao dịch cho hai mơ hình DML, mơ hình đề xuất LearningChain Tôi bỏ qua multi-Krum khơng cung cấp mơ hình DML ngoại trừ tình bất lợi trình tổng hợp Tơi thử nghiệm với PoW cho LearningChain PoET cho mơ hình ghi lại kết trung bình 10 lần Như hiển thị Hình 4.14, quy tắc tổng hợp dựa lỗi tơi có mức tiêu thụ thời gian thấp so với multi-Krum LearningChain cho số người tham gia khác mạng phân tán quy mô lớn Đặc biệt, multi-Krum sử dụng mạng phân tán có thời gian tính tốn cao quy mơ người tham gia lớn Ngồi ra, Hình 4.15 cho thấy mơ hình tơi có độ trễ giao dịch thấp so với LearningChain dựa chuỗi khối không phép áp dụng PoET mơ hình 20 người tham gia Do đó, 56 mơ hình tơi tiết kiệm thời gian tính tốn gấp 16 lần so với hệ thống DML dựa chuỗi khối trước tơi đào tạo 500 vịng Khoản tiết kiệm lớn thường xử lý liệu quy mơ lớn Với thuật tốn đề xuất đề cập phần trước, việc áp dụng học máy ứng dụng thông minh dựa chuỗi khối blockchain, ứng dụng vào phát triển hệ thống máy học thông minh theo ý tưởng chủ đạo sau: + Tính mạnh mẽ chống gian lận: Sử dụng chuỗi khối cho phép học máy diễn môi trường phân tán mà không cần tới bên trung gian Điều làm giảm nguy gian lận tăng tính mạnh mẽ hệ thống Nếu số nút mạng thực khơng xác, hệ thống hoạt động thông qua việc sử dụng nút khác + Bảo vệ liệu: Kết hợp học máy chuỗi khối giúp bảo vệ quyền riêng tư liệu Dữ liệu không cần phải chia sẻ trực tiếp với tất bên tham gia, giữ cho liệu cục an tồn Thay vào đó, thông tin cần thiết cho việc học (như gradient) chia sẻ ghi lại chuỗi khối + Kiểm tra kiểm soát: Hệ thống kiểm soát dựa lỗi cho phép theo dõi hiệu suất nút tìm nút đáng ngờ thực sai sót Điều khơng giúp cải thiện hiệu suất hệ thống mà tăng cường an ninh + Học đồng thời cập nhật: Vì việc học thực nhiều nút, hệ thống học đồng thời từ nhiều nguồn liệu cập nhật mơ hình dựa thơng tin từ tất nút Điều tạo hệ thống học tập hiệu linh hoạt so với mơ hình học tập trung tâm + Tính dẻo dai bền vững: Hệ thống khơng có khả chịu đựng phục hồi từ lỗi (do lưu trữ liệu chuỗi khối kiểm soát dựa lỗi), mà cịn có khả thích ứng với thay đổi liệu đầu vào môi trường học tập (do việc sử dụng học máy) + Hợp tác cộng tác: Hệ thống cho phép nhiều bên tham gia hợp tác trình học mà không cần phải tin tưởng chia sẻ liệu cách trực tiếp 57 Như vậy, thuật toán đề xuất mở nhiều khả cho việc phát triển hệ thống máy học thông minh, an toàn, bảo mật hiệu Differential Privacy Machine Learning (DML) chọn để sử dụng thuật toán đề xuất số lý do: + Bảo vệ liệu cá nhân: DML phương pháp học máy đặc biệt giúp bảo vệ riêng tư liệu cá nhân Nó cung cấp khả đảm bảo thông tin cá nhân không bị tiết lộ, liệu sử dụng để huấn luyện mơ hình học máy + Phân tích hành vi đáng ngờ: DML giúp việc phân tích phát hành vi đáng ngờ mạng chuỗi khối mà không vi phạm quyền riêng tư người dùng + Chất lượng dự đoán: Mặc dù DML cung cấp bảo vệ cho liệu, giữ chất lượng dự đoán Điều đặc biệt quan trọng việc phát hành vi đáng ngờ Tuy nhiên, điều khơng có nghĩa khơng thể sử dụng mơ hình học máy khác, tiên tiến để tăng cường tính bảo mật Trên thực tế, có nhiều thuật tốn kỹ thuật học máy khác ứng dụng ngữ cảnh Ví dụ, Federated Learning phương pháp học máy phân tán, giúp huấn luyện mơ hình nhiều thiết bị mà không cần chia sẻ liệu nguyên gốc Nó sử dụng kết hợp với chuỗi khối để cung cấp hệ thống an toàn riêng tư Điều quan trọng cần chọn mơ hình học máy phù hợp với yêu cầu cụ thể ngữ cảnh ứng dụng, dựa tiêu chí bảo vệ liệu, hiệu suất, khả mở rộng, yếu tố khác Dựa vào chức thành phần mạng chuỗi khối, ta áp dụng số thuật toán học máy sau: + Phân loại phát giao dịch đáng ngờ: Các thuật toán học máy Máy vectơ hỗ trợ (Support Vector Machines - SVM), định (Decision Trees) mạng neural sử dụng để phân loại phát giao dịch đáng ngờ blockchain, giúp nâng cao an ninh cho hệ thống 58 + Dự đoán giá tiền mã hóa: Các thuật tốn học máy mạng neural dài ngắn (Long Short-Term Memory - LSTM), ARIMA hay Facebook's Prophet sử dụng để dự đốn giá tiền mã hóa dựa liệu giá q khứ + Tối ưu hóa chứng minh cơng việc (proof-of-work) chứng minh cổ phần (proof-of-stake): Một số thuật tốn học tăng cường (Reinforcement Learning) áp dụng để tối ưu hóa quy trình chứng minh công việc (proof-of-work) chứng minh cổ phần (proof-of-stake), giúp nâng cao hiệu suất công việc phân phối khối + Phân tích dự đốn hành vi người dùng: Các thuật tốn học máy sử dụng để phân tích dự đốn hành vi người dùng chuỗi khối, giúp nhà phát triển người dùng hiểu rõ hành vi xu hướng cộng đồng + Phân cụm phân loại nút mạng chuỗi khối: Các thuật toán phân cụm K-means DBSCAN sử dụng để phân loại nhóm nút mạng chuỗi dựa đặc điểm định 59 PHẦN KẾT LUẬN Kết nghiên cứu đề tài Trong đề án này, phát triển hệ thống DML (Differential Privacy Machine Learning) bảo vệ quyền riêng tư blockchain có quyền truy cập cách sử dụng DP (Differential Privacy) Cụ thể, đề xuất mơ hình DML dựa kiến trúc "simulate-order-execute" Hyperledger Fabric, hệ thống blockchain có quyền truy cập phổ biến, thực tế có khả sử dụng cao Tôi đề xuất phương pháp tổng hợp dựa lỗi để tính tốn trọng số, gọi quy tắc tổng hợp dựa lỗi Các thí nghiệm tơi cho thấy quy tắc tổng hợp dựa lỗi có hiệu cao so với quy tắc tổng hợp dựa đa số hai kịch vào q trình tổng hợp mơ hình DML Đặc biệt, quy tắc tổng hợp dựa lỗi có hiệu cao kịch bảo vệ quyền riêng tư theo ngun tắc "differentially private" Mơ hình tơi có độ phức tạp thời gian thấp so với quy tắc tổng hợp khác tiết kiệm thời gian lớn so với hệ thống DML dựa blockchain không giới hạn quyền truy cập Trong đề tài học máy sử dụng để phân tích phát hành vi đáng ngờ mạng blockchain, giúp tăng cường tính bảo mật Các thuật tốn học máy xác định hành vi gian lận, công mạng hoạt động bất thường khác, giúp cảnh báo ngăn chặn mối đe dọa tiềm ẩn, học máy để phân tích liệu từ chuỗi khối dự đốn xu hướng q trình giao dịch, hỗ trợ việc phát lỗi gỡ rối hệ thống blockchain Các mô hình học máy phân tích thơng tin từ nút mạng xác định nguyên nhân gây lỗi Điều giúp giảm thời gian công sức việc tìm sửa chữa vấn đề mạng blockchain Tóm lại, áp dụng học máy ứng dụng thông minh dựa chuỗi khối đem lại nhiều lợi ích quan trọng, bao gồm tăng cường tính bảo mật, dự đốn phân tích xu hướng, tối ưu hóa hiệu suất, phát lỗi gỡ rối, tăng cường 60 quản lý rủi ro Việc kết hợp học máy blockchain mang lại tiềm lớn để phát triển ứng dụng thơng minh đảm bảo tính an tồn, tin cậy hệ thống Hạn chế đề tài Mặc dù học máy đem lại nhiều lợi ích ứng dụng thông minh dựa chuỗi khối blockchain, có số hạn chế cần xem xét việc áp dụng học máy ứng dụng thơng minh dựa chuỗi khối blockchain Có thể lưu trữ lượng lớn liệu, việc huấn luyện mơ hình học máy tập liệu lớn địi hỏi tài ngun tính tốn thời gian lớn Việc xử lý huấn luyện liệu blockchain trở nên chậm chạp tốn Dữ liệu blockchain thường mã hóa phân tán, đảm bảo tính bảo mật riêng tư Tuy nhiên, việc áp dụng học máy yêu cầu truy cập đến liệu chi tiết nhạy cảm Sự xung đột tính bảo mật/riêng tư yêu cầu liệu cho việc học máy gây khó khăn q trình triển khai Việc áp dụng học máy ứng dụng blockchain gặp khó khăn mở rộng sang quy mơ lớn Đề xuất kết hợp Differential Privacy Machine Learning (DML) với công nghệ Blockchain giải nhiều vấn đề liên quan đến bảo mật liệu, đặc biệt môi trường sử dụng liệu lớn nhiều người dùng + Bảo mật liệu: Một ưu điểm chuỗi khối khả bảo mật liệu Một liệu thêm vào chuỗi, việc thay đổi xóa liệu trở nên vơ khó khăn Điều giúp bảo vệ liệu từ công giả mạo thay đổi liệu trái phép + Bảo vệ quyền riêng tư: Bằng cách áp dụng Differential Privacy, mơ hình học máy xử lý liệu mà khơng cần biết thông tin chi tiết người dùng, cần phép toán liệu tổng hợp Điều giúp bảo vệ quyền riêng tư người dùng, chí xử lý liệu lớn + Khả mở rộng: Chuỗi khối xử lý lượng lớn liệu từ nhiều người dùng cách hiệu quả, giữ cho hệ thống hoạt động cách liền mạch số lượng người dùng tăng lên 61 Tuy nhiên, có số điều cần xem xét đến triển khai môi trường sở liệu lớn nhiều người dùng: + Hiệu suất: Việc thực học máy chuỗi khối gặp khó khăn hạn chế tốc độ công suất xử lý chuỗi khối Điều trở thành vấn đề xử lý tập liệu lớn phải xử lý lượng lớn yêu cầu đồng thời + Cơ sở liệu cục bộ: giả định người tham gia có sở liệu cục riêng Điều tạo số vấn đề bảo mật, rò rỉ liệu, sở liệu không bảo vệ cách + Bảo mật Differential Privacy: Việc áp dụng Differential Privacy không hoàn toàn loại bỏ nguy bảo mật Nếu kẻ cơng có đủ thơng tin ngoại vi, họ khơi phục lại thơng tin riêng tư từ tóm tắt liệu ẩn Việc đảm bảo phương pháp bảo mật thực cách quan trọng cho việc bảo vệ quyền riêng tư người dùng + Quản lý người dùng: Nếu có nhiều người dùng tham gia vào mạng chuỗi khối, việc quản lý danh tính quyền truy cập họ trở thành thách thức Vì vậy, mơ hình đề xuất có tiềm lớn việc bảo vệ quyền riêng tư bảo mật liệu, cần xem xét rủi ro thách thức cụ thể áp dụng vào mơi trường thực tế với liệu lớn nhiều người dùng Vấn đề kiến nghị hướng nghiên cứu Các nhà nghiên cứu mong đợi công nghệ tồn cầu, cịn nhiều trở ngại khác cản trở tích hợp Blockchain Technology Machine Learning Sự tích hợp cịn giai đoạn sơ khai Nghiên cứu thảo luận vấn đề mở tương lai thách thức việc áp dụng Machine Learning Blockchain Technology để giao tiếp an toàn Nghiên cứu nhấn mạnh thách thức Tính phù hợp, Cơ sở hạ tầng, Quyền riêng tư, bảo mật, Bộ nhớ, Thực Khả phục hồi lượng tử 62 DANH MỤC TÀI LIỆU THAM KHẢO [1] A Bellet, R Guerraoui, M Taziki and M Tommasi, “Personalized and private peer-to-peer machine learning,” in Proc of the 21st Int Conf on Artificial Intelligence and Statistics, Playa Blance, Lanzaroto, Canary Islands, 2018, pp.1-20 [2] A Kumar, P Pahwa, V Rathi, Sahil, S Swami, and D Virmani (2015), “Dynamic cluster head selection using fuzzy logic on cloud in wireless sensor networks”, arXiv:1601.03810v1 [cs.NI] [3] B Kada, A Alzubairi, and A Tameem, “Industrial communication networks and the future of industrial automation,” in 2019 Industrial & Systems Engineering Conference (ISEC), 2019 [4] Chai, H., Leng, S., Chen, Y., Zhang, K.: A hierarchical block-chain-enabled federated learning algorithm for knowledge sharing in internet of vehicles IEEE Trans Intell Transp Syst (2020) [5] Fang Chen, Hong Wan, Hua Cai‡, and Guang Cheng, “Machine Learning in/for Blockchain: Future and Challenges”, May 11, 2022 [6] Jiasi Weng, J Weng, Weiqi Luo, “DeepChain: Auditable and PrivacyPreserving Deep Learning with Blockchain-Based Incentive”, IEEE Transactions on Dependable and Secure Computing, November 2019 [7] Jinoh Kim; Makiya Nakashima; Wenjun Fan; Simeon Wuthier; Xiaobo Zhou; Ikkyun Kim; Sang-Yoon Chan, “A Machine Learning Approach to Anomaly Detection Based on Traffic Monitoring for Secure Blockchain Networking”, IEEE Transactions on Network and Service Management ( Volume: 19, Issue: 3, September 2022) [8] M A Khan and K Salah, "IoT security: Review blockchain solutions and open challenges", Future Gener Comput Syst., vol 82, pp 395-411, May 2018 63 [9] M L de Prado, Advances in financial machine learning, John Wiley & Sons, 2018 [10] Muhammad Shafay, Raja Wasim Ahmad, Khaled Salah, Ibrar Yaqoob, Raja Jayaraman & Mohammed Omar, “Blockchain for deep learning: review and open challenges” Cluster Computing volume 26, pages197–221 (2023) [11] R.Lakshmana Kumar a, Firoz Khan b, Seifedine Kadry c, Seungmin Rho, “A Survey on blockchain for industrial Internet of Things”, Alexandria Engineering Journal, Volume 61, Issue 8, August 2022, Pages 6001-6022 [12] Shah, D., Patel, D., Adesara, J et al.(2021) “Integrating machine learning and blockchain to develop a system to veto the forgeries and provide efficient results in education sector” Visual Computing for Industry, Biomedicine, and Art https://doi.org/10.1186/s42492-021-00084-y [13] S S Singhar, D Jena and S Sharma, "Integrating Machine Learning with Blockchain to Ensure Data Privacy," 2020 11th International Conference on Computing, Communication and Networking Technologies (ICCCNT), Kharagpur, India, 2020, pp 1-6, doi: 10.1109/ICCCNT49239.2020.9225342 [14] X Chen, J Ji, C Luo, W Liao and P Li, “Distributed machine learning meets blockchain: A decentralized, secure, and privacypreserving realization,” in Int Conf on Bigdata, Seattle, WA, USA, 2018, pp.11771186 [15] X Li, P Jiang, T Chen, X Luo and Q Wen, "A survey on the security of blockchain systems", Future Gener Comput Syst., vol 107, pp 841-853, Jun 2018 [16] Xuhui Chen; Jinlong Ji; Changqing Luo; Weixian Liao; Pan Li, “When Machine Learning Meets Blockchain: A Decentralized, Privacy-preserving and Secure Design”, IEEE International Conference on Big Data, 10-13 December 2020 64 [17] Yasir Afaq, Ankush Manocha, “Blockchain and Deep Learning Integration for Various Application: A Review”, Journal of Computer Information Systems, 15 Feb 2023 [18] Yijia Liu; Jie Wang; Zheng Yan; Zhiguo Wan; Riku Jäntti, “A Survey on Blockchain-Based Trust Management for Internet of Things”, IEEE Internet of Things Journal ( Volume: 10, Issue: 7, 01 April 2023) [19] Y Liu, F R Yu, X Li, H Ji and V C M Leung, "Blockchain and Machine Learning for Communications and Networking Systems," in IEEE Communications Surveys & Tutorials, vol 22, no 2, pp 1392-1431, Secondquarter 2020, doi: 10.1109/COMST.2020.2975911 [20] Yiming Liu; F Richard Yu; Xi Li; Hong Ji; Victor C M Leung All Authors, “Blockchain and Machine Learning for Communications and Networking Systems”, IEEE Communications Surveys & Tutorials ( Volume: 22, Issue: 2, Secondquarter 2020) BẢN CAM ĐOAN Tôi cam đoan thực việc kiểm tra mức độ tương đồng nội dung đề án tốt nghiệp qua phần mềm https://kiemtratailieu.vn/ cách trung thực đạt kết mức độ tương đồng 8% toàn nội dung đề án tốt nghiệp Bản đề án tốt nghiệp kiểm tra qua phần mềm cứng đề án tốt nghiệp nộp để bảo vệ trước hội đồng Nếu sai tơi xin chịu hình thức kỉ luật theo quy định hành Học viện Tp Hồ Chí Minh, ngày 17 tháng năm 2023 Học viên thực đề án Nguyễn Hoàng Vũ Học viên thực đề án Người hướng dẫn khoa học Nguyễn Hoàng Vũ PGS.TS Trần Công Hùng