1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài phát hiện tin giả dựa trên ngôn ngữ tự nhiên và cách tiếp cận blockchain

32 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 6,31 MB

Nội dung

ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA HỆ THỐNG THÔNG TIN BÁO CÁO ĐỒ ÁN MẠNG XÃ HỘI ĐỀ TÀI PHÁT HIỆN TIN GIẢ DỰA TRÊN NGÔN NGỮ TỰ NHIÊN VÀ CÁCH TIẾP CẬN BLOCKCHAIN Giảng viên hướng dẫn: ThS Nguyễn Thị Anh Thư Sinh viên thực hiện: Lê Duy Hoàng 19521533 Nguyễn Thừa An Thái 19522192 Huỳnh Lê Kim Phát 19521992 Bùi Thắng Lợi 19521768 Nguyễn Lê Na 19520747 TP Hồ Chí Minh, tháng 11 năm 2022 LỜI CẢM ƠN Nhóm chúng em xin gửi lời cảm ơn lịng biết ơn sâu sắc tới Cô giáo – ThS Nguyễn Thị Anh Thư, người hướng dẫn cho em suốt thời gian làm đề tài Cô trực tiếp hướng dẫn tận tình, sửa chữa đóng góp nhiều ý kiến q báu giúp nhóm chúng em hồn thành tốt phần báo cáo Một lần chúng em chân thành cảm ơn thầy chúc Cô dồi sức khỏe Trong thời gian thực đề tài, nhóm vận dụng kiến thức tảng tích lũy, đồng thời kết hợp với việc học hỏi nghiên cứu kiến thức từ Cô, bạn bè nhiều nguồn tài liệu tham khảo Từ đó, vận dụng tối đa thu thập để hoàn thành báo cáo tốt Tuy nhiên, kiến thức chun mơn cịn hạn chế thân thiếu nhiều kinh nghiệm thực tiễn nên nội dung báo cáo không tránh khỏi thiếu sót, nhóm mong nhận góp ý, bảo thêm Cơ nhằm hồn thiện kiến thức để chúng em dùng làm hành trang cho báo cáo cuối kỳ hỗ trợ việc thực đề tài khác tương lai Một lần xin gửi đến Cô lời cảm ơn chân thành tốt đẹp nhất! Thành phố Hồ Chí Minh, tháng 11 năm 2022 Nhóm sinh viên thực NHẬN XÉT CỦA GIẢNG VIÊN ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… MỤC LỤC LỜI CẢM ƠN NHẬN XÉT CỦA GIẢNG VIÊN MỤC LỤC CHƯƠNG I TỔNG QUAN ĐỀ TÀI I THÔNG TIN BÀI BÁO II BÀI TOÁN ĐẶT RA III GIỚI THIỆU CHUNG IV CÁC CÔNG NGHỆ SỬ DỤNG Mechine Learning .7 Natural Language Processing CHƯƠNG II CÁC NGHIÊN CỨU LIÊN QUAN I CÔNG NGHỆ MECHINE LEARNING .9 II BLOCKCHAIN FRAMEWORK ĐỂ PHÁT HIỆN TIN GIẢ 10 III NATURAL LANGUAGE PROCESSING ĐỐI VỚI TIN GIẢ 11 CHƯƠNG III Đề XUẤT HỆ THỐNG PHÁT HIỆN TIN GIẢ 13 I PHÁT HIỆN TIN GIẢ SỬ DỤNG XỬ LÝ NGÔN NGỮ TỰ NHIÊN .13 CHƯƠNG IV PHÂN TÍCH ẢNH HƯỞNG DỰA TRÊN PHÁT HIỆN DỮ LIỆU GIẢ 14 I THU THẬP VÀ PHÂN TÍCH DỮ LIỆU 14 II PHÂN TÍCH VÀ KỸ THUẬT MẪU 16 III CHUẨN HOÁ DỮ LIỆU 18 IV TRÍCH XUẤT DỮ LIỆU ĐẶC TRƯNG 18 CHƯƠNG V THỰC HIỆN MÔI TRƯỜNG ML VÀ BLOCKCHAIN FRAMEWORK ĐƯỢC ĐỀ XUẤT .20 I TRIỂN KHAI DỰA TRÊN BLOCKCHAIN ĐỂ PHÁT HIỆN TIN TỨC GIẢ ĐƯỢC ĐỀ XUẤT 20 II THỰC HIỆN PHÂN TÍCH DỰ ĐỐN VÀ THÍ NGHIỆM 22 CHƯƠNG VI Kết thực nghiệm dựa Blockchain - Hệ thống bảo mật minh bạch 23 I PHÂN TÍCH KẾT QUẢ .23 II ĐÁNH GIÁ CHẤT LƯỢNG CỦA BLOCKCHAIN 25 III ĐÁNH GIÁ KỸ THUẬT MÁY HỌC ĐƯỢC ÁP DỤNG .27 CHƯƠNG VII TÀI LIỆU THAM KHẢO 28 CHƯƠNG I TỔNG QUAN ĐỀ TÀI I THÔNG TIN BÀI BÁO - Năm xuất bản: 6/9/2021 - Tác giả: ZEINAB SHAHBAZI YUNG-CHEOL BYUN - Xuất tại: IEEE Access - Link: Fake Media Detection Based on Natural Language Processing and Blockchain Approaches | IEEE Journals & Magazine | IEEE Xplore II BÀI TOÁN ĐẶT RA Mạng xã hội phần quan trọng sống người Tạo môi trường cho người chia sẻ thông tin cập nhật thông tin với đề tài khác Mạng xã hội đem lại nhiều lợi ích, mặt khác, có nhiều thơng tin giả mạo đánh lừa dư luận, người đọc Vì vậy, vấn đề tính xác thơng tin trở thành vấn đề lớn mạng xã hội Để xử lý vấn đề trên, đề xuất hệ thống tích hợp blockchain phương pháp xử lý ngôn ngữ tự nhiên (Natural language processing), để áp dụng máy học (Machine learning) để phát thông tin giả mạo III GIỚI THIỆU CHUNG Phương tiện truyền thơng có nhiều loại thơng tin chia sẻ Từ năm 2017, có nhiều loại tin giả thường xuyên sử dụng mạng Việc chống lại tin giả vấn đề chưa giải mạng xã hội trở thành vấn đề xuất lĩnh vực ngoại giao, kinh tế trị Sự tiết lộ thơng tin giả q trình khơng cần thiết tài ngun mạng Hơn nữa, chứa tồn nội dung tính hợp lệ dựa dịch vụ có sẵn Do đó, việc chia sẻ thơng tin sai có liên quan đến Chất lượng Tin cậy (QoT) để áp dụng cho việc phân phối tin tức Phân loại văn máy học cải thiện mức độ bảo mật Bày tỏ cảm xúc chia sẻ ý kiến từ khảo sát tổ chức phi phủ chứa nhiều tài khoản giả mạo thông tin lưu chuyển cổng thông tin dựa kênh Trong trường hợp này, tài khoản gây hại không mong muốn cần chuyển sang mạng để cung cấp thêm không gian lưu trữ quản lý tình trạng lộn xộn vấn đề liên quan tới trị mạng Một lĩnh vực liên quan để khai thác thông tin tuyên truyền, đặc biệt dành cho mục đích trị Các tin tức giả mạo ngôn ngữ xảo quyệt vấn đề khơi dậy làm trầm trọng cảm xúc người dùng việc phát tán thông tin giả mạo Phát tin giả khả phân tích nội dung dựa thật thông tin chia sẻ Một số lượng liệu gây nhiễu phi cấu trúc, tăng trưởng số lượng người dùng tin tức, ta cần phải có giải pháp để trích xuất tin tức giả Các thuật ngữ bị hạn chế dựa phát triển gần máy học, học sâu trí tuệ nhân tạo Chứng minh quyền tác giả bước bắt buộc để chia sẻ thông tin Blockchain khuôn mẫu phù hợp đầy hứa hẹn, tảng phi tập trung an toàn để cải thiện việc khai thác thông tin giả mạo Một hệ thống blockchain liên tục tăng số lượng khối mà khối có mã băm, dấu thời gian thông tin giao dịch khối trước Tính tồn vẹn liệu đảm bảo với blockchain tất kho lưu trữ thông tin xun quốc gia Khía cạnh blockchain làm cho trở thành tảng tiếng cách tiếp cận Theo nghiên cứu, thu thập nội dung mạng xã hội facebook, twitter Nghiên cứu nhằm mục đích cấp phép cho người dùng thông tin giả mạo cách sử dụng kỹ thuật blockchain, NLP máy học Cụ thể hơn, hệ thống đề xuất cách tiếp cận phòng ngừa dựa kỹ thuật tích hợp cho khái niệm trích xuất liệu giả kết hợp với thành phần gamification Học củng cố thuật toán dựa học tập nhằm cải thiện chất lượng hệ thống dựa thông tin cung cấp Nếu thông tin sai, hệ thống ngăn chặn việc sử dụng thông tin tương tự trước để giảm đánh giá thông tin giả sai Đóng góp báo gấp ba lần:  Thiết kế hệ thống ngăn chặn tin tức giả mạo thay hệ thống phát áp dụng Xử lý ngôn ngữ tự nhiên (NLP) để phân tích văn chi tiết dựa nội dung chia sẻ  Áp dụng giao thức Proof of authority thiết kế nguồn gốc tài Q trình khía cạnh mạnh mẽ hệ thống để tìm thơng tin tài khoản người dùng giả mạo  Áp dụng kỹ thuật Học tăng cường để dự đốn tốc độ học hệ thống trích xuất tài khoản giả mạo Tìm kiếm mối liên hệ nội dung, rút ý nghĩa cấu trúc tương tự thông tin chia sẻ để tránh chia sẻ tin giả Hình 1: Sơ đồ khối phương pháp phát tin giả đề xuất Hình cho thấy tổng quan cách tiếp cận đề xuất việc phát tin tức giả dựa phương pháp tích hợp Hệ thống blockchain áp dụng mạng cấp phép mà người tham gia phải đăng ký yêu cầu xác thực để làm cho họ đủ điều kiện tham gia vào mạng blockchain Trong blockchain phép, xác thực người dùng có quyền tham gia vào mạng mà trình trách nhiệm người quản lý nhận dạng người dùng Quá trình yêu cầu chứng xác thực đăng ký cho người tham gia hợp lệ Mục đích hệ thống đề xuất lưu trữ liệu tin tức sổ phân tán, tảng đáng tin cậy an tồn IV CÁC CƠNG NGHỆ SỬ DỤNG Mechine Learning Classifier model (Mơ hình phân lớp) mơ hình Machine Learning dùng để phân loại vật mẫu dựa đặc tính xác định Machine Learning q trình dạy máy tính thực nhiệm vụ, thay lập trình làm để thực nhiệm vụ bước Khi kết thúc đào tạo, hệ thống Machine Learning đưa dự đốn xác cung cấp liệu Điều nghe khơ khan, dự đốn trả lời liệu miếng trái ảnh chuối hay táo, người băng qua trước xe tự lái, cho dù việc sử dụng sách từ câu liên quan đến bìa mềm đặt phòng khách sạn, cho dù email thư rác hay nhận dạng giọng nói đủ xác để tạo thích cho video YouTube Machine Learning thường chia thành học có giám sát, máy tính học ví dụ từ liệu gắn nhãn học khơng giám sát, máy tính nhóm liệu tương tự xác định xác bất thường Deep Learning tập hợp Machine Learning, có khả khác biệt số khía cạnh quan trọng so với Machine Learning nơng truyền thống, cho phép máy tính giải loạt vấn đề phức tạp giải Convolutional Neural Network (CNNs – Mạng nơ-ron tích chập) mơ hình Deep Learning tiên tiến Nó giúp cho xây dựng hệ thống thơng minh với độ xác cao CNN sử dụng nhiều toán nhận dạng object ảnh Để tìm hiểu thuật toán sử dụng rộng rãi cho việc nhận dạng (detection), tìm hiểu thuật toán Reinforcement Learning việc đào tạo mơ hình Machine Learning để đưa chuỗi định Trong Reinforcement Learning, trí tuệ nhân tạo (AI) đối mặt với tình giống trị chơi Máy tính sử dụng thử sai (trial and error) để đưa giải pháp cho vấn đề Để khiến máy làm lập trình viên muốn, máy (agent) nhận phần thưởng (reward) hình phạt (penalty) cho hành động(action) mà thực Mục tiêu tối đa hóa tổng phần thưởng Data annotation (Gán nhãn liệu)là trình gắn ý nghĩa với liệu số Q trình thủ công thường thực hỗ trợ phần mềm cần có tiếp xúc người Gán nhãn liệu phần quan trọng trình tiền xử lý liệu cho thuật toán học máy, đặc biệt học có giám sát, liệu đầu vào đầu gắn nhãn để phân loại nhằm cung cấp sở học tập cho việc xử lý liệu tương lai Các nhãn có nhiều dạng, chẳng hạn thích hình ảnh, thích văn bản, thích video chí thích âm Nói tóm lại, bản, thông tin bổ sung liệu cung cấp cho thuật toán chúng tơi điều chỉnh để đạt kết xác mong muốn Natural Language Processing Khái niệm: Xử lý ngôn ngữ tự nhiên (NLP) nhánh trí tuệ nhân tạo (AI) NLP tập trung vào việc nghiên cứu tương tác máy tính ngôn ngữ tự nhiên người Mục tiêu NLP:  Giúp máy tính hiểu thực tốt nhiệm vụ liên quan đến ngôn ngữ người: tương tác máy tính người, cải thiện hiệu giao tiếp người người  Nâng cao hiệu xử lý văn lời nói CHƯƠNG II CÁC NGHIÊN CỨU LIÊN QUAN Trong phát triển công nghệ ứng dụng ứng dụng sống, đăng chia sẻ thông tin vô nghĩa Mạng xã hội dẫn đến bãi rác lớn hệ thống Mạng xã hội Quá trình tạo vấn đề việc thu thập câu trả lời hợp lý cho topic cần tìm hiểu Twitter Mạng xã hội nói với lượng người sử dụng dày đặc, người mà chia sẻ hàng triệu tin tức đa dạng chủ đề Vì thế, q trình này, Machine Learning Blockchain system đóng vai trị vơ quan trọng việc phát viết khơng đáng tin cậy I CƠNG NGHỆ MECHINE LEARNING Thuật toán hệ thống Machine Learning (ML) sử dụng Natural Language Processing (NLP) để xác định nhận dạng điểm ngữ pháp tin giả tin 10 Chú thích: Hyperledger Composer cơng cụ tương tác với để xây dựng hệ thống blockchain CHƯƠNG IV PHÂN TÍCH ẢNH HƯỞNG DỰA TRÊN PHÁT HIỆN DỮ LIỆU GIẢ Phần trình bày phân tích dự đoán áp dụng phát tin tức giả để cải thiện hiệu suất hệ thống trợ giúp quản lý hình thành mạng lưới kinh doanh hiệu Mơ hình dự đốn trình bày bao gồm bước sau: thu thập liệu, tiền xử lý liệu, sử dụng công nghệ khai thác liệu để trích xuất mẫu bản, chuẩn hóa liệu, đánh giá, lựa chọn thông số liệu xử lý thuật tốn học máy Hình mơ tả chi tiết kiến trúc phân tích dự đốn Tồn q trình phân tích dự đốn sau cho thấy thông tin liệu thu thập ID người dùng, ID tin tức, lịch dự đoán tin tức, ngày xuất bản, loại tin tức, giới tính người dùng, tên người dùng thông tin liên hệ người dùng Q trình xử lý liệu thơ trải qua kỹ thuật tiền xử lý, tính tính tốn chuẩn hóa liệu Sau lựa chọn tính chia nhỏ liệu thành tập huấn luyện thử nghiệm, thuật toán học tăng cường sử dụng để phát tin tức giả RL thuật toán dựa học tập để cải thiện hiệu suất quy trình trích xuất hình thức tin tức giả mạng xã hội dựa quy tắc xác định I THU THẬP VÀ PHÂN TÍCH DỮ LIỆU 18 Trong hệ thống phát tin tức giả mạo đề xuất, liệu thu thập từ nguồn trực tuyến mạng xã hội Twitter, Facebook, BBC news, v.v Tổng số liệu xử lý chứa 900.000 ghi tin tức từ năm 2015-2019 Bảng cho thấy tính trình bày tập liệu thu thập Có tổng cộng chín thuộc tính tập liệu đặt tên là: ID, tiêu đề, văn bản, URL, người dùng, nguồn, ngày xuất bản, phim hình ảnh Mỗi thuộc tính đại diện cho thơng tin trang web chia sẻ tin tức giả mạo, tiêu đề tin tức chia sẻ, nội dung tin tức, địa web tin tức, thông tin người dùng, tệp nguồn tin tức chia sẻ, ngày tin tức chia sẻ nội dung thơng tin chia sẻ Bảng trình bày tập liệu tin tức giả có sẵn truy cập trực tuyến Mỗi tập liệu số có danh mục khác nhiều ghi với chủ đề khác như: Bài đăng Facebook nhận xét, báo, tuyên bố Wikipedia, trị đăng twitter 19 II PHÂN TÍCH VÀ KỸ THUẬT MẪU Một quy trình quan trọng để khám phá tính ẩn kỹ thuật tạo mẫu dựa kỹ thuật khai thác liệu (DM) Cách hiệu để cải thiện độ xác tập huấn luyện kiểm thử trích xuất tính dựa kỹ thuật học máy Mơ hình trình bày sử dụng tính sau như: ngày tin tức, loại tin tức giới tính người dùng cho khám phá kiến thức thông qua thông tin thu thập dựa kỹ thuật DM Trong bước đầu tiên, mơ hình quan sát ngày dự kiến chia sẻ tin tức dựa ngày, tháng năm Thứ hai, phân tích tổng số tin tức dựa phân tích hàng ngày, hàng tháng, hàng năm Hình trình bày phân tích hàng ngày tin tức chia sẻ dựa hai nhóm giới tính nam nữ Phân tích hàng ngày tiết lộ mức trung bình tin tức chia sẻ tần suất người dùng nam cao người dùng nữ 20 Hình cho thấy phân tích hàng tháng tin tức chia sẻ trình bày tần suất chia sẻ tin tức từ tháng đến tháng 12 Phân tích hàng tháng cho thấy từ tháng đến tháng 12 số lượng tin tức chia sẻ tương đối cao 21 Hình 10 trình bày tin tức chia sẻ sở phân tích hàng năm Q trình tùy thuộc vào giới tính người dùng Các phân tích hàng năm cho thấy ghi tin tức chia sẻ từ 120.000 đến 160.000 tần suất nam nữ, với ghi nam cao III CHUẨN HOÁ DỮ LIỆU Trong tập liệu thu thập, số đặc điểm giá trị liệu độ lệch, ví dụ: tần suất chuỗi thời gian tin tức chia sẻ Dựa lý này, yêu cầu chuẩn hóa liệu để tránh độ lệch nhận phạm vi giá trị liệu đồng Có nhiều kỹ thuật khác để chuẩn hóa liệu, chẳng hạn chuẩn hóa điểm số z, chuẩn hóa tối thiểu-tối đa chuẩn hóa tỷ lệ thập phân Trong q trình này, kỹ thuật chuẩn hóa áp dụng chuẩn hóa tối thiểu [37] Kỹ thuật chuẩn hóa thuộc tính dựa việc chia tỷ lệ chúng để nhận tính liệu chế độ thống Phương trình sử dụng để chuẩn hóa liệu phạm vi 22 IV TRÍCH XUẤT DỮ LIỆU ĐẶC TRƯNG Kỹ thuật NLP phân tích liệu truy xuất từ nguồn liệu Tiếp theo, văn phân đoạn thành token Bước làm token phân đoạn để loại bỏ từ hành động ký tự ý nghĩa Trong giai đoạn này, tính trích xuất, trích xuất đặc trưng nội dung tin tức Các tính trích xuất q trình phân loại thành năm nhóm sau: điểm giả, điểm thật, miền thật, miền giả, sim phù hợp Điểm giả đại diện nhóm từ giả từ tiêu cực xuất nội dung tin tức Điểm thực cho thấy nhóm từ tích cực nội dung tin tức Miền giả miền thực đại diện cho số lượng mạng xã hội tảng truyền thông chia sẻ tin tức giả thật tính sim phù hợp thể giống truy vấn nội dung tin tức Hình 11 cho thấy sơ đồ chung kỹ thuật NLP áp dụng liệu đặc trưng 23 CHƯƠNG V THỰC HIỆN MÔI TRƯỜNG ML VÀ BLOCKCHAIN FRAMEWORK ĐƯỢC ĐỀ XUẤT Phần trình bày việc triển khai môi trường phát tin tức giả mạo dựa phân tích dự đốn(predictive analysis) cơng nghệ blockchain để dự đoán số lượng tin tức giả mạo chia sẻ giảm thời gian chờ đợi hệ thống Có hai loại để triển khai hệ thống triển khai dựa blockchain phân tích dự đốn(predictive analysis) I TRIỂN KHAI DỰA TRÊN BLOCKCHAIN ĐỂ PHÁT HIỆN TIN TỨC GIẢ ĐƯỢC ĐỀ XUẤT Thiết lập cho mơi trường phát triển tính phát tin giả đề xuất liệt kê Bảng Hệ điều hành cho phương pháp đề xuất Ubuntu Linux 18.04 LTS, hệ điều hành có loạt thử nghiệm Mơi trường Docker với phiên 18.06.1 áp dụng cho cấu hình hệ thống cài đặt máy ảo 24 Hơn nữa, sử dụng cấu trúc Hyperledger để phát triển thời gian chạy blockchain, open source framework Composer playground áp dụng cho việc thiết kế phát triển mạng lưới kinh doanh Hỗ trợ blockchain localhost web, composer web-playground provided Nạp liệu dựa cơng nghệ blockchain cần cấu hình Composer REST server CLI Tool Bảng trình bày danh sách API RESTFul tạo composer-rest-server để tạo mối quan hệ blockchain client REST server thực thao tác CRUD để điều khiển trạng thái hồ sơ phân tán Có ba phần composer-restserver định nghĩa là: tài nguyên, động từ hành động Các tài nguyên trình bày đường dẫn liệu theo request respone, đồng thời định tài nguyên 25 định dựa hành động yêu cầu POST, DELETE, GET PUT Yêu cầu POST có nghĩa tạo cập nhật người tham gia nội dung GET có nghĩa lấy liệu từ nguồn liệu II THỰC HIỆN PHÂN TÍCH DỰ ĐỐN VÀ THÍ NGHIỆM Thiết lập triển khai mơ hình dự đốn tóm tắt Bảng phần Máy học trình bày mơ hình dựa thuật toán học tăng cường (RL), dựa học tập phù hợp với môi trường chiến lược định Khía cạnh tích cực mơ hình dựa học tập cải tiến hệ thống đào tạo dựa quy tắc xác định để trích xuất tin tức giả mạo Tồn trình cách tiếp cận dựa RL trình bày chia thành hai phần tập huấn luyện kiểm tra Có nhiều kỹ thuật khác sử dụng để phân tách liệu, chẳng hạn như: holdout k-fold, v.v Thư viện sklearn ngôn ngữ python chia liệu thành hai tập theo tỷ lệ phân chia 70 đến 30 hệ thống 26 Phương trình cho thấy tỷ lệ phân chia đào tạo thử nghiệm liệu tin tức Bảng cho thấy tính phát chuỗi thời gian dựa lĩnh vực tri thức có CHƯƠNG VI KẾT QUẢ THỰC NGHIỆM DỰA TRÊN BLOCKCHAIN - HỆ THỐNG BẢO MẬT VÀ MINH BẠCH Phần cung cấp đánh giá chất lượng kết thực nghiệm mơ hình blockchain I PHÂN TÍCH KẾT QUẢ 27 Hình 12 Giao diện bảng điều khiển Hyperledger 28  Chức Hyperledger framework bao gồm: Hồ sơ người dùng, thởi gian - lịch chia sẻ tin tức, lịch sử record, dịch vụ,  User Profile: thể thơng tin cá nhân người dùng, tạo mới, chỉnh sửa xóa  News Scheduling module: bao gồm thông tin báo trạng thái báo  Người dùng kiểm tra trạng thái thơng tin báo để lưu vào record hệ thống blockchain Hơn nữa, admin kiểm tra hệ thống lịch sử ghi báo bên số thuộc blockchain  Cùng với Data analysis module, cung cấp cho ta thông tin quan trọng phân tích II ĐÁNH GIÁ CHẤT LƯỢNG CỦA BLOCKCHAIN   Sử dụng thuật toán đồng thuận để đánh giá: PBFT RAFT [35] PBFT dựa “Byzantine fault tolerance (Bft)” với độ trễ thấp tốc độ giao dịch cao cho dạng bounded nodes (blockchain)  Khả mở rộng nhược điểm thuật toán PBFT, với lượng lớn records gửi đến lúc cho consensus messages Hệ thống blockchain sử dụng permissioned blockchain, nên tính message PBFT hồn tồn phù hợp với mơ hình blockchain  Cũng giống thuật toán PoA, thuật toán RAFT mang đến tính độ trễ thấp thơng lượng cao (low latency and high throughput) Để đảm bảo tính quán liệu, thứ đồng hóa Thuật tốn RAFT làm điều với bước chính: đảm bảo bảo mật, lựa chọn node blockchain làm “leader node”, đồng hóa, thay đổi thành viên 29 Hình 13 Đánh giá độ trễ transactions theo số lượng người dùng => Số lượng người dùng cao độ trễ transactions cao Hình 14 Đánh giá độ trễ transactions theo số transaction giây (TPS) 30 Hình 15 Đánh giá độ trễ transactions theo số transaction giây (TPS) III ĐÁNH GIÁ KỸ THUẬT MÁY HỌC ĐƯỢC ÁP DỤNG  Có nhiều cách để đánh giá chất lượng mơ hình máy học Ở sử dụng “mean absolute error (MAE)”, “root mean square error (RMSE)”, “mean absolute percentage error (MAPE)”, “R2 score”  Mean Absolute Error (MAE): Tìm khác giá trị thực giá trị dự đoán  Root Mean Square Error (RMSE): RMSE chạy từ đến ∞ 31  R Score: Tỷ lệ phương sai giá trị, công thức thống kê áp dụng cho kết từ đến CHƯƠNG VII TÀI LIỆU THAM KHẢO 32

Ngày đăng: 17/08/2023, 10:33

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN