TRƯỜNG ĐẠI HỌC DUY TÂN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN (( TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN (( TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI Chuyên ngành Khoa học máy tính Mã số 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học TS Lê Thanh Long ĐÀ NẴNG – 2021 LỜI CẢM.
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI Chuyên ngành: Khoa học máy tính Mã số: 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS Lê Thanh Long ĐÀ NẴNG – 2021 i LỜI CẢM ƠN Đầu tiên, tơi xin bày lịng cảm ơn chân thành sâu sắc đến TS Lê Thanh Long hướng dẫn bảo tận tình Thầy suốt trình em theo học làm luận văn tốt nghiệp Những định hướng, lời khuyên kiến thức vô quý giá Thầy giúp em nhiều trình hồn thành luận văn tốt nghiệp Tơi xin gửi lời cảm ơn sâu sắc tới Thầy Cơ khoa Khoa học Máy Tính – trường Đại học Duy Tân tận tình giảng dạy, trang bị cho kiến thức quý báu suốt trình tơi học tập khoa Đây tiền đề giúp tơi hồn thiện luận văn thạc sĩ Cuối cùng, xin gửi lời cảm ơn chân thành đến anh chị em đồng nghiệp gia đình, bạn bè, người thân giúp đỡ vật chất lẫn tinh thần để hoàn thành luận văn Mặc dù cố gắng luận văn chắn không tránh khỏi thiếu sót, tơi mong nhận ý kiến nhận xét đánh giá từ phía Thầy Cơ để luận văn hồn thiện Tơi xin chân thành cảm ơn! Đà Nẵng, ngày tháng năm 2021 Học viên Trần Trọng Nghĩa ii LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Xây dựng hệ thống phát tự động tin giả mạo kênh mạng xã hội” thực hướng dẫn TS Lê Thanh Long Tham khảo từ nghiên cứu liên quan trích dẫn cách rõ ràng danh mục tài liệu tham khảo Khơng có việc chép tài liệu, cơng trình nghiên cứu người khác mà không rõ tài liệu tham khảo MỤC LỤC iii LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT .v DANH MỤC CÁC BẢNG BIỂU v PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu Nhiệm vụ nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Tổng quan vấn đề nghiên cứu Chương BÀI TOÁN TỰ ĐỘNG PHÁT HIỆN TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI 1.1Tổng quát .4 1.2 Bài toán thu thập liệu 14 1.3 Lưu trữ truy xuất liệu .16 1.4 Bài tốn xử lí ngơn ngữ tự nhiên 18 Chương CÁC CÔNG NGHỆ SỬ DỤNG TRONG HỆ THỐNG PHÁT HIỆN TIN GIẢ MẠO .19 2.1 Mạng nơron nhân tạo mơ hình nơron LSTM 19 2.1.1 Deep Learning 19 2.1.2 Mạng nơron nhân tạo 20 2.1.3 Mạng nơron hồi quy 24 2.1.4 Mạng nhớ dài-ngắn LSTM 27 2.2 Word2Vec 34 2.3 Công nghệ sử dụng thu thập liệu .42 Chương XÂY DỰNG HỆ THỐNG THỬ NGHIỆM PHÁT HIỆN TIN GIẢ MẠO – NEWS DETECT 45 3.1 Quy trình thu thập liệu 45 3.1.1 Quy trình lấy thơng tin từ báo .45 3.1.2 Quy trình lấy thơng tin từ facebook 47 3.2 Dữ liệu thử nghiệm 48 3.2.1 Huấn luyện mơ hình 48 3.2.2 Dữ liệu huấn luyện 51 3.2.3 Dữ liệu kiểm tra 52 3.3 Kiểm tra kết đánh giá hệ thống .52 3.3.1 Kiểm tra kết 53 3.3.2 Một số nghiên cứu liên quan .54 3.3.3 Đánh giá kết 54 iv Tập học .54 Tập kiểm tra 54 Độ xác 99,12% 54 Độ xác 70,35% 54 KẾT LUẬN 58 Kết luận 58 Hạn chế 58 Một số hướng mở rộng đề tài 58 TÀI LIỆU THAM KHẢO 59 v DANH MỤC CÁC TỪ VIẾT TẮT Viết tắt LSTM ML FnewsDetect API CSDL NLP AI Dạng đầy đủ Long Short-Term Memory Machine Learning FnewsDetect Application Programming Interface Cơ sở liệu Xử lý ngơn ngữ tự nhiên Trí tuệ nhân tạo Giải thích/Diễn giải Mạng nhớ ngắn dài Machine Learning Phát tin giả mạo Application Programming Interface – phương thức trung gian kết nối ứng dụng thư viện khác Cơ sở liệu Xử lý ngôn ngữ tự nhiên Trí tuệ nhân tạo DANH MỤC CÁC BẢNG BIỂU LỜI CẢM ƠN i LỜI CAM ĐOAN ii vi MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT .v DANH MỤC CÁC BẢNG BIỂU v PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu Nhiệm vụ nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Tổng quan vấn đề nghiên cứu Chương BÀI TOÁN TỰ ĐỘNG PHÁT HIỆN TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI 1.1Tổng quát .4 1.2 Bài toán thu thập liệu 14 1.3 Lưu trữ truy xuất liệu .16 1.4 Bài tốn xử lí ngơn ngữ tự nhiên 18 Chương CÁC CÔNG NGHỆ SỬ DỤNG TRONG HỆ THỐNG PHÁT HIỆN TIN GIẢ MẠO .19 2.1 Mạng nơron nhân tạo mơ hình nơron LSTM 19 2.1.1 Deep Learning 19 2.1.2 Mạng nơron nhân tạo 20 2.1.3 Mạng nơron hồi quy 24 2.1.4 Mạng nhớ dài-ngắn LSTM 27 2.2 Word2Vec 34 2.3 Công nghệ sử dụng thu thập liệu .42 Chương XÂY DỰNG HỆ THỐNG THỬ NGHIỆM PHÁT HIỆN TIN GIẢ MẠO – NEWS DETECT 45 3.1 Quy trình thu thập liệu 45 3.1.1 Quy trình lấy thơng tin từ báo .45 3.1.2 Quy trình lấy thơng tin từ facebook 47 3.2 Dữ liệu thử nghiệm 48 3.2.1 Huấn luyện mô hình 48 3.2.2 Dữ liệu huấn luyện 51 3.2.3 Dữ liệu kiểm tra 52 3.3 Kiểm tra kết đánh giá hệ thống .52 3.3.1 Kiểm tra kết 53 3.3.2 Một số nghiên cứu liên quan .54 3.3.3 Đánh giá kết 54 Tập học .54 Tập kiểm tra 54 Độ xác 99,12% 54 vii Độ xác 70,35% 54 KẾT LUẬN 58 Kết luận 58 Hạn chế 58 Một số hướng mở rộng đề tài 58 TÀI LIỆU THAM KHẢO 59 viii DANH MỤC CÁC HÌNH VẼ Hình 2.1 Mạng nơ-ron nhân tạo lớp Error: Reference source not found Hình 2.2 Nơron nhân tạo Error: Reference source not found Hình 2.3 Mạng MLP tổng quát Error: Reference source not found Hình 2.4 Mạng nơ ron hồi quy có vịng lặp Error: Reference source not found Hình 2.5 Mơ đun lặp lại mạng RNN chứa tầng .Error: Reference source not found Hình 2.6 Mô đun lặp lại mạng LSTM chứa tầng tương tác.Error: Reference source not found Hình 2.7 Các ký hiệu mạng LSTM Error: Reference source not found Hình 2.8 Ảnh minh họa đường liên kết nút mạng Error: Reference source not found Hình 2.9 Ảnh minh họa cổng, tầng mạng phép toán véc tơ 30 Hình 2.10 Ảnh minh họa cổng quên f Error: Reference source not found Hình 2.11 Ảnh minh họa cổng vào i Error: Reference source not found Hình 2.12 Ảnh minh họa Véc tơ ngữ cảnh Error: Reference source not found Hình 2.13 Ảnh minh họa Véc tơ áp dụng tanhError: Reference source not found Hình 2.14 Ảnh minh họa đường thêm vào cổng .Error: Reference source not found Hình 2.15 Ảnh minh họa nối cổng loại trừ đầu vào với .Error: Reference source not found Hình 2.16 Ảnh minh họa cổng cập nhật Error: Reference source not found Hình 2.17 Ảnh minh họa tập hợp từ vựng sang không gian véc tơ Error: Reference source not found Hình 2.18 Ảnh minh họa ma trận từ vựng Error: Reference source not found Hình 2.19 Ảnh minh họa liệu wordnet .Error: Reference source not found Hình 2.20 Ví dụ cặp từ đích, từ ngữ cảnh Error: Reference source not found ... khảo, Luận văn gồm chương: Chương 1: Bài toán tự động phát tin giả mạo kênh mạng xã hội Chương 2: Các công nghệ sử dụng hệ thống phát tin giả mạo Chương 3: Xây dựng hệ thống thử nghiệm phát tin giả. .. - - TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI Chuyên ngành: Khoa học máy tính Mã số: 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người... tài ? ?Xây dựng hệ thống phát tự động tin giả mạo kênh mạng xã hội? ??, áp dụng việc thu thập phân tích tin tức kênh mạng xã hội Mục đích nghiên cứu Truyền thơng thời đại số, nơi người phép thảo luận