1. Trang chủ
  2. » Luận Văn - Báo Cáo

LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội

75 34 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 75
Dung lượng 4,28 MB

Nội dung

TRƯỜNG ĐẠI HỌC DUY TÂN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN (( TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN (( TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI Chuyên ngành Khoa học máy tính Mã số 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học TS Lê Thanh Long ĐÀ NẴNG – 2021 LỜI CẢM.

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI Chuyên ngành: Khoa học máy tính Mã số: 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS Lê Thanh Long ĐÀ NẴNG – 2021 i LỜI CẢM ƠN Đầu tiên, tơi xin bày lịng cảm ơn chân thành sâu sắc đến TS Lê Thanh Long hướng dẫn bảo tận tình Thầy suốt trình em theo học làm luận văn tốt nghiệp Những định hướng, lời khuyên kiến thức vô quý giá Thầy giúp em nhiều trình hồn thành luận văn tốt nghiệp Tơi xin gửi lời cảm ơn sâu sắc tới Thầy Cơ khoa Khoa học Máy Tính – trường Đại học Duy Tân tận tình giảng dạy, trang bị cho kiến thức quý báu suốt trình tơi học tập khoa Đây tiền đề giúp tơi hồn thiện luận văn thạc sĩ Cuối cùng, xin gửi lời cảm ơn chân thành đến anh chị em đồng nghiệp gia đình, bạn bè, người thân giúp đỡ vật chất lẫn tinh thần để hoàn thành luận văn Mặc dù cố gắng luận văn chắn không tránh khỏi thiếu sót, tơi mong nhận ý kiến nhận xét đánh giá từ phía Thầy Cơ để luận văn hồn thiện Tơi xin chân thành cảm ơn! Đà Nẵng, ngày tháng năm 2021 Học viên Trần Trọng Nghĩa ii LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Xây dựng hệ thống phát tự động tin giả mạo kênh mạng xã hội” thực hướng dẫn TS Lê Thanh Long Tham khảo từ nghiên cứu liên quan trích dẫn cách rõ ràng danh mục tài liệu tham khảo Khơng có việc chép tài liệu, cơng trình nghiên cứu người khác mà không rõ tài liệu tham khảo MỤC LỤC iii LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT .v DANH MỤC CÁC BẢNG BIỂU v PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu Nhiệm vụ nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Tổng quan vấn đề nghiên cứu Chương BÀI TOÁN TỰ ĐỘNG PHÁT HIỆN TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI 1.1Tổng quát .4 1.2 Bài toán thu thập liệu 14 1.3 Lưu trữ truy xuất liệu .16 1.4 Bài tốn xử lí ngơn ngữ tự nhiên 18 Chương CÁC CÔNG NGHỆ SỬ DỤNG TRONG HỆ THỐNG PHÁT HIỆN TIN GIẢ MẠO .19 2.1 Mạng nơron nhân tạo mơ hình nơron LSTM 19 2.1.1 Deep Learning 19 2.1.2 Mạng nơron nhân tạo 20 2.1.3 Mạng nơron hồi quy 24 2.1.4 Mạng nhớ dài-ngắn LSTM 27 2.2 Word2Vec 34 2.3 Công nghệ sử dụng thu thập liệu .42 Chương XÂY DỰNG HỆ THỐNG THỬ NGHIỆM PHÁT HIỆN TIN GIẢ MẠO – NEWS DETECT 45 3.1 Quy trình thu thập liệu 45 3.1.1 Quy trình lấy thơng tin từ báo .45 3.1.2 Quy trình lấy thơng tin từ facebook 47 3.2 Dữ liệu thử nghiệm 48 3.2.1 Huấn luyện mơ hình 48 3.2.2 Dữ liệu huấn luyện 51 3.2.3 Dữ liệu kiểm tra 52 3.3 Kiểm tra kết đánh giá hệ thống .52 3.3.1 Kiểm tra kết 53 3.3.2 Một số nghiên cứu liên quan .54 3.3.3 Đánh giá kết 54 iv Tập học .54 Tập kiểm tra 54 Độ xác 99,12% 54 Độ xác 70,35% 54 KẾT LUẬN 58 Kết luận 58 Hạn chế 58 Một số hướng mở rộng đề tài 58 TÀI LIỆU THAM KHẢO 59 v DANH MỤC CÁC TỪ VIẾT TẮT Viết tắt LSTM ML FnewsDetect API CSDL NLP AI Dạng đầy đủ Long Short-Term Memory Machine Learning FnewsDetect Application Programming Interface Cơ sở liệu Xử lý ngơn ngữ tự nhiên Trí tuệ nhân tạo Giải thích/Diễn giải Mạng nhớ ngắn dài Machine Learning Phát tin giả mạo Application Programming Interface – phương thức trung gian kết nối ứng dụng thư viện khác Cơ sở liệu Xử lý ngôn ngữ tự nhiên Trí tuệ nhân tạo DANH MỤC CÁC BẢNG BIỂU LỜI CẢM ƠN i LỜI CAM ĐOAN ii vi MỤC LỤC ii DANH MỤC CÁC TỪ VIẾT TẮT .v DANH MỤC CÁC BẢNG BIỂU v PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu Nhiệm vụ nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Tổng quan vấn đề nghiên cứu Chương BÀI TOÁN TỰ ĐỘNG PHÁT HIỆN TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI 1.1Tổng quát .4 1.2 Bài toán thu thập liệu 14 1.3 Lưu trữ truy xuất liệu .16 1.4 Bài tốn xử lí ngơn ngữ tự nhiên 18 Chương CÁC CÔNG NGHỆ SỬ DỤNG TRONG HỆ THỐNG PHÁT HIỆN TIN GIẢ MẠO .19 2.1 Mạng nơron nhân tạo mơ hình nơron LSTM 19 2.1.1 Deep Learning 19 2.1.2 Mạng nơron nhân tạo 20 2.1.3 Mạng nơron hồi quy 24 2.1.4 Mạng nhớ dài-ngắn LSTM 27 2.2 Word2Vec 34 2.3 Công nghệ sử dụng thu thập liệu .42 Chương XÂY DỰNG HỆ THỐNG THỬ NGHIỆM PHÁT HIỆN TIN GIẢ MẠO – NEWS DETECT 45 3.1 Quy trình thu thập liệu 45 3.1.1 Quy trình lấy thơng tin từ báo .45 3.1.2 Quy trình lấy thơng tin từ facebook 47 3.2 Dữ liệu thử nghiệm 48 3.2.1 Huấn luyện mô hình 48 3.2.2 Dữ liệu huấn luyện 51 3.2.3 Dữ liệu kiểm tra 52 3.3 Kiểm tra kết đánh giá hệ thống .52 3.3.1 Kiểm tra kết 53 3.3.2 Một số nghiên cứu liên quan .54 3.3.3 Đánh giá kết 54 Tập học .54 Tập kiểm tra 54 Độ xác 99,12% 54 vii Độ xác 70,35% 54 KẾT LUẬN 58 Kết luận 58 Hạn chế 58 Một số hướng mở rộng đề tài 58 TÀI LIỆU THAM KHẢO 59 viii DANH MỤC CÁC HÌNH VẼ Hình 2.1 Mạng nơ-ron nhân tạo lớp Error: Reference source not found Hình 2.2 Nơron nhân tạo Error: Reference source not found Hình 2.3 Mạng MLP tổng quát Error: Reference source not found Hình 2.4 Mạng nơ ron hồi quy có vịng lặp Error: Reference source not found Hình 2.5 Mơ đun lặp lại mạng RNN chứa tầng .Error: Reference source not found Hình 2.6 Mô đun lặp lại mạng LSTM chứa tầng tương tác.Error: Reference source not found Hình 2.7 Các ký hiệu mạng LSTM Error: Reference source not found Hình 2.8 Ảnh minh họa đường liên kết nút mạng Error: Reference source not found Hình 2.9 Ảnh minh họa cổng, tầng mạng phép toán véc tơ 30 Hình 2.10 Ảnh minh họa cổng quên f Error: Reference source not found Hình 2.11 Ảnh minh họa cổng vào i Error: Reference source not found Hình 2.12 Ảnh minh họa Véc tơ ngữ cảnh Error: Reference source not found Hình 2.13 Ảnh minh họa Véc tơ áp dụng tanhError: Reference source not found Hình 2.14 Ảnh minh họa đường thêm vào cổng .Error: Reference source not found Hình 2.15 Ảnh minh họa nối cổng loại trừ đầu vào với .Error: Reference source not found Hình 2.16 Ảnh minh họa cổng cập nhật Error: Reference source not found Hình 2.17 Ảnh minh họa tập hợp từ vựng sang không gian véc tơ Error: Reference source not found Hình 2.18 Ảnh minh họa ma trận từ vựng Error: Reference source not found Hình 2.19 Ảnh minh họa liệu wordnet .Error: Reference source not found Hình 2.20 Ví dụ cặp từ đích, từ ngữ cảnh Error: Reference source not found ... khảo, Luận văn gồm chương: Chương 1: Bài toán tự động phát tin giả mạo kênh mạng xã hội Chương 2: Các công nghệ sử dụng hệ thống phát tin giả mạo Chương 3: Xây dựng hệ thống thử nghiệm phát tin giả. .. - - TRẦN TRỌNG NGHĨA XÂY DỰNG HỆ THỐNG PHÁT HIỆN TỰ ĐỘNG TIN GIẢ MẠO TRÊN CÁC KÊNH MẠNG XÃ HỘI Chuyên ngành: Khoa học máy tính Mã số: 848 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người... tài ? ?Xây dựng hệ thống phát tự động tin giả mạo kênh mạng xã hội? ??, áp dụng việc thu thập phân tích tin tức kênh mạng xã hội Mục đích nghiên cứu Truyền thơng thời đại số, nơi người phép thảo luận

Ngày đăng: 19/04/2022, 16:27

HÌNH ẢNH LIÊN QUAN

DANH MỤC CÁC BẢNG BIỂU - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
DANH MỤC CÁC BẢNG BIỂU (Trang 7)
2.1 Mạng nơron nhân tạo và mô hình nơron LSTM - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
2.1 Mạng nơron nhân tạo và mô hình nơron LSTM (Trang 31)
Hình 2.4. Mạng nơron hồi quy có vòng lặp - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.4. Mạng nơron hồi quy có vòng lặp (Trang 37)
Bảng 2.1. Một số ký hiệu trong mô hình mạng nơron hồi quy - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Bảng 2.1. Một số ký hiệu trong mô hình mạng nơron hồi quy (Trang 37)
Hình 2.5. Mô đun lặp lại trong mạng RNN chứa một tầng - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.5. Mô đun lặp lại trong mạng RNN chứa một tầng (Trang 39)
Hình 2.6. Mô đun lặp lại trong mạng LSTM chứa 4 tầng tương tác - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.6. Mô đun lặp lại trong mạng LSTM chứa 4 tầng tương tác (Trang 40)
Hình 2.9. Ảnh minh họa cổng, tầng mạng và phép toán véc tơ - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.9. Ảnh minh họa cổng, tầng mạng và phép toán véc tơ (Trang 41)
Hình 2.11. Ảnh minh họa cổng và oi - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.11. Ảnh minh họa cổng và oi (Trang 43)
Hình 2.13. Ảnh minh họa Véc tơ khi áp dụng tanh - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.13. Ảnh minh họa Véc tơ khi áp dụng tanh (Trang 44)
Hình 2.15. Ảnh minh họa nối 2 cổng loại trừ và đầu vào với nhau - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.15. Ảnh minh họa nối 2 cổng loại trừ và đầu vào với nhau (Trang 45)
Hình 2.16. Ảnh minh họa cổng cập nhật - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.16. Ảnh minh họa cổng cập nhật (Trang 45)
Hình 2.17. Ảnh minh họa tập hợp các từ vựng sang không gian véc tơ - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.17. Ảnh minh họa tập hợp các từ vựng sang không gian véc tơ (Trang 46)
Hình 2.19. Ảnh minh họa dữ liệu về wordnet - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.19. Ảnh minh họa dữ liệu về wordnet (Trang 47)
Hình 2.18. Ảnh minh họa ma trận từ vựng - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.18. Ảnh minh họa ma trận từ vựng (Trang 47)
Hình 2.21. Một mô hình CBOW đơn giản với chỉ một từ trong ngữ cảnh - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.21. Một mô hình CBOW đơn giản với chỉ một từ trong ngữ cảnh (Trang 49)
Hình 2.23. Minh họa CBOW và Skip-Ngram - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.23. Minh họa CBOW và Skip-Ngram (Trang 50)
Hình 2.24. Một mô hình CBOW đơn giản với chỉ một từ trong ngữ cảnh - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.24. Một mô hình CBOW đơn giản với chỉ một từ trong ngữ cảnh (Trang 50)
Hình 2.26. Ảnh minh họa mô hình Skip-gram - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.26. Ảnh minh họa mô hình Skip-gram (Trang 51)
Hình 2.25. Ảnh minh họa áp dụng mô hình CBOW phân tích từ - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.25. Ảnh minh họa áp dụng mô hình CBOW phân tích từ (Trang 51)
Hình 2.27. Ảnh minh họa kiến trúc mô hình Skip-gram - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.27. Ảnh minh họa kiến trúc mô hình Skip-gram (Trang 52)
Hình 2.28. Ảnh minh họa Word2vec với bài toán Recommender System - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 2.28. Ảnh minh họa Word2vec với bài toán Recommender System (Trang 53)
Bảng 2.3. Phân tích ưu, nhược điểm trong thư viện BeautifulSoup - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Bảng 2.3. Phân tích ưu, nhược điểm trong thư viện BeautifulSoup (Trang 55)
 Kiểm tra độ chính xác của mô hình - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
i ểm tra độ chính xác của mô hình (Trang 57)
Hình 3.3. Lấy nội dung các thuộc tính trong class - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 3.3. Lấy nội dung các thuộc tính trong class (Trang 58)
Hình 3.6. Tìm phần từ Bình luận theo xpath trên facebook - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 3.6. Tìm phần từ Bình luận theo xpath trên facebook (Trang 59)
Hình 3.5. Ảnh minh họa kết quả khi crawl dữ liệu - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 3.5. Ảnh minh họa kết quả khi crawl dữ liệu (Trang 59)
3.2.1 Huấn luyện mô hình - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
3.2.1 Huấn luyện mô hình (Trang 60)
- Hàm fit() – Huấn luyện mô hình: - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
m fit() – Huấn luyện mô hình: (Trang 61)
Hình 3.8. Mô hình huấn luyện - LUẬN văn THẠC sĩ xây DỰNG hệ THỐNG PHÁT HIỆN tự ĐỘNG TIN GIẢ mạo TRÊN các KÊNH MẠNG xã hội
Hình 3.8. Mô hình huấn luyện (Trang 67)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w