1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) phát hiện url độc hại dựa trên học sâu

63 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Lê Minh Đăng PHÁT HIỆN URL ĐỘC HẠI DỰA TRÊN HỌC SÂU ĐỀ ÁN ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI – NĂM 2023 iii MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN II DANH MỤC CHỮ VÀ KÍ HIỆU VIẾT TẮT V DANH MỤC BẢNG BIỂU VI DANH MỤC HÌNH VẼ VII LỜI MỞ ĐẦU CHƯƠNG I TỔNG QUAN VỀ URL ĐỘC HẠI VÀ PHƯƠNG PHÁP PHÁT HIỆN URL ĐỘC HẠI .3 1.1 Khái quát URL 1.1.1 Khái niệm URL 1.1.2 Các thành phần URL 1.1.3 Lịch sử phát triển 1.2 Khái quát URL độc hại 1.2.1 URL độc hại .8 1.2.2 Các dạng URL độc hại 1.3 Các phương pháp phát URL độc hại 11 1.3.1 Phát dựa danh sách đen, chữ ký 11 1.3.2 Phát dựa phân tích nội dung trang web 12 1.3.3 Phát dựa phân tích URL 13 1.3.4 Phát dựa thống kê, học máy, học sâu 14 1.4 Một số công cụ phát URL độc hại 15 1.5 Kết chương 16 CHƯƠNG II: PHÁT HIỆN URL ĐỘC HẠI DỰA TRÊN HỌC SÂU 17 2.1 Khái quát học máy học sâu 17 2.1.1 Khái quát học máy 17 2.1.2 Khái quát học sâu 21 2.1.3 Một số phương pháp học sâu 23 2.2 Mơ hình phát URL độc hại dựa học sâu 32 iv 2.2.1 Giới thiệu mơ hình 32 2.2.2 Kiến trúc mơ hình 33 2.2.3 Tiêu chuẩn đánh giá mơ hình 34 2.3 Kết chương 36 CHƯƠNG III THỬ NGHIỆM VÀ ĐÁNH GIÁ 37 3.1 Tập liệu thử nghiệm 37 3.2 Tiền xử lý liệu 38 3.3 Cài đặt, thử nghiệm kết 41 3.3.1 Môi trường thử nghiệm 41 3.3.2 Kết nhận xét 41 3.4 Cài đặt thử nghiệm mô đun phát URL độc hại 43 3.5 Nhận xét, đánh giá 45 3.6 Kết chương 46 KẾT LUẬN 47 TÀI LIỆU THAM KHẢO 48 v DANH MỤC CHỮ VÀ KÍ HIỆU VIẾT TẮT Chữ/Ký hiệu Tiếng Anh AI Artificial intelligence Tiếng Việt/Giải thích Trí tuệ nhân tạo BoW Bag of word CNN Convolutional neural network CSS Cascading style sheet DDos Distributed Denial of Service Từ chối dịch vụ phân tán DGA Domain Generation Algorithm Thuật toán sinh tên miền DNN Deep Neural Network Mạng nơ ron sâu DNS Domain name system Hệ thống tên miền FC Fully Connected FTP File Transfer Protocol HTML IP LSTM Hyper text markup language Internet protocol address Long Short Term Memory Túi đựng từ Mạng nơ ron tích chập Ngơn ngữ để định dạng trang HTML Kết nối đầy đủ Giao thức truyền tải tệp tin Ngôn ngữ đánh dấu siêu văn Giao thức mạng IP Mạng nhớ ngắn dài networks RNN Recurrent neural networks SVM Support vector machine Mạng nơ ron hồi quy Máy vector hỗ trợ TTL Time To Live URL Uniform resource locator Web World wide web Thời gian sống Địa định vị tài nguyên thống Mạng web toàn cầu vi DANH MỤC BẢNG BIỂU Bảng 2-1 Dữ liệu bệnh nhân 18 Bảng 2-2 Bảng liệu giới tính, tuổi bệnh nhân 19 Bảng 3-1 Môi trường thử nghiệm 41 Bảng 3-2 Kết thử nghiệm với CNN 42 Bảng 3-3 Kết phân loại 20 URL 44 vii DANH MỤC HÌNH VẼ Hình 1-1 Cấu trúc URL Hình 1-2 Các thành phần cụ thể URL .5 Hình 2-1 Mơ hình DNN 23 Hình 2-2 Mơ hình CNN 27 Hình 2-3 Mơ hình RNN 29 Hình 2-4 Mơ hình LSTM 31 Hình 2-5 Mơ hình phát URL độc hại dựa học sâu CNN 32 Hình 2-6 Confusion matrix TN, FN, FP, TP 34 Hình 3-1 Một số mẫu URL gán nhãn “ bad” 37 Hình 3-2 Một số URL gán nhãn “good” 37 Hình 3-3 Tỉ lệ tập Train Validation 38 Hình 3-4 Tỷ lệ số nhãn gán 38 Hình 3-5 Số domain, sub domain, domain suffix 39 Hình 3-6 Đặc điểm domain 39 Hình 3-7 Đặc điểm subdomain 40 Hình 3-8 Đặc điểm domain suffix 40 Hình 3-9 Quá trình training liệu 41 Hình 3-10 Biểu đồ trình trainning liệu 42 Hình 3-11 Kết trả Url độc hại 43 Hình 3-12 Kết trả Url an toàn 44

Ngày đăng: 05/10/2023, 14:06

HÌNH ẢNH LIÊN QUAN

Hình 1-2 Các thành phần cụ thể của URL - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 1 2 Các thành phần cụ thể của URL (Trang 15)
Bảng 2-1 Dữ liệu về bệnh nhân - (Luận văn) phát hiện url độc hại dựa trên học sâu
Bảng 2 1 Dữ liệu về bệnh nhân (Trang 28)
Bảng 2-2 Bảng dữ liệu về giới tính, tuổi của bệnh nhân - (Luận văn) phát hiện url độc hại dựa trên học sâu
Bảng 2 2 Bảng dữ liệu về giới tính, tuổi của bệnh nhân (Trang 29)
Hình 2-1 Mô hình DNN - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 2 1 Mô hình DNN (Trang 33)
Hình 2-2 Mô hình CNN - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 2 2 Mô hình CNN (Trang 37)
Hình 2-3 Mô hình RNN - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 2 3 Mô hình RNN (Trang 39)
Hình 2-4 Mô hình LSTM - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 2 4 Mô hình LSTM (Trang 41)
Hình 2-5 Mô hình phát hiện URL độc hại dựa trên học sâu CNN - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 2 5 Mô hình phát hiện URL độc hại dựa trên học sâu CNN (Trang 42)
Hình 2-6 Confusion matrix của TN, FN, FP, và TP - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 2 6 Confusion matrix của TN, FN, FP, và TP (Trang 44)
Hình 3-1 Một số mẫu URL gán nhãn “ bad” - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 1 Một số mẫu URL gán nhãn “ bad” (Trang 47)
Hình 3-2 Một số URL gán nhãn “good” - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 2 Một số URL gán nhãn “good” (Trang 47)
Hình 3-5 Số các domain, sub domain, domain suffix - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 5 Số các domain, sub domain, domain suffix (Trang 49)
Hình 3-6 Đặc điểm các domain - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 6 Đặc điểm các domain (Trang 49)
Hình 3-7 Đặc điểm các subdomain - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 7 Đặc điểm các subdomain (Trang 50)
Hình 3-8 Đặc điểm các domain suffix - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 8 Đặc điểm các domain suffix (Trang 50)
Bảng 3-1 Môi trường thử nghiệm - (Luận văn) phát hiện url độc hại dựa trên học sâu
Bảng 3 1 Môi trường thử nghiệm (Trang 51)
Bảng 3-2 Kết quả thử nghiệm với CNN - (Luận văn) phát hiện url độc hại dựa trên học sâu
Bảng 3 2 Kết quả thử nghiệm với CNN (Trang 52)
Hình 3-12 Kết quả trả về Url an toàn - (Luận văn) phát hiện url độc hại dựa trên học sâu
Hình 3 12 Kết quả trả về Url an toàn (Trang 55)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w