1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Tóm Tắt Đề Án) Phát Hiện Url Độc Hại Dựa Trên Học Sâu.pdf

7 7 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Lê Minh Đăng PHÁT HIỆN URL ĐỘC HẠI DỰA TRÊN HỌC SÂU Chuyên ngành Khoa học máy tính Mã số 8 48 01 01 TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HÀ NỘI NĂM 2023 (Tóm tắt[.]

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Lê Minh Đăng PHÁT HIỆN URL ĐỘC HẠI DỰA TRÊN HỌC SÂU Chun ngành: Khoa học máy tính Mã số: 8.48.01.01 TĨM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HÀ NỘI - NM 2023 (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu ỏn tt nghip c hon thnh tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: PGS.TS HOÀNG XUÂN DẬU Phản biện 1: ……………………………………………………………… Phản biện 2: …………………………………………………………… Đề án tốt nghiệp bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc sĩ Học viện Công nghệ Bưu Viễn thơng Vào lúc: ngày tháng năm Có thể tìm hiểu đề án tốt nghiệp tại: - Thư viện Hc vin Cụng ngh Bu chớnh vin thụng (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu TĨM TẮT ĐỀ ÁN An tồn thơng tin khơng gian mạng đóng vai trị quan trọng việc bảo vệ liệu hệ thống khỏi mối đe dọa trực tuyến Với phát triển nhanh chóng công nghệ thông tin phổ biến Internet, việc đảm bảo an tồn thơng tin trở thành thách thức ngày lớn đề án sử dụng phương pháp học sâu để phát URL độc hại dựa việc phân tích yếu tố mẫu URL Điều giúp cải thiện khả phát ngăn chặn hoạt động độc hại Internet Đề án phát URL độc hại dựa học sâu hệ thống thiết kế để tự động phân loại độc hại hay khơng Nó sử dụng phương pháp học sâu, phương pháp lĩnh vực trí tuệ nhân tạo, để học từ liệu huấn luyện dự đoán xem URL có khả độc hại hay khơng Mơ hình học sâu xây dựng thơng qua q trình huấn luyện liệu Mơ hình học cách phân tích yếu tố mẫu URL để xác định xem có tính chất độc hại hay khơng Q trình huấn luyện sử dụng thuật toán học sâu mạng nơ-ron học sâu (deep neural networks) để tối ưu hóa điều chỉnh tham số mơ hình Sau mơ hình huấn luyện, triển khai để phân loại URL Khi URL cung cấp, mơ hình áp dụng kỹ thuật học sâu học để dự đoán xem URL có khả độc hại hay khơng Kết từ mơ hình cho biết mức độ độc hại ước tính URL Đề án sử dụng tập liệu Malicious URLs dataset thử nghiệm bao gồm 651.191 URL gán nhãn 428.103 gán nhãn “benign”, 96.457 gãn nhãn “defacement” URLs, 94.111 “phishing” URLs 32.520 gán nhãn “malware” URLs Nội dung đề án chưa thành chương, cụ thể nh sau: (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu CHNG 1: TNG QUAN V URL ĐỘC HẠI VÀ PHƯƠNG PHÁP PHÁT HIỆN URL ĐỘC HẠI Chương tập trung vào giới thiệu URL, URL độc hại phương pháp để phát chúng Phần đầu tác giả giới thiệu tổng quan URL URL chuỗi ký tự đại diện cho địa tài nguyên internet Cùng với giới thiệu thành phần URL lịch sử hình hình thành URL Tiếp theo tác giả giới thiệu tổng quan URL độc hại phân loại chúng URL đọc hại đường dẫn web thiết kế để thực hoạt động độc hại gian lận Cuối tác giả giới thiệu phương pháp mơ hình phát URL độc hại tồn Chương giới thiệu khái quát URL, URL độc hại số phương phát phát URL độc hại Đồng thời ưu nhược điểm mô hình tồn đưa ý tưởng cho đề án nghiên cứu dựa ưu nhược điểm cải tiến đề xuất từ nghiên cu ú (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu CHNG 2: PHT HIN URL ĐỘC HẠI DỰA TRÊN HỌC SÂU Ở chương 2, tác giả sâu vào nghiên cứu mơ hình học máy, học sâu giúp người đọc hiểu biết nhận dạng mơ hình trí tuệ nhân tạo Về học máy tác giả đưa khái niệm phân loại mơ hình học máy như: học có giám sat, học không giám sát, học tăng cương, học bán giám sát Về học sâu tác giả giới thiệu học sâu mơ hình học sâu tiêu biểu như: DNN, CNN, LSTM, v.v Chương trình bày áp dụng mơ hình học sâu CNN vào phát URL độc hại Cùng với đưa kiến trúc mơ hình tiêu chuẩn đánh mụ hỡnh (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu CHNG 3: TH NGHIM V ĐÁNH GIÁ Trong lĩnh vực trí tuệ nhân tạo nói chung học sâu nói riêng, tập liệu đóng vai trò quan trọng việc phát triển đánh giá thuật tốn, ứng dụng Việc phân tích đánh giá chất lượng tập liệu yếu tố quan trọng để đảm bảo tính đắn đáng tin cậy kết thu Trong chương này, tác giả trình bày chi tiết tập liệu, phân tích đánh giá tập liệu Sau xây dựng ứng dụng chạy thử Chương tác giả thực tiền sử lý liệu để tích hợp với mơ hình CNN Tác giã thực chạy thu độ xác F1 = 98,99% Chương vào chi tiết thực nghiệm đề tài, việc lựa chọn tệp liệu đào tạo định thành công mô hình Chính tác giả lựa chọn kỹ lưỡng mơ hình liệu thử nghiệm Trong chương sâu vào phân tích đánh giá mơ hình Thơng qua định hướng tip theo cho s m rng ca ỏn (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu (Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu(Tm.tỏt.ỏằã.Ăn).phĂt.hiỏằn.url.ỏằc.hỏĂi.dỏằa.trên.hỏằãc.sÂu

Ngày đăng: 02/11/2023, 02:37

w