Nghiên cứu phương pháp phát sinh mẫu mã độc đối kháng chống lại trình Phát hiện mã độc tổng hợp ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA MẠNG MÁY TÍNH VÀ TRUYỀN THÔNG TÔ[.]
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN KHOA MẠNG MÁY TÍNH VÀ TRUYỀN THƠNG TƠ TRỌNG NGHĨA LÊ KIM DANH KHĨA LUẬN TỐT NGHIỆP NGHIÊN CỨU PHƯƠNG PHÁP PHÁT SINH MẪU MÃ ĐỘC ĐỐI KHÁNG CHỐNG LẠI TRÌNH PHÁT HIỆN MÃ ĐỘC TỔNG HỢP A method to generate adversarial samples against the ensemble learning-based malware detector KỸ SƯ NGÀNH AN TỒN THƠNG TIN TP HỒ CHÍ MINH, 2022 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN KHOA MẠNG MÁY TÍNH VÀ TRUYỀN THƠNG TƠ TRỌNG NGHĨA – 18521150 LÊ KIM DANH - 18520560 KHÓA LUẬN TỐT NGHIỆP NGHIÊN CỨU PHƯƠNG PHÁP PHÁT SINH MẪU MÃ ĐỘC ĐỐI KHÁNG CHỐNG LẠI TRÌNH PHÁT HIỆN MÃ ĐỘC TỔNG HỢP A method to generate adversarial samples against the ensemble learning-based malware detector KỸ SƯ AN TỒN THƠNG TIN GIẢNG VIÊN HƯỚNG DẪN TS NGUYỄN TẤN CẦM THS PHAN THẾ DUY TP HỒ CHÍ MINH, 2022 THƠNG TIN HỘI ĐỒNG CHẤM KHĨA LUẬN TỐT NGHIỆP Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số …………………… ngày .của Hiệu trưởng Trường Đại học Cơng nghệ Thơng tin LỜI CẢM ƠN Nhóm thực khóa luận chân thành cảm ơn TS Nguyễn Tấn Cầm với ThS Phan Thế Duy theo sát q trình thực đề tài, đóng góp ý kiến hữu ích để nhóm hồn thành đề tài khóa luận cách hồn chỉnh Nhóm xin gửi lời cảm ơn đến gia đình bạn bè động viên, khuyến khích nhóm hồn thành khóa luận Nhóm xin cảm ơn đến tất quý thầy cô trường Đại học Công nghệ Thông tin – ĐHQG TP.HCM, đặc biệt thầy phịng thí nghiệm an tồn thơng tin InSecLab khoa Mạng Máy tính Truyền thơng giúp đỡ hỗ trợ nhóm Xin chân thành cảm ơn! TP.Hồ Chí Minh, ngày 16 tháng năm 2022 Nhóm tác giả Tơ Trọng Nghĩa Lê Kim Danh Mục lục TĨM TẮT KHỐ LUẬN 1 2 4 5 5 7 10 10 11 13 14 17 18 18 22 23 23 24 TỔNG QUAN 1.1 Tóm tắt toán 1.2 Tính ứng dụng 1.3 Những thách thức 1.4 Mục tiêu, đối tượng phạm vi nghiên cứu 1.4.1 Mục tiêu 1.4.2 Đối tượng nghiên cứu 1.4.3 Phạm vi nghiên cứu 1.5 Cấu trúc Khóa luận tốt nghiệp CÁC NGHIÊN CỨU LIÊN QUAN VÀ CƠ SỞ LÝ THUYẾT 2.1 Các cơng trình liên quan 2.2 Cấu trúc tệp PE tệp PE độc hại 2.2.1 Cấu trúc tệp PE 2.2.2 Phát phần mềm PE độc hại 2.2.2.1 Thu thập liệu 2.2.2.2 Trích xuất đặc trưng 2.2.2.3 Huấn luyện mơ hình dự đốn 2.3 Học tổng hợp 2.3.1 Tổng quan 2.3.2 Phương pháp Stacking 2.4 Mạng sinh đối kháng 2.4.1 Giới thiệu tổng quan 2.4.2 Mạng Tạo sinh v 2.5 2.4.3 Mạng Phân biệt Học tăng cường 2.5.1 Giới thiệu tổng quan 2.5.2 Các thành phần học tăng cường 2.5.2.1 Tác nhân 2.5.2.2 Môi trường 2.5.2.3 Hành động 2.5.2.4 Trạng thái 2.5.2.5 Phần thưởng 2.5.2.6 Chính sách 2.5.3 Quá trình định Markov 2.5.4 Học tập Q 2.5.5 Học sâu tăng cường mạng Q 26 27 27 28 28 28 28 28 28 29 29 30 31 PHƯƠNG PHÁP PHÁT SINH MẪU MÃ ĐỘC ĐỐI KHÁNG CHỐNG LẠI TRÌNH PHÁT HIỆN MÃ ĐỘC TỔNG HỢP 3.1 Mơ hình hóa mối đe dọa 3.2 Tổng quan phương pháp tạo mã độc đối kháng 3.3 Chi tiết phương pháp tạo mã độc đối kháng 3.3.1 Mơ hình FeaGAN 3.3.1.1 Trình Tạo sinh 3.3.1.2 Trình Phát thay 3.3.1.3 Trình Phát mã độc 3.3.1.4 Quá trình huấn luyện 3.3.2 Mô hình học tăng cường 3.3.2.1 Môi trường 3.3.2.2 Không gian hành động 3.3.2.3 Phần thưởng 3.3.2.4 Tác nhân 3.3.2.5 Quá trình huấn luyện 3.4 Bộ phân tích động 32 32 34 35 36 37 37 38 38 39 40 40 41 42 43 45 THÍ NGHIỆM VÀ ĐÁNH GIÁ 4.1 Mơi trường thí nghiệm 47 47 vi 47 47 48 51 51 51 51 52 53 53 55 56 56 56 58 64 64 64 64 64 65 65 66 66 KẾT LUẬN 5.1 Kết luận 5.2 Hướng phát triển 72 72 73 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.1.1 Cấu hình 4.1.2 Cài đặt module thư viện 4.1.3 Xây dựng hệ thống phân tích động Kịch thực nghiệm Tập liệu Phân chia liệu 4.4.1 Mô hình FeaGAN 4.4.2 Mơ hình mục tiêu Tiền xử lý liệu 4.5.1 Mơ hình FeaGAN 4.5.2 Mơ hình mục tiêu Tiêu chí đánh giá Triển khai đánh giá hiệu thuật tốn tổng hợp 4.7.1 trình Phát mã độc FeaGAN 4.7.2 Mơ hình mục tiêu Kết thực nghiệm 4.8.1 Mơ hình FeaGAN 4.8.1.1 Mạng Tạo sinh 4.8.1.2 Mạng Phân biệt 4.8.1.3 Đánh giá kết mơ hình FeaGAN 4.8.2 Hiệu mẫu đột biến 4.8.2.1 Triển khai 4.8.2.2 Trước đột biến 4.8.2.3 Sau đột biến TÀI LIỆU THAM KHẢO 74 vii Danh sách hình vẽ 2.1 2.6 2.7 2.8 2.9 Ba thách thức việc trì ngữ nghĩa phần mềm PE độc hại đối kháng Cấu trúc tệp PE Các phương pháp phát mã độc Tổng quan bước phát mã độc dựa học máy học sâu Sơ đồ phân chia mơ hình máy học dựa cách kết hợp thuật tốn yếu độ phức tạp Kiến trúc mạng GAN Lan truyền ngược huấn luyện mạng Tạo sinh Lan truyền ngược huấn luyện mạng Phân biệt Tổng quan học tăng cường 19 24 25 26 27 3.1 3.2 3.3 3.4 Chiến lược hệ thống đề xuất Tổng quan hệ thống tạo mẫu độc hại đối kháng Sơ đồ cấu trúc mơ hình FeaGAN Sơ đồ cấu trúc mơ hình DQEAF 34 35 36 40 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 Giao diện Cuckoo Sandbox Thông tin hàm chức trích xuất từ mẫu liệu Thơng tin phân đoạn trích xuất từ mẫu liệu Dạng liệu đưa vào mơ hình Dữ liệu mẫu sau tiền xử lý cho mô hình mục tiêu Diện tích đường cong thuật toán đơn Đường AUC thuật toán tổng hợp đồng Voting Đường AUC thuật toán tổng hợp Stacking Đường AUC thuật toán Gradient Boosting paper trước 50 53 54 54 55 60 61 62 63 2.2 2.3 2.4 2.5 viii 11 12 13 4.10 Biểu đồ thể tỉ lệ trốn tránh mẫu đột biến 4.11 Biểu đồ thể tỉ lệ trốn tránh tăng lên sau đột biến mẫu độc hại 4.12 Kiểm tra thách thức ix 67 69 70 Danh sách bảng 2.1 2.2 Một số loại đặc trưng phổ biến tệp PE Danh mục số phương pháp học tổng hợp 14 22 4.1 4.2 4.3 4.4 4.5 4.6 4.7 Phân chia liệu FeaGAN Phân chia liệu cho Mơ hình mục tiêu Công thức số Bảng kết thuật toán đơn FeaGAN Bảng kết thuật toán tổng hợp đồng FeaGAN Bảng kết thuật tốn khơng đồng FeaGAN Hiệu thuật toán đơn tổng hợp đồng Mơ hình mục tiêu Hiệu thuật tốn tổng hợp khơng đồng mơ hình mục tiêu Recall trình Phát mã độc mẫu đặc trưng đối kháng Khả nhận diện 2000 mẫu mã độc gốc Kết khả lẩn tránh mẫu đột biến mô hình mục tiêu VirusTotal Kết khả nhận diện mẫu đột biến thực chuyển giao Khả đảm bảo thách thức 100 mẫu đột biến thuật toán 52 52 56 57 57 58 4.8 4.9 4.10 4.11 4.12 4.13 x 59 61 65 66 67 68 71 ... 30 31 PHƯƠNG PHÁP PHÁT SINH MẪU MÃ ĐỘC ĐỐI KHÁNG CHỐNG LẠI TRÌNH PHÁT HIỆN MÃ ĐỘC TỔNG HỢP 3.1 Mơ hình hóa mối đe dọa 3.2 Tổng quan phương pháp tạo mã độc đối kháng. .. 18521150 LÊ KIM DANH - 18520560 KHÓA LUẬN TỐT NGHIỆP NGHIÊN CỨU PHƯƠNG PHÁP PHÁT SINH MẪU MÃ ĐỘC ĐỐI KHÁNG CHỐNG LẠI TRÌNH PHÁT HIỆN MÃ ĐỘC TỔNG HỢP A method to generate adversarial samples against... malware, việc cải thiện khả phát mã độc trình Phát hay đơn việc mẫu mã độc đối kháng Tuy nhiên, nay, nghiên cứu GANs chế tạo mã độc đối kháng nhiều hạn chế Song song với đó, phương pháp tổng quát mạnh