Một số thuật toán phân lớp và ứng dụng phát hiện xâm lược trái phép, báo cáo hệ thống thông tin hay dành cho các bạn sinh viên các trường đại hocjc ao đẳng Một số thuật toán phân lớp và ứng dụng phát hiện xâm lược trái phép
SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 1 2 Nguyễn Đình Chiểu | chieund@tttt.daklak.gov.vn Một Số Thuật Toán Phân Lớp Và Ứng Dụng Phát Hiện Xâm Nhập Trái Phép 1 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 2 2 NỘI DUNG CHÍNH IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 2 1. ĐẶT VẤN ĐỀ 3. MỘT SỐ KỸ THUẬT PHÂN LỚP 4. THỰC NGHIỆM 5. KẾT LUẬN 2. TỔNG QUAN HỆ THỐNG PHÁT HIỆN XÂM NHẬP TRÁI PHÉP SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 3 2 ĐẶT VẤN ĐỀ IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 3 1. Lý do 3. Đối tượng và phạm vi nghiên cứu 4. Phương pháp nghiên cứu 2. Mục tiêu SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 4 2 TỔNG QUAN VỀ IDS IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 4 1. Hệ thống phát hiện xâm nhập 2. Phân loại hệ thống phát hiện xâm nhập. 3. Kiến trúc của hệ thống phát hiện xâm nhập 4. Các kỹ thuật phát hiện xâm nhập trái phép. 5. Kỹ thuật khai phá dữ liệu trong phát hiện xâm nhập trái phép SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 5 2 Hệ thống phát hiện xâm nhập 1. Khái niệm: 2. Phát hiện xâm nhập: 3. Chính sách của IDS: - Phần cứng và phần mềm. - Xâm nhập tính toàn vẹn, tính sẵn sàn, tính tin cậy của HT. - HT thực hiện giám sát theo dõi, thu thập thông tin. - Phân tích, đánh giá. - Network intrusion detection system. - Host-base Intrusion detection system. - Ai sẽ giám sát hệ thống IDS? - Ai sẽ điều hành IDS? - Xử lý phát hiện như thế nào? 5 IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 6 2 PHÂN LOẠI IDS IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 6 ƯU ĐIỂM HẠN CHẾ NIDS - Quản lý được phân đoạn mạng. - Có tính trong suốt, độc lập. - Cài đặt, bảo trì đơn giản. - Tránh bị tấn công bởi một host cụ thể. - Xãy ra trường hợp báo động giả. - Không phân tích được lưu lượng đã mã hoá. - Phải luôn cập nhật thường xuyên. - Khó biết được việc mạng bị tấn công. - Giới hạn về băng thông. - Hacker vận dụng phân mãnh chồng chéo. HIDS - Xác định được người dùng. - Phát hiện tấn công trên một máy. - Phân tích dữ liệu đã được mã hoá. - Cung cấp các thông tin về host. - Hệ điều hành cùng thoả hiệp. - HIDS cần thiết lập trên từng host. - Không có khả năng phát hiện, thăm dò mạng. - Cần tài nguyên host để thực hiện. - Tấn công từ chối dịch vụ (Dos). SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 7 2 KIẾN TRÚC CỦA IDS IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 7 Ngăn chặn (Prevention) Giám sát xâm nhập (IM) Kiểm tra xâm nhập (IS) Trả lời (Response) Mô phỏng Phân tích Thông báo 1. Quá trính thực hiện của IDS SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 8 2 KIẾN TRÚC CỦA IDS IDS; Data mining; Ba thuật toán Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 8 2. Cơ sở hạ tầng IDS Thêm cơ sở hạ tầng IDS Thông báo Giám sát Hệ thống bảo vệ Nhiệm vụ của IDS SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 9 2 KIẾN TRÚC CỦA IDS IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 9 3. Kiến trúc của IDS SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 10 2 KIẾN TRÚC CỦA IDS IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 10 4. Giải pháp Kiến trúc đa tác nhân: [...]... | Make yourself to be an expert! CÁC KỸ THUẬT PHÁT HIỆN XÂM NHẬP TRÁI PHÉP 11 1) Phát hiện dựa vào dấu hiệu bất thường 2 2) Phát hiện dựa trên sự bất thường 3) Phát hiện dựa và phân tích trạng thái giao thức 4) Phát hiện dựa trên mô hình IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 11 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! KỸ THUẬT DATA MINING TRONG IDS 12 models 2... audit data IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 12 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! MỘT SỐ KỸ THUẬT PHÂN LỚP 13 1 Tổng quan về khai phá dữ liệu 2 Một số kỹ thuật phân2 lớp dữ liệu 3 Phân lớp dựa trên phương pháp học Naïve Bayes 4 Phân lớp dựa trên cây quyết định 5 Kỹ thuật phân loại máy vector hỗ trợ IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn... liệu Ứng dụng trong khai phá dữ liệu 2 Các bài toán trong khai phá dữ liệu Tiến trình trong khai phá dữ liệu IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 14 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! MỘT SỐ KỸ THUẬT PHÂN LỚP 15 Khái niệm về phân lớp Mục đích của phân lớp 2 Các tiêu chí đánh giá thuật toán phân lớp Các phương pháp đánh giá độ chính xác của mô hình phân lớp. .. Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 30 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! KẾT LUẬN 1 Về mặt lý31 luận Tổng quan về hệ thống phát hiện xâm nhập 2 trái phép, các loại hệ thống xâm nhập và các thành phần của hệ thống xâm nhập Tổng quan về các kỹ thuật sử dụng trong phát hiện xâm nhập trái phép: dấu hiệu, sự bất thường, trạng thái giao thức, kỹ thuật khai phá dữ... Xây dựng bộ phân lớp Xây dựng bộ phân lớp để phát hiện xâm nhập dựa trên ba thuật toán Naïve Bayes, Cây quyết định, Support vector machine Mục đích đánh giá hiệu quả về hai khía cạnh thời gian và độ chính xác của thuật toán IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 25 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! Thực Nghiệm 26 2 Kết quả thực nghiệm b Phân lớp dựa trên... an expert! Phân lớp SVM 21 Máy vector hỗ trợ là một khái niệm trong thống kê khoa học máy tính cho một tập hợp các phương pháp học có giám sát liên quan đến nhau để phân loại và phân tích hồi qui 2 SVM tuyến tính: Là phân lớp nhị phân, phân biệt giữa lớp + và lớp - Đây là ý tưởng phân chia biên rộng D = {( xi , yi ) | xi ∈ R , yi ∈ {− 1,1}} P n i =1 SVM phi tuyến: Ánh xạ vector dữ liệu vào không gian... 3 thuật toán, DC, NB, SVM IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 31 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! KẾT LUẬN 32 2 Về mặt thực nghiệm Dựa trên kỹ thuật phân lớp sử dụng tập dự 2 liệu mô phỏng tấn công KDD99 và trình bày mô hình bài toán Đã đánh giá được độ chính xác và thời gian của ba thuật toán phân lớp trên tập dữ liệu mô phỏng Qua thực nghiệm kỹ thuật. .. P(X|C).P(C)/P(X) - P(X) là hằng số cho tất cả các lơp - P(C) là tần số liên quan của các mẫu thuộc lớp C IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 17 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! Phân lớp Cây quyết định 18 Là một cây phân cấp có cấu trúc được dùng để phân lớp các đối tượng dựa vào dãy các luật Việc xây dựng cây quyết 2 định được tiến hành một cách đề qui Lần lượt... nhóm Mỗi một đường dẫn từ gốc đến lá trong cây tạo thành một luật Mỗi cặp giá trị thuộc tính trên một đường dẫn tạo nên một sự liên quan Nút lá giữ quyết định phân lớp dự đoán Các luật được tạo dễ hiểu hơn các cây IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 19 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! Phân lớp Cây quyết định Thuật toán căn20 bản Xây dựng một cây... mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn 16 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! Phân lớp Naïve Bayes 17 Dự đoán theo xác suất: Dự đoán nhiều giả thuyết, trọng số cho bởi khả năng xảy ra của chúng 2 Chuẩn: Tất cả loại phân lớp nào cũng theo một chuẩn nhất định Nhằm để tạo ra quyết định ưu tiên đối với từng thuật toán Thuật toán này dựa theo định lý Bayes để áp dụng: P(C|X)= . chieund@tttt.daklak.gov.vn Một Số Thuật Toán Phân Lớp Và Ứng Dụng Phát Hiện Xâm Nhập Trái Phép 1 SECURITY BOOTCAMP 2012 | Make yourself to be an expert! 2 2 NỘI DUNG CHÍNH IDS; Data mining; Ba thuật toán Naïve. expert! 15 2 MỘT SỐ KỸ THUẬT PHÂN LỚP IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 15 Khái niệm về phân lớp. Mục đích của phân lớp. Các tiêu chí đánh giá thuật toán phân lớp. . expert! 13 2 MỘT SỐ KỸ THUẬT PHÂN LỚP IDS; Data mining; Ba thuật toán: Naïve Bayes, DC, SVM; Nguyễn Đình Chiểu 13 1. Tổng quan về khai phá dữ liệu 2. Một số kỹ thuật phân lớp dữ liệu. 3. Phân lớp dựa