1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Tiểu luận) đề tài nghiên cứu mô hình idsdựa trên dnn để phát hiện tấn công trong hệ thống iot

79 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐỖ VĂN VIỆT HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA VIỄN THƠNG I NGHIÊN CỨU MƠ HÌNH IDS DỰA TRÊN PCA ĐNN ĐỂ PHÁT HIỆN TẤN CÔNG TRONG HỆ THỐNG IOT ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC ĐỀ TÀI: NGHIÊN CỨU MƠ HÌNH IDS DỰA TRÊN DNN ĐỂ PHÁT HIỆN TẤN CÔNG TRONG HỆ THỐNG IOT Giảng viên hướng dẫn TS HOÀNG TRỌNG MINH Sinh viên thực ĐỖ VĂN VIỆT Lớp Hệ ĐHCQ Hà Nội, 2022 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA VIỄN THƠNG I ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC ĐỀ TÀI: NGHIÊN CỨU MƠ HÌNH IDS DỰA TRÊN PCA DNN ĐỂ PHÁT HIỆN TẤN CÔNG TRONG HỆ THỐNG IOT Giảng viên hướng dẫn TS HOÀNG TRỌNG MINH Sinh viên thực ĐỖ VĂN VIỆT Lớp Hệ ĐHCQ Hà Nội, 2022 Ậ Ủ Ả VIÊN HƯỚ Ẫ ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Điểm: (Bằng chữ Ngày tháng năm 2022 ảng viên hướng dẫn TS.Hoàng Trọng Minh Ậ Ủ Ả Ả Ệ ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… ………………………………………………………………………………………… Điểm: (Bằng chữ Ngày tháng năm 2022 ảng viên phản biện Ờ ẢM ƠN Kết đồ án tốt nghiệp đại học trình rèn luyện, tích lũy kiến thức sau năm học Học Viện Cơng Nghệ Bưu Chính Viễn Thơng Để kiến thức q giá em xin gửi lời cảm ơn chân thành sâu sắc tới tất thầy cô giáo, cán giảng viên dạy trường Học viện Cơng nghệ Bưu Viễn Thơng, đặc biệt thầy, cô khoa Viễn Thông 1, cảm ơn tất thầy năm dắt, dạy dỗ để cáo tốt nghiệp hôm Em xin gửi lời cảm ơn chân thành sâu sắc tới – giảng Trọng trực tiếp hướng dẫn hầy giáo, đồ tốt đỡ, sẻ nghiệp Thầy nhiệt tình bảo em cách tỉ mỉ cẩn thận ơn đình, bạn thường kinh nghiệm, thời gian học tập, nghiên cứu suốt trình em thực làm đồ án tốt nghiệp Hà Nội, ngày Năm 202 Sinh viên thực Đỗ Văn Việt Document continues below Discover more from: lý dự án quản 2021 Học viện Công ng… 421 documents Go to course 14 35 83 130 47 BÀI TẬP LỚN CÁ NHÂN MẪU VỀ DỰ… quản lý dự án 94% (52) Bai nhom Qun ly d an D an xay dn quản lý dự án 100% (4) Bài-tập-lớn-mônQuản-lý-dự-án-… quản lý dự án 100% (3) QLDA v1 - Giáo trình quản lý dự án phần… quản lý dự án 100% (2) HỆ THỐNG CÂU HỎI TRẮC NghiệM… quản lý dự án Ụ Ụ LỜI CẢM ƠN 179 Quản trị dự án 143 c viện Công nghệ… quản lý dự án MỤC LỤC DANH MỤC HÌNH VẼ DANH MỤC BẢNG THUẬT NGỮ VIẾT TẮT LỜI MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ MƠ HÌNH IDS VÀ HỆ THỐNG IOT 1.1 Tổng quan hệ thống IoT 1.2 Tổng quan IDS hệ thống IoT 1.2.1 Phương pháp dựa chữ ký (SIDS) 1.2.2 Phương pháp dựa bất thường (AIDS) 1.3 Dữ liệu hệ thống IoT 1.4 Phương pháp tiếp cận học máy cho hệ thống IDS 1.5 Kết luận chương CHƯƠNG 2: XÂY DỰNG MƠ HÌNH IDS DỰA TRÊN PCA 2.1 Mạng nơ ron học sâu 2.1.1 Khái niệm học sâu 2.1.2 Mạng Nơ ron học sâu Kỹ thuật phân tích thành phần 2.3 Ứng dụng PCA 2.4 Thiết lập mơ hình 2.5 Kết luận chương CHƯƠNG 3: TRIỂN KHAI THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 3.1 Phân tích xử lý liệu 100% (2) 100% (2) 3.1.1 Phân tích liệu 3.1.2 Tiền xử lý liệu 3.1.3 Giảm chiều cho tập liệu 3.2 Giai đoạn triển khai mơ hình thử nghiệm 3.2.1 Thiết lập mơ hình mạng Nơ ron học sâu 3.2.2 Các kịch triển khai thử nghiệm mơ hình 3.3 Phân tích đánh giá kết 3.3.1 Các kịch với tập liệu nhỏ 3.3.2 Các kịch với PCA 3.4 Kết luận chương KẾT LUẬN TÀI LIỆU THAM KHẢO Ụ Ẽ Hình 1.1 Kiến trúc Hệ thống IoT Hình 1.2 Các khía cạnh IoT Hình 1.3 Ứng dụng IoT Hình 1.4 Ứng dụng AI cho hệ thống IoT Hình 1.5 Tổng quan IDS hệ thống IoT 1.6 Khái niệm phương pháp IDS dựa chữ ký Hình 1.7 Hệ thống IDS dựa chữ ký dựa bất thường Hình 1.8 Các kỹ thuật học máy Hình 2.1 Khái niệm mạng thần kinh Hình 2.2 Minh họa mạng nơ ron học sâu Hình 2.3 Mơ hình DNN đơn giản Minh họa q trình tính tốn nơ Hình 2.5 Mơ tả cho việc sử dụng thành phần bias Hình 2.6 Q trình tính tốn mạng nơ ron học sâu Hình 2.7 Đồ thị hàm sigmoid Hình 2.8 Đồ thị hàm Hình 2.9 Đồ thị hàm Relu Hình 2.10 Đồ thị hàm Gelu Relu Hình 2.11 Đồ thị hàm Softmax Hình 2.12 Minh họa cho phép chuyển sở khơng gian Hình 2.13 Các bước thực PCA Hình 2.14 Mơ hình thiết lập thử nghiệm Hình 3.1 Hình ảnh minh họa giá trị tập liệu IoT Hình 3.2 Minh họa mã hóa One Hình 3.3 Mơ hình mạng nơ ron học sâu DNN thiết lập cho thử nghiệm Hình 3.4 Ví dụ minh cho Confusion Matrix phân loại đa nhãn Hình 3.5 Ví dụ Confusion Matrix cho phân loại nhị phân 3.6 Đồ thị Accuracy với tập liệu nhỏ Hình 3.7 Đồ thị hàm Loss với tập liệu nhỏ Đồ án tốt nghiệp Đại học Chương Triển khai thử nghiệm đánh giá kết Theo tác giả , kỹ thuật đánh giá Confusion matrix có hiệu cao việc phân loại đa nhã 3.4 đưa ví dụ cho kỹ thuật toán phân loại đa nhãn Tuy nhiên, để hình dung rõ kỹ thuật đánh giá này, trình bày ma trận toán phân loại hai lớp – nhị phân Trước tiên, số khái niệm cần quan tâm Dương tính (Positive), Âm tính (Negative) biểu thị cho nhãn nhãn cho toán phân loại nhị phân Kết hợp với việc dự đoán sai mơ hình DNN, bốn khái niệm sau biểu thị: Dương tính Đúng (TP), Âm tính Đúng (TN), Dương tính Sai (FP), Âm tính Sai (FN) Hình 3.5 trình bày ví dụ đơn giản cho điều Ví dụ minh cho Confusion Matrix phân loại đa nhãn Ví dụ Confusion Matrix cho phân loại nhị phân Trong toán phân loại nhị phân, TP biểu thị cho lượng liệu dự đoán nhãn dán cho liệu 1; TN biểu thị cho lượng liệu dự đoán nhãn dán cho liệu 0; FP biểu thị cho lượng liệu dự đoán nhãn dán cho liệu 0; FN biểu thị cho lượng liệu dự đoán nhãn dán cho liệu Từ ma trận này, theo tác giả sử dụng tham số Accuracy, Precision, Recall F1 Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương thức Triển khai thử nghiệm đánh giá kết để đánh giá mơ hình Khái niệm tham số sau: hiểu tỉ lệ phần trăm dự đoán thử nghiệm Được tính việc chia tổng số mẫu dự đoán cho tổng tất mẫu dự đoán 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑇𝑃+𝑇𝑁 𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 tỉ lệ mẫu dự đốn Dương tính Đúng với tồn mẫu dự đốn Dương tính 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃 𝑇𝑃+𝐹𝑃 tỉ lệ mẫu dự đốn Dương tính Đúng với tổng mẫu có nhãn Dương tính 𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃 𝑇𝑃+𝐹𝑁 tỉ lệ dung hòa cho hai tham số Precision Recall Nếu hai tỉ lệ cao mức gây cho tỉ lệ cịn lại giảm Do cần tham số dung hịa hai tỉ lệ F1 score coi tỷ lệ đánh giá cho mơ hình, mơ hình tốt F1 score cao 𝐹1 − 𝑠𝑐𝑜𝑟𝑒 = × 𝑝𝑟𝑒𝑐𝑐𝑖𝑠𝑖𝑜𝑛×𝑟𝑒𝑐𝑎𝑙𝑙 𝑝𝑟𝑒𝑐𝑐𝑖𝑠𝑖𝑜𝑛+𝑟𝑒𝑐𝑎𝑙𝑙 Thêm yếu tố tốn máy học hàm loss, Trong trình đào tạo, hàm loss tính lại liên tục để biểu thị khả học cho tham số mơ hình, giá trị hàm loss thể chênh lệch giá trị việc dự đoán nhãn với với giá trị nhãn Độ chênh lệch lớn chứng tỏ việc dự đoán sai lớn, hàm loss cao Khi giá trị hàm loss mức nhỏ, chứng tỏ việc dự đoán sai khơng xảy ra, điều chứng tỏ mơ hình đào tạo tốt Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Phân tích đánh giá kế Trong nội dung phần này, Triển khai thử nghiệm đánh giá kết ả đưa kết thử nghiệm theo kịch đề Bằng kiến thức nghiên cứu, thực phân tích giải thích kết đạt Các kịch với tập liệu nhỏ Như đề cập phần 3.2.2, kịch tập liệu nhỏ thực với số lượng lấy mẫu khác 100 nghìn mẫu/ cơng, 500 nghìn mầu/ cơng triệu mẫu/ cơng Hình 3.7 thể mơ tả độ xác khả đào tạo mơ hình cho q trình đào tạo với kịch tập liệu nhỏ Độ xác cụ thể cho kịch mô tả bảng 3.4 100k mẫu/ công Bảng 500k mẫu/tấn cơng triệu mẫu/ cơng Độ xác cho tập liệu nhỏ Đồ thị Accuracy với tập liệu nhỏ Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Triển khai thử nghiệm đánh giá kết Đồ thị hàm Loss với tập liệu nhỏ Theo kết thu được, cho rằng, với việc sử dụng tập liệu với số lượng triệu mẫu/ công để thực thử nghiệm khả thi Với độ xác %, tập liệu bao qt tồn công tập liệu 23 Trong kết quả, nhận thấy việc chênh lệch độ xác tập liệu nhỏ l Điều xảy tập liệu với số lượng lấy mẫu nhỏ không đủ “kiến thức” để mơ hình DNN học, độ xác không cao Điều thường gặp phải toán học máy nay, liệu vô quan trọng, ảnh hưởng hiệu mơ hình máy học Các kịch với PCA Trong phần này, đưa kết cho kịch thử nghiệm với tập liệu theo số lượng đặc tính giữ lợi việc sử dụng PCA Các thử nghiệm thử tăng dần theo số lượng đặc tính muốn lại đạt kết tốt Việc thử nghiệm cho thấy kết tốt số lượng đặc tính giữ lại n=5, với tập liệu giữ lại 30% lượng thông tin tập liệu ban đầu, cụ thể trình bày bảng 3.5 Tại kịch này, độ xác đạt 0.992 , kết cho thấy gần với tập liệu ban đầu 0.99 Xét kịch liền tiếp theo, mức độ thay đổi độ xác tăng Vậy nên, để tối ưu mặt liệu, kịch bản PCA với n=5 lượng thông tin giữ lại từ liệu gốc 30% coi kịch tốt để đào tạo mơ hình Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Triển khai thử nghiệm đánh giá kết 𝒓𝑲 Bảng Kết thử nghiệm với PCA Đồ thị Accuracy với kịch PCA Đồ thị hàm Loss với kịch PCA Để thể rõ hiệu mơ hình DNN đào tạo kịch này, thực so sánh đồ thị kịch PCA n =5 với kịch không sử dụng PCA cho tập liệu, hình 3.10 3.11 Nhận thấy kịch này, đồ thị Accuracy có độ cao chậm so với kịch không sử dụng PCA, nhiên, điều giải thích việc tập liệu giảm số lượng đặc tính gây mơ hình khó khăn việc Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Triển khai thử nghiệm đánh giá kết học từ liệu, dẫn tới cần học nhiều lần Tuy nhiên, mơ hình học hiệu quả, điều chấp nhận Đồ thị so sánh Accuracy cho tập liệu sử dụng PCA Đồ thị so sánh hàm Loss cho tập liệu sử dụng PCA Chỉ số Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Bảng Triển khai thử nghiệm đánh giá kết Các tham số đánh giá mơ hình Bảng 3.6 đưa để đánh giá cho mơ hình thử nghiệm Các tham số Precision, score trình bày phần 3.2 Đây tham số dùng để đánh giá cho mơ hình thử nghiệm em Hầu đa số tham số cho kết cao việc phân loại xác liệu cho nhãn Tuy nhiên số nhãn, việc phân loại chưa cho kết tốt Trong công việc nghiên cứu, em nhận thấy vấn đề tập liệu, số loại công liệu có số lượng liệu ít, điều gây cho việc đào tạo không cho mơ hình Việc xử lý liệu dạng cho thách thức chênh lệch số lượng liệu lớn loại cơng Tuy nhân, nhìn cách tổng thể, phần lớn loại công phân loại mơ hình coi mơ hình hiệu Như vậy, sau triển khai thử nghiệm kịch nghiên cứu này, mơ hình DNN kết hợp PCA mang lại hiệu tốt độ xác cho cơng việc phân loại công với ưu điểm việc sử dụng liệu có kích thước nhỏ Việc sử dụng liệu mang lại hiệu sử dụng tài nguyên lớn đối việc công việc ảm tải khả tính tốn, làm tăng hiệu suất thời gian Bảng 3.7 hình 3.12 mơ tả rõ ràng hiệu mặt thời gian mơ hình kết hợp PCA Với tập liệu ban đầu chưa áp dụng PCA, thời gian tiêu tốn với tập liệu sử dụng PCA, thời gian giảm , giảm đáng kể tài nguyên thời gian Phần giảm thời gian giải thích Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Triển khai thử nghiệm đánh giá kết kích thước liệu giảm đi, tài nguyên tiêu tốn giảm đi, tài nguyên giảm tài ngun tính tốn, tài ngun nhớ máy tính, tài ngun cho tham số mơ hình Ưu điểm kịch tối ưu thời gian, phương pháp tối ưu phải đánh đổi với số tiêu chí khác, phương pháp tối ưu này, độ xác mơ hình bị ảnh hưởng Tuy độ xác sử dụng tập liệu PCA cho đào tạo giảm so với tập liệu không PCA, 0.9923 so với 0.99 chấp nhận so với mặt tích cực thời gian mà đem lại Thời gian (ms) Thời Bảng Tài nguyên thời gian sử dụng So sánh thời gian đào tạo DNN kết hợp Đỗ Văn Việt – phần giảm Đồ án tốt nghiệp Đại học ế Chương Triển khai thử nghiệm đánh giá kết ận chương Trong nghiên cứu này, nội dung khai thác liệu IoT 23 với kỹ thuật đại mơ hình mạng nơ ron học sâu DNN kỹ thuật phân tích thành phần PCA Nội dung phần triển khai nghiên cứu hồn thành cơng việc sau: nghiệm mơ hình DNN tập liệu nhỏ đánh giá hiệu việc sử dụng tập liệu Mục đích cơng việc nhằm thử nghiệm cho lợi ích việc lấy lượng vừa đủ liệu tập liệu ban đầu Khi tập liệu cung cấp nhiều liệu, dẫn tới công việc xử lý cho tồn liệu gặp vấn đề Vì em đưa giải pháp thử nghiệm cho tập liệu bé tăng dần xác định tập liệu phù hợp với số lượng lấy mẫu vừa đủ Qua ứng dụng nội dung nghiên cứu nói riêng cho nghiên cứu tương lai nói chung Thử nghiệ mơ hình DNN kết hợp PCA tập liệu xử lý với PCA đánh giá kết thử nghiệm Kỹ thuật PCA nội dung nghiên cứu giúp ích cho việc giảm kích thước cho tập liệu nhằm nhằm tải việc tính tốn q trình đào tạo mơ hình Từ đó, thời gian giảm cách đáng kể Kết trình thử nghiệm cho thấy, thời gian tiêu tốn cho đào tạo mô hình DNN kết hợp PCA so với thời gian tiêu tốn cho đào tạo mơ hình DNN đơn lẻ với độ xác mơ hình kết hợp PCA DNN thử nghiệm mức kết tốt cho mơ hình, độ xác giảm sử dụng PCA kết tốt với việc giảm thiểu đáng kể mặt thời gian đào tạo mô Việc đánh giá kết cho mơ hình thử nghiệm đưa đồ án, kết thu cho thấy tính khả thi mơ hình phát xâm nhập IDS dựa PCA DNN Trong trình đánh giá, em nhận số vấn đề cần tiếp tục nghiên cứu thêm tương lai, ví dụ cho điều liệu số loại công cho kết xấu, nhiên điều giải thích tập liệu cung cấp chưa cân bằng, lượng liệu chưa phân bổ loại công, dẫn đến mức độ học chưa hồn thiện cho loại cơng này, số loại cơng có Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Chương Triển khai thử nghiệm đánh giá kết liệu cho thấy khó khăn việc đào tạo mơ hình, dẫn đến dự đoán sai Tuy nhiên, vấn đề liên quan tới số loại công có số lượng liệu, loại cơng có số lượng lớn liệu, đủ cho việc đào tạo mơ hình cho kết tốt Như chứng minh mơ hình có tính khả thi Các kết chưa tác động lớn phạm vi điều kiện thực nghiên cứu, nhiên, phạm vi điều kiện rộng lớn hơn, đặc biệt bối cảnh bùng nổ liệu nay, với cơng việc địi hỏi hiệu suất cao khả tận ụng tài nguyên tốt, thay đổi tạo thay đổi lớn Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Kết luận chung Ế Ậ Đề tài “Nghiên cứu mơ hình IDS dựa PCA DNN để phát công hệ thống IoT” kết sau khoảng thời gian dài tìm hiểu, nghiên cứu với nỗ lực học tậ trường Học iện Cơng ghệ Bưu hính Viễn Thơng đặc biệt có thêm hỗ trợ nhiệt tình từ thầy giáo TS.Hoàng Trọng Minh Qua đề tài em thu số kết sau:  Trình bày kiến thức tổng quan hệ thống phát xâm nhập mạng IoT số phương pháp tiếp cận cho hệ thống  Nắm số kỹ thuật đại mạng nơ ron học sâu, DNN kỹ thuật phân tích thành phần PCA cho giảm chiều liệu  Xây dựng mơ hình IDS dựa PCA DNN cho việc phát loại công từ liệu mạng IoT  Triển khai thử nghiệm mơ hình tập liệu sử dụng phổ biến lĩnh vực nghiên cứu, tập liệu IoT  Đạt kết thử nghiệm mức tốt cho mơ hình độ xác đặc biệt tối ưu tài nguyên thời gian cho việc đào tạo mơ hình Do thời gian thực đề tài nghiên cứu giới hạn, vậy, việc xuất sai sót đồ án em tránh khỏi Vậy thầy, cô bạn có đóng góp giúp em nhận điểm chưa tốt cố gắng hoàn thiện Một lần em xin chân thành cảm ơn Thầy giáo TS Hồng Trọng Minh thầy giáo, gia đình bạn bè giúp đỡ em trình thực đồ án Em xin chân thành cảm ơn! Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Tài liệu tham khảo Ệ Đỗ Văn Việt – Ả Đồ án tốt nghiệp Đại học Tài liệu tham khảo Bojan Stojčetović, Živče Šarkoćević, Dragan Lazarević, Danijela Marjanović, Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Tài liệu tham khảo – Đỗ Văn Việt – Đồ án tốt nghiệp Đại học Hết Đỗ Văn Việt –

Ngày đăng: 28/12/2023, 18:59

w