(Luận văn thạc sĩ) nghiên cứu hệ thống phát hiện xâm nhập (ids) thông minh cho iot tại biên mạng

71 1 0
(Luận văn thạc sĩ) nghiên cứu hệ thống phát hiện xâm nhập (ids) thông minh cho iot tại biên mạng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Trần Thị Thanh Thủy NGHIÊN CỨU HỆ THỐNG PHÁT HIỆN XÂM NHẬP (IDS) THÔNG MINH CHO IOT TẠI BIÊN MẠNG ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI- NĂM 2023 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Trần Thị Thanh Thủy NGHIÊN CỨU HỆ THỐNG PHÁT HIỆN XÂM NHẬP (IDS) THÔNG MINH CHO IOT TẠI BIÊN MẠNG Chuyên ngành : Kỹ thuật Viễn thông Mã số: 8.52.02.08 ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC TS HOÀNG TRỌNG MINH HÀ NỘI- NĂM 2023 i LỜI CAM ĐOAN Tôi cam đoan tất nội dung đề án “Nghiên cứu hệ thống phát xâm nhập (IDS) thông minh cho IoT biên mạng” cơng trình nghiên cứu riêng tơi hướng dẫn, bảo, góp ý TS Hồng Trọng Minh, giảng viên Khoa Viễn thông 1, Học viện Công nghệ Bưu Viễn thơng Các số liệu, kết nêu đề án tốt nghiệp trung thực chưa cơng bố cơng trình khác khơng chép hình thức Các tài liệu tham khảo đề án trích dẫn đầy đủ, rõ ràng Tôi xin chịu trách nhiệm cơng trình nghiên cứu riêng ! Tác giả đề án Trần Thị Thanh Thủy ii LỜI CẢM ƠN Lời hết, em xin bày tỏ lời cảm ơn sâu sắc đến người hướng dẫn khoa học TS Hoàng Trọng Minh – Trưởng môn Mạng viễn thông, khoa Viễn thông 1, Học viện cơng nghệ bưu viễn thơng, người khơng hướng dẫn trực tiếp mặt khoa học mà hỗ trợ em mặt động viên để em hồn thành đề án sau năm học Thạc sĩ Hơn nữa, kiến thức, bảo tận tâm, động viên cổ vũ thầy giúp em có nhiều hội, dự định học lên cấp cao Em xin chân thành cảm ơn toàn thể giảng viên khoa Viễn Thông khoa Đào tạo Sau Đại học giúp đỡ, nhiệt tâm giảng dạy, hướng dẫn chia sẻ kiến thức kinh nghiệm quý báu cho em suốt năm học vừa qua lĩnh vực ICT nói chung lĩnh vực Viễn thơng nói riêng Đối với em, hành trình tương đối khó khăn đầy thử thách, thời gian học tập nghiên cứu Nhưng nhờ giúp đỡ tận tình dạy thầy q trình học Thạc sĩ trường, em có thêm kiến thức, tạo tảng, dạy cách tư duy, định hướng để em hồn thành q trình học tập thực đề án giúp em tự tin hành trang phía trước Em khắc ghi cơng ơn dạy dỗ thầy cô khoa Viễn Thông khoa Đào Tạo Sau Đại Học Em nhớ trường này, thầy cô thật tự hào học tập từ đại học đến cao học đây, nơi mà em gửi gắm phần xn vui có buồn có thực xúc động viết lời Em xin cảm ơn anh chị bạn học viên lớp M21CQTE01-B sát cánh đồng hành em trình học tập trường hoàn thành đề án Cuối cùng, em dành lời yêu thương đến gia đình em, bố mẹ em trai em Sự động viên, giúp đỡ hi sinh, nhẫn nại họ động lực mạnh mẽ giúp tơi vượt qua khó khăn để hoàn thành đề án Xin chân thành cảm ơn! iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN .ii DANH MỤC CHỮ VIẾT TẮT v DANH MỤC BẢNG vii DANH MỤC HÌNH ẢNH viii MỞ ĐẦU CHƯƠNG – TỔNG QUAN VỀ IOT, ĐIỆN TOÁN BIÊN VÀ KỸ THUẬT PHÁT HIỆN XÂM NHẬP 1.1 Giới thiệu chung IoT 1.1.1 Công nghệ IoT .3 1.1.2 Các vấn đề an tồn thơng tin IoT 1.2 Tổng quan mơ hình điện tốn biên IoT 1.3 Hệ thống phát xâm nhập (IDS) 11 1.3.1 Giới thiệu chung 11 1.3.2 Kiến trúc chung chức IDS .12 1.3.3 Kỹ thuật phát xâm nhập dựa vào dấu hiệu 16 1.3.4 Kỹ thuật phát xâm nhập dựa vào bất thường 17 1.4 Hệ thống phát xâm nhập (IDS) cho IoT biên mạng 18 1.4.1 Giới thiệu chung 18 1.4.2 Kỹ thuật phát xâm nhập cho IoT .19 1.4.3 Ứng dụng giải pháp phát xâm nhập cho IoT biên mạng 22 1.5 Kết luận chương 23 CHƯƠNG – GIẢI PHÁP PHÁT HIỆN XÂM NHẬP THÔNG MINH CHO IOT TẠI BIÊN MẠNG 24 2.1 Giới thiệu chung 24 2.2 Một số kỹ thuật thông minh phát xâm nhập 27 (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng iv 2.3 Mt s thut toỏn thụng minh cho IoT biên mạng phát xâm nhập 28 2.3.1 SVM 29 2.3.2 J48 Decision Tree 30 2.3.3 Random Forest 30 2.3.4 Hồi quy logistic 32 2.3.5 Thuật toán heuristic 33 2.3.6 Mạng Nơ-Ron sâu (DNN) 36 2.4 Tập liệu IoT-23 sử dụng mơ hình phát xâm nhập 40 2.5 Kết luận chương 42 CHƯƠNG – ĐỀ XUẤT GIẢI PHÁP IDS THÔNG MINH TẠI BIÊN MẠNG 43 3.1 Đề xuất xây dựng mô hình hệ thống phát xâm nhập cho IoT biên mạng 43 3.1.1 Tiền xử lý liệu 45 3.1.2 Phân cụm liệu .47 3.1.3 Trích chọn đặc trưng 48 3.1.4 Mơ hình IDS dựa DNN 51 3.2 Thử nghiệm mơ hình hệ thống phát xâm nhập đề xuất 52 3.3 Đánh giá kết thử nghiệm mơ hình đề xuất 55 3.3.1 Các tham số đánh giá .55 3.3.2 Đánh giá kết thử nghiệm mơ hình đề xuất 57 3.4 Kết luận chương 59 KẾT LUẬN VÀ KIẾN NGHỊ 60 DANH MỤC TÀI LIỆU THAM KHẢO 61 (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng v DANH MC CH VIẾT TẮT Từ viết tắt Nghĩa Tiếng Anh Nghĩa Tiếng Việt AI Artificial Intelligence Trí tuệ nhân tạo CNN Convolutional Neural Network Mạng nơ-ron tích chập CPU Central Processing Unit Bộ phận xử lý trung tâm CSO Cuckoo Search Optimization Tối ưu hóa tìm kiếm Cuckoo DNN Deep Neural Network Mạng nơ-ron sâu DoS Denial of Service Tấn công từ chối dịch vụ DDoS Distributed Denial of Service Tấn công từ chối dịch vụ phân tán DT Decision Tree Cây định EMS Event Management System Hệ thống quản lý kiện FA Firefly Algorithm Thuật tốn đom đóm FFDNN Feed Forward Deep Neural Networks Mạng thần nơ-ron chuyển tiếp FTP File Transfer Protocol Giao thức truyền file GA Genetic Algorithm Thuật toán di truyền HTTP Hypertext Transfer Protocol Giao thức truyền siêu văn IDS Intrusion Detection System Hệ thống phát xâm nhập IoT Internet of Things Internet vạn vật IP Internet Protocol Giao thức Internet KNN K - Nearest Neighbor K-Láng giềng gần LR Logistic Regression Hồi quy logistic LR-CSO LR-FA Logistic Regression- Cuckoo Hồi quy tuyến tính-Tối ưu hóa tìm Search Optimization Logistic Algorithm kiếm Cuckoo Regression-Firefly Hi quy tuyn tớnh-Thut toỏn om úm (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng vi LR-GA LR-PSO Logistic Regression-Genetic Hi quy tuyn tớnh-Thut tốn di truyền Algorithm Logistic Regression-Particle Hồi quy tuyến tính-Tối ưu hóa bầy Swarm Optimization đàn LSTM Long Short-Term Memory Trí nhớ ngắn hạn ML Machine Learning Học máy POP Post Office Protocol Giao thức bưu điện PSO Particle Swarm Optimization Tối ưu hóa bầy đàn RNN Recurrent Neural Networks Mạng nơ-ron hồi quy SMTP Simple Mail Transfer Protocol Giao thức truyền mail đơn giản SVM Support Vector Machine Máy vectơ hỗ trợ TCP Transmission Control Protocol Giao thức điều khiển truyền dẫn UDP User Datagram Protocol Giao thức gói liệu người dùng WSN Wireless Sensor Network Mạng cảm bin khụng dõy (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng vii DANH MC BNG Bng 2.1 Tóm tắt kịch IoT độc hại lành tính 41 Bảng 3.1 Tất loại công tập liệu IoT-23 .466 Bảng 3.2 Tập liệu sử dụng mơ hình đề xuất trích xuất tập liệu IoT-23 47 Bảng 3.3 Tham số mơ hình .54 Bảng 3.4 Bảng ma trận nhầm lẫn đa lớp (Confusion Matrix) 56 Bảng 3.5 Hiệu suất mơ hình đề xuất tập liệu IoT-23 .58 Bảng 3.6 Hiệu suất mơ hình đề xuất theo loại công .59 (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng viii DANH MC HèNH NH Hỡnh 1.1 Mơ hình điện tốn biên Hình 1.2 Kiến trúc chung IDS 13 Hình 1.3 Quy trình hoạt động chung kỹ thuật phát xâm nhập dựa vào dấu hiệu 17 Hình 1.4 Quy trình hoạt động chung kỹ thuật phát xâm nhập dựa vào bất thường .18 Hình 1.5 Giải pháp phát xâm nhập ứng dụng cho hệ thống IoT .20 Hình 2.1 Thuật tốn SVM ……………………………………………………… 29 Hình 2.2 Sơ đồ mơ tả thuật tốn Random Forest 31 Hình 2.3 Mạng nơ-ron bốn lớn với hai lớp ẩn 38 Hình 3.1 Mơ hình hệ thống ……………………………………………………… 44 Hình 3.2 Tập liệu IoT-23 ban đầu với 23 đặc trưng 52 Hình 3.3 Tập liệu IoT-23 sau tiền xử lý liệu 52 Hình 3.4 Dữ liệu sau phân cụm trực quan hóa 53 Hình 3.5 Biểu đồ huấn luyện phương pháp LR-GA (bao gồm accuracy loss) 54 Hình 3.6 Biểu đồ huấn luyện phương pháp LR-PSO (bao gồm accuracy loss) 54 Hình 3.7 Biểu đồ huấn luyện phương pháp LR-CSO (bao gồm accuracy loss) 55 Hình 3.8 Biểu đồ huấn luyện phương pháp LR-FA (bao gồm accuracy loss) 55 (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 47 vect trng thỏi nhị phân độc lập [10] Ví dụ, tệp liệu có hai cột loại địa IPv4: “id.orig_h” “id.resp_h”, cột biểu thị giá trị địa IP khác Tiêu chuẩn cho mã hóa địa IP, mã hóa liệu địa IPv4 thành định dạng kỹ thuật số thư viện “ipaddress” Bằng cách chuyển đổi octet thành nhị phân bit sau nối bốn octet để tạo chuỗi nhị phân 32 bit, thư viện chuyển đổi địa IP thành biểu diễn kỹ thuật số Sau chuyển đổi lại thành số thập phân từ hệ nhị phân 32 bit Trong đề án này, tập liệu sử dụng trích xuất loại công từ tập liệu IoT-23 gốc mô tả bảng 3.2 Tập liệu sử dụng trích xuất loại cơng lưu lượng cao phổ biến loại công lưu lượng thấp bao gồm Okiru, PartOfAHorizontalPortScan, C&C PartOfAHorizontal- PortScan C&C- Heart Beat Attack Các loại công gán nhãn từ đến để kiểm thử với mô hình đề xuất Bảng 3.2 Tập liệu sử dụng mơ hình đề xuất trích xuất tập liệu IoT-23 Number Type Samples Okiru 100000 PartOfAHorizontalPortScan 100000 C&C PartOfAHorizontalPortScan 888 C&C HeartBeat Attack 834 Sum 201722 3.1.2 Phân cụm liệu Trong sơ đồ hình 3.1, phân cụm tập liệu công lưu lượng cao áp dụng sau tiền xử lý liệu Đối với cơng có lưu lượng truy cập cao, điều cần thiết tìm điểm liệu quan trọng có ảnh hưởng nhiều đến mơ hình thay xử lý tồn tập liệu Do đó, việc phân cụm cỏc d liu (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 48 cú lu lng truy cập cao giảm kích thước tập liệu chọn điểm liệu quan trọng Trong đề án này, sử dụng phương pháp K-means cho cơng có lưu lượng truy cập cao tính đơn giản dễ thực cho hiệu tương đối cao tính đơn giản dễ thực Thuật tốn ban đầu chọn K tâm cụm ngẫu nhiên Sau đó, tính tốn điểm liệu cho trung tâm cụm ban đầu điểm liệu gần trung tâm cụm thuộc cụm Trung tâm cụm tính tốn lại với giá trị trung bình điểm liệu Thuật tốn dừng lại cải thiện Các bước chi tiết thuật toán K-means hoạt động thuật toán Thuật toán Thuật toán K-means 1: Khởi tạo k điểm tâm ban đầu Các điểm trung tâm chọn ngẫu nhiên dựa kiến thức liệu 2: Tính tốn khoảng cách điểm liệu đến điểm trung tâm, sau gán vào nhóm có điểm trung tâm gần 3: Tính lại vị trí k điểm tâm dựa liệu điểm gán cho nhóm 4: Lặp lại bước điểm trung tâm không đổi đạt đến số lần lặp tối đa cho trước 5: Trả nhóm liệu phân loại 3.1.3 Trích chọn đặc trưng Trong tập liệu IoT-23, số lượng đặc trưng 33 sau tiền xử lý liệu Thêm vào đó, thực tế tập liệu IoT-23 chứa công lưu lượng nhỏ lớn nên dẫn đến cân liệu, khiến cho mạng nơ-ron gặp thách thức cho việc phát loại cơng Do đó, đề án này, sử dụng số thuật toán heuristic kết hợp với thuật toán LR để chọn đặc trưng nhỏ mang nhiều thông tin từ 33 đặc trưng giảm chiều liệu để nâng cao độ xác phát công tập liệu IoT-23 Đồng thời, giải vấn đề cân liệu cách sử dụng phương pháp class weight LR Thut toỏn LR-GA (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 49 GA tìm kiếm giải pháp tiềm sử dụng giao thoa đột biến để tạo hệ giải pháp mới, giải pháp tốt ưu tiên cho hệ Các giải pháp biểu diễn dạng trình tự gen, tương tự ký tự chuỗi Thuật toán LR-GA thuật toán kết hợp thuật tốn LR GA Thuật tốn LR-GA có bước thuật tốn Thuật tốn Tối ưu tham số GA thuật toán LR 1: Khởi tạo tập tham số ban đầu 2: Khởi tạo cá thể cho quần thể ban đầu 3: Tính tốn hàm fitness dựa thuật tốn LR 4: Chọn cá thể có hiệu cao 5: Áp dụng phép đột biến cho số giải pháp hệ để tạo đa dạng tập hợp giải pháp 6: Đánh giá chất lượng giải pháp hệ 7: Lựa chọn giải pháp tốt để trở thành tập hợp giải pháp cho hệ 8: Lặp lại từ bước đến bước đạt giải pháp tốt đủ số hệ 9: Kết thúc thuật toán  Thuật toán LR-PSO Thuật toán LR-PSO thuật toán kết hợp thuật tốn LR với PSO, thuật tốn LR-PSO có bước thuật tốn Thuật tốn Tối ưu tham số PSO thuật toán LR 1: Khởi tạo tập tham số ban đầu 2: Khởi tạo cá thể cho quần thể ban đầu 3: Tính tốn hàm fitness dựa thuật tốn LR lựa chọn vị trí tốt cá th lm qun th tip theo (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 50 4: Cập nhật vị trí hạt cách tính tốn vector tốc độ cộng vào vị trí hạt Vector tốc độ tính toán cách kết hợp hai thành phần: (a) thành phần tự do, hạt hướng dẫn vị trí tốt mà tìm thấy (b) thành phần xã hội, hạt hướng dẫn vị trí tốt mà hạt khác tập hợp tìm thấy 5: Đánh giá chất lượng hạt sau cập nhật vị trí 6: Cập nhật vị trí tốt mà tập hợp hạt tìm thấy 7: Lặp lại từ bước đến bước đạt giải pháp tốt đủ số lần lặp 8: Kết thúc thuật toán  Thuật toán LR-CSO Thuật toán Logistic Regression kết hợp với thuật toán Cuckoo Search mơ tả chi tiết thuật tốn Thuật tốn Tối ưu tham số CSO thuật toán LR 1: Khởi tạo quần thể cuckoo bao gồm giá trị ngẫu nhiên cho tham số mơ hình LR 2: Đánh giá hiệu suất cuckoo quần áo cách sử dụng mô hình LR để dự đốn so sánh với giá trị thực tế 3: Sử dụng chiến lược sinh sản cuckoo để tạo hệ quần thể, cách kết hợp giá trị cuckoo có hiệu tốt 4: Lặp lại bước bước đạt tiêu chuẩn dừng chuẩn 5: Kết thúc thuật toán  Thuật toán LR-FA Thuật toán Firefly kết hợp với thuật toán Logistic Regression triển khai thuật toán Thuật toán Tối ưu tham số ca FA bng thut toỏn LR (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 51 1: Khởi tạo số lượng lớn đom đóm ban đầu Thiết lập tham số, bao gồm: số lượng đom đóm, tham số alpha (hệ số học tương tự với hệ số học thuật toán logistic regression) khoảng cách r 2: Tìm kiếm di chuyển: Tính toán giá trị hàm mục tiêu cho đom đóm dựa tham số mơ hình LR 3: Đánh giá chọn lọc: Đánh giá hiệu suất mơ hình LR với tham số tìm kiếm Lựa chọn firefly tốt dựa giá trị hàm mục tiêu chúng 4: Cập nhật mơ hình: Sử dụng tham số firefly tốt để cập nhật mơ hình LR 5: Lặp lại bước từ đến đáp ứng yêu cầu hiệu suất mô hình 6: Kết thúc thuật tốn 3.1.4 Mơ hình IDS dựa DNN Mơ hình DNN cho thấy ưu điểm vượt trội khả phân loại liệu Do để phân loại loại công, mô hình DNN với năm lớp lớp đầu vào, ba lớp ẩn lớp đầu xây dựng đề án Lớp ban đầu có 128 nút, nén thành 64, 32 16 Đầu sau phụ thuộc vào số lớp tập liệu xử lý Chức phi tuyến mạng nơ-ron gọi “Relu” Sau lớp, sử dụng kỹ thuật Dropout để ẩn phần liên kết với giá trị 5% Trong mơ hình này, lớp đầu có bốn nút tương ứng với số đầu toán sử dụng chức kích hoạt cho lớp cuối “softmax” Triển khai mơ chức tối ưu hóa cách sử dụng trình tối ưu hóa “Adam” chức entropy chéo để điều chỉnh trọng số tối ưu hóa Tỷ lệ học tập (learning rate) quan trọng mơ hình học tập; ban đầu đặt 0,001 phép học; mơ hình xuống cấp lỗi xác thực tăng ba giai đoạn liên tiếp, giảm tỷ lệ học tập 0,2 lần (learning_rate = learning_rate*0,2), mức tối thiểu 0,00001 Trong đề án, mơ hình đề xuất sử dụng phương pháp khiến mơ hình đề xuất ngừng đào tạo sớm để giảm việc học mức Quá trình đào tạo kết thúc chức lỗi xác thực không giảm sau số epoch định Để xỏc minh rng li (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 52 xỏc thc khụng tăng qua epoch, điều chỉnh số lượng epoch để cung cấp độ xác mạng tốt khoảng thời gian học tập Cuối cùng, cách sử dụng phần liệu IoT-23 để thử nghiệm việc đánh giá mơ hình đề xuất dựa tham số model accuracy (độ xác mơ hình), model loss (sự sai lệch mơ hình), precision (độ xác), recall (khả thu hồi) F1score (điểm F1) 3.2 Thử nghiệm mô hình hệ thống phát xâm nhập đề xuất Trong phần tiến hành thiết lập thử nghiệm giải pháp phát xâm nhập IDS đề xuất tập liệu nhỏ IoT-23 Tập liệu IoT-23 nhỏ ban đầu sử dụng đề án trích xuất từ tập liệu gốc mô tả hình 3.2 Sau tiền xử lý, liệu có dạng hình 3.3 Tại liệu tiền xử lý, giá trị thiếu “missing value” điền phương pháp lấy trung bình giá trị, đặc trưng có tồn giá trị NaN bỏ đặc trưng bỏ đặc trưng khơng cần thiết, khơng có ý nghĩa phát xâm nhập Các đặc trưng “unnamed”, “label”, “local resp” “local orig” tập liệu IoT-23 bị loại khỏi ghi chúng khơng có ý nghĩa việc phân loại công Các đặc trưng mã hóa chuyển sang dạng liệu số “id.orig_h” “id.resp_h” Hình 3.2 Tập liệu IoT-23 ban đầu với 23 đặc trưng Hình 3.3 Tập liệu IoT-23 sau tiền xử lý liu (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 53 Hỡnh 3.4 D liu sau phân cụm trực quan hóa Sau đó, liệu công lưu lượng cao phân cụm phương pháp K-means nhằm giảm kích thước tập liệu, phần liệu tập IoT-23 trực quan hóa hình 3.4 theo hai chiều Kết trình phân cụm tập hợp cụm, cụm chứa điểm liệu tương tự Bằng cách phân cụm, giảm kích thước tập liệu ban đầu cách lấy tâm cụm đại diện cho cụm trực quan hóa thơng tin quan trọng cơng lưu lượng cao biểu đồ Ví dụ, hình 3.4 mơ tả cụm liệu sau sử dụng thuật tốn K-means Sau liệu cơng lưu lượng cao giảm kích thước kết hợp với liệu tập huấn luyện công lưu lượng thấp để làm đầu vào thuật toán heuristic kết hợp với LR nhằm chọn đặc trưng chứa nhiều thơng tin hữu ích giúp việc phát phân loại cơng trở nên nhanh chóng Đồng thời đây, vấn đề xử lý cân liệu (giữa công lưu lượng cao công lưu lượng thấp) xử lý phương pháp class-weigth thuật toán LR nhờ vào hàm mục tiêu (fitness) Q trình trích chọn đặc trưng thuật toán heuristic (GA, PSO, CSO FA) kết hợp với thuật toán LR xử lý cân liệu (các tham số số lượng hệ, kích thước quần thể mode cân thể bảng 3.3) Cuối cùng, liệu tập huấn luyện đưa vào mơ hình DNN để phõn (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 54 loi cỏc kiu tn cụng Quỏ trình huấn luyện bốn mơ hình thể hình 3.5, 3.6, 3.7 3.8 Bảng 3.3 Tham số mơ hình Các tham số Giá trị Số lượng hệ 10 Kích thước quần thể 50 Mode cân Hình 3.5 Biểu đồ huấn luyện phương pháp LR-GA (bao gồm accuracy loss) Hình 3.6 Biểu đồ huấn luyện phương pháp LR-PSO (bao gồm c accuracy v loss) (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 55 Hỡnh 3.7 Biu đồ huấn luyện phương pháp LR-CSO (bao gồm accuracy loss) Hình 3.8 Biểu đồ huấn luyện phương pháp LR-FA (bao gồm accuracy loss) 3.3 Đánh giá kết thử nghiệm mơ hình đề xuất 3.3.1 Các tham số đánh giá Các tham số sử dụng để đánh giá giải pháp đề xuất đề án precision, recall f1-score Các tham số đánh giá tính tốn dựa vào ma trận nhầm lẫn (Confusion Matrix) Ma trận nhầm lẫn bảng sử dụng để đánh giá hiệu suất mơ hình phân loại, hiển thị khác biệt dự đoán thực mơ hình giá trị thực tế liệu Ngồi ra, cịn cung cấp nhìn tổng quan khả phân loại mơ hình giúp xác định sai sót phân loại cụ thể Do mơ hình đề xuất phân loại loi tn cụng, (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 56 nờn s dng ma trận nhầm lẫn nhiều lớp (cụ thể lớp) có dạng bảng 3.4 Từ ma trận nhầm tính tốn tham số đánh giá hiệu suất mơ precision, recall, F1-score Bảng 3.4 Bảng ma trận nhầm lẫn đa lớp (Confusion Matrix) Dự đoán Class Class Class Class Thực tế Class TP FN FN FN Class FP TP FN FN Class FP FP TP FN Class FP FP FP TP Trong đó: - TP(i) - True Positive: Số lượng dự đoán lớp i - FP(i) - False Positive: Số lượng dự đoán sai lớp i, thực tế lớp khác - FN(i) - False Negative: Số lượng dự đoán sai lớp khác, thực tế lớp i Precision (chính xác) tham số sử dụng để đánh giá hiệu suất mơ hình phân loại Nó tính tỷ lệ dự đoán positive xác định tổng số dự đốn positive Cơng thức tính precision class chung cho tất class biểu diễn công thức 3.1 Precision (i)  TP  i  TP  i   FP  i  n 1 Precision   Precision  i  , với n tổng số class i 0 (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (3.1) (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 57 Recall cũn c gi l true positive rate (tỷ lệ true positive) sensitivity (độ nhạy) tham số đánh giá khả mơ hình phân loại việc tìm tất trường hợp positive tập liệu Recall có giá trị từ đến Giá trị gần 1, tức recall cao, mơ hình phân loại tốt việc tìm trường hợp positive Một recall cao mơ hình có khả bỏ sót trường hợp positive Cơng thức tính recall mơ tả cơng thức 3.2 Recall (i)  TP  i  TP  i   FN  i  (3.2) n 1 Recall   Recall  i  , với n tổng số class i 0 F1-score tham số tổng hịa precision recall tốn phân loại Nó kết hợp khả phân loại xác trường hợp positive (precision) khả tìm tất trường hợp positive (recall) F1-score có giá trị từ đến 1, giá trị gần cho thấy mơ hình phân loại có precision recall tốt F1-score thường sử dụng cần cân đối precision recall tốn phân loại khơng cân nhắc q nhiều false positives false negatives Cơng thức 3.3 tính F1-score F1-score (i)  2* Precision  i  * Recall  i  Precision  i   Recall  i  (3.3) n 1 F1  score   F1  score  i  , với n tổng số class i 0 3.3.2 Đánh giá kết thử nghiệm mơ hình đề xuất Trong đề án này, đề xuất sử dụng phương pháp K-means để giảm kích cỡ hay số lượng mẫu liệu, kỹ thuật trích chọn đặc trưng dựa thuật toán heuristic để giảm chiều liệu tập liệu, điều dẫn đến chọn đặc trưng nhỏ hiệu làm tăng đáng kể tốc dộ mà không giảm độ xác Bên cạnh đó, mơ hình huấn luyện mở với trọng số “class-weight” giúp mơ hình làm việc hiệu với liệu cân Các loại cơng phân loại mơ hình DNN kiểm tra tập IoT-23 nhỏ mà trích xuất (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 58 Hiu nng ca mụ hỡnh h thống mơ tả bảng 3.5 Nhìn chung, kết thuật toán sử dụng đề xuất (LR-GA, LP-PSO, LR-CSO, LR-FA) có hiệu suất tương đối cao lên đến 99% Tuy nhiên, thuật toán sử dụng đề xuất, thuật tốn LR-GA cho kết tốt Bởi sau trích chọn đặc trưng, thuật tốn LR-GA chọn đặc trưng từ 33 đặc trưng để phân biệt loại công ban đầu mà giữ precision, recall F1-score cao 99% thuật tốn khác giảm thời gian tính tốn Thuật tốn LR-GA giảm thời gian tính tốn tập kiểm thử phải định dựa đặc trưng, trình huấn luyện cần thời gian nhiều để chọn đặc trưng từ 33 đặc trưng ban đầu Trong thuật toán khác, số lượng đặc trưng chọn sau ứng dụng thuật toán LR-PSO, LR-CSO LR-FAO 30, 26 26 Lúc đó, q trình kiểm thử tốn thời gian hơn, trình huấn luyện khơng cần tốn q nhiều thời gian Chính vậy, triển khai hệ thống IoT biên mạng với tài nguyên hạn chế phải đưa định nhanh chóng hệ thống IDS dựa DNN kết hợp với thuật toán LR-GA phù hợp Tuy nhiên mơ hình đề xuất tồn nhược điểm tương đối lớn phụ thuộc liệu đầu vào, cần thường xuyên cập nhật liệu loại công Bảng 3.5 Hiệu suất mơ hình đề xuất tập liệu IoT-23 Phương pháp Số đặc trưng lại LR-GA Precision Recall F1-score 0.99 0.99 0.99 LR- PSO 30 0.99 0.99 0.99 LR- CSO 26 0.99 0.99 0.99 LR- FAO 26 0.99 0.99 0.98 Cuối cùng, bảng 3.6 thể đầu kết thực nghiệm (precision, recall F1-score) class thuật toán mơ hình đề xuất kiểm nghiệm tập liệu IoT-23 Khi sử dụng mẫu nhỏ, thấy mơ hình có kết tốt Chính phù hợp ứng dụng vào thiết bị với tài nguyên biờn mng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 59 Bng 3.6 Hiu sut ca mơ hình đề xuất theo loại cơng Method Class Precision Recall F1 score Samples 0.99 0.99 0.99 100000 0.99 0.99 0.99 100000 0.99 0.98 0.99 177 0.98 0.99 0.99 168 0.99 0.99 100000 1 0.99 0.99 100000 0.99 1 177 0.99 0.99 0.99 168 0.99 0.99 100000 0.99 0.99 0.99 100000 0.99 177 0.99 1 168 0.99 0.99 100000 0.99 0.98 0.99 100000 0.99 0.99 0.99 177 0.99 0.99 168 LR-GA LR- PSO LR- CSO LR- FAO 3.4 Kết luận chương Chương cuối đề án, giải pháp IDS thông minh sử dụng thuật toán học máy để phát công cách hiệu đề xuất Đồng thời, mơ hình hệ thống thử nghiệm đánh giá Hệ thống IDS dựa mơ hình DNN với q trình xử lý liệu thuật tốn K-means thuật toán heuristic kết hợp với LR cho kết tương đối tốt, LR-GA cho kết tốt hệ thống IoT biên mạng phải định loại cơng dựa đặc tính mà đảm bảo chớnh xỏc (precision) lờn n 99% (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng 60 KẾT LUẬN VÀ KIẾN NGHỊ Sau trình làm đề án “Nghiên cứu hệ thống phát xâm nhập (IDS) thông minh cho IoT biên mạng”, đề án trình bày bám sát nội dung đề cương duyệt bao gồm chương:  Chương 1: Tổng quan IoT, điện toán biên kỹ thuật phát xâm nhập  Chương 2: Giải pháp phát xâm nhập thông minh cho IoT biên mạng  Chương 3: Đề xuất giải pháp IDS thông minh biên mạng Đề án đề xuất mô hình IDS dựa DNN với phương pháp K-means thuật toán heuristic (GA, PSO, CSO FAO) kết hợp với LR để phát công đánh giá hiệu suất chúng Mơ hình đề xuất sử dụng phương pháp K-means phân cụm liệu để giảm kích thước liệu Các thuật tốn heuristic tối ưu hóa LR nhằm trích xuất đặc trưng quan trọng đồng thời sử dụng kỹ thuật trọng số lớp (class-weight) để ngăn chặn công cân Các công phân biệt dựa vào DNN Mơ hình đề xuất kiểm tra nhiều kích thước mẫu khác liệu IoT-23 Kết thử nghiệm chứng minh rằng, tất phương pháp độ xác phát cơng mơ hình đề xuất tốt với độ xác precision, recall F1score lên đến 99% với số lượng mẫu khác Ngồi ra, thuật tốn GA kết hợp với LR mơ hình IDS dựa DNN để phát công hiệu so sánh thuật toán heuristic số lượng đặc trưng chọn tương đối (8 đặc trưng) đảm bảo độ xác, từ giảm thời gian tính tốn Do đó, khả ứng dụng mơ hình đề xuất sử dụng thiết bị biên mạng có nguồn tài nguyên hạn chế, đặc biệt mơ hình sử dụng thuật tốn GA, triển khai thực tế thiết bị tiên tiến thực hệ thống IoT nông nghiệp Các kết yếu nghiên cứu liên quan đề án công bố 01 tạp chí Mendel: [1] T T Thuy, L Thuan, N Duc, and H Minh, “A Study on Heuristic Algorithms Combined With LR on a DNN-Based IDS Model to Detect IoT Attacks”, mendel, vol 29, no 1, pp 62-70, Jun 2023 (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng (Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng(Luỏưn.vn.thỏĂc.sâ).nghiên.cỏằâu.hỏằ.thỏằng.phĂt.hiỏằn.xÂm.nhỏưp.(ids).thng.minh.cho.iot.tỏĂi.biên.mỏĂng

Ngày đăng: 02/11/2023, 02:34

Tài liệu cùng người dùng

Tài liệu liên quan