Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 17 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
17
Dung lượng
311 KB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN THANH HỒNG NGHIÊN CỨU GIẢI PHÁP PHÁT HIỆN TẤN CƠNG TRONG MẠNG VẠN VẬT KẾT NỐI SỬ DỤNG HỌC MÁY Chuyên ngành: Kỹ thuật Viễn thơng Mã số: 8.52.02.08 TĨM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HÀ NỘI - 2023 Đề án tốt nghiệp hoàn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: TS Nguyễn Minh Tuấn Phản biện 1: …………………………………………………………………………… Phản biện 2: …………………………………………………………………………… Đề án tốt nghiệp bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc sĩ Học viện Cơng nghệ Bưu Viễn thơng Vào lúc: ngày tháng năm Có thể tìm hiểu đề án tốt nghiệp tại: - Thư viện Học viện Công nghệ Bư Viễn thơng 1 LỜI MỞ ĐẦU Với sự phát triển vượt bậc công nghệ IoT, đã đóng góp phần khơng nhỏ q trình thơng minh hóa, đại hóa sống người ngày Bằng khả thu thập phân tích thơng tin mơi trường xung quanh, thiết bị IoT xuất hầu hết lĩnh vực thiết yếu sống, góp phần cải thiện chất lượng dịch vụ, ứng dụng lên tiêu chuẩn cao Mặc dù đem lại nhiều giá trị thực tiễn tích cực, cơng nghệ IoT nói chung thiết bị IoT nói riêng cũng phải đối mặt với nhiều thách thức, nổi bật số vấn đề bảo mật hệ thống IoT Hệ thống IoT hệ thống phức tạp, tạo thành từ nhiều thành phần khác Do đó, yêu cầu vận hành, bảo mật hệ thống IoT thách thức không nhỏ cho nhà quản lý khai thác hệ thống Tuy nhiên, việc triển khai giải pháp bảo mật cho hệ thống IoT cũng gặp nhiều khó khăn Đầu tiên, thiết bị IoT chủ yếu hoạt động cách tự động, không giám sát, chủ yếu kết nối qua mạng không dây Bên cạnh đó, sự hạn chế mặt tài nguyên phần cứng thiết bị IoT, khiến cho việc nghiên cứu, phát triển ứng dụng giải pháp có độ phức tạp cao cực kỳ khó khăn Chính vậy, giải pháp xây dựng, vận hành hệ thống mạng IoT phải xem xét cách toàn diện để đảm bảo yêu cầu bảo mật Hệ thống phát xâm nhập chế bảo mật tiên tiến nhằm bảo vệ hệ thống mạng máy tính IoT trước công, truy cập trái phép Việc xây dựng hệ thống IDS hiệu gặp nhiều thách thức, khó khăn yêu cầu ngày cao độ xác việc phát xâm nhập cũng hình thức cơng ngày trở nên đa dạng Do vậy, với mục tiêu nghiên cứu, tìm hiểu nắm bắt giải pháp IDS hiệu ứng dụng hệ thống IoT, đề án: “Nghiên cứu phát triển mơ hình thơng minh phát cơng mạng vạn vật kết nối” lựa chọn để nghiên cứu phát triển Đề án trình bày theo 03 chương với nội dung sau: o Chương – Giới thiệu an tồn thơng tin IoT o Chương – Giải pháp phát công mạng: o Chương – Thử nghiệm, đề xuất IDS ứng dụng IoT CHƯƠNG 1: GIỚI THIỆU VỀ AN TỒN THƠNG TIN TRONG IOT 1.1 Tổng quan công nghệ, hệ thống IoT 1.1.1 Công nghệ IoT IoT viết tắt cụm từ Internet of Things – Internet vạn vật, mang ý nghĩa kết nối thứ với Internet Trong vật cung cấp định danh khác nhau, có khả tự động truyền tải liệu qua mạng lưới khơng cần thơng qua tương tác máy tính với người hay người với người Có thể khái quát rằng IoT đề cập đến thiết bị vật lý tất nơi có khả kết nối với nhau, với Internet để biến thứ trở nên chủ động, thông minh IoT đã ảnh hưởng đến xã hội đại nhiều khía cạnh khác nhau, bao gồm từ dịch vụ chăm sóc sức khỏe cá nhân đến sản phẩm sản xuất ngành công nghiệp Một số ứng dụng phổ biến IoT có hệ thống tự hành dành cho phương tiện giao thông tự động, lưới điện siêu nhỏ phân tán để quản lý, phẩn bổ tài nguyên lượng, máy bay không người lái để giám sát hoạt động thành phố thông minh Ngồi ra, IoT cũng len lỏi, góp phần làm cho lĩnh vực quen thuộc với đời sống hàng ngày trở nên đại hơn, thông minh thuận tiện Cụ thể, nông nghiệp, nhiệt độ, độ ẩm trang trại theo dõi thơng qua q biến q trình tưới cây, bón phân cũng thực cách hồn toàn tự động Hay y tế, thiết bị đeo thông minh ứng dụng rộng rãi nhằm cập nhật tình trạng sức khỏe thời gian thực cho bệnh nhân bác sĩ, từ phát chữa trị kịp thời,… 1.1.2 Hệ thống IoT Kiến trúc IoT dựa hệ thống lớp/tầng bao gồm lớp nhận thức/ phần cứng, lớp mạng/ giao tiếp lớp giao diện/dịch vụ Các yếu tố tạo nên hệ thống IoT phần cứng/thiết bị, giao thức truyền thông giao diện/dịch vụ lớp bao gồm: Lớp nhận thức, lớp mạng, lớp hỗ trợ lớp ứng dụng Trong hệ thống IoT, thiết bị phần cững cũng giao thức truyền thống đóng vai trò quan trọng Ngồi ra, tởng hợp, cũng thành phần quan trọng khác cởng vào cho kiến trúc IoT Các cổng vào cung cấp khả kết nối xuôi dòng cho nhiều nguồn, thiết bị, hệ thống khác Ngồi ra, với cơng nghệ truyền thông mới, chẳng hạn 5G, làm cho vai trò dịch vụ đám mây trở nên quan trọng Kết nối di động 4G 5G cho phép giao tiếp không dây tầm xa Hơn nữa, khả làm cho tất thiết bị IoT xác định địa bằng cách sử dụng IPV6, cho phép thiết bị IoT kết nối trực tiếp với hệ thống, dịch vụ đám mây 1.2 Vấn đề an tồn thơng tin hệ thống IoT Bên cạnh mặt tích cực mà IoT mang lại, cũng tồn nhiều cần phải giải quyết để tiếp tục trì sự phát triển IoT, đặc biệt vấn đề bảo mật an tồn thơng tin Một vấn đề lớn hệ thống IoT vấn đề bảo mật an tồn thơng tin Có mục tiêu việc triển khai giải pháp bảo mật cho hệ thống IoT: o Đảm bảo tất liệu thu thập, lưu trữ, xử lí vận chuyển an toàn o Phát hiện, loại bỏ lỗ hổng bảo mật thành phần hệ thống 1.2.1 Các lỗ hổng bảo mật của phần mềm và phần sụn Việc đảm bảo tính bảo mật hệ thống IoT phức tạp, chủ yếu nhiều thiết bị thông minh bị hạn chế tài ngun, có khả tính tốn hạn chế khiến cho việc tích hợp giải pháp bảo mật gặp khó khăn Việc hạn chế tài nguyên phần cứng cũng dẫn đến việc khơng có cập nhật thường xuyên cũng số thiết bị có t̉i đời cao khơng còn đáp ứng tiêu chuẩn để cập nhật, từ làm cho lỗ hổng hệ thống không vá lỗi kịp thời, tạo tiền đề cho đối tượng công xâm phạm hoạt động liên lạc hệ thống, cài đặt phần mềm độc hại đánh cắp liệu có giá trị 1.2.2 Trùn thơng khơng an toàn Hầu hết chế bảo mật ban đầu thiết kế cho máy tính cá nhân, điều dẫn đến việc khó triển khai thiết bị IoT bị hạn chế tài nguyên Đó lý biện pháp bảo mật truyền thống khơng hiệu nói đến việc bảo vệ thông tin liên lạc thiết bị IoT Các thiết bị kết nối dễ bị công từ thiết bị khác Chẳng hạn, cần kẻ công giành quyền truy cập vào thiết bị hệ thống mạng gia đình hay tở chức, chúng dễ dàng xâm phạm tất thiết bị không bị cô lập khác đánh cắp thơng tin, làm tê liệt hệ thống, 1.2.3 Rò rỉ dữ liệu từ hệ thống IoT Bằng cách tận dụng thông tin bảo mật hoặc khơng mã hóa, tin tặc truy cập vào nơi mà liệu lưu trữ xử lý Không thế, với sự phát triển dịch vụ đám mây, nhiều thơng tin quan trọng lưu trữ bị rò rỉ từ từ thiết bị cũng môi trường đám mây mà chúng kết nối Ngoài ra, dịch vụ nhà cùng cấp thứ ba cũng gây rò rỉ liệu, tiêu biểu Facebook, Google mà khơng có sự cho phép chủ sở hữu thông tin, ảnh hưởng đến trải nghiệm cũng thông tin riêng tư khách hàng 1.2.4 Rủi ro từ các phần mềm độc hại Nếu kẻ cơng tìm cách đưa phần mềm độc hại vào hệ thống IoT, chúng thay đổi chức hệ thống, thu thập liệu cá nhân thực công khác Hơn nữa, số thiết bị bị nhiễm vi-rút lập tức nếu nhà sản xuất không đảm bảo bảo mật phần mềm đầy đủ 1.2.5 Tấn công mạng Các hình thức cơng mạng phở biến, gây nhiều thiệt hại cho hệ thống IoT DDoS, DoS, DoSL, MitM,… ngày tăng lên, cùng với sự thách thức việc triển khai giải pháp bảo mật cho thiết bị IoT, đặc biệt IoT xuất gần tất lĩnh vực, đời sống hàng ngày cũng hoạt động công nghiệp, dẫn đến việc nghiên cứu phát triển giải pháp phát công mạng ngày trở nên cấp thiết hết 1.3 Các giải pháp phát công hệ thống IoT 1.3.1 Quản lý tin cậy Những người sử dụng hưởng lợi từ thành phần quản lí tin cậy để giúp họ vượt qua nguy hiểm thứ không chắn liên quan đến IoT Sự tin cậy coi thuật ngữ bao gồm quyền riêng tư bảo mật Nghĩa là, người tiêu dùng có quyền quản lý tài nguyên họ bất kỳ lúc từ bất kỳ vị trí nào, cũng tiện ích cho phép họ hiểu sự tương tác với hệ thống IoT 1.3.2 Sự xác thực Xác thực trình xác định người dùng thiết bị mạng cấp quyền truy cập cho người ủy quyền thiết bị không bị thao túng Xác thực cách để giảm thiểu công đến hệ thống IoT công trả lời, công MitM, công mạo danh công mạo nhận Phương pháp cấp quyền truy cập cho người dùng lớp ứng dụng cũng cấp quyền truy cập vào thiết bị mạng IoT 1.3.3 Hệ thống phát xâm nhập IDS loại hệ thống phát đóng vai trò việc bảo vệ an ninh mạng bằng cách giám sát trạng thái phần mềm phần cứng hoạt mạng để từ đưa cảnh báo phát hoạt động bất thường IDS hướng đến mục tiêu bảo mật máy tính nhằm mục đích phát loạt hành vi vi phạm an ninh, từ nỗ lực đột nhập người bên để thâm nhập hệ thống hay sự lạm dụng người bên hệ thống Các chức IDS để giám sát máy chủ mạng, phân tích hành vi hệ thống máy tính, tạo cảnh báo phản hồi đến hành vi đáng ngờ 1.3.3.1 Các thành phần chính của một hệ thống IDS IDS bao gồm thành phần sau: o Thành phần thu thập gói tin o Thành phần phân tích gói tin o Thành phần phản hồi 1.3.3.2 Phân loại các hệ thớng phát hiện xâm nhập Có hai loại phương pháp phân loại IDS: phương pháp dựa phát phương pháp dựa nguồn liệu Ngày này, cách phân loại dựa vào nguồn liệu thường sử dụng Trong số phương pháp dựa liệu, IDS chia thành IDS dựa máy chủ IDS dựa mạng 1.3.3.3 Phân loại dựa phương pháp phát hiện Có phương pháp phát xâm nhập chính: phát dựa vào chữ ký phát dựa vào sự bất thường Đối với phát dựa vào chữ ký, Ý tưởng sử dụng chữ ký đại diện cho hành vi cơng Q trình phát đối sánh chữ ký mẫu bằng chữ ký có sở liệu Còn phát dựa sự bất thường việc thiết lập hồ sơ hành vi bình thường sau xác định hành vi bất thường theo mức độ sai lệch chúng so với hồ sơ bình thường 1.3.3.4 Phân loại dựa ng̀n dữ liệu HIDS sử dụng nhật ký kiểm tra làm nguồn liệu Các phương pháp phát nhật ký chủ yếu kết hợp dựa quy tắc học máy, dựa tính nhật ký sử dụng phương pháp dựa phân tích văn Nhược điểm HIDS chiếm tài nguyên máy chủ, phụ thuộc độ tin cậy máy chủ phát công mạng NIDS sử dụng nguồn liệu - thường gói tin, đóng vai trò đơn vị q trình truyền thơng Phần lớn NIDS độc lập với hệ điều hành, đó, chúng áp dụng môi trường hệ điều hành khác Hơn nữa, NIDS phát loại công mạng giao thức cụ thể Nhược điểm NIDS giám sát lưu lượng qua phân đoạn mạng cụ thể 1.4 Kết luận chương Ở chương 1, khái niệm cũng góc nhìn tởng quan vấn đề an tồn thơng tin IoT đã khảo sát Yêu cầu bảo mật cho IoT ngày khắt khe, IDS phương pháp hiệu quả, ứng dụng rộng rãi Phương pháp sử dụng nhiều khả tận dụng sức mạnh thuật toán học máy, học sâu để phát loại cơng, từ đưa cảnh báo sớm cho hệ thống IoT để có biện pháp phòng ngừa, giảm thiểu thiệt hại mức tối thiểu 7 CHƯƠNG 2: GIỚI THIỆU VỀ AN TỒN THƠNG TIN TRONG IOT 2.1 Tổng quan giải pháp IDS IoT sử dụng học máy IDS nổi lên phương pháp bảo mật hiệu tận dụng tiềm mạnh mẽ thuật tốn học máy Khơng tḥt tốn học máy truyền thống, mơ hình học kết hợp để khai thác tối đa hiệu suất phân loại cũng nhiều nhà nghiên cứu thực Bên cạnh học máy, thuật toán học sâu cũng ứng dụng IDS khả phân loại khơng cần trích xuất đặc tính chúng Tuy nhiên, việc tận dụng triệt để khả tḥt tốn thơng minh gặp khơng khó khăn, đặc biệt việc tinh chỉnh, tối ưu siêu tham số chúng kết phân loại tốt Bên cạnh đó, IDS, tḥt tốn u cầu lượng liệu khởng lồ chứa hình thức công đa dạng để tăng hiệu trình học tập phân loại, thế cũng thách thức việc thu thập liệu loại công yêu cầu nhiều yếu tố sở hạ tầng, thiết bị đại 2.2 Giới thiệu thuật toán học máy học sâu sử dụng nghiên cứu 2.2.1 Rừng ngẫu nhiên Rừng ngẫu nhiên thuật toán học máy mạnh mẽ sử dụng cho hai tốn là: hồi quy phân loại Đây phương pháp học tập hợp, nghĩa mơ hình rừng ngẫu nhiên tạo thành từ số lượng lớn quyết định nhỏ hơn, gọi cơng cụ ước tính, đưa dự đốn riêng chúng Mơ hình rừng ngẫu nhiên kết hợp dự đốn cơng cụ ước tính để đưa dự đốn xác Bởi cực kỳ mạnh mẽ, dễ bắt đầu có khả xử lý tốt loại liệu không đồng có siêu tham số, nên tḥt toán RF thường điểm đến đầu tiên nhà khoa học liệu phát triển hệ thống học máy 2.2.2 Đóng bao Đây tập kỹ thuật học đồng giúp cải thiện hiệu suất tốt độ xác tḥt tốn học máy Nó sử dụng để giải quyết vấn đề liên quan đến sự đánh đổi sai lệch – phương sai giảm phương pháp sai mơ hình dự đốn BG giúp tránh khớp liệu mức giống tḥt tốn RF, tḥt tốn BG áp dụng để giải quyết vấn đề cho mô hình hồi quy mơ hình phân loại, đặc biệt cho tḥt tốn có phương sai cao quyết định, phân loại hồi quy 8 2.2.3 Thúc đẩy Tḥt tốn thúc đẩy tìm cách cải thiện khả dự đoán bằng cách đào tạo chuỗi mơ hình ́u, mơ hình bù đắp điểm ́u mơ hình tiền nhiệm Ý tưởng để lặp lại mơ hình phù hợp cho việc huấn luyện mơ hình bước định phụ thuộc vào mơ hình đã huấn luyện bước trước BS cách tiếp cận nổi tiếng số cách tiếp cận tạo mơ hình tập hợp thường thiên vị so với mơ hình học ́u tạo 2.2.4 k láng giềng gần nhất Thuật toán k-láng giềng gần nhất, còn gọi KNN, thuật toán phân loại học có giám sát phi tham số, sử dụng khoảng cách gần để phân loại hoặc dự đốn nhóm điểm liệu riêng lẻ Luật k láng giềng gần phân loại x bằng cách gán nhãn cho nhãn có tần số xuất nhiều số k mẫu gần nhất; nói cách khác, quyết định đưa bằng cách kiểm tra nhãn k điểm gần thực bầu chọn Truy vấn k-láng giềng gần bắt đầu điểm kiểm tra phát triển vùng hình cầu cho đến chứa k mẫu huấn luyện dán nhãn điểm cần kiểm tra theo kết bình chọn đa số 2.3 Đề xuất mơ hình kiến trúc tổng thể phát công IDS sử dụng học máy Phương pháp bao gồm ba bước Trong bước đầu tiên, liệu làm xử lý trước để loại bỏ số giá trị không cần thiết cũng số đặc tính khơng có nhiều ảnh hưởng đến mục đích nghiên cứu Các phương pháp ch̉n hóa, mã hóa cũng sử dụng Trong bước thứ hai, phương pháp RFE sử dụng với mơ hình BS phương pháp CV để tính tốn tầm quan trọng cho đặc tính riêng lẻ Tồn đặc tính đầu vào sau xếp hạng theo giá trị độ quan trọng tính Ở bước cuối cùng, tất đặc tính kết hợp đưa vào mơ hình học máy khác để ước tính hiệu suất phát mơ hình học máy Hình 2.1 Mơ hình tổng quan bước phương pháp đề xuất 2.4 Giới thiệu bộ dữ liệu NSL-KDD dùng cho xây dựng, thiết kế IDS Bộ liệu đời phiên cải tiến liệu nổi tiếng KDDCUP99 NSL-KDD chứa ghi thiết yếu liệu KDD hoàn chỉnh Các ghi dư thừa loại bỏ phép phân loại tạo kết khơng thiên vị Bên cạnh đó, số lượng ghi chọn từ nhóm cấp độ khó khác tỷ lệ nghịch với phần trăm ghi liệu KDD gốc Quan trọng nhất, NSL-KDD có điểm liệu KDD-99, tất Điều giúp tốn mặt tính tốn để sử dụng cho việc huấn luyện mơ hình máy học NSL-KDD chứa KDDTrain+, KDDTest+, KDDTest-21 Trong ghi có 41 đặc tính khác nhau, gồm lớp cơng: DoS, Probe, U2R, R2L 2.5 Kết luận chương Trong chương đã tìm hiểu tởng quan giải pháp IDS ứng dụng khả thuật toán học máy nghiên cứu sử dụng cho vấn đề bảo mật IoT Bằng việc tận dụng thuật tốn học máy, mơ hình IDS hướng đến mục tiêu giải quyết vấn đề bảo mật IoT đề xuất Ngoài ra, đặc trưng, ưu nhược điểm liệu NSL-KDD cũng lựa chọn để huấn luyện xây dựng IDS cho IoT 10 CHƯƠNG 3: THỬ NGHIỆM, ĐỀ XUẤT IDS ỨNG DỤNG TRONG IOT 3.1 Xử lí tiền xử lí dữ liệu 3.1.1 Tiền xử lí dữ liệu Dữ liệu thô chưa xử lí, chưa làm nguyên nhân gây sự bất ởn q trình huấn luyện, cho kết không đáng tin, làm giảm tốc độ cũng làm giảm hiệu suất thuật toán học máy Vì vậy, giai đoạn đóng vai trò quan trọng với mục tiêu làm liệu, tích hợp chuyển hóa liệu cũng giảm kích thước liệu đầu vào 3.1.2 Chuẩn hóa lớn nhất-nhỏ nhất Cũng giống tinh chỉnh liệu, vấn đề ch̉n hóa liệu đóng vai trò vơ cùng quan trọng việc giải quyết vấn đề tận dụng khả tḥt tốn thơng minh Bởi lẽ phương pháp phân tích liệu khác lại tập trung vào khía cạnh khác liệu, nên ch̉n hóa thay đởi đặc tính liệu làm tăng tính hiệu phương pháp phân tích cụ thể Chuẩn hóa nhỏ – lớn phương pháp đơn giản việc chia tỉ lệ phạm vi đặc tính bằng việc ch̉n hóa chúng khoảng đặc biệt [0, 1] hoặc [-1, 1] 3.2 Lựa chọn đặc tính tối ưu dữ liệu 3.2.1 Loại bỏ đặc tính đệ quy Hầu hết trường hợp phổ biến lĩnh vực khoa học liệu, liệu sử dụng làm đầu vào cho thuật toán học máy, học sâu thường kích thước lớn Kết là, mơ hình thơng minh triển khai liệu có độ phức tạp lớn, có yêu cầu không gian thời gian huấn luyện đặc thù đồng thời mơ hình cũng thường nạn nhân vấn đề thiệt hại liên quan đến chiều liệu Những liệu nhiều chiều ln chứa nhiều đặc tính, nhiên khơng phải tất đặc tính đem lại kết tốt hiệu suất dự đoán, phân loại mơ hình học máy, học sâu Loại bỏ đặc tính đệ quy tḥt tốn lựa chọn đặc tính phở biến Đây phương pháp lựa chọn đặc tính phù hợp với mơ hình loại bỏ hoặc nhiều đặc tính yếu cho đến đạt số lượng đặc tính mong muốn, phương pháp loại bỏ dư thừa 11 liệu tạo tập hợp chứa đặc tính nhỏ gọn RFE phở biến có cấu hình đơn giản hiệu việc chọn đặc tính phù hợp cho việc dự đoán, phân loại mục tiêu Hai điều cần lưu ý sử dụng thuật toán RFE lựa chọn số lượng đặc tính lựa chọn tḥt tốn hỗ trợ lựa chọn đặc tính 3.2.2 Xác thực chéo k lần Xác thực chéo k lần hay kiểm chứng chéo, k lần phương pháp thống kê dùng để ước lượng hiệu hiệu suất mơ hình học máy, học sâu, hỗ trợ so sánh chọn mơ hình tốt cho toán Xác thực chéo k lần chia nhỏ tập liệu để kiểm chứng hiệu mơ hình từng phần liệu riêng biệt, áp dụng trường hợp khơng có q nhiều liệu Kỹ thuật đơn giản, dễ thực cho kết đáng tin cậy hầu hết phương pháp khác cùng chức Việc sử dụng xác thực chéo lần mang đến nhiều lợi ích cho mơ hình đề xuất Trước hết, xác thực chéo k lần giúp tận dụng khả liệu Hơn nữa, giai đoạn xác thực dùng tất liệu cho kết đáng tin cậy so với việc sử dụng phần liệu 3.2.3 Triển khai lựa chọn đặc tính tối ưu dữ liệu Trong nghiên cứu này, RFE kết hợp với mơ hình BS để lựa chọn đặc tính chứa thông tin liên quan đến việc cải thiện hiệu suất phát liệu xâm nhập Dữ liệu huấn luyện sử dụng để đào tạo mơ hình BS, sau tạo giá trị đặc trưng cho độ quan trọng đặc tính riêng lẻ Sau đó, tất đặc tính đầu vào xếp hạng dựa vào giá trị độ quan trọng chúng theo thứ tự từ thấp đến cao 3.3 Thiết lập, mô phỏng, thử nghiệm hệ thống IDS dựa học máy Các mơ hình học máy khác áp dụng với xác thực chéo lần để ước tính hiệu suất phân loại chúng bằng cách sử dụng tở hợp đặc tính khác lựa chọn sau trình thực phương pháp RFE Hiệu suất phát trung bình mơ hình học máy sau tính tốn để so sánh phân tích Các tham số sử dụng để đánh giá hiệu lần lượt Acc, TPR, FPR đường cong ROC tiêu cũng đặt để lựa chọn mơ hình học máy tối ưu 3.4 Phân tích kết quả, so sánh hiệu IDS sử dụng thuật toán học máy khác 12 3.4.1 Loại bỏ đặc tính đệ quy Tồn đặc tính đầu vào xếp hạng theo giá trị quan trọng chúng, tạo từ mơ hình BS đào tạo tập liệu huấn luyện Hầu hết giá trị quan trọng tương đối thấp Tuy nhiên, ba đặc tính hàng đầu “protocol type”, “service”, and “source bytes” hiển thị giá trị độ quan trọng tương đối cao, điều ngụ ý rằng đặc tính có liên quan chứa nhiều thơng tin có ý nghĩa Các đặc tính có độ quan trọng bằng bị loại bỏ 3.4.2 Đánh giá mô hình Kết so sánh cho thấy, phân loại RF tổ hợp 19 đặc tính nằm khoảng từ thứ tự 23 đến 41 giá trị tối ưu thu Theo tiêu chí đưa phần trước, thuật toán đề xuất sử dụng số lượng nhỏ đặc tính tở hợp đã chọn so với mơ hình học máy khác Độ xác phát xác thực thuật toán đề xuất cho IDS 98,7%, nhỏ 0,2% so với giá trị cao 98,8% phân loại BG đưa Tuy nhiên, phân loại BG chọn kết hợp 39 đặc tính, lớn đáng kể so với phân loại RF đã chọn với 19 đặc tính Kết hiệu suất xác thực phân loại BS KNN cũng cao số lượng đặc tính tở hợp chọn lại lớn, lần lượt 36 40, dẫn đến sự phức tạp tốn thời gian cho việc huấn luyện triển khai mơ hình ứng dụng thế giới thực Thuật toán RF lựa chọn đáp ứng u cầu độ phức tạp cũng hiệu suất giải pháp Bên cạnh tham số Acc, TPR FPR, ma trận nhầm lẫn cũng đường cong ROC thuật toán tốt cũng đưa để có nhìn tởng qt mơ hình 3.4.3 So sánh hiệu IDS đề xuất với các nghiên cứu khác ứng dụng học máy, học sâu Để đánh giá hiệu suất IDS đề xuất cách tổng quan nhất, số nghiên cứu xây dựng phát triển IDS ứng dụng thuật toán học máy, học sâu sử dụng để đối chiếu, so sánh kết ta thấy mơ hình đề xuất có độ xác cao nhất, lên đến 98,7% Từ kết so sánh, mặc dù giá trị FPR thấp chút so với 13 nghiên cứu [25], mơ hình đề xuất có độ xác tởng thể vượt trội hẳn so với nghiên cứu [25] Từ kết trên, thấy khả phân loại mơ hình IDS đề xuất nghiên cứu tốt với liệu sử dụng NSL-KDD 3.5 Lựa chọn IDS tối ưu áp dụng cho hệ thống IoT Trong nghiên cứu này, thuật toán phát nhị phân đã đề xuất, áp dụng cho IDS để phát loại liệu bất thường mạng IoT Phương pháp RFE kết hợp với mơ hình BS sử dụng để huấn luyện liệu để thu giá trị độ quan trọng liệu, để từ làm tiền đề tạo tở hợp đặc tính khác thu liệu chứa đặc tính tối ưu Kết thực cho thấy thuật toán học máy đề xuất cho IDS khẳng định khả mặt phát bất thường có khả ứng dụng IoT thực tế Hiệu suất tốt đạt với thuật toán RF tở hợp 19 đặc tính Ngồi ra, nghiên cứu xây dựng IDS cho hệ thống IoT với phương pháp nổi bật cũng khảo sát để tởng hợp phương pháp sử dụng để tối ưu IDS đề xuất tương lai 3.6 Những giới hạn phương pháp đề xuất Các giới hạn nghiên cứu cần mở rộng, tiếp tục nghiên cứu tương lai, bao gồm: o Đề án sử dụng liệu NSL-KDD o Đề án sử dụng thuật toán lựa chọn đặc tính o Đề án chưa mở rộng ứng dụng học sâu mơ hình lai o Đề án thực phân loại nhị phân 3.7 Kết luận chương Bằng cách làm sạch, chuẩn hóa liệu đồng thời kết hợp thêm kĩ thuật loại bỏ đặc tính đệ quy RFE để thu liệu chứa đặc tính tốt NSL-KDD Bộ 14 liệu sau qua giai đoạn tiền xử lí liệu sử dụng cùng với tḥt tốn học máy với mục đích huấn luyện kiểm tra nhằm xây dựng hệ thống IDS có khả phát xâm nhập với hiệu suất cao IoT Từ kết thu được, kết ḷn rằng mơ hình IDS đề xuất đã xây dựng thành công với hiệu suất phân loại cao lên đến 98,7% độ xác sử dụng thuật toán RF 15 KẾT LUẬN Với sự phát triển vượt bậc hệ thống IoT, đã góp phần giúp cho nhiều lĩnh vực hoạt động ngày trở nên thông minh hơn, thuận tiện Tuy nhiên, bên cạnh tốc độ phát triển chóng mặt đó, hệ thống IoT cũng phải đương đầu với số vấn đề lớn, nguy hiểm số vấn đề bảo mật Việc triển khai giải pháp phòng thủ trước công hệ thống IoT điều không dễ dàng, vấn đề giới hạn tài nguyên thiết bị IoT Vì vậy, việc nghiên cứu phát triển giải pháp phát xâm nhập hệ thống IoT ngày trở nên thiết yếu hết Hệ thống phát xâm nhập (IDS) giải pháp phổ biến sử dụng để phát sớm cơng tận dụng khả tḥt tốn thơng minh Trong khn khở đề án này, học viên tập trung vào làm rõ vấn đề tổng quan vấn đề bảo mật còn tồn đọng hệ thống IoT cũng khả tḥt tốn thơng minh để giải quyết vấn đề này, từ lựa chọn, xử lí liệu để xây dựng, đề xuất hệ thống phát xâm nhập có hiệu suất cao ứng dụng tḥt tốn học máy, học sâu nói Kết thu rằng mơ hình đề xuất có hiệu suất phát xâm nhập lên đến 98,7% kết hợp với kĩ thuật loại bỏ đặc tính đệ quy tḥt tốn Rừng ngẫu nhiên, cho thấy nghiên cứu đã xây dựng thành công mơ hình với hiệu suất tốt , có khả ứng dụng giải quyết toán thực tế Tuy nhiên, đề án còn yếu điểm cần khắc phục, mở rộng, đa dạng hóa thêm giải pháp để cải thiện thêm mặt hiệu suất cũng giải quyết thêm nhiều vấn đề an toàn thơng tin hơn, đóng góp vào khoa học cơng nghệ nước