Hệ thống phát hiện xâm nhập (Intrusion Detection System - IDS) dựa trên sự bất thường sử dụng các thuật toán Học máy (Machine Learning - ML) ngày càng được chú ý do lợi thế của chúng trong việc phát hiện các cuộc tấn công.
Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) ALID-GAN: Phương pháp hỗ trợ học chủ động cho hệ thống phát xâm nhập dựa mạng sinh đối kháng Bùi Xuân Thái∗† , Nguyễn Ngọc Minh Trí ∗ ∗† , Nghi Hồng Khoa ∗† , Phan Thế Duy∗† Phịng Thí Nghiệm An Tồn Thơng Tin, Trường Đại Học Cơng Nghệ Thơng Tin † Đại Học Quốc Gia Tp Hồ Chí Minh Email: {18521379, 18521529}@gm.uit.edu.vn, {khoanh, duypt}@uit.edu.vn Tóm tắt—Hệ thống phát xâm nhập (Intrusion Detection System - IDS) dựa bất thường sử dụng thuật toán Học máy (Machine Learning - ML) ngày ý lợi chúng việc phát công Tuy nhiên nghiên cứu gần phương pháp phát sử dụng máy học thường chịu nhiều rủi ro trước mẫu cơng đối kháng, mẫu có đầu vào gần giống với đầu vào gốc phân loại khơng xác Việc huấn luyện IDS yêu cầu lượng lớn liệu đào tạo, điều thực tế khó đáp ứng liệu cơng phát sinh ngày nhiều đa dạng nên đáp ứng hết yêu cầu liệu IDS Do đó, để khắc phục hạn chế này, đề xuất phương pháp học tập chủ động (Active Learning) dựa mạng sinh đối kháng Generative Adversarial Network (GAN) để cải thiện khả phát công IDS Điểm cải tiến đề xuất dựa vào liệu công đầu vào, mơ hình học sinh liệu liên quan đến cơng đó, sinh liệu biến thể công đưa vào liệu IDS, từ tăng cường khả IDS Chúng thực nghiệm mơ hình tập liệu CICIDS2018 [15] đánh giá mơ hình đề xuất nhiều tiêu chí khác Kết cho thấy mơ hình đạt tỷ lệ phát xác lên đến 99,931% mơ hình IDS sử dụng 20% số lượng mẫu liệu gắn nhãn q trình đào tạo Từ khóa—Intrusion Detection System (IDS), Machine Learning (ML), Generative Adversarial Network (GAN), Active Learning I GIỚI THIỆU Hiện nay, phát triển nhanh chóng Internet of Things (IoT) mở chiều hướng kết hợp thiết bị điện tử, cảm biến, phần mềm kết nối để tăng cường kết nối, thu thập trao đổi liệu Mặc dù có khả kết hợp sử dụng rộng rãi, hầu hết 80% thiết bị IoT dễ bị công mạng [2] Hệ thống phát xâm nhập (IDS) chịu trách nhiệm kiểm tra lưu lượng mạng liệu hệ thống để tìm hoạt ISBN 978-604-80-5958-3 293 động độc hại đưa cảnh báo, phần quan trọng chiến lược phịng thủ Có kiến thức thích hợp địa điểm thời gian xác nơi bất thường cụ thể tạo mối nguy hiểm hệ thống giúp giảm thiểu tác động cách thực hành động thích hợp, hệ thống phịng chống xâm nhập vào hoạt động Hệ thống ngăn chặn xâm nhập hoạt động đồng thời với hệ thống phát xâm nhập để ngăn kẻ công thực tác hại hệ thống Sự phát triển IDS kèm với phát triển phần mềm độc hại nguy xâm nhập Đặc biệt, nguy đáng báo động xuất trình phát triển phần mềm độc hại phát triển phần mềm độc hại tự thích ứng có khả điều chỉnh hành vi để tránh bị phát chế bảo mật Wu cộng [3] đề xuất phương pháp deep Q-learning để vượt qua mơ hình phát botnet cách kiểm soát luồng lưu lượng mạng botnet tạo Shi cộng [4] sử dụng Mạng sinh đối kháng (GAN) để tổng hợp liệu huấn luyện cho công thăm dị cơng causative phân loại trực tuyến thực để phân tích tính subjectivity liệu Erpek cộng [5] đề xuất phương pháp để công gây nhiễu vào kênh truyền khơng dây sử dụng mơ hình mạng học sâu để dự đoán trạng thái kênh truyền mơ hình GAN để đẩy nhanh q trình đào tạo mơ hình dự đốn GAN sử dụng [6] để sửa đổi lưu lượng mạng kênh truyền dòng lệnh điều khiển (Command Control C2) phần mềm độc hại Trojan Remote Access (truy cập từ xa) cho lưu lượng sửa đổi giống với lưu lượng Facebook chat Lin cộng [7] đề xuất phương pháp dựa GAN trình tạo tính tốn đặc điểm lưu lượng mạng đối nghịch để cơng mơ hình Black-box IDS Các phương pháp Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) khác đề xuất [3], [6] [7] nhóm lại thành loại cơng đặc biệt có tên cơng đối nghịch nhằm vào mơ hình IDS dựa ML Mặc dù phương pháp đề xuất [3], [6] [7] cho thấy hiệu việc làm sai lệch khả mơ hình IDS dựa ML, mối đe dọa chúng môi trường mạng thực tế bị hạn chế giả định lý tưởng lượng lớn nhãn liệu để đào tạo có khả dụng thơng tin hàm mát (loss function) mơ hình IDS biết Để khắc phục hạn chế mặt liệu này, đề xuất phương pháp hỗ trợ học chủ động cho trình phát xâm nhập, với tên gọi ALID-GAN, phương pháp chúng tơi có đóng góp sau: • Khơng u cầu kiến thức cấu trúc bên mơ hình IDS hàm mát để đào tạo mơ hình IDS • Khơng yêu cầu số lượng lớn liệu đầu vào, phương pháp tạo liệu cung cấp cho hệ thống IDS • Chúng tơi sử dụng loại biến thể GAN WGAN, WGAN-GP, WGAN-GP-TTUR mơ hình ALID-GAN, đánh giá tập liệu CICIDS2018 [15] Phần lại báo viết sau: Trong phần II cung cấp kiến thức liên quan đến việc triển khai mơ hình Mơ hình đề xuất chúng tơi trình bày phần III Trong phần IV, tiến hành thực nghiệm phương pháp đưa tiêu chí đánh giá, phân tích số liệu thực nghiệm thu từ thí nghiệm cụ thể Cuối cùng, kết luận công việc tương lai đề cập phần V II KIẾN THỨC LIÊN QUAN A Mạng sinh đối kháng (Generative Adversarial Network – GAN) GAN đề xuất Goodfellow cộng vào năm 2014 [10], cơng cụ mạnh mẽ hứa hẹn học sâu GAN ước tính mơ hình tổng qt thơng qua cách tiếp cận đối nghịch, bao gồm hai mơ hình độc lập: tạo sinh (Generator G) phân biệt (Discriminator - D) Mơ hình tổng qt G ước tính phân phối liệu p(g) không gian liệu thực x Xét biến nhiễu đầu vào p(z), mục tiêu G tạo mẫu đối nghịch G(z) xuất phát từ phân phối x Mặt khác, mơ hình phân biệt D trả xác suất D(x), mẫu x cho từ tập liệu thực tạo G Mục đích sinh (Generator) tạo liệu đánh lừa ISBN 978-604-80-5958-3 294 hệ thống IDS, phân biệt (Discriminator) có vai trị bắt chước hệ thống IDS việc phân loại liệu đầu vào (đúng sai) để đưa phản hồi cho sinh mẫu [8] Vì vậy, G D mơ lại trị chơi minmax hai người chơi, mà tạo sinh phải cạnh tranh với đối thù phân biệt, tạo sinh sản sinh mẫu mà đối thủ phải phân biệt mẫu liệu từ tập huấn luyện mẫu từ tạo sinh Hàm giá trị V(G, D) định nghĩa sau: max V (D, G) = G D Ex∼pdata (x) [log D(x)] + Ez∼pz (z) [log(1 − D(G(z)))] (1) B Học chủ động (Active learning) Học chủ động nhóm phương pháp học máy tối ưu hóa q trình thu thập liệu đào tạo để xây dựng tập liệu đào tạo với kích thước tối thiểu mà mang lại hiệu suất phù hợp Trong học chủ động, thuật toán chủ động chọn tập để làm ví dụ dán nhãn cho tập chưa gán nhãn [9] Phương pháp học tập tích cực thường trình lặp lặp lại xen kẽ việc đào tạo mơ hình ML (ví dụ: phân loại) tăng cường tập liệu đào tạo với điểm liệu gắn nhãn từ oracle (ví dụ: thích người mơ hình ML) Q trình thường khởi tạo với tập liệu đào tạo nhỏ nhóm lớn điểm tính chưa gắn nhãn Trong lần lặp lại, tập hợp điểm đặc trưng chọn từ nhóm chưa gắn nhãn gửi đến oracle để gắn nhãn Chiến lược để chọn điểm tính chưa gắn nhãn từ nhóm chưa gắn nhãn vấn đề quan trọng cần giải học tập tích cực Trong nghiên cứu này, chúng tơi sử dụng GAN để sinh liệu để giải vấn đề thiếu hụt liệu hỗ trợ cho IDS học chủ động C Một số biến thể GAN Biến thể Wasserstein GAN (WGAN) mơ hình GAN sử dụng khoảng cách Wasserstein vào làm hàm mát Trong WGAN, để tính khoảng cách Wasserstein, ta cần sử dụng thêm hàm hàm liên tục K-Lipschitz Việc sử dụng khoảng cách Wasserstein giúp cung cấp số đo mượt với độ dốc gradient, thích hợp cho trình học tập ổn định [10] Ở biến thể WGAN, việc đảm bảo hàm liên tục Lipschitz cách cắt giảm trọng lượng (weight clipping) (kẹp trọng số phạm vi cố định nhỏ [-c,c]) [16] Trong với biến thể WGAN-GP (WGAN Gradient Penalty), thay sử dụng cắt giảm (weight clipping), mơ hình Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thơng Cơng nghệ Thơng tin (REV-ECIT2021) Hình Mơ hình ALID-GAN hỗ trợ học chủ động cho IDS học máy bị phạt với lần độ dốc gradient di chuyển khỏi chuẩn giá trị Việc sử dụng phạt gradient biến thể WGAN-GP cho thấy khả học nhanh chất lượng tốt so với WGAN [11] Đối với vấn đề học tập GAN, nhóm tác giả [12] đề xuất quy tắc Two Time-Scale Update Rule (TTUR) giúp hội tụ theo giả định trạng thái đứng yên cân cục Nash [17] Phương pháp sử dụng TTUR đề xuất sử dụng hai tốc độ học khác cho trình phân biệt trình tạo sinh Trình tối ưu thay từ RMSProp lại Adam Ở biến thể WGAN-GP TTUR biến thể WGAN-GP thay đổi theo TTUR D Các nghiên cứu liên quan Zhu Bento [13] đề xuất GAAL, sử dụng GAN để tạo mẫu tổng hợp không chắn chu kỳ tạo mẫu đối kháng Việc tạo thay chọn mẫu không chắn dẫn đến vấn để thời gian phải chạy liên tục việc tạo mẫu độc lập có kích thước phải huấn luyện GAN trước Họ sử dụng thuật toán tối ưu hố truyền thơng khoảng cách tối thiểu đề thay biến x (mẫu chung) tập liệu đào tạo Sau đó, sử dụng gradient descent để giảm số lượng đối tượng tối đa Tuy nhiên, GAAL hoạt động so với lấy mẫu ngẫu nhiên hai tập MNIST CIFAR-10 (2 nhãn) sử dụng SVM DC-GAN ASAL Christoph Radu đề xuất [14], kế thừa ý tưởng tạo mẫu Zhu Bento [13] sử dụng thông tin entropy làm thang điểm số cho không chắn mở rộng thành nhiều nhãn Đóng góp ISBN 978-604-80-5958-3 295 họ chọn mẫu tương đồng từ mẫu chung phương pháp đối sánh mẫu phát triển Tác giả đề xuất ba phương pháp nhận dạng mẫu đặc trưng khác mà họ tính tốn cho mẫu chung mơ hình để phù hợp với mơ hình láng giềng gần Trong trình học chủ động, tác giả tính tốn nhận dạng mẫu đặc trưng mẫu tổng hợp lấy mẫu tương tự từ nhóm theo thời gian hàm phụ tuyến tính Ngồi ra, ASAL sử dụng phân loại dưa CNN thay SVM tạo sinh Wasserstein GAN [1] III MƠ HÌNH ĐỀ XUẤT Để giải vấn đề nêu trên, kiến trúc với kết hợp GAN active learning đề xuất Hình 1, gọi ALID-GAN (Active Learning for Intrusion Detection using GANs) Hệ thống tạo với vai trò sinh mẫu liệu cách cho gần giống thật nhằm mục đích cải thiện hệ thống IDS để chống lại công không gian mạng Trong mơ hình gồm module: Database Module, IDS Module, Data Synthesizer Module Chi tiết module chúng tơi trình bày phần A Database Module Trong module chứa tập liệu phục vụ cho công việc huấn luyện IDS Các mẫu liệu lấy từ trình sinh liệu Data Synthesizer Module Trong database gồm hai loại liệu: Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) Bảng I CHI TIẾT MƠ HÌNH HỌC MÁY CHO Class LR Logistic Regression IV THỰC NGHIỆM VÀ ĐÁNH GIÁ IDS VỚI SCIKIT-LEARN A Môi trường thực nghiệm Parameter penalty=’12’,*, dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver=’lbfgs’, max_iter=100, multi_class=’auto’, verbos=0, warm_start=False, n_jobs=None, l1_ratio=None SVM SVC • • C=1.0, kernel=’rbf’, degree=3, gamma=’scale’, coef0=0.0, shrinking=True, probability=False, tol=0.001, cache_size=200, class_weight=None, verbose=False, max_iter=-1, decision_function_shape=’ovr’, break_ties=False, random_state=None Dữ liệu xử lý (Pending): Khi GAN sinh liệu kiểm chứng để cải thiện hệ thống IDS Tuy nhiên không chắn GAN, lô liệu sinh cần kiểm tra cách huấn luyện huấn luyện lại nhiều lần Dữ liệu tổng hợp (Synthetic): Nếu liệu chờ xử lý góp phần cải thiện hiệu suất IDS, điều khiển thay đổi cờ chúng từ trạng thái chờ xử lý thành tổng hợp lưu trữ chúng vĩnh viễn sở liệu x = B IDS Module Ở mô-đun này, ban đầu IDS huấn luyện trước với tập liệu thu sẵn Sau q trình hoạt động tương tác với module IDS lại tiếp tục cập nhật Chúng tơi sử dụng hai thuật tốn học máy Linear Regression (LR) Support Vector Machine (SVM), SVM mơ hình cho hiệu tốt cho toán phân loại Machine Leaning, để xây dựng IDS Các mơ hình máy học LR, SVM triển khai với thư viện scikit-learn (thông số chi tiết mô tả Bảng I) C Data Synthesizer Module (DSM) Thành phần tổng hợp liệu (Data Synthesizer Module - DSM) Phần cốt lõi module dựa mơ hình GAN Gồm mơ hình tạo (Generator Module) phân biệt (Discriminator Module) Generator sinh liệu nhằm mục đích đánh lừa Discriminator Khi q trình huấn luyện GAN hồn tất tạo mẫu liệu với độ xác cao Mục đích module sinh liệu cung cấp cho Database module để huấn luyện mơ hình IDS ISBN 978-604-80-5958-3 ALID-GAN triển khai mơi trường Google Colab, với cấu hình: Intel(R) Xeon(R) CPU @ 2.30GHz, 12.69 GB RAM, dung lượng đĩa cứng lưu trữ 107.72 GB Chúng thực nghiệm tập liệu CICIDS2018 [15], tập liệu chứa mô tả chi tiết xâm nhập mơ hình phân phối trừu tượng cho ứng dụng, giao thức thực tể mạng cấp thấp Tập liệu bao gồm bảy kịch công: DoS, DDoS, Brute-force, Heartbleed, Botnet, infiltration Web attacks Nhưng nghiên cứu này, sử dụng kịch công DoS Trước tiên, thực số bước để chuyển ghi liệu sang dạng số thích hợp Chúng tơi loại bỏ số cột không liên quan cột thời gian khơng phải dạng số chúng khơng đóng vai trị nghiên cứu chúng tơi Ngồi ra, dịng liệu chứa NaN, chúng tơi xóa để chuẩn hóa cấu trúc tiêu chuẩn ghi Sau chúng tơi tiến hành chuyển đổi giá trị dạng số nhằm mục đích đưa giá trị đặc trưng phạm vi [0,1] phương pháp chuẩn hóa min-max Trong x giá trị ban đầu, x’ giá trị sau chuẩn hóa, xmin giá trị nhỏ đặc trưng, xmax giá trị lớn đặc trưng 296 x − xmin xmax − xmin (2) Sau chuẩn hóa chúng tối thu 327 153 mẫu liệu Chúng dùng 90% (294 438 mẫu liệu) cho q trình huấn luyện, cịn 10% (32 715 mẫu liệu) cho q trình kiếm tra B Tiêu chí đánh giá Chúng xem xét số sau để đánh giá hiệu suất ALID-GAN: • Precision: Tỷ lệ quan sát tích cực dự đốn xác tổng số quan sát tích cực • Recall: Tỷ lệ quan sát tích cực dự đốn xác tổng số quan sát tích cực thực tế • F1 score: Trung bình có trọng số độ xác thu hồi có tính đến False Positive False Negative Trong trường hợp phân phối khơng FN FP, F1 score suy khả hiểu rõ hiệu suất mơ hình • Area Under Curve (AUC): Chỉ số tính tốn dựa đường cong Receiving Operating Curve Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) (ROC) ROC dùng để biểu diễn khả phân loại mơ hình ngưỡng threshold, đường cong dựa hai số True Positive Rate (TPR hay Recall) False Positive Rate (FPR) • Confusion Matrix: Một bảng nhằm trình bày số lượng dự đốn sai thực lớp Nó cung cấp thơng tin chi tiết rõ ràng dự đốn hiển thị loại phân loại / phân loại sai Do đó, hiệu suất IDS phân tích cách sử dụng yếu tố quan trọng Bảng II TIÊU CHÍ ĐÁNH GIÁ Tiêu chí True Positive, TP False Positive, FP True Negative, TN False Negative, FN Nhãn thực Attack Normal Normal Attack Dự đốn Attack Attack Normal Normal Từ tiêu chí này, hiệu suất IDS dễ dàng tính tốn cách sử dụng cơng thức sau: TP (T P + F P ) TP Recall, R = (T P + F N ) False Positive Rate, F P R = − T P R 2∗P ∗R F1 score = (P + R) Precision, P = (3) (4) (5) (6) C Kết thực nghiệm Chúng lấy 20%, 40%, 60%, 80%, 100% số ghi tập liệu dùng để huấn luyện để giả lập trường hợp IDS huấn luyện điều kiện thiếu hụt liệu với số lượng ghi luồng mạng khác Với ALID-GAN, sử dụng biến thể GAN để huấn luyện: WGAN, WGAN-GP, WGAN-GPTTUR đánh giá dựa số F1-Score AUC để đánh giá mơ hình cách tổng quan Chúng tơi huấn luyện với hai thuật tốn LR SVM với learning_rate_g = 0.0001 learning_rate_d = 0.0001 hai mơ hình WGAN WGAN-GP Cịn mơ hình WGAN-GP-TTUR learning_rate_g = 0.0001 learning_rate_d = 0.0002 Bảng III Bảng IV kết mơ hình chúng tơi huấn luyện Với mơ hình thứ áp dụng GAN sinh liệu mơ hình thứ hai không áp dụng GAN Kết thể Bảng III Bảng IV kết ALID-GAN tập ISBN 978-604-80-5958-3 297 liệu kiểm thử (testing), cho thấy với mơ hình thơng thường số đánh giá thấp cụ thể thuật toán LR số F1 dao động từ 45.71% - 63.932%, AUC dao động từ 45.46% - 64% Chỉ số đánh giá thuật toán SVM với mơ hình thơng thường thấp, F1 dao động từ 50.632% - 72.352%, AUC dao động từ 50.70% - 72.37% Đối với mơ hình triển khai, số đánh giá F1 AUC cao dao động 99% - 100% hai thuật tốn Ngồi số đánh giá cao, ALID-GAN cịn có hiệu tốt trường hợp thiếu hụt liệu đầu vào Cụ thể, ta thấy số F1 AUC mơ hình triển khai ln ổn định kích thước liệu đầu vào thay đổi, cịn mơ hình thơng thường số đánh giá F1 AUC tăng dần theo kích thước đầu vào liệu Qua chúng tơi kết luận mơ hình chúng tơi triển khai có khả giải tốn thiếu hụt liệu mà đề cập phần trước V TỔNG KẾT Trong báo này, đề xuất mơ hình GAN có khả học tập chủ động, ALID-GAN, để cải thiện khả IDS Nó hoạt động tốt IDS độc lập tập liệu cân lĩnh vực hệ thống vật lý mạng nơi có liệu để đào tạo mơ hình Phân tích thử nghiệm cho thấy đề xuất dự đốn với độ xác tốt so với IDS độc lập, sau đào tạo với tập liệu gốc nhỏ từ đầu Trong tương lai, tiến hành triển khai mơ hình hệ thống mạng SDN đồng thời thực nghiệm nhiều tập liệu phức tạp hơn, áp dụng nhiều thuật toán để cải thiện mơ hình tốt Ngồi ra, chúng tơi dự định vận dụng quy trình MLOps vào việc giám sát, thực triển khai mơ hình học máy giúp phát cơng hay mã độc mơi trường có nhiều thiết bị đa dạng mạng IoT TÀI LIỆU THAM KHẢO [1] Shu, Dule, et al "Generative adversarial attacks against intrusion detection systems using active learning." Proceedings of the 2nd ACM Workshop on Wireless Security and Machine Learning 2020 [2] "Smart home: Threats and countermeasures" https://www.rambus.com/iot/ smart-home/, 2019 Accessed: 2020-01-29 [3] Di Wu, Binxing Fang, Junnan Wang, Qixu Liu, and Xiang Cui 2019 "Evading Machine Learning Botnet Detection Models via Deep Reinforcement Learning" In ICC 2019-2019 IEEE International Conference on Communications (ICC) IEEE, 1–6 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) KẾT QUẢ CỦA ALID-GAN ÁP Size 20 40 60 80 100 KẾT WGAN F1 AUC(%) 0.99933 100 0.99932 100 0.99934 100 0.99932 100 0.99933 100 QUẢ CỦA 20 40 60 80 100 WGAN F1 AUC(%) 0.9982 100 0.9998 100 0.9998 100 0.9998 100 0.9998 100 Bảng III LINEAR REGRESSION ALID-GAN WGAN-GP F1 AUC(%) 0.99931 100 0.99932 100 0.99933 100 0.99933 100 0.99931 100 ALID-GAN ÁP Size DỤNG DỤNG ALID-GAN WGAN-GP F1 AUC(%) 0.99932 100 0.9998 100 0.9998 100 0.9998 100 0.9998 100 298 IDS THÔNG THƯỜNG IDS WGAN-GP-TTUR F1 AUC(%) 0.99931 100 0.99933 100 0.99934 100 0.99933 100 0.99932 100 Bảng IV SUPORT VECTOR MACHINE [4] Yi Shi, Yalin E Sagduyu, Kemal Davaslioglu, and Jason H Li 2018 "Generative adversarial networks for black-box API attacks with limited train data" In 2018 IEEE International Symposium on Signal Processing and Information Technology (ISSPIT) IEEE, 453–458 [5] Tugba Erpek, Yalin E Sagduyu, and Yi Shi 2018 "Deep learning for launching and mitigating wireless jamming attacks IEEE Transactions on Cognitive Communications and Networking 5, (2018), 2–14 [6] Maria Rigaki and Sebastian Garcia 2018 "Bringing a gan to a knife-fight: Adapting malware communication to avoid detection" In 2018 IEEE Security and Privacy Workshops (SPW) IEEE, 70–75 [7] Zilong Lin, Yong Shi, and Zhi Xue 2018 "Idsgan: Generative adversarial networks for attack generation against intrusion detection" arXiv preprint arXiv:1809.02077 (2018) [8] J Brownlee, Generative Adversarial Networks with Python: Deep Learning Generative Models for Image Synthesis and Image, 2019 [9] Algorithmia, "Active learning machine learning: What it is and how it works," 01 10 2021 [Online] Available: https://algorithmia.com/blog/active-learning-machine-learning [10] J Hui, "GAN — Why it is so hard to train Generative Adversarial Networks!", 2018 [Online] [11] Ishaan Gulrajani, Faruk Ahmed, Faruk Ahmed, Vincent Du- ISBN 978-604-80-5958-3 SO VỚI SO VỚI F1 0.4571 0.507 0.55322 0.58253 0.63932 IDS THÔNG AUC(%) 45.46 50.68 54.98 58.25 64.00 THƯỜNG IDS WGAN-GP-TTUR F1 AUC(%) 0.9998 100 0.99981 100 0.9998 100 0.9998 100 0.9998 100 [12] [13] [14] [15] [16] [17] [18] F1 0.50632 0.5398 0.59654 0.66532 0.72352 AUC(%) 50.70 54.00 59.98 66.62 72.37 moulin, Aaron Courville, "Improved training of Wasserstein GANs," 2017 Martin Heusel, Hubert Ramsauer, Thomas Unterthiner, Bernhard Nessler, "GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium," 2018 Shahid Anwar, Jasni Mohamad Zain, Mohamad Fadli Zolkipli, Zakira Inayat, Suleman Khan, Bokolo Anthony, and Victor Chang "From intrusion detection to an intrusion response system: fundamentals, requirements, and future directions" Algorithms, 10(2):39, 2017 J.-J Zhu and J Bento Generative adversarial active learn- ing In Advances in Neural Information Processing Systems Workshops, 2017 CSE-CIC-IDS2018 on AWS https://www.unb.ca/cic/datasets/ids2018.html [Online] J Hui, "GAN — Wasserstein GAN WGAN-GP", 2018 [Online] Martin Heusel, Hubert Ramsauer, Thomas Unterthiner, Bernhard Nessler, Sepp Hochreiter 2018 "GANs Trained by a Two TimeScale Update Rule Converge to a Local Nash Equilibrium" arXiv:1706.08500v6 [cs.LG] 12 Jan 2018 Shahriar, Md Hasan, et al "G-ids: Generative adversarial networks assisted intrusion detection system." 2020 IEEE 44th Annual Computers, Software, and Applications Conference (COMPSAC) IEEE, 2020 ... IDS biết Để khắc phục hạn chế mặt liệu này, đề xuất phương pháp hỗ trợ học chủ động cho trình phát xâm nhập, với tên gọi ALID-GAN, phương pháp chúng tơi có đóng góp sau: • Khơng u cầu kiến thức... G D Ex∼pdata (x) [log D(x)] + Ez∼pz (z) [log(1 − D(G(z)))] (1) B Học chủ động (Active learning) Học chủ động nhóm phương pháp học máy tối ưu hóa q trình thu thập liệu đào tạo để xây dựng tập... tối thiểu mà mang lại hiệu suất phù hợp Trong học chủ động, thuật tốn chủ động chọn tập để làm ví dụ dán nhãn cho tập chưa gán nhãn [9] Phương pháp học tập tích cực thường trình lặp lặp lại xen