T ng quan mô hình học máy cộng tác

Một phần của tài liệu (LUẬN văn THẠC sĩ) phát hiện sớm mã độc IOT BOTNET trên các thiết bị IOT (Trang 33 - 36)

Học máy cộng tác là quá trình sử dụng các bộ phân loại và kết hợp kết quả dự đoán của các bộ phân loại này để tạo nên một mô hình đưa ra quyết định phức tạp nhưng cải thiện hiệu năng dự đoán hơn so với các bộ phân loại con. Phương pháp kết hợp có thể linh hoạt dựa trên đặc trưng, hoặc kết quả phân loại. Có một vài lý do khiến cho mô hình học máy cộng tác có thể cải thiện khả năng dự đoán [39]:

- Tránh việc mô hình quá vừa dữ liệu: Khi chỉ có một lượng nhỏ dữ liệu, thuật toán học có xu hướng tìm ra nhiều giả thuyết khác nhau dự đoán tất cả dữ liệu

huấn luyện một cách hoàn hảo trong khi đưa ra dự đoán k m cho các trường hợp chưa nhìn thấy. Tính trung bình các giả thuyết khác nhau làm giảm nguy cơ chọn một giả thuyết không chính xác và do đó, cải thiện hiệu suất dự đoán t ng thể.

- Lợi thế về việc tính toán: Những bộ phân loại đơn lẻ thực hiện các tìm kiếm cục bộ có thể gặp khó khăn trong tối ưu cục bộ. Bằng cách kết hợp nhiều bộ phân loại học, các phương pháp t ng hợp làm giảm nguy cơ đạt được cực tiểu cục bộ.

- Biểu diễn dữ liệu: Giả thuyết tối ưu có thể nằm ngoài không gian của bất k mô hình đơn lẻ nào. Bằng cách kết hợp các mô hình khác nhau, không gian tìm kiếm có thể được mở rộng và do đó, đạt được sự phù hợp hơn với không gian dữ liệu.

Dựa vào phương thức kết hợp dữ liệu có thể chia các mô hình học cộng tác thành 3 nhóm chính:

- Hợp nhất sớm: là phương pháp hợp nhất các dữ liệu đầu vào bằng cách tạo ra một tập dữ liệu đại diện cho các tập dữ liệu con đơn lẻ. Tập dữ liệu đại diện này được sinh ra bằng cách nối các đặc trưng của các tập dữ liệu con vào với nhau để tạo thành tập dữ liệu đại diện có chứa tất cả các đặc trưng của các tập dữ liệu con. Sau khi đã có được tập đại diện thì mô hình phân loại sử dụng một thuật toán học máy duy nhất để thực hiện quá trình phân loại dữ liệu đại diện.

- Hợp nhất muộn: là phương pháp cho phép các tập hợp các kết quả phân loại của các bộ học máy phân loại (Classifier) đơn lẻ thông qua hàm hợp nhất (Fusion). Mỗi một bộ dữ liệu đặc trưng đầu vào sẽ được huấn luyện và phân loại dựa trên các thuật toán học máy riêng biệt. Kết quả phân loại sẽ được t ng hợp để đưa ra quyết định cuối cùng.

Hình 2.2. Mô hình hợp nhất muộn

- Hợp nhất trung gian (Intermediate fusion): là cách hợp nhất các đặc trưng qua việc sử dụng các lớp ẩn (Hidden layer). Các đặc trưng đầu vào sẽ được đưa vào các thuật toán học máy có lớp ẩn để tìm ra các đặc trưng có liên quan tới mục tiêu phân loại. Kết quả phân loại từng bộ dữ liêu riêng lẻ này sẽ được đưa qua lớp hợp nhất và quyết định cuối cùng cũng sử dụng một lớp ẩn để t ng hợp kết quả.

Các mô hình học máy cộng tác kể trên đều có ưu điểm và nhược điểm, bằng việc nghiên cứu lý thuyết và qua quá trình thực nghiệm, luận văn đã lựa chọn sử dụng phương pháp hợp nhất muộn cho bài toán phát hiện sớm mã độc IoT Botnet và đạt được hiệu quả khả quan.

Một phần của tài liệu (LUẬN văn THẠC sĩ) phát hiện sớm mã độc IOT BOTNET trên các thiết bị IOT (Trang 33 - 36)

Tải bản đầy đủ (PDF)

(75 trang)