Bài tốn xây dựng đặc trưng từ lời gọi hệ thống

Một phần của tài liệu Nghiên cứu xây dựng hệ thống VSandbox trong phân tích và phát hiện mã độc IoT Botnet. (Trang 88 - 89)

6. Bố cục của luận án

2.4. Kết luận Chương 2

3.1.2. Bài tốn xây dựng đặc trưng từ lời gọi hệ thống

Với nội dung đã được trình bày ở trên, hạn chế chính của các nghiên cứu sử dụng lời gọi hệ thống để phát hiện mã độc IoT nĩi chung và IoT Botnet nĩi riêng đã được phân tích ở trên bao gồm:

1) Các nghiên cứu sử dụng lời gọi hệ thống hầu hết mới chỉ quan tâm tới đặc trưng tần xuất xuất hiện lời gọi, chưa khai thác hiệu quả đặc trưng tuần tự của lời gọi hệ thống.

2) Các nghiên cứu sử dụng đồ thị trong xử lý chuỗi lời gọi hệ thống của mã độc tồn tại các nhược điểm như vector đặc trưng cĩ số chiều quá lớn, giá trị đặc trưng được

trích xuất từ đồ thị cịn phức tạp để thực hiện phân lớp hiệu quả, độ chính xác khi áp dụng chưa cao, cịn lệ thuộc vào kiến trúc vi xử lý và nền tảng hệ điều hành.

Như vậy, để giải quyết các hạn chế kể trên, bài tốn nghiên cứu của Chương này được phát biểu như sau:

- Cho E là tập hợp gồm n tập tin thực thi được đối với thiết bị IoT hạn chế tài nguyên, ký hiệu là E = {e1, e2, …, en} với �� cĩ thể là mã độc hoặc tệp lành tính.

- Cho � = {���ℎ������, ���ℎ���ℎ��ℎ, ��������, �������, ��ℎ�����, �������} là

tập hợp các đặc trưng trích xuất từ lời gọi hệ thống trong bài tốn phát hiện mã độc IoT Botnet, với mỗi đặc trưng trong tập F sẽ cho ra n đặc trưng tương ứng với mỗi �� � �, cụ thể tồn tại một ánh xạ { : � � → �; � ↦ = � �(�)}. Ví dụ, với đặc trưng ���ℎ������ thì tồn tại tập giá trị đặc trưng ���ℎ������(�) = {�1 ↦ ���ℎ������1 , �2 ↦ ���ℎ������2 , … , �� ↦

���ℎ�������}.

- Cần tìm �����∉ | � ∀�� ∈ , � ∃�� ↦ ������mà �����hiệu quả hơn ��∈ �,

được định lượng bằng các chỉ số đánh giá mơ hình học máy phổ biến trên cùng một tập dữ liệu tương đồng.

Để giải quyết bài tốn nghiên cứu kể trên, nghiên cứu sinh đề xuất đặc trưng đồ thị lời gọi hệ thống cĩ hướng (Directed System Call Graph - DSCG) để cấu trúc hố một cách tuần tự các lời gọi hệ thống thu được từ mơi trường V-Sandbox. Đặc trưng được đề xuất sẽ cĩ độ phức tạp thấp, dễ áp dụng với những thuật tốn học máy đơn giản. Tiếp theo, nghiên cứu sinh trình bày các nội dung mơ tả cụ thể về mơ hình tởng quan và phương pháp trích xuất đặc trưng từ đồ thị lời gọi hệ thống được đề xuất.

Một phần của tài liệu Nghiên cứu xây dựng hệ thống VSandbox trong phân tích và phát hiện mã độc IoT Botnet. (Trang 88 - 89)

Tải bản đầy đủ (DOC)

(143 trang)
w