.7 Kết quả tập dữ liệu lớ p2 sau khi thực hiện phân đoạn

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu và ứng dụng kỹ thuật học máy vào bài toán phát hiện mã độc (Trang 53 - 55)

Lớp 2 Đặc trưng AA AA BB BB CC CC DD DD Đoạn 1 0.6 0.3 0.5 0.8 0.6 0.3 0.5 0.7 0.6 0.3 0.5 0.3 Đoạn 2 0.5 0.2 0.5 0.2 0.5 0.2 0.5 0.2 0.5 0.2 0.5 0.1

Minh họa với đặc trưng “BB BB” ta có:

Bảng 3.8 Minh họa với đặc trưng “BB BB” thuộc lớp 1 sau khi thực hiện phân đoạn

Lớp 1 Đặc Trưng BB BB

Đoạn 1 ( chứa 2 phần tử) 0.9 0.7 Đoạn 2 ( chứa 2 phần tử) 0.6 0.5

Bảng 3.9 Minh họa với đặc trưng “BB BB” thuộc lớp 2 sau khi thực hiện phân đoạn

Lớp 2 Đặc Trưng BB BB Đoạn 1 ( chứa 3 phần tử) 0.3 0.3 0.3 Đoạn 2 ( chứa 3 phần tử) 0.2 0.2 0.2

Bước 3: Trên mỗi đoạn thực hiện tính ra giá trị trung bình cộng tần số xuất hiện của mỗi đặc trưng :

Minh họa với đặc trưng “BB BB”:

 Giá trị tần số xuất hiện trung bình của nó trên đoạn 1 của lớp 1 sẽ là (0.9+0.7)/2=0.8

 Giá trị tần số xuất hiện trung bình của nó trên đoạn 2 của lớp 1 sẽ là : (0.6+0.5)/2 = 0.55

 Giá trị tần số xuất hiện trung bình của nó trên đoạn 1 của lớp 2 sẽ là: (0.3+0.3+0.3)/3=0.3

 Giá trị tần số xuất hiện trung bình của nó trên đoạn 2 của lớp 2 sẽ là: (0.2+0.2+0.2)/3=0.2

Tương tự cách tính như vậy với các đặc trưng còn lại thu được bảng sau:

Bảng 3.10 giá trị trung bình cộng tần số xuất hiện của mỗi đặc trưng trên từng đoạn thuộc lớp 1 Lớp 1 Đặc trưng AA AA BB BB CC CC DD DD TF trung bình trên từng đoạn Đoạn 1 0.6 0.8 1.0 0.2 Đoạn 2 0.5 0.55 0 0.1

Bảng 3.11 giá trị trung bình cộng tần số xuất hiện của mỗi đặc trưng trên từng đoạn thuộc lớp 2 Lớp 2 Đặc trưng AA AA BB BB CC CC DD DD TF trung bình trên từng đoạn Đoạn 1 0.6 0.3 0.5 0.6 Đoạn 2 0.5 0.2 0.5 0.16

Bước 4: Thực hiện tính độ lệch của tần số xuất hiện giữa các đoạn của từng đặc trưng trên 2 lớp, bằng cách trừ lấy trị tuyệt đối 2 tần số trên cùng một đoạn của cùng 1 đặc trưng trên 2 lớp dữ liệu.

Minh họa với đặc trưng “ BB BB” thì:

 Độ lệch tần số giữa 2 lớp của đặc trưng “ BB BB” trên đoạn 1 là: |0.8 – 0.3|=0.5  Độ lệch tần số giữa 2 lớp của đặc trưng “ BB BB” trên đoạn 2 là: |0.55-0.2|=0.35

Thực hiện tương tự với các đặc trưng khác thu được bảng sau:

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu và ứng dụng kỹ thuật học máy vào bài toán phát hiện mã độc (Trang 53 - 55)

Tải bản đầy đủ (PDF)

(67 trang)