Nhiệm vụ của khai phá dữ liệu

Một phần của tài liệu nghiên cứu giải pháp phát hiện xâm nhập mạng máy tính bất thường dựa trên khai phá dữ liệu (Trang 28 - 29)

Cho đến nay đã có rất nhiều công trình nghiên cứu và phát triển trong lĩnh vực khai phá dữ liệu. Dựa trên những loại tri thức đƣợc khám phá, chúng ta có thể phân loại nhƣ theo các nhiệm cụ nhƣ sau:

Khai phá luật thuộc tính: tóm tắt những thuộc tính chung của tập dữ liệu nào đó trong cơ sở dữ liệu. Ví dụ nhƣ để phát hiện máy tính A bị nhiễm Virus thƣờng thể hiện các biểu hiện qua một tập các dấu hiệu A1, A2,

Khai phá những luật phân biệt: khai phá những đặc trƣng, những thuộc tính để phân biệt giữa tập dữ liệu này với tập dữ liệu khác. Ví dụ nhƣ nhằm phân biệt các loại Virus máy tính với nhau thì cần một tập các mẫu và dấu hiệu của các loại Virus máy tính để phần mềm có thể so sánh và đƣa ra kết luận.

Khám phá luật kết hợp: khai phá sự kết hợp giữa những đối tƣợng trong một tập dữ liệu. Giả sử hai tập đối tƣợng {A1, A2,… ,An} và {B1, B2,… ,Bn} thì luật kết hợp có dạng {A1^A2^…^ An) →{B1^ B2^… ^Bn).

Khám phá luật phân lớp: phân loại dữ liệu vào trong tập những lớp đã biết. Ví dụ nhƣ Virus máy tính có các dấu hiệu chung để phân vào các lớp dựa trên độ nguy hiểm, cách thức lây nhiễm, …

Phân nhóm: xác định một nhóm cho một tập các đối tƣợng dựa trên thuộc tính của chúng. Một số các tiêu chuẩn đƣợc sử dụng để xác định đối tƣợng có thuộc về nhóm hay không.

Dự báo: dự báo giá trị có thể đúng của những dữ liệu bị thiếu hoặc sự phân bố thuộc tính nào đó trong tập dữ liệu.

Khám phá quy luật biến đổi: tìm những tập luật phản ánh những hành vi tiến hóa, biến đổi chung của một tập dữ liệu. Ví dụ nhƣ quy luật lây nhiễm và phát tán của Virus máy tính trên mạng Internet.

Một phần của tài liệu nghiên cứu giải pháp phát hiện xâm nhập mạng máy tính bất thường dựa trên khai phá dữ liệu (Trang 28 - 29)

Tải bản đầy đủ (PDF)

(74 trang)