Bài toán phân loại một lớp và một số ứng dụng

Một phần của tài liệu Phát hiện dữ liệu ngoại lai bằng mô hình svm một lớp (Trang 26)

liệu bình thường. Chính vì vậy mà rất khó, nếu không muốn nói là không thể để thu thập tập dữ liệu ngoại lai để dán nhãn. Sự thiếu cân bằng trong tập dữ liệu gây ra rất nhiều khó khăn cho quá trình huấn luyện.

Sự đa dạng về các loại bất thường: Có ba loại bất thường đã được khám phá bao gồm điểm dữ liệu bất thường đơn lẻ, dữ liệu bất thường có điều kiện và dữ liệu bất thường theo nhóm.

Thách thức

Phát hiện các dị thường phức tạp: Hầu hết các phương pháp hiện tại chỉ áp dụng với điểm dữ liệu bất thường riêng lẻ, không thể sử dụng cho dữ liệu bất thường có điều kiện và bất thường theo nhóm vì chúng thể hiện hành vi hoàn toàn khác với các điểm bất thường riêng lẻ. Ngoài ra, các phương pháp hiện tại chủ yếu tập trung vào việc phát hiện các điểm bất thường từ các nguồn dữ liệu đơn lẻ, trong khi nhiều ứng dụng yêu cầu phát hiện các điểm bất thường với nhiều nguồn dữ liệu không đồng nhất, ví dụ: dữ liệu đa chiều, dữ liệu đồ thị, hình ảnh, văn bản và âm thanh. Một thách thức chính là một số điểm bất thường chỉ có thể được phát hiện khi xem xét hai hoặc nhiều nguồn dữ liệu.

Áp dụng với dữ liệu nhiều chiều: Mô hình phát hiện ngoại lai có thể làm việc tốt với dữ liệu có số chiều nhỏ. Nhưng với tập dữ liệu có số chiều lớn, mô hình gặp khó khăn trong việc phát hiện. Số chiều lớn của tập dữ liệu đã và đang là một thách thức mang tính lâu dài.

1.3 Bài toán phân loại một lớp và một số ứng dụng

Một phần của tài liệu Phát hiện dữ liệu ngoại lai bằng mô hình svm một lớp (Trang 26)