Hạn chế của phương pháp SVM

Một phần của tài liệu PHÂN LỚP ẢNH SỬ DỤNG KỸ THUẬT MDS KẾT HỢP VỚI SVM (Trang 32)

Có lẽ hạn chế lớn nhất của tiếp cận theo phương pháp SVM nằm ở việc lựa chọn hàm xử lý chính. Khi đã có hàm xử lý chính, bộ phân loại SVM chỉ có một tham số cho người dùng chọn (ngưỡng lỗi), nhưng hàm xử lý chính là bài toán lớn với khả năng của các tham số. Một số nghiên cứu đã giới hạn hàm xử lý chính bằng cách dùng tri thức cho trước, nhưng việc chọn hàm xử lý chính tốt nhất cho một bài toán cho trước vẫn là một bài toán cần nghiên cứu.

Giới hạn thứ hai là tốc độ và kích thước, cả trong huấn luyện và thử nghiệm.

1.2.4.2 Giới thiệu về kỹ thuật PCA

Phân tích thành phần chính (Principal Component Analysis – PCA) là một trong những phương pháp phân tích dữ liệu nhiều biến đơn giản nhất. Nói một cách ngắn gọn, mục tiêu của PCA là tìm một không gian mới (với số chiều nhỏ hơn không gian cũ). Các trục tọa độ trong không gian mới được xây dựng sao cho trên mỗi trục, độ biến thiên của dữ liệu trên đó là lớn nhất có thể. Một điểm nữa của PCA là các trục tọa độ trong không gian mới luôn đảm bảo trực giao đôi một với nhau, mặc dù trong không gian ban đầu, các trục có thể không trực giao.Về mặt ứng dụng của phương pháp PCA là rất rộng trong công nghiệp, nông nghiệp, kinh tế, khoa học cơ bản… với bảng số liệu mà các cột là các biến và các dòng là các cá thể, trên đó đo giá trị của biến.

Hình 1.10: Minh họa PCA tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên cao nhất.

Hình 1.11: Hình hiển thị dùng PCA giảm số chiều những vẫn đảm bảo được các thông tn quan trọng nhất.

Giả sử tập dữ liệu ban đầu trong không gian 3D, dữ liệu này sẽ được chiếu lên các cặp trục tọa độ không gian 2D, theo hình 1.10 thì khi chiếu lên trục y, z ta thu được kết quả có độ biến thiên cao nhất.

Một phần của tài liệu PHÂN LỚP ẢNH SỬ DỤNG KỸ THUẬT MDS KẾT HỢP VỚI SVM (Trang 32)

Tải bản đầy đủ (DOCX)

(79 trang)
w