Phân tích thành phần chính PCA

Một phần của tài liệu PHÂN LỚP ẢNH SỬ DỤNG KỸ THUẬT MDS KẾT HỢP VỚI SVM (Trang 34)

Giả sử tập huấn luyện có P ảnh, khi đó ta sẽ có P vector: T1, T2, …, TP. Ví dụ:

Tính vector ảnh trung bình:

Sự khác biệt giữa những khuôn mặt với ảnh trung bình là những vector: Ai = Ti - m, i=1…P.

Ý tưởng của việc phân tích thành phần chính là tìm một tập những vector trực chuẩn uk sao cho những vector này mô tả tốt nhất sự phân bố những vector khuôn mặt trong không gian. Những vector uk được chọn sao cho:

Những vector uk và giá trị vô hướng λk chính là những vector riêng và trị riêng tương ứng của ma trận AAT. là tích vô hướng giữa hai vector u, v.

x = 3 x A Vλ(eigenvalue) (eigenvector) v1 v2 v3

Ta thấy ma trận A có kích thước M*N × P, còn ma trận AAT có kích thước M*N×M*N, do kích thước ma trận này quá lớn nên ta không thể tìm được những vector riêng và những trị riêng trực tiếp được, thay vào đó ta sẽ tìm những vector riêng của ma trận ATA có kích thước P×P.

Nếu v là một vector riêng của ATA và λ là trị riêng tương ứng, khi đó ta có: ATAv = λv  ATA Av = λAv.

Tức là Av là một trị riêng của ma trận AAT. Ví dụ Các thông số ma trận:

Thông thường ta chỉ lấy một số Q vector riêng ứng với Q trị riêng có giá trị lớn nhất. Sau khi có các vector riêng của ma trận AAT, ta sẽ chuẩn hóa chúng để thu được một cơ sở trực chuẩn của không gian khuôn mặt.

Đặt L= ATA , tìm V là tập hợp các vector riêng của L, D là tập hợp các trị riêng tương ứng .V bao gồm Q vector riêng ứng với những trị riêng lớn hơn một giá trị nào đó hoặc ứng với Q trị riêng lớn nhất trong D.

Ví dụ: Các vector riêng vi của ATA là

ui = Avi là tập các vector riêng hiệp phương sai của ATA.

U =

u1 u2 u3 u1 u2 u3 ui = AVi

Hình 1.2: Ảnh gốc ban đầu chuyển sang eigenfaces.

Do đây là những vector riêng, mà nó lại có dạng khuôn mặt nên còn được gọi là Eigenfaces. E là ma trận M*N×Q, mỗi cột là một vector riêng.

Chuẩn hóa các vector cột trong E (chia mỗi vector cho độ dài của vector đó). Bây giờ, ta có thể coi E là một cơ sở trực chuẩn của không gian khuôn mặt. Như vậy các vector cột trong E đại diện cho các các ảnh đã được trích chọn đặc trưng bởi các Eigenfaces của các đối tượng. Dữ liệu này sẽ là dữ liệu đầu vào sử dụng cho SVM sử dụng để huấn luyện và nhận dạng đối tượng.

Hình ảnh minh họa

Trong ví dụ này ta có một tập huấn luyện gồm những bức ảnh khuôn mặt kích thước 640x480 pixel, dưới đây là một số hình ảnh của những eigenfaces thu được (lưu ý là đây chỉ là các vector trực giao, những C thực sự chính là những vector này được chuẩn hóa).

Hình 1.13: Sơ đồ hoạt động của hệ thống PCA và SVM.

1.2.4.3 Xây dựng mô hình kết hợp PCA-SVM

Mô hình sơ đồ kết hợp PCA-SVM được thể hiện trong sơ đồ hình 1.13. Mô hình hệ thống hoạt động như sau:

Bước 1: Dữ liệu đầu vào được phân chia làm hai loại dữ liệu (dữ liệu huấn luyện, dữ liệu nhận dạng). Dữ liệu đầu vào được xử lý và chuẩn hóa bởi giai đoạn tiền xử lý.

Bước 2: Sau giai đoạn tiền xử lý đến giai đoạn trích chọn đặc trưng, ở đây ta sử dụng phương pháp PCA để trích chọn. Như đã giới thiệu ở trên phương pháp PCA sẽ tìm ra vector riêng và giá trị riêng của ảnh.

Bước 3: Sau khi xác định số lượng trị riêng lớn nhất của ảnh cần sử dụng để làm đầu vào cho việc huấn luyện và ta chọn mô hình huấn luyện, tại đây ta sử dụng kỹ thuật SVM để huấn luyện và kiểm tra. Kết quả sau khi huấn luyện là các vector tựa của các lớp dữ liệu đồng thời gán nhãn cho từng lớp.

Bước 4: Đến giai đoạn kiểm tra ta cũng làm các bước tương tự như huấn luyện, đầu tiên ta cũng tiền xử lý để chuẩn hóa dữ liệu, tiếp đến là trích chọn đặc trưng của ảnh cần kiểm tra.

Bước 5: Sau khi xác định được các đặc trưng là các giá trị riêng của ảnh cần kiểm tra kết hợp với nhãn của ảnh để làm đầu vào cho kiểm tra dữ liệu. Ta phải sử dụng kỹ thuật SVM giống như khi huấn luyện. Ta sẽ dùng một trong các phương pháp phân lớp để kiểm tra dữ liệu.

Bước 6: Kết quả cuối cùng là thông tin cho ta biết ảnh cần kiểm tra thuộc lớp nào trong bộ dữ liệu mẫu ban đầu.

Một phần của tài liệu PHÂN LỚP ẢNH SỬ DỤNG KỸ THUẬT MDS KẾT HỢP VỚI SVM (Trang 34)

Tải bản đầy đủ (DOCX)

(79 trang)
w