4.1.3.3 Trích chọn đặc trưng
Mặc dù mô hình Markov ẩn đã chọn có khả năng mô phỏng các quá trình ngẫu nhiên một chiều nhưng ảnh mặt lại là một trường ngẫu nhiên hai chiều và trong một số trường hợp cụ thể là trường hai chiều với mỗi phần tử là giá trị một điểm ảnh. Như vậy, cần phải có một phương pháp để xử lý dữ liệu đầu vào thành các chuỗi quan sát mà lý thuyết mô hình Markov ẩn đã chỉ ra theo yêu cầu của các bài toán cơ bản, nền tảng của các ứng dụng mô hình Markov ẩn.
Trong các ứng dụng xử lý ảnh, đối tượng thao tác thường là các dãy điểm ảnh được lấy ra từ ảnh ban đầu thông qua một phép xử lý nào đó. Trong trường hợp mô hình hoá khuôn mặt trong ảnh bằng mô hình Markov ẩn, các biểu tượng quan sát là các vectơ được tính toán từ một dãy các điểm ảnh lấy trực tiếp từ ảnh đầu vào. Với một ảnh mặt được mô hình hoá bởi mô hình Markov, các đặc trưng ảnh chính là các khối điểm ảnh nằm gối lên nhau được trích ra từ ảnh. Mỗi khối bao gồm một
số hàng điểm ảnh, các hàng này sau khi trích ra được sắp xếp lại tạo thành một dãy một chiều các điểm ảnh.
Trong một số công trình đã thực hiện, toàn bộ dãy điểm ảnh được sử dụng như một vectơ quan sát. Giá trị của mỗi thành phần là giá trị cường độ sáng của điểm ảnh hay là giá trị mức xám của ảnh đa mức xám của điểm ảnh đó. Cách tiếp cận này khiến cho kích thước của vectơ quan sát trở nên rất lớn, gây ra khả năng bị ảnh hưởng bởi nhiễu trong ảnh và làm giảm hiệu năng tính toán của hệ thống vì các giá trị điểm ảnh thực ra không biểu diễn đặc trưng mạnh và các giá trị điểm ảnh rất nhạy cảm với nhiễu ảnh cũng như các phép quay,dịch chuyển và thay đổi về độ chiếu sáng.
Một số cách làm khác cũng đã từng được đưa ra để xây dựng tập vectơ quan sát từ dãy các điểm ảnh trong đó có sử dụng các đại lượng của phép biến đổi Cô-sin hai chiều (DCT) hoặc các đại lượng của phép biến đổi Karhunen Loeve (KLT). Hai cách làm này thực sự có hiệu quả đặc biệt bởi khả năng giảm ảnh hưởng của nhiễu, giảm đáng kể kích thước của vectơ quan sát thông qua việc loại bỏ các thành phần chứa ít thông tin trong ảnh.
Phương pháp được mô tả trong chương này sử dụng các đại lượng của phép biến đổi KL để xây dựng các vectơ quan sát sử dụng trong huấn luyện mô hình Markov ẩn để tìm kiếm và nhận dạng khuôn mặt người trong ảnh. Các bước thực hiện sẽ được lần lượt trình bày trong các phần tiếp theo.
Trích chọn các khối điểm ảnh
Một ảnh đầu vào kích thước W x H điểm ảnh với W là chiều rộng và H là chiều cao của ảnh chứa một khuôn mặt bên trong (điều này đúng với các ảnh mẫu), các khối điểm ảnh L hàng được trích ra và sử dụng để tạo nên các quan sát. Hình vẽ sau mô tả cách lấy các khối quan sát.