4 Chương MÔ HÌNH MAKOV ẨN VÀ ỨNG DỤNG NHẬN DẠNG
4.1.3.4 Luyện mô hình mặt
Quá trình luyện một mô hình Markov ẩn để biểu diễn mô hình mặt dùng trong tìm kiếm khuôn mặt và nhận dạng khuôn mặt là tương tự nhau, điểm khác biệt duy nhất là ở tập dữ liệu sử dụng để luyện. Với tìm kiếm khuôn mặt, các ảnh mặt trong tập dữ liệu mẫu biểu diễn khuôn mặt nhìn thẳng của những người khác nhau
được lấy dưới những điều kiện chiếu sáng khác nhau và tất cả các ảnh được sử dụng đê luyện chỉ một mô hình Markov. Trong khi đó, đối với nhận dạng khuôn mặt, mỗi cá nhân trong cơ sở dữ liệu được biểu diễn bởi một mô hình Markov và tập hợp các ảnh khác nhau của cùng một người được sử dụng để luyện mô hình đó.
Sau khi trích chọn các khối quan sát từ các ảnh mặt trong tập mẫu, các vectơ quan sát được tạo ra và được sử dụng để luyện mô hình. Với các ảnh mẫu trong cơ sở dữ liệu ORL, các thông số của các khối quan sát được lựa chọn là L=10 hàng, W=92 cột, P=8 dòng, và sử dụng 10 đại lượng KLT tương ứng với 10 vectơ riêng lớn nhất. Quá trình luyện mô hình được thực hiện theo các bước sau:
Đầu tiên, các tham số được khởi đầu bằng cách phân đoạn đều các dữ liệu
mẫu theo số trạng thái của mô hình Markov, sau đó các vectơ quan sát ứng với mỗi trạng thái được sinh ra và sử dụng để tính toán các đánh giá ban đầu của ma trận xác suất quan sát B. Các phần tử của ma trận A cũng được khởi đầu với các giá trị thống nhất với cấu trúc tuần tự từ trên xuống dưới của mô hình nghĩa là aij=0 với j<i và j>i+1, hay nói cách khác mô hình chỉ có thể chuyển từ một trạng thái trở lại chính nó hoặc chuyển sang trạng thái tiếp theo. Với ma trận phân phối xác suất trạng thái khởi đầu π, ta khởi tạo π1=1 và πi=0 với i≠1 nghĩa là mô hình chỉ bắt đầu từ trạng thái 1.
Ở các bước lặp tiếp theo, phân đoạn đều mẫu được thay thế bằng phân
đoạn Viterbi. Phân đoạn Viterbi là một phương pháp phân đoạn đặc biệt trong đó các dãy trạng thái tương ứng với các vectơ quan sát tạo thành các đoạn có cùng trạng thái. Chú ý rằng phân đoạn Viterbi chỉ xuất hiện trong các mô hình trái phải tuần tự không có bước nhảy. Kết quả của phép phân đoạn này đối với mỗi dãy quan sát là đánh giá tối đa độ tương tự của tập các vectơ quan sát bên trong các trạng thái tương ứng với mô hình hiện tại. Bước lặp tiếp tục được thực hiện cho đến khi độ tương tự phân đoạn Viterbi ở các bước lặp kết tiếp nhỏ hơn một ngưỡng xác định. Khi đó, mô hình Markov coi như được khởi tạo.
Tiếp theo sau việc khởi tạo mô hình, các tham số mô hình được đánh giá
lại sử dụng thủ tục đánh giá lại Baum – Welch. Quá trình này điều chỉnh lại các tham số mô hình để cực đại hoá xác suất quan sát dữ liệu mẫu.
Mô hình sau khi đánh giá lại ~λ được so sánh với mô hình trước λ thông qua tỉ số khoảng cách phản ánh độ tương tự thống kê giữa các mô hình. Nếu
tỉ số khoảng cách vượt quá một ngưỡng, mô hình cũ λ được thay thế bởi mô
hình mới λ~ và toàn bộ quá trình luyện được thực hiện lại, nếu tỉ số khoảng cách nhỏ hơn ngưỡng, mô hình được coi là hội tụ và các tham số đạt được giá trị cuối cùng.
Hình 4-9. Chiến lược huấn luyện mô hình Markov ẩn cho biểu diễn khuôn mặt