Phép lƣợng hóa vô hƣớng

Lƣợng hóa một đại lƣợng vô hƣớng thì không mới. Nhƣ minh họa trong hình 5.6, dòng số thực biểu diễn một đại lƣợng đo đƣợc, chia thành các phần Ci – codebook. Khi đó lƣợng hóa là tiến trình ánh xạ mỗi số thực vào nhãn (label) của phần chứa điểm tƣơng ứng trên dòng. Sai lệch đƣợc biết đến khi tất cả các điểm trong một phần đƣợc ánh xạ vào cùng một nhãn. Sai lệch trung bình trên toàn bộ, D, có thể đƣợc tính khi cho trƣớc độ đo sai lệch d(x,y) theo đó giá trị x đƣợc lƣợng hóa thành y:

D= [d(x,y)] (51)

= (52)

Trong đó là toán tử kỳ vọng, có L phần Ci trong codebook, P[x Ci] là xác suất rời rạc mà x nằm trong Ci và p(x) là data của x.

Hình 3.11 Phép lượng hóa mật độ đo một chiều

Khái niệm định lƣợng vô hƣớng không bị giới hạn trong một chiều. Một vector N- chiều có thể đƣợc định lƣợng vô hƣớng bằng cách xem xét mỗi chiều trong N chiều nhƣ những dòng số thực độc lập đƣợc định lƣợng nhƣ đã mô tả ở trên. Một ví dụ của định lƣợng vô hƣớng hai chiều đƣợc trình bày trong hình 3.11

10 20 30 40 50 60

Hình 3.12 Phép lượng hóa không gian hai chiều

Mục đích của thuật toán VQ thƣờng là cực tiểu toàn bộ sai lệch trung bình sinh ra quá trình định lƣợng. Sai lệch này đƣợc định nghĩa trong phƣơng trình (60) theo d(x,y) – độ đo sai lệch khi vector x đƣợc lƣợng hóa thành codeword y. Nhƣ vậy dạng của d(x,y) có ý nghĩa đáng kể trong quá trình thiết kế codebook.

Nhƣ vậy chúng ta đã xem xét quá trình lƣợng hóa nhƣ tiến trình đánh nhãn một vector liên tục với định danh của tế bào mà nó rơi vào. Với mục đích nhận dạng, tế bào nên đƣợc đánh nhãn bằng một vector đại diện – code vector (điển hình là trọng tâm của nó) cùng với một định danh

Gọi y là code vector mà x đƣợc lƣợng hóa thành và yk là chiều thứ k của y. Có một số độ đo sai lệch thông thƣờng gồm:

-Sai số bình phƣơng trung bình:

dl(x,y) = (53)

- Dạng tổng quát hơn là:

dt(x,y) = (54)

Thông thƣờng, r = l hay r = , d1 biểu diễn sai số tuyệt đối trung bình và tiến về sai số cực đại. Cực tiểu hóa D với r = sẽ tƣơng đƣơng với cực tiểu hóa sai số định lƣợng cực đại.

Sai số bình phƣơng trung bình giả thiết rằng mỗi chiều của vector góp phần nhƣ nhau vào sai số. Một sai số bình phƣơng trung bình có trọng số đƣợc định nghĩa nhƣ sau:

- Sai số bình phƣơng trung bình có trọng số:

dw(x,y) = W(x-y) (55)

trong đó W là ma trận định nghĩa trọng số dƣơng. Nếu W= l, trong đó là ma trận hợp biến của vector ngẫu nhiên x thì dw trở thành khoảng cách Mahalanobis.

Cách tiếp trên đã chia không gian vector thành một số tế bào N – chiều, và lƣợng hóa mỗi vector liên tục thành một vector đại diện cho tế bào mà nó nằm trong đó.

Nhƣ vậy thiết kế codebook là quá trình điều chỉnh phân bố để cực tiểu sai lệch trung bình tổng thể.

Một cách tiếp cận khác là biểu diễn mỗi tế bào nhƣ một img N- chiều. Thao tác lƣợng hóa sau đó gồm ƣớc lƣợng mỗi img cho vector liên tục để xác định xác suất mà mỗi img có thể đƣa ra vector. Vector đại diện của tế bào với xác suất cực đại sau đó đƣợc chọn làm kết quả định lƣợng. Ƣu điểm của phƣơng pháp này là các ảnh có thể chồng lên nhau trong khi trƣớc đây chúng ta chỉ có thể xem xét một phân bố hạn chế trong các tế bào. Điều này phản ánh cấu trúc của quần thể gần gũi hơn bằng những phân bố giới hạn. Một ƣu điểm chủ yếu khác của cách tiếp cận này là khả năng thực hiện định lƣợng mềm (Soft Quantisation). Bằng cách ƣớc lƣợng xác suất mỗi img tạo ra vector, các codeword có thể đƣợc lƣu thay vì xác suất. Nhƣ vậy một quyết định cứng là không cần và nhƣ thế sẽ giữ lại nhiều thông tin hơn cho những giai đoạn xử lý tiếp theo.

Kết quả của cách tiếp cận cực đại xác suất là tập hợp các vector liên tục đƣợc mô hình hóa nhƣ một hàm mật độ hỗn hợp, và quá trình lƣợng hóa là xác định thành phần hỗn hợp nào tạo ra vector. Quá trình thiết kết codebook sau đó cực đại hóa xác suất của hàm mật độ hỗn hợp biểu diễn toàn bộ tập hợp.

Huấn luyện và cho điểm HMM

Giải thuật tiến – lùi (forward-backward algorithm)