Ngoài cỏc phƣơng phỏp sử dụng khụng gian con tuyến tớnh và sử dụng mạng neural, cũn có cỏc phƣơng phỏp phỏt hiện mặt sử dụng cỏc đặc trƣn g thống kờ. Những phƣơng phỏp này dựa trờn cơ sở lý thuyết thụng tin, lý thuyết về SVM (Support Vector Machine) và cỏc luật xỏc suất của Bayes.
Dƣ̣a trờn các phƣơng pháp tìm kiờ́m mă ̣t tụ́i đa hoá sƣ̣ tƣơng đụ̀ng , Colmenarez và Huang đó đƣa ra một h ệ thống dựa trờn thụng tin tƣơng quan Kullback (hay khoảng cỏch Kullback). Khoảng cỏch này là một phộp đo khụng õm khoảng cỏch giữa hai hàm mõ ̣t đụ ̣ xác suṍt PXn và MXn của quỏ trỡnh ngẫu nhiờn Xn:
ln n n n n X P M X X X P H P M (13)
Trong quá trình ho ̣c , với mụ̃i că ̣p điờ̉m ảnh trong tõ ̣p mõ̃u ho ̣c , mụ ̣t biờ̉u đụ̀ xám kờ́t hơ ̣p đƣợc sƣ̉ du ̣ng đờ̉ xõy dƣ̣ng các hàm xác suṍt cho các lớp mă ̣t và khụng phải mă ̣t. Khi giá tri ̣ cỏc điểm ảnh phụ thuộc nhiều vào cỏc điểm ảnh xung quanh , Xn đƣợc xem nhƣ mụ ̣t quá trình Markov bõ ̣c mụ ̣t và các giá tri ̣ điờ̉m ảnh trong ảnh xám đƣợc lƣơ ̣ng hoá la ̣i theo 4 mƣ́c. Colmenarez và Huang đã sƣ̉ du ̣ng mụ ̣t tõ ̣p lớn cá c ảnh 11x11 gụ̀m ảnh mă ̣t và ảnh khụng phải mă ̣t trong quá trình ho ̣c . Kờ́t quả của quá trình học là một tập cỏc bảng tỡm kiếm với cỏc t ỷ sụ́ tƣơng tƣ̣ tính đƣợc . Đờ̉ cải thiờ ̣n hiờ ̣u năng và giảm yờu cõ̀u tính toán , cỏc cặp đ iờ̉m ảnh khụng ảnh hƣởng nhiờ̀u tới đụ ̣ sai khỏc tổng thể đƣợc loại bỏ khỏi cỏc bảng tỡm kiếm và khụng đƣợc sử dụng trong hệ thụ́ng tìm kiờ́m mă ̣t. Mụ ̣t kỹ thuõ ̣t khác cũng đƣợc Colmenaez và Huang sƣ̉ du ̣ng là kỹ thuõ ̣t ho ̣c nụ̃ lƣ̣c với mu ̣c tiờu cải thiờ ̣n và hƣớng tới các hờ ̣ thụ́ng dò tìm thời gian thƣ̣c.
Osuna và cộng sự đã áp du ̣ng phƣơng pháp SVM vào tìm kiờ́m khuụn mă ̣t . Hợ̀ thụ́ng đờ̀ xuṍt tuõn theo các nguyờn tắc giụ́ng nhƣ hờ ̣ thụ́ng của Sung và Pogg io. Mụ ̣t SVM với hàm cơ sở là đa thƣ́c bõ ̣c hai đƣợc luyờ ̣n với mụ ̣t thuõ ̣t toán phõn rã đảm bảo đa ̣t tới tụ́i ƣu toàn cu ̣c . Quỏ trỡnh luyện đƣợc thực hiện với thuật toỏn bẫy lỗi và cỏc
45
Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
ảnh đầu vào cũng đƣợc tiền xử lý theo cự ng phƣơng pháp giụ́ng nhƣ phƣơng pháp của Sung và Poggio. Kumar và Poggio gõ̀n đõy đã tích hợp thuõ ̣t toán SVM của Osuna vào mụ ̣t hờ ̣ thụ́ng thời gian thƣ̣c tìm kiờ́m và phõn tích mă ̣t . Họ ỏp dụng thuật toỏn SVM trờn các vùng da đã đ ƣợc phõn đoạn trong ảnh đầu vào để trỏnh việc tỡm kiếm toàn bộ ảnh. SVM cũng đƣợc sƣ̉ du ̣ng trong dò tìm nhiờ̀u mă ̣t bằng cách xõy dƣ̣ng các SVM riờng biờ ̣t cho các vùng khác nhau . Terrillon và cộng sự đã sƣ̉ du ̣ng SVM đờ̉ nõng cao hiờ ̣u năng của các bụ ̣ tìm kiờ́m mă ̣t so với sƣ̉ du ̣ng các MLP trong các nghiờn cƣ́u trƣớc đó.
Schneiderman và Kanade đã mụ tả hai bụ ̣ tìm kiờ́m mă ̣t dƣ̣a trờn luõ ̣t ra quyờ́t đi ̣nh Bayes:
| non-object| object objectobject
P image P non
P image P
(14)
Nờ́u tỷ sụ́ tƣơng tƣ̣ (vờ́ trái) của phƣơng trỡnh trờn lớn hơn vế phải thỡ cú thể đi đến kết luận rằng một đối tƣợng (mụ ̣t khuụn mă ̣t ) cú tồn tại ở vị trớ hiện tại . Mụ ̣t ƣu điờ̉m của cách tiờ́p cõ ̣n này là nờ́u các biờ̉u diờ̃n cho P image | object và
| object
P image non là chớnh xỏc thỡ luật ra quyết định đƣợc chứng minh là tối ƣu .
Trong hờ ̣ thụ́ng tìm kiờ́m mă ̣t đõ̀u tiờn đƣợc Schneiderman và Kanade đờ̀ xuṍt , hàm xỏc suất đƣợc sinh ra dựa trờn một tập hợp cỏc sửa đổi và đơn giản hoỏ:
- Độ phõn giải của cỏch ảnh mặt đƣợc chuẩn hoỏ thành 64x64 điờ̉m ảnh.
- Cỏc ảnh mặt đƣợc phõn chia thành cỏc vựng con 16x16 điờ̉m ảnh và khụng có mụ hình thụ́ng kờ nào liờn quan giƣ̃a các vùng con với nhau.
- Cỏc vựng con đƣợc chiếu vào cỏc khụng gian con 12 chiờ̀u (xõy dƣ̣ng bởi PCA). - Toàn bộ vựng mặt đƣợc chuẩn hoỏ để cú trung bỡnh bằng khụng và phƣơng sai
đơn vi ̣.
Trong hờ ̣ thụ́ng thƣ́ hai đƣợc đƣa ra, cỏc thuộc tớnh trực quan của ảnh khụng đƣợc biờ̉u diờ̃n bằng các đa ̣i lƣợng vectơ riờng cu ̣c bụ ̣ (nhƣ trong phƣơng pháp tiờ́p cõ ̣n thƣ́ nhṍt) mà đƣợc thay thế bằng lấy mẫu cục bộ cỏc biến đổi wavelet . Mụ ̣t phép biờ́n đụ̉i wavelet có thờ̉ thu thõ ̣p đƣợc các thụng tin liờn quan đờ́n các thuụ ̣c tính trƣ̣c quan nhƣ khụng gian , tõ̀n sụ́ và hƣớng ; nhƣ võ ̣y có thờ̉ thích hợp đờ̉ mụ tả các đă ̣c tính của khuụn mă ̣t ngƣời. Mụ ̣t cách áp du ̣ng biờ́n đụ̉i wavelet khác sƣ̉ du ̣ng phõn rã 3 mƣ́c với
46
Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
bụ ̣ lo ̣c dải 5/3 pha tuyờ́n tính. Biờ́n đụ̉i này sẽ phõn rã ảnh thành 10 dải con. Tƣ̀ các dải con này, 17 thuụ ̣c tính trƣ̣c quan, mụ̃i thuụ ̣c tính bao gụ̀m 8 đa ̣i lƣợng đƣợc trích ra và đƣơ ̣c xem nhƣ các biờ́n ngõ̃u nhiờn đụ ̣c lõ ̣p thụ́ng kờ . Cỏc đại lƣợng sau đú đƣợc lƣợng hoỏ lại theo 3 mƣ́c và các thuụ ̣c tính trƣ̣c quan đƣợc biờ̉u diờ̃n dƣới da ̣ng biờ̉u đụ̀ . Với cỏch tiếp cận này, mụ ̣t bụ ̣ tìm kiờ́m mă ̣t dƣ̣a trờn khung nhìn sẽ đƣợc xõy dƣ̣ng với mụ ̣t bụ ̣ dò tìm khung nhỡn thẳng và một bộ dũ tỡm khung nhỡn nghiờng phải (để dũ tỡm khung nhìn nghiờng trái , khung nhìn nghiờng phải đƣợc áp du ̣ng nhƣ với ảnh ngƣời của khung nhỡn trỏi ). Cỏc kết quả tốt nhất đó đạt đƣợc từ hai hệ thống mụ tả trờn đõy với hờ ̣ thụ́ng các vectơ riờng , tuy nhiờn điờ̀u này la ̣i có đƣợc trờn tõ ̣p dƣ̃ liờ ̣u thƣ̉ mà chƣ́a phõ̀n lớn các ảnh mă ̣t nhìn thẳng . Trong mụ ̣t thí nghiờ ̣m riờng biờ ̣t trờn tõ ̣p chủ yờ́u các ảnh nhìn nghiờng , bụ ̣ tìm kiờ́m với wavelet hoa ̣t đụ ̣ng tụ́t hơn hờ ̣ thụ́ng tìm kiờ́m sƣ̉ du ̣ng các vectơ riờng.
Phƣơng pháp tìm kiờ́m mă ̣t dƣ̣a trờn mụ hình Markov õ̉n cũng là mụ ̣t trong các hƣớng nghiờn cƣ́u đƣợc chú tro ̣ng . Mụ hình Markov õ̉n là mụ ̣t tõ ̣p các mụ hình thụ́ ng kờ đƣơ ̣c sƣ̉ du ̣ng đờ̉ mụ tả các đă ̣c tính thụ́ng kờ của tín hiờ ̣u . Lý thuyết về chuỗi Markov và mụ hình Markov đã đƣợc nghiờn cƣ́u sõu rụ ̣ng và áp du ̣ng nhiờ̀u trong lý thuyờ́t nhõ ̣n da ̣ng nhƣ nhõ ̣n da ̣ng tiờ́ng nói , chƣ̃ viờ́t. Samarie và cộng sự, Netfian và cộng sự là hai nhóm nghiờn cƣ́u hàng đõ̀u trong viờ ̣c áp du ̣ng mụ hình Markov õ̉n vào tỡm kiếm và nhận dạng mặt ngƣời.
Túm lại, nhận biết mặt ngƣời là một lĩnh vực đang thu hỳt nhiều sự quan tõm của cỏc nhà nghiờn cứu. Ngày càng cú nhiều thuật toỏn mới, hƣớng tiếp cận mới nhằm nõng cao chất lƣợng cũng nhƣ độ chớnh xỏc của hệ thống dũ tỡm khuụn mặt. Tuy nhiờn, do tớnh phức tạp của mụi trƣờng, khụng gian và bối cảnh cũng nhƣ yờu cầu về tớnh thời gian thực của hệ thống mà cho đến nay vẫn chƣa cú một phƣơng phỏp nào thật sự tối ƣu. Việc tỡm ra phƣơng phỏp mới vẫn cũn để ngỏ và cú thể cần sự trợ giỳp của cụng nghiệp mỏy tớnh, đú là sự phỏt triển của phần cứng, tốc độ xử lý của mỏy tớnh.
Nhỡn chung thỡ nhận dạng mặt ngƣời cú hai hƣớng tiếp cận chớnh là hƣớng tiếp cận dựa vào những đặc trƣng của mặt ngƣời và hƣớng tiếp cận dựa vào thụng tin hỡnh ảnh.
47
Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Hƣớng tiếp cận dựa vào những đặc trƣng của mặt ngƣời đƣợc ỏp dụng chủ yếu khi hệ thống yờu cầu tớnh thời gian thực. Vỡ khi đú vấn đề về màu sắc và chuyển động của hỡnh ảnh phải đƣợc quan tõm. Tuy nhiờn, hƣớng tiếp cận này thỡ chất lƣợng phỏt hiện của hệ thống cú thể sẽ khụng cao, muốn nõng cao chỳng ta phải cú thờm những kỹ thuật mới bổ sung và khỏ phức tạp.
Hƣớng tiếp cận dựa vào thụng tin hỡnh ảnh là phƣơng phỏp cú chất lƣợng và hiệu quả cao nhất nhƣng chỉ xử lý cho ảnh xỏm. Và cỏc phƣơng phỏp đều sử dụng chung kỹ thuật cửa sổ đa phõn giải. Chỳng ta cú thể khụng cần sử dụng cửa sổ quột này nếu kết hợp hƣớng tiếp cận trờn với phƣơng phỏp dựa vào đặc tớnh khuụn mặt nhƣ là một bƣớc tiền xử lý.
Ứng dụng quan trọng nhất của phỏt hiện khuụn mặt cho đến hiện nay cú lẽ là giai đoạn tiền xử lý cho hệ thống nhận dạng mặt ngƣời. Ngoài ra, với sự gia tăng của tài nguyờn trờn Internet, lý thuyết về nhận biết mặt ngƣời cú thể đƣợc ứng dụng để chỉ số húa nội dung ảnh và cơ sở dữ liệu video. Ngoài ra cũn cú ứng dụng trong cụng nghệ sinh trắc học và hội thảo truyền hỡnh.