Mụ hỡnh hỡnh dạng động (Active shape models)

Một phần của tài liệu (LUẬN văn THẠC sĩ) phát hiện và nhận dạng khuôn mặt từ camera, ứng dụng trong điểm danh (Trang 33 - 37)

Đõy là mụ hỡnh thời gian thực hiệu quả và là thành tựu quan trọng của hƣớng tiếp cận dựa vào phõn tớch đặc trƣng. Mụ hỡnh dựa vào tớnh chất vật lý thật sự và sự xuất hiện mức cao của cỏc đặc trƣng. Mụ ̣t khi đƣợc đƣa ra với mụ ̣t mƣ́c đụ ̣ tƣơng tƣ̣ với đă ̣c trƣng, mụ ̣t mụ hình hình da ̣ng tích cƣ̣c nhƣ võ ̣y sẽ tƣơng tác với các đă ̣c trƣng ảnh cu ̣c bụ ̣ (nhƣ đƣờng biờn, đụ ̣ sáng) và gần nhƣ biến dạng để đạt đƣợc hỡnh dạng của cỏc đặc trƣng. Hiờ ̣n ta ̣i, cú khoảng 3 dạng mụ hỡnh hỡnh dạng tớch cực đƣợc nghiờn cứu trong lĩnh vực trớch chọn cỏc đặc trƣng mặt . Dạng thứ nhất sử dụng khỏi ni ệm đƣờng nột tụ̉ng quát và có tờn là con rắn (snake), đƣợc đƣa ra đõ̀u tiờn bởi Kass và cộng sự vào năm 1987. Dạng mẫu cú thể biến đổi (deformable template) đƣơ ̣c đƣa ra bởi Yuille và cộng sự trong đó quan tõm tới mƣ́c đụ ̣ ƣu tiờn của cá c đă ̣c tính mă ̣t và nhằm hƣớng tới hiờ ̣u năng cao hơn da ̣ng con rắn . Dạng thứ ba đƣợc Cootes và cộng sự đề xuất sử dụng mụ hình mờ̀m dẻo tụ̉ng quát mới có tờn là con rắn thụng minh (smart snake) và PDM để cung cấp một phƣơng tiện hi ệu quả xỏc định mặt ngƣời . Mụ hình của Cootes và cộng sự dƣ̣a trờn tõ ̣p hợp các điờ̉m đƣợc gán nhãn chỉ cho phép biờ́n đụ̉i theo mụ ̣t vài hỡnh dạng dựa trờn quỏ trỡnh học.

a. Mụ hỡnh dạng con rắn (Snake)

Đƣợc sử dụng để xỏc định đƣ ờng bao của đầu . Đờ̉ thƣ̣c hiờ ̣n viờ ̣c này , mụ ̣t con rắn ban đõ̀u đƣơ ̣c khởi ta ̣o ta ̣i mụ ̣t vùng lõn cõ ̣n xung quanh vùng biờn đõ̀u . Sau đó co dõ̀n vờ̀ phía các đƣờng biờn và đƣa ra hình da ̣ng giả đi ̣nh của vùng đõ̀u . Sƣ̣ tiờ́n hoá của con rắn đƣơ ̣c thƣ̣c hiờ ̣n thụng qua viờ ̣c cƣ̣c tiờ̉u hoá mụ ̣t hàm năng lƣợng Esnake (tƣơng tƣ̣ với các hờ ̣ thụ́ng võ ̣t lý) và đƣợc biểu diễn nhƣ sau:

Esnake = Ebờn trong + Ebờn ngoài

Trong đó: Ebờn trong và Ebờn ngoài lõ̀n lƣợt là các hàm n ăng lƣợng bờn trong và bờn ngoài. Năng lƣợng bờn trong là phõ̀n năng lƣợng phu ̣ thuụ ̣c vào các thuụ ̣c tính bản chṍt của con rắn và ta ̣o nờn sƣ̣ tiờ́n hoá tƣ̣ nhiờn của đƣờng biờn đụ ̣ng . Cỏc tiến hoỏ tự nhiờn điờ̉n hình của con rắn là sƣ̣ co ngắn và sƣ̣ mở rụ ̣ng. Trong khi đó năng lƣợng bờn ngoài cú khuynh hƣớng chống lại năng lƣợng bờn trong và làm cho cỏc đƣờng biờn

34

Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

đụ ̣ng sai lờ ̣ch so với tiờ́n hoá tƣ̣ nhiờn thõ ̣m chí thƣ̀a nhõ ̣n hình da ̣ng của các đă ̣c tính gõ̀n nhṍt là hình da ̣ng vùng đõ̀u khi ở tra ̣ng thái cõn bằng.

Hai vṍn đờ̀ chính cõ̀n quan tõm trong viờ ̣c áp du ̣ng mụ hình con rắn là lƣ̣a cho ̣n cỏch tớnh năng lƣợng chớnh xỏc và kỹ thuật cực tiểu hoỏ năng lƣợng . Năng lƣợng

Elastic đƣợc sử dụng phổ biến nhƣ là năng lƣợng bờn trong . Khoảng cỏch giữa cỏc điờ̉m điờ̀u khiờ̉n trờn đƣờng biờn đụ ̣ng đƣợc cõn đụ́i và do đó đem la ̣i cho đƣờng biờn đă ̣c tính giụ́ng nhƣ sợi dõy cao su có thờ̉ co hoă ̣c dãn . Vṍn đờ̀ năng lƣợng bờn ngoài đƣơ ̣c xem xét dƣ̣a vào kiờ̉u da ̣ng của đă ̣c trƣng ảnh đƣợc xem xét . Gunn và Nixon làm cho năng lƣơ ̣ng này phản ƣ́ng với gradient của ảnh nờn các đƣờng biờn đụ ̣ng thƣờng hụ ̣i tu ̣ vờ̀ phía các vi ̣ trí biờn. Bờn ca ̣nh các thụng sụ́ vờ̀ gradient, mụ ̣t sụ́ cách tính năng lƣơ ̣ng bờn ngoài khác còn bao gụ̀m cả các hàm liờn quan đờ́n màu da trong đó hṍp dõ̃n cỏc con rắn về phớa cỏc vựng mặt . Viờ ̣c cƣ̣c tiờ̉u hoá năng lƣợng đƣợc thƣ̣c hiờ ̣n thụng qua các kỹ thuõ ̣t tụ́i ƣu hoá nhƣ phƣơng pháp giảm gradient dụ́c nhṍt . Do yờu cõ̀u tính toỏn cao của quỏ trỡnh cực tiểu hoỏ , Hoang và Chen , Lam và Yang đã đụ̀ng thời sƣ̉ dụng phƣơng phỏp lặp nhanh (thuõ ̣t toán tham ăn) để tăng tốc độ hội tụ.

Mă ̣c dự phƣơng phỏp con rắn một cỏch tổng quỏt cú thể xỏc định đƣợc cỏc đƣờng bao quanh các vùng đă ̣c trƣng nhƣng viờ ̣c triờ̉n khai phƣơng pháp võ̃n bi ̣ cản trở bởi hai vṍn đờ̀ . Cỏc phần của con rắn hay bị bẫy vào cỏc cỏc vựng đặc t rƣng ảnh khụng đúng. Hơn nƣ̃a, phƣơng pháp con rắn khụng thƣ̣c sƣ̣ hiờ ̣u quả trong xác đi ̣nh các đă ̣c trƣng khụng lụ̀i do xu hƣớng tiờ́n tới cƣ̣c tiờ̉u đụ ̣ cong của các con rắn . Gunn và Nixon giải quyết cỏc vấn đề này bằng một mụ hỡnh c on rắn đƣơ ̣c tham sụ́ hoá cho trích cho ̣n mă ̣t và đƣờng bao vùng đõ̀u. Mụ hình bao gụ̀m hai đƣờng biờn đụ ̣ng tích hợp với nhau, mụ ̣t đƣờng mở rụ ̣ng bờn trong mă ̣t và mụ ̣t đƣờng co nhỏ la ̣i bờn ngoài đƣờng bao vùng mă ̣t. Ban đõ̀u, sƣ̣ biờ́n đụ̉i của hai con rắn đƣợc điờ̀u khiờ̉n bởi mụ ̣t mụ hình tham sụ́ đă ̣t giƣ̃a chúng. Mụ hình tham sụ́ này hƣớng hai đƣờng vờ̀ hình da ̣ng đích và cho phép phõn biờ ̣t các vùng đă ̣c trƣng ảnh khụng dựng và do đú khụng bị bẫy bởi chỳng . Khi mụ ̣t đƣờng đa ̣t đƣợc đờ́n sƣ̣ cõn bằng , mụ hình bi ̣ loa ̣i bỏ và thay vào đó các đƣờng biờn đƣơ ̣c hoa ̣t đụ ̣ng đụ ̣c lõ ̣p nhƣ là các đƣờng biờn đụ ̣ng cơ bản tiờ́n tới trích cho ̣n đƣơ ̣c đƣờng bao cuụ́i cùng . Đƣờng bao cũn đƣợc sử dụn g trong dò tìm kính đeo mắt trong hờ ̣ thụ́ng của Saito và cộng sự.

b.Mụ hỡnh dạng biến đổi (Deformable templates)

35

Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Xỏc định đƣờng bao của một vựng đặc trƣng mặt khụng phải là một vấn đề dễ giải quyết bởi vỡ cỏc dấu hiệu cục bộ của cỏc đƣờng biờn mặt khú cú thể đƣợc tổ chức thành cỏc thực thể tổng thể nhận biết đƣợc thụng qua cỏc đƣờng biờn . Độ tƣơng phản thṍp vờ̀ đụ ̣ sáng xung quanh mụ ̣t sụ́ vùng đă ̣c trƣng ảnh cũng làm cho quá trình dò biờn khú thực hiờ ̣n. Yuille và cộng sự mở rụ ̣ng khái niờ ̣m con rắn thụng qua viờ ̣c kờ́t hợp cỏc thụng tin tổng thể về cặp mắt để nõng cao độ tin cậy của quỏ trỡnh trớch chọn đặc trƣng. Mụ ̣t mõ̃u có thờ̉ thay đụ̉i của mắt dƣ̣a trờn các đă ̣c trƣng n ổi bật của chỳng đƣợc tham sụ́ hoá sƣ̉ du ̣ng 11 tham sụ́. Hoạt động theo nguyờn tắc giống nhƣ cỏc con rắn , mụ ̣t mõ̃u nờ́u đƣợc khởi đõ̀u gõ̀n với đă ̣c trƣng mắt sẽ tƣ̣ biờ́n đụ̉i hƣớng tới đƣờng bao đă ̣c trƣng tụ́i ƣu . Cơ chờ́ biờ́n đụ̉i liờn quan đờ́n phƣơng pháp cƣ̣c tiờ̉u hoá giảm gradient dụ́c nhṍt của tụ̉ hợp năng lƣợng ngoài do các vùng trũng , đƣờng biờn, đỉnh và đụ ̣ sáng của ảnh (Ev, Ee, Ep, Ei) đƣợc tính theo cụng thƣ́c:

E = Ev + Ee + Ep + Ei + Ebờn trong

Tṍt cả cỏc biểu thức năng lƣợng trờn đƣợc biểu diễn bằng một tớch phõn sử dụng cỏc thuộc tớnh mẫu nhƣ diện tớch , đụ ̣ dài của đƣờng tròn và đƣờng parabol . Năng lƣơ ̣ng bờn trong đƣợc tính theo nhƣ các tham sụ́ mõ̃u nhƣ sau:

 2   2   2 3 2 1 2 2 bờn trong 1 2 1 1 2 2 e c 2 2 2 2 2 k k k k Exx  pr b   pr b   br         (7)

Cỏc đại lƣợng của biểu thức năng lƣợng nhƣ {k1, k2, k3Y} điờ̀u khiờ̉n diờ̃n biờ́n quỏ trỡnh và sự biến đổi của cỏc mẫu . Thay đụ̉i giá tri ̣ của các đa ̣i lƣợng này cho phép mụ ̣t chiờ́n lƣợc đụ́i sánh mới trong đó cỏc mẫu biến đổi và thể hiện xung quanh cỏc vựng đặc trƣng ảnh trong cỏc giai đoạn khỏc nhau . Yuille và cộng sự đã đờ̀ xuṍ t ra mụ ̣t đa ̣i lƣợng 6 mụ́c (trờn mụ ̣t lõ̀n lă ̣p) làm thay đổi chiến lƣợc cho cỏc mẫu mắt đƣợc khởi đõ̀u bờn dƣới vi ̣ trí că ̣p mắt . Cỏc kỹ thuật này đó đƣợc sử dụng nhƣ là một phần quan trọng trong hệ thống xỏc thực mặt dựa trờn tƣơng tỏc trực quan ngƣời - mỏy của Tistarelly và Grosso.

Cú một số vấn đề lớn trong cỏc ứng dụng sƣ̉ du ̣ng mõ̃u có thờ̉ thay đụ̉i . Do chiến lƣợc đối sỏnh mẫu là cố định , vị trớ khởi đầu của cỏc mẫu sẽ ảnh hƣởng nhiều đến quỏ trỡnh tiến hoỏ. Chẳng hạn, Yuillr và cộng sự đã chỉ ra rằng nờ́u mõ̃u đƣợc đă ̣t trờn mắt thỡ nú cú thể bị hấp dẫn đ ến lụng mày thay vỡ cặp mắt . Thời gian xƣ̉ lý cũng sẽ rṍt lớn quỏ trỡnh thực hiện tuần tự hoỏ của quỏ trỡnh cực tiểu hoỏ . Cỏc trọng số của biểu thức

36

Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

năng lƣơ ̣ng là heuristic và rṍt khó tụ̉ng quát hoá . Cỏc nghiờn cứu tro ng lĩnh vƣ̣c này hiờ ̣n ta ̣i đang tõ ̣p trung chủ yờ́u vào các vṍn đờ̀ nhƣ giảm thời gian thƣ̣c hiờ ̣n , thay đụ̉i cỏc mẫu và biểu thức của năng lƣợng . Shackleton và Welsh nõng cao đụ ̣ chính xác của đụ́i sánh mõ̃u mắt bằng cách thờm các tham sụ́ bụ̉ sung và và sƣ̉ du ̣ng biờ̉u thƣ́c năng lƣơ ̣ng bờn ngoài nha ̣y với vùng trắng của mắt đã đƣợc cải thiờ ̣n . Tỷ lờ ̣ khớp mõ̃u 86% đƣơ ̣c báo cáo trờn thí nghiờ ̣m với tõ ̣p 64 ảnh. Thời gian xƣ̉ lý kéo dài đƣợc giảm đi bằng cá ch sƣ̉ du ̣ng mụ ̣t phiờn bản đơn giản của mõ̃u đa ̣t đƣợc qua viờ ̣c loa ̣i bỏ các tham sụ́ ít ảnh hƣởng đờ́n các hình da ̣ng mõ̃u tụ̉ng thờ̉ . Chow và cộng sự sƣ̉ du ̣ng tiờ́p cõ ̣n hai bƣớc đờ̉ trích cho ̣n că ̣p mắt . Phộp biến đổi Hough vũng đƣ ợc thực hiện để xỏc đi ̣nh mụ́ng mắt trƣớc khi đụ́i sánh với mụ ̣t mõ̃u mắt đơn giản hoá chỉ có mụ hình cṍu trỳc mắt dạng parabol . Viờ ̣c đơn giản hoá làm tăng thời gian cha ̣y nhanh gṍp 16 lõ̀n so sỏnh với cỏc mẫu của Yuille và cộ ng sự. Trong mụ ̣t phát triờ̉n gõ̀n đõy , Lam và Yan đã sƣ̉ du ̣ng các thụng tin vờ̀ góc mắt đờ̉ đánh giá các tham sụ́ khởi đõ̀u của mụ hình mõ̃u mắt. Sƣ̣ gia tăng vờ̀ thụng tin làm cho phép sƣ̣ đụ́i sánh mõ̃u sẽ chính xác , tin cõ ̣y hơn. Thời gian để mẫu đạt đƣợc vị trớ tối ƣu cũng đó đƣợc giảm đến 40% (so sánh với mõ̃u ban đõ̀u ). Bờn ca ̣nh các mõ̃u mắt , cỏc mẫu miệng cũng đƣợc sử dụng với cựng một chiờ́n lƣơ ̣c.

c. Mụ hỡnh phõn phối điểm (Point Distributed Models)

Là mụ ̣t mụ tả tham sụ́ hoá tụ́i ƣu của hình da ̣ng dƣ̣a trờn thụ́ng kờ . Kiờ́n trúc và quỏ trỡnh so khớp cả PDM khỏc với của cỏc mụ hỡnh hỡnh dạng động khỏc . Cỏc đƣờng biờn đụ ̣ng của PDM đƣợc rời ra ̣c hoá thành các tõ ̣p điờ̉m đƣợc đ ỏnh nhón. Sƣ̣ biờ́n đụ̉i của cỏc tập điểm này trƣớc hết đƣợc tham số hoỏ thụng qua cỏc tập mẫu học chứa cỏc đụ́i tƣơ ̣ng có hình da ̣ng và tƣ thờ́ khác nhau . Sƣ̉ du ̣ng phƣơng pháp phõn tích thành phõ̀n chính (PCA), sƣ̣ biờ́n đụ̉i củ a các đă ̣c trƣng trong tõ ̣p mõ̃u ho ̣c đƣợc xõy dƣ̣ng thành một mụ hỡnh linh động tuyến tớnh . Mụ hình đƣợc cṍu thành tƣ̀ trung bình của tṍt cả cỏc đặc trƣng trong tập hợp và mụ hỡnh cơ bản của sự biến đổi từng điểm ảnh :

x x Pv (8)

Trong đó : x biờ̉u diờ̃n mụ̣t điờ̉m trong PDM và x là đặc tớnh trung bỡnh trong tập mõ̃u đụ́i với điờ̉m đó , P = [p1p2…pt] là ma trận chứa t vectơ biờ́n đụ̉i quan trọng nhṍt của ma trận hiờ ̣p biờ́n, v là vectơ trọng số.

37

Số hoỏ bởi Trung tõm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

Mụ hình PDM cho mă ̣t đƣợc phát triờ̉n đõ̀u tiờn bởi Lanitis và cộng sự nhƣ là mụ ̣t mụ hình linh đụ ̣ng. Mụ hình minh hoa ̣ dáng vẻ tụ̉ng thờ̉ của mă ̣t bao gụ̀m các đă ̣c tính mă ̣t nhƣ lụng mày , mũi và mắt . Sử dụng 152 điờ̉m điờ̀u khiờ̉n đƣợc cho ̣n bằng tay và 160 ảnh mặt mẫu , mụ̣t mụ hình PDM đƣợc xõy dƣ̣ng . Chỉ sử dụng 16 trọng số, mụ hỡnh cú thể xấp xỉ đƣợc 95% cỏc hỡnh dạng mặt trong tập mẫu . Đờ̉ so khớp mụ ̣t mụ hỡnh PDM với m ột mặt, mụ hình hình da ̣ng trung bình (với điờ̉m đánh nhãn = x) đõ̀u tiờn đƣơ ̣c đă ̣t gõ̀n mă ̣t . Sau đó các chiờ́n lƣợc tìm kiờ́m trờn mƣ́c xám cu ̣c bụ ̣ đƣợc sƣ̉ dụng để đƣa từng điểm hƣớng đến điểm tƣơng ứng t huụ ̣c đƣờng bao . Trong suụ́t quá trỡnh biến đổi này , hỡnh dạng chỉ đƣợc phộp thay đổi theo một cỏch phự hợp với cỏc thụng tin đã đƣợc mụ hình hoá trong tõ ̣p mõ̃u.

Lơ ̣i điờ̉m của viờ ̣c sƣ̉ du ̣ng mụ hình mă ̣t PDM là các mụ tả đƣợc tham sụ́ hoá tụ́i ƣu. Mụ hình PDM đã đƣợc cài đă ̣t nhƣ là biờ̉u diờ̃n tụ̉ng quát trong mụ ̣t sụ́ ƣ́ng du ̣ng xƣ̉ lý mă ̣t và các đă ̣c trƣng mă ̣t. Lanitis và cộng sự trong các bƣớc tiờ́p theo đã tích hợp thuõ ̣t toán di truyờ̀n (GA) và cỏc ti ếp cận đa phõn giải để giải quyết vấn đề tồn tại nhiờ̀u vùng khả năng là mă ̣t . Đặc tớnh tổng thể của mụ hỡnh cũng cho phộp tất cả cỏc đă ̣c trƣng đƣợc xác đi ̣nh song song với nhau và do đó lƣợc bớt đƣợc yờu cõ̀u phải tìm kiếm cỏc đặc trƣng . Hơn nƣ̃a, sƣ̣ thiờ́u vắng mụ ̣t đă ̣c trƣng nào đó khụng trở thành vṍn đề nghiờm trọng khi mà đến cỏc đặc trƣng khỏc trong mụ hỡnh vẫn cú thể đạt tới một giải phỏp tối ƣu toàn thể.

Một phần của tài liệu (LUẬN văn THẠC sĩ) phát hiện và nhận dạng khuôn mặt từ camera, ứng dụng trong điểm danh (Trang 33 - 37)

Tải bản đầy đủ (PDF)

(65 trang)