Các hệ thống camera sẽ xác định đâu là con người và theo dõi xem con người đó cólàm gì phạm pháp không, ví dụ như lấy trộm đồ, xâm nhập bất hợp pháp vào một khuvực nào đó.Lưu trữ khuôn m
Trang 1Giảng viên hướng dẫn: PGS TSKH Hoàng Đăng Hải
Nhóm học viên: Ngô Thanh Bình
Đào Thị Lan Hương Dương Toàn Trung
Lớp: M11CQDT01-B
Hà Nội 6/2012
Trang 2MỤC LỤC
MỤC LỤC 1
DANH MỤC HÌNH VẼ 2
LỜI NÓI ĐẦU 3
CHƯƠNG I: TỔNG QUAN VỀ NHẬN DẠNG KHUÔN MẶT 4
1.1 Bài toán nhận diện khuôn mặt 4
1.2 Những khó khăn và thách thức trong bài toán nhận diện khuôn mặt 4
1.3 Các ứng dụng của bài toán nhận diện khuôn mặt 5
CHƯƠNG II: CÁC PHƯƠNG PHÁP NHẬN DIỆN KHUÔN MẶT 7
2.1 Phương pháp dựa trên tri thức 7
2.1.1 Phương pháp của Yang và Huang 7
2.1.2 Phương pháp của Kotropoulos và Pitas 8
2.2 Phương pháp dựa trên đặc trưng bất biến 9
2.2.1 Các đặc trưng của khuôn mặt 10
2.2.2 Kết cấu của khuôn mặt 11
2.2.3 Mầu sắc da 11
2.2.4 Đa đặc trưng 11
2.3 Phương pháp so sánh khớp mẫu 12
2.4 Phương pháp dựa trên diện mạo 14
CHƯƠNG III: GIẢI THUẬT ADABOOST 16
3.1 Tiếp cận Boosting 16
3.2 Thuật toán Adaboost 17
3.2.1 Đặc trưng Haar-like 19
3.2.2 Mô hình Cascade 23
3.2.3 Mô hình Boost Cascade 24
CHƯƠNG IV: NHẬN DIỆN KHUÔN MẶT SỬ DỤNG OPENCV 25
4.1 Sơ lược về OpenCV 25
4.2 Kết quả mô phỏng 25
KẾT LUẬN 29
Trang 3DANH MỤC HÌNH VẼ
Hình 1.1: Nhận dạng mặt người 4
Hình 2.1: Các ảnh với độ phân giải khác nhau 7
Hình 2.2: Một tri thức về khuôn mặt 8
Hình 2.3: Minh họa giải thuật chiếu 9
Hình 2.4: Mẫu khuôn mặt có kích thước 14 * 16 pixel trong định vị khuôn mặt của Sinha 13
Hình 3.1: Boosting 16
Hình 3.2: Bộ phân loại mạnh H(x) xây dựng bằng Adaboost 18
Hình 3.3: 4 đặt trưng Haar-like cơ bản 20
Hình 3.4: Các đặc trưng mở rộng của các đặc trưng Haar-like cơ sở 21
Hình 3.5: Minh họa đặc trưng Haar-like 21
Hình 3.6: Cách tính Integral Image của ảnh 22
Hình 3.7: Ví dụ cách tính nhanh tổng các điểm ảnh của vùng D trên ảnh 22
Hình 3.8: Cách tính nhanh tổng điểm ảnh của vùng D trên ảnh với các đặc trưng xoay 45o 22
Hình 3.9: Mô hình Cascade 23
Hình 4.1: Cấu trúc cơ bản của OpenCV 25
Trang 4LỜI NÓI ĐẦU
Nhận dạng hay nhận biết một đối tượng thông qua các giác quan của con người đặcbiệt là thị giác là một đặc điểm hết sức quan trọng Nó giúp chúng ta phân biệt được các
sự vật hiện tượng và cảm nhận được thế giới thiên nhiên cũng như mọi người xungquanh
Ngày nay với sự phát triển của khoa học công nghệ, vấn đề nhận dạng đang đượcđặc biệt quan tâm và phát triển nhất là trong lĩnh vực rô bốt, tự động hóa, bảo mật Conngười ngày càng mong ước tạo ra được một hệ thống nhận dạng có khả năng tươngđương hoặc thậm chí là vượt hơn hệ thống nhận dạng sinh học
Nhận dạng khuôn mặt người là một trong những vấn đề được khoa học thế giớinghiên cứu và phát triển, nó có rất nhiều ứng dụng trong thực tế cuộc sống cũng nhưtrong khoa học công nghệ Vì vậy trong tiểu luận này chúng em xin được nghiên cứu vềvấn đề nhận dạng khuôn mặt
Trang 5CHƯƠNG I: TỔNG QUAN VỀ NHẬN DẠNG KHUÔN MẶT
1.1 Bài toán nhận diện khuôn mặt
Ngày nay cùng với sự bùng nổ thông tin, sự phát triển công nghệ cao, sự giao tiếpgiữa con người và máy tính đang thay đổi rất nhanh, giờ đây giao tiếp này không còn đơnthuần dùng những thiết bị cơ học như chuột, bàn phím… mà có thể thông qua các biểuhiện của khuôn mặt Bên cạnh đó, công nghệ càng phát triển thì giá cả ngày càng giảm,thêm vào đó tốc độ xử lý của máy tính ngày càng cao, do đó hệ thống xử lí khuôn mặtđang được phát triển rất nhiều
Hình 1.1: Nhận dạng mặt người
Trong số đó, có thể nói đến hệ thống phát hiện khuôn mặt, hệ thống này có thể giúpmáy tính và con người giao tiếp với nhau tốt hơn Những nghiên cứu trong hệ thống nàychủ yếu dựa trên những thông tin trong ảnh để phát hiện vị trí khuôn mặt, làm bước đệmcho các ứng dụng tiếp theo Rất nhiều nghiên cứu và ứng dụng được phát triển dựa trên
hệ thống này Đó là nhiệm vụ đầu tiên của bất kì hệ thống xử lý khuôn mặt nào Tuynhiên, đây cũng là một thử thách rất lớn bởi phát hiện được khuôn mặt còn dựa vào nhiềuyếu tố như tỉ lệ, vị trí, hướng nhìn (từ trên xuống, quay,…), kiểu chụp (chụp đối diện,chụp ngang,…) Ngoài ra, những cảm xúc của khuôn mặt, một số phần bị che, hoặchướng ánh sáng cũng ảnh hưởng đến bài toán phát hiện khuôn mặt
Trang 61.2 Những khó khăn và thách thức trong bài toán nhận diện khuôn mặt
Bài toán nhận dạng mặt người đã được nghiên cứu từ những năm 70, người đầutiên là Kanade Tuy nhiên, đây là một bài toán khó nên những nghiên cứu hiện tại vẫnchưa đạt được kết quả mong muốn Có thể kể đến những khó khăn của bài toán nhậndạng mặt người như dưới đây:
Tư thế, góc chụp: Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì góc chụp
giữa camera và khuôn mặt Chẳng hạn như: chụp thẳng, chụp chéo bên trái 45ohay chéo bên phải 45o, chụp từ trên xuống, chụp từ dưới lên ) Với các tư thếkhác nhau, các thành phần trên khuôn mặt như mắt, mũi, miệng có thể bị khuấtmột phần hoặc thậm chí khuất hết
Sự xuất hiện hoặc thiếu một số thành phần của khuôn mặt: Các đặc trưng như: râu
mép, râu hàm, mắt kính có thể xuất hiện hoặc không Vấn đề này làm cho bàitoán càng trở nên khó hơn rất nhiều
Cảm xúc biểu hiện trên khuôn mặt: Cảm xúc có thể làm ảnh hưởng đáng kể lên
các thông số của khuôn mặt Chẳng hạn, cùng một khuôn mặt một người, nhưng
có thể sẽ rất khác khi họ cười hoặc sợ hãi…
Sự che khuất: Khuôn mặt có thể bị che khuất bởi các đối tượng khác hoặc các
khuôn mặt khác
Hướng của ảnh: Các ảnh của khuôn mặt có thể biến đổi rất nhiều với các góc quay
khác nhau của trục camera Chẳng hạn chụp với trục máy ảnh nghiêng làm chokhuôn mặt bị nghiêng so với trục của ảnh
Điều kiện của ảnh: Ảnh được chụp trong các điều kiện khác nhau về: chiếu sáng,
về tính chất camera (máy kỹ thuật số, máy hồng ngoại ) ảnh hưởng rất nhiều đếnchất lượng ảnh khuôn mặt
1.3 Các ứng dụng của bài toán nhận diện khuôn mặt
Ứng dụng của bài toán nhận diện khuôn mặt có rất nhiều và đã được triển khaitương đối hiệu quả trong thực tế Có thể kể đến một số ứng dụng điển hình sau đây:
Xác minh tội phạm
Dựa vào ảnh của một người, nhận dạng xem người đấy có phải là tội phạm haykhông bằng cách so sách với các ảnh tội phạm đang được lưu trữ Hoặc có thể sử dụngcamera để phát hiện tội phạm trong đám đông Ứng dụng này giúp cơ quan an ninh quản
lý con người tốt hơn
Camera chống trộm
Trang 7Các hệ thống camera sẽ xác định đâu là con người và theo dõi xem con người đó cólàm gì phạm pháp không, ví dụ như lấy trộm đồ, xâm nhập bất hợp pháp vào một khuvực nào đó.
Lưu trữ khuôn mặt
Xác định mặt người có thể được ứng dụng trong các trạm rút tiền tự động (ATM)
để lưu trữ khuôn mặt của người rút tiền Hiện nay có những người bị người khác lấy trộmthẻ ATM và mã PIN, và bị rút tiền trộm, hoặc có những chủ tài khoản đi rút tiền nhưnglại báo với ngân hàng là bị mất thẻ và bị rút tiền trộm Nếu lưu trữ được khuôn mặt củangười rút tiền, ngân hàng có thể đối chứng và xử lý dễ dàng hơn
Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt ngườitrên nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyền hình, …
Ví dụ: tìm các đoạn video có tổng thống Bush phát biểu, tìm các phim có diễnviên Lý Liên Kiệt đóng, tìm các trận đá bóng có Ronaldo đá, …
Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ trợthông báo khi cần thiết
Tương lai sẽ phát triển các loại thẻ thông minh có tích hợp sẵn đặc trưng củangười dùng trên đó, khi bất cứ người dùng khác dùng để truy cập hay xử lý tại các
hệ thống sẽ được yêu cầu kiểm tra các đặc trưng khuôn mặt so với thẻ để biết nay
có phải là chủ thẻ hay không
Hãng máy chụp hình Canon đã ứng dụng bài toán xác định khuôn mặt người vàomáy chụp hình thế hệ mới để cho kết quả hình ảnh đẹp hơn, nhất là khuôn mặt
Trang 9CHƯƠNG II: CÁC PHƯƠNG PHÁP NHẬN DIỆN KHUÔN MẶT
2.1 Phương pháp dựa trên tri thức
Trong hướng tiếp cận này, phương pháp phát hiện khuôn mặt dựa trên các quy tắcrút ra từ những tri thức về khuôn mặt được các nhà khoa học nêu ra Dễ dàng để có đượcluật đơn giản để thể hiện các đặc trưng mặt người và mối quan hệ của chúng Chẳng hạn,một khuôn mặt thường có 2 mắt đối xứng nhau, 1 mũi, và 1 miệng Quan hệ giữa chúngthể hiện qua quan hệ khoảng cách hay vị trí Thường thì các đặc trưng khuôn mặt của ảnhđầu vào được trích chọn trước để đưa ra các ứng viên, tiếp đó là dùng tập luật trên đây đểloại bỏ tiếp các ứng viên không phải khuôn mặt Thông thường có một giai đoạn kiểm tralại kết quả các ứng viên khuôn mặt đó để tăng độ chính xác của hệ thống
Tuy nhiên, hướng tiếp cận này gặp một khó khăn đó là việc chuyển từ tri thức vềmặt người thành tập luật xác định tốt cho nhiều trường hợp Tập luật quá chi tiết sẽ rất dễdẫn đến bỏ sót các khuôn mặt thật, ngược lại nếu tập luật sơ sài sẽ dẫn đến kết quả có rấtnhiều khuôn mặt mà trong số đó có cả các ứng viên không phải khuôn mặt Thêm vào đóhướng tiếp cận này là khá khó khăn khi mở rộng bài toán trong các trường hợp tư thếchụp khác nhau vì tư thế chụp có thể dẫn đến luật trên đây áp dụng không đúng nữa.Theo hướng tiếp cận này, chúng ta sẽ xem xét 2 nghiên cứu sau đây:
2.1.1 Phương pháp của Yang và Huang
Hai nhà khoa học Yang và Huang đã dùng phương pháp có thứ tự theo hướng tiếpcận này để phát hiện khuôn mặt Hệ thống của hai ông bao gồm 3 tầng luật:
Tầng đầu tiên: Tìm ra các ứng viên bằng cách quét 1 cửa sổ khắp ảnh đầu vào, các
ứng viên phải thỏa mãn tập luật tầng này
Tầng giữa: Sử dụng các tập luật mô tả chung về khuôn mặt.
Tầng cuối cùng: Dùng các tập luật xem xét một cách chi tiết các đặc trưng khuôn
mặt
Một hệ thống ảnh đa phân giải được xây dựng theo các mẫu con với độ xám của cảmẫu đó được thay bằng mức xám trung bình của mẫu Ví dụ như dưới đây
Trang 10Hình 2.1: Các ảnh với độ phân giải khác nhau
các mẫu mới được mã hóa theo quy tắc n*n pixels có giá trị trung bình của các pixelstrong mẫu Trái qua phải n=1,4,9,16
Tầng giữa: Dùng biểu đồ historgram để xem xét tiếp các ứng viên trên đây, đồngthời tìm ra đường cạnh bao ứng viên
Tầng cuối cùng: Dùng các tập luật của tầng này xem xét đặc trưng khuôn mặt cácứng viên qua được tầng giữa Ví dụ đặc trưng về mắt, miệng …
Nhận xét: phương pháp này khá đơn giản, dễ thực hiện, tuy nhiên , kết quả lại chưa cao.
Song các ý tưởng của phương pháp đã làm nền tảng cho các nghiên cứu sau này như ýtưởng sử dụng ảnh đa phân giải hay các tri thức về khuôn mặt đã dùng
2.1.2 Phương pháp của Kotropoulos và Pitas
Hai ông khá thành công trong việc định vị vùng chứa khuôn mặt bằng phương phápchiếu Ta xem xét phương pháp này với ảnh đa mức xám Cơ sở của phương pháp có thểhiểu như sau:
Giả thiết I(x,y) là độ xám tại vị trí tọa độ (x,y) của ảnh kích thước m*n
Định nghĩa
Trang 11- HI(x)= : đặc trưng xám ngang
- VI(y)= : đặc trưng xám dọc
Với nhận xét mức xám vùng da mặt chỉ nằm trong 1 khoảng nhất định, từ đó dựatrên sự thay đổi của đường cong HI(x), tìm ra 2 cực trị địa phương tương ứng vớihai bên của phần đầu người Tương tự với sự thay đổi của VI(y), tìm ra các cực trịđịa phương tương ứng với vùng đôi mắt, đôi môi và đỉnh mũi Các đặc trưng này
đủ để phát hiện được các ứng viên khuôn mặt
Xem ví dụ dưới đây cho giải thuật này Hình 2.3a minh họa cho cách xác định biêncủa khuôn mặt ứng với các cực trị địa phương như đã nêu trên đây Sau đó dùng vài luậtđơn giản để kiểm tra lại ví như việc tồn tại của lông mày/ mắt, lỗ mũi/ mũi hay cái miệng
… Tuy nhiên ở hai hình bên 2.3b và 2.3c việc xác định các cực trị địa phương như đã nêu
là rất khó khăn do sự thay đổi của các đường cong HI(x) và VI(y) phụ thuộc vào nhiềuyếu tố Trường hợp hình 2.3b là ảnh với nền phức tạp, trường hợp hình 2.3c là ảnh với sự
có mặt của nhiều khuôn mặt trong ảnh
Hình 2.3: Minh họa giải thuật chiếu
Phương pháp được đưa ra kiểm tra trên một tập khuôn mặt trong trong video gồm
37 người khác nhau Mỗi ảnh chỉ chứa 1 khuôn mặt trên 1 nền không đổi Phương phápcủa họ tìm ra được đúng các ứng viên khuôn mặt Tỷ lệ phát hiện đúng là 86.5% và định
vị đúng các đặc trưng của khuôn mặt như mắt, mũi, môi …
Nhận xét: phương pháp của Kotropoulos Pitas khá đơn giản, dễ thực hiện, tuy nhiên,
phương pháp này lại chỉ cho hiệu quả cao với các ảnh có một khuôn mặt, tư thế chụpthẳng và nền ảnh không quá phức tạp Sau này, phương pháp này đã được cải tiến, kếthợp với ý tưởng đa phân giải, hay tiền xử lí sáng tạo trước khi chiếu
Trang 122.2 Phương pháp dựa trên đặc trưng bất biến
Tiếp cận dựa trên các đặc trưng không thay đổi là tiếp cận theo kiểu bottom up.Dựa trên thực tế, chúng ta cố gắng tìm ra những đặc điểm không thay đổi khi của khuônmặt khi ở các tư thế khác nhau và các điều kiện môi trường như ánh sáng khác nhau Đã
có rất nhiều nghiên cứu về hướng tiếp cận này, các đặc điểm không thay đổi được tìmthấy như lông mày, mắt, mũi, miệng hay các đường viền trên tóc … Trên cơ sở các đặctrưng này, các nhà nghiên cứu xây dựng lên một mô hình thống kê mô tả quan hệ của cácđặc trưng và từ đó xác định sự xuất hiện của khuôn mặt trong bức ảnh Khó khăn củahướng tiếp cận này đó là phải mô tả các đặc trưng không thay đổi và quan hệ giữa chúngphù hợp với điều kiện ánh sáng, độ nhiễu hay bị che khuất
2.2.1 Các đặc trưng của khuôn mặt
Có rất nhiều nghiên cứu về các đặc trưng của khuôn mặt Có thể dựa vào các đặctrưng như hai mắt, hai lỗ mũi, miệng, phần nối giữa mũi và miệng … hoặc dựa vàođường viền của khuôn mặt
Leung đã đưa ra một mô hình xác xuất để xác định khuôn mặt trong ảnh có hìnhnền phức tạp dựa trên việc tìm kiếm các đặc trưng không thay đổi của khuôn mặt trongảnh, sau đó dùng đồ thị ngẫu nhiên để xác định khuôn mặt Tư tưởng của phương phápnày đó là xem bài toán xác định khuôn mặt như là bài toán tìm kiếm với mục tiêu là tìmthứ tự các đặc trưng không thay đổi của khuôn mặt Dùng năm đặc trưng (hai mắt, hai lỗmũi, phần nối giữa mũi và miệng) để mô tả một khuôn mặt Đồng thời tính quan hệkhoảng cách cho tất cả các cặp đặc trưng (như mắt trái, mắt phải), sau đấy dùng phân bốGauss để mô hình hóa Một mẫu khuôn mặt được đưa ra thông qua trung bình tương ứngcho một tập đa hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss Từ một ảnh, các đặc trưng củaứng viên được xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng với vectormẫu Hai ứng viên có đặc trưng đứng đầu sẽ được chọn để tìm kiếm cho các đặc trưngkhác của khuôn mặt Từ các đặc trưng không thay đổi, các đặc trưng khác sẽ được xácđịnh thông qua sự đánh giá xác xuất khoảng cách giữa các đặc trưng, hơn nữa phương saicủa phép thống kê này có thể được tính toán trước để xác định các đặc trưng với xác xuấtlớn Tỷ lệ chính xác của phương pháp này là 86%
Bên cạnh tính khoảng cách liên quan để mô tả quan hệ giữa các đặc trưng nhưLeung Kendall, Mardia and Dryden dùng lý thuyết xác suất thống kê về hình dáng.Dùng hàm mật độ xác suất (Probility Density Function - PDF) qua N điểm đặc trưng,tương ứng (xi, yi) là đặc trưng thứ i với giả sử là phân bố Gauss có 2N-chiều Các tác giả
áp dụng phương thức cực đại khả năng (Maximum-Likelihood - ML) để xác định vị trí
Trang 13khuôn mặt Một thuận lợi của phương pháp này là các khuôn mặt bị che khuất vẫn có thểxác định được Hạn chế phương pháp này đó là không xác định được nhiều khuôn mặttrong cùng một ảnh.
Không dùng phương pháp xác xuất, Sirohey đưa một phương pháp khác xác địnhkhuôn mặt từ một ảnh có hình nền phức tạp Phương pháp dựa trên cạnh Dùng phươngpháp Candy và heuristics loại bỏ các cạnh để còn lại duy nhất một đường bao xungquanh khuôn mặt Một hình ellipse dùng để bao khuôn mặt, tách biệt vùng đầu và hìnhnền Tỷ lệ chính xác của thuật toán là 80%
Graf đưa ra một phương pháp xác định đặc trưng rồi xác định khuôn mặt trong ảnhxám Dùng bộ lọc để làm nổi các biên, các phép toán hình thái học (morphology) đượcdùng để làm nổi bật các vùng có cường độ cao và hình dáng chắc chắn (như mắt) Thôngqua histogram để tìm các đỉnh nổi bật để xác định các ngưỡng chuyển ảnh xám thành haiảnh nhị phân Các thành phần dính nhau đều xuất hiện trong hai ảnh nhị phân thì đượcxem là vùng của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặt không.Phương pháp được kiểm tra trên các ảnh chỉ có đầu và vai của người Tuy nhiên phươngpháp này còn một vấn đề đấy là sử dụng các phép toán morphology như thế nào và làmsao xác định khuôn mặt trên các vùng ứng viên
Park dùng Gaze để tìm ứng viên góc mắt, miệng và tâm mắt Ông xây dựng SVM(Support Vector Machine) đã được học trước đó để xác định các vị trí ứng viên có phải làgóc mắt, miệng, và tâm mắt hay không để theo vết con mắt người
Juan và Narciso xây dựng một không gian màu mới YCg’Cr’ để lọc các vùng làứng viên khuôn mặt dựa trên sắc thái của màu da người Sau khi có ứng viên, hai ôngdùng các quan hệ về hình dáng khuôn mặt, mức độ cân đối của các thành phần khuônmặt để xác định khuôn mặt người Tương tự, Chang và Hwang cũng dùng không gianmầu Ycg’Cr’ với tỷ lệ chính xác hơn 80% trong ảnh xám
Jin xây dựng một bộ lọc để xác định ứng viên khuôn mặt người theo màu da người
Từ ứng viên này tác giả xác định khuôn mặt người theo hình dáng khuôn mặt và cácquan hệ đặc trưng về thành phần khuôn mặt, với mắt phải được chọn làm gốc tọa độ đểxét quan hệ Tỷ lệ chính xác cho khuôn mặt chụp thẳng trên 80%
2.2.2 Kết cấu của khuôn mặt
Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng để phân loại sovới các đối tượng khác Từ kết cấu của khuôn mặt xây dựng lên một bộ phân loại, gọi làkết cấu giống khuôn mặt (face-like texture)
Trang 142.2.3 Mầu sắc da
Thông thường các ảnh màu không xác định trực tiếp trên toàn bộ dữ liệu ảnh màcác tác giả dùng tính chất sắc màu của da người (khuôn mặt người) để chọn ra được cácứng viên có thể là khuôn mặt người (lúc này dữ liệu đã thu hẹp đáng kể) để xác địnhkhuôn mặt người
2.2.4 Đa đặc trưng
Gần đây có nhiều nghiên cứu sử dụng các đặc trưng toàn cục như: màu da người,kích thước và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó sẽ xác định ứng viênnào là khuôn mặt thông qua dùng các đặc trưng cục bộ (chi tiết) như: mắt, lông mày,mũi, miệng, và tóc Tùy mỗi tác giả sẽ sử dụng tập đặc trưng khác nhau
2.3 Phương pháp so sánh khớp mẫu
Sakai đã cố gắng thử xác định khuôn mặt người chụp thẳng trong ảnh Ông dùngvài mẫu con (sub template) về mắt, mũi, miệng, và đường viền khuôn mặt để mô hìnhhóa một khuôn mặt Mỗi mẫu con được định nghĩa trong giới hạn của các đoạn thẳng.Các đường thẳng trong ảnh được trích bằng cách xem xét thay đổi của hệ số góc và sokhớp các mẫu con Đầu tiên tìm các ứng viên thông qua mối tương quan giữa các ảnhcon và các mẫu về đường viền Sau đó, so khớp với các mẫu con khác Hay nói một cáchkhác, giai đoạn đầu xem như là giai đoạn sơ chế để tìm ứng viên, giai đọan thứ hai là giaiđoạn tinh chế để xác định ứng viên có phải là khuôn mặt hay không Ý tưởng này đượcduy trì cho đến các nghiên cứu sau này
Craw đưa ra một phương pháp xác định khuôn mặt người dựa vào các mẫu về hìnhdáng của các ảnh được chụp thẳng (dùng vẻ bề ngoài của hình dáng khuôn mặt) Đầutiên dùng phép lọc Sobel (Phép lọc Sobel dựa vào tích vô hướng của hai vector gradient)
để tìm các cạnh Các cạnh này sẽ được nhóm lại theo một số ràng buộc Sau đó, tìmđường viền của đầu, quá trình tương tự được lặp đi lặp lại với mỗi tỷ lệ khác nhau để xácđịnh các đặc trưng khác như: mắt, lông mày, và môi Sau đó Craw mô tả một phươngthức xác định dùng một tập có 40 mẫu để tìm các đặc trưng khuôn mặt và điều khiểnchiến lược dò tìm
Một số nhà nghiên cứu sử dụng hình chiếu như các mẫu để xác định khuôn mặtngười Silhouettes dùng PCA (phân tích thành phần chính – Principal ComponentAnalysis - PCA) để có một tập hình chiếu cơ bản từ các mẫu khuôn mặt, hình chiếu được
mô tả như một mảng các bit Dùng đặc trưng hình chiếu riêng kết hợp biến đổi Hough đểxác định khuôn mặt người Sau đó một phương pháp xác định dựa trên đa loại mẫu để
Trang 15xác định các thành phần của khuôn mặt được trình bày Phương pháp này định nghĩa một
số giả thuyết để mô tả các khả năng của các đặc trưng khuôn mặt Với một khuôn mặt sẽ
có một tập giả thuyết, lý thuyết DepsterShafer Dùng một nhân tố tin cậy để kiểm tra sựtồn tại hay không của các đặc trưng của khuôn mặt, và kết hợp nhân tố tin cậy này vớimột độ đo để xem xét có hay không có khuôn mặt trong ảnh
Sinha dùng một tập nhỏ các ảnh bất biến trong không gian ảnh để mô tả không giancác mẫu ảnh Tư tưởng chính của ông dựa vào sự thay đổi mức độ sáng của các vùngkhác nhau của khuôn mặt (như hai mắt, hai má, và trán), (quan hệ về mức độ sáng củacác vùng còn lại thay đổi không đáng kể) Sau đấy xác định các cặp tỷ số của mức độsáng của một số vùng (một vùng tối hơn hay sáng hơn) cho ta một lượng bất biến kháhiệu quả Ông lưu sự thay đổi độ sáng của các vùng trên khuôn mặt trong một tập thíchhợp với các cặp quan hệ sáng hơn – tối hơn giữa các vùng nhỏ Một khuôn mặt được xácđịnh nếu nó thỏa mãn tất cả các cặp sáng hơn – tối hơn Ý tưởng này xuất phát từ sự khácbiệt của cường độ giữa các vùng kề cục bộ trên ảnh, sau này nó được mở rộng trên cơ sởbiến đổi wavelet để xác định người đi bộ, xác định xe hơi, xác định khuôn mặt Ý tưởngcủa Sinha còn được áp dụng trong các nghiên cứu về thị giác của robot Hình 2.4 chothấy mẫu khuôn mặt với 16 vùng và 23 quan hệ Các quan hệ này được dùng để phânloại, có 11 quan hệ thiết yếu (các mũi tên màu đen) và 12 quan hệ xác thực (các mũi tênmầu xám) Mỗi mũi tên là một quan hệ Một quan hệ của hai vùng thỏa mãn mẫu khuônmặt khi tỷ lệ giữa hai vùng vượt qua một ngưỡng và một khuôn mặt được xác định khi có
23 quan hệ thỏa mãn điều kiện trên
Hình 2.4: Một mẫu khuôn mặt có kích thước 14 * 16 pixel trong phương pháp định vị khuôn mặt
của Sinha Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ.
Một số phương pháp khác như của Froba và Zink lọc cạnh ở độ phân giải thấp rồi
Trang 16ở dạng chụp hình thẳng ở dạng xám Tỷ lệ chính xác trên 91% Ngoài ra Shu và Jain cònxây dựng ngữ nghĩa khuôn mặt Ngữ nghĩa xây dựng theo hình dáng và vị trí các thànhphần khuôn mặt Hai ông từ bộ ngữ nghĩa này tạo một đồ thị quan hệ để dễ dàng so khớpkhi xác định khuôn mặt người …
Rất nhiều hướng tiếp cận dựa trên dường gấp khúc (snake) và các mẫu để xác địnhkhuôn mặt Đầu tiên ảnh sẽ được làm xoắn lại bởi một lọc làm mờ rồi dùng phép toánmorphology để làm nổi bật cạnh lên Tiếp theo dùng một đường gấp khúc có n điểm ảnh(giá trị n nhỏ) để tìm và ước lượng các đoạn cong nhỏ Mỗi khuôn mặt được xấp xỉ bằngmột ellipse và biến đổi Hough, rồi tìm một ellipse nổi trội nhất Các ứng viên sẽ có bốntham số mô tả một ellipse (để xác định khuôn mặt) Với mỗi ứng viên, một phương thứctương tự như phương thức mẫu biến dạng được dùng để xác định các đặc trưng ở mứcchi tiết Nếu tìm thấy số lượng đáng kể các đặc trưng khuôn mặt và thỏa mãn tỷ lệ cânđối thì xem như đã xác định được một khuôn mặt Lam và Yan cũng dùng đường gấpkhúc để xác định vị trí đầu với thuật toán greedy để cực tiểu hóa hàm năng lượng
Thay vì dùng đường gấp khúc thì Huang và Su dùng lý thuyết dòng chảy để xácđịnh đường viền khuôn mặt dựa trên đặc tính hình học Hai ông dùng lý thuyết tập hợpđồng mức (Level Set) để loang từ các khởi động ban đầu để có được các khuôn mặtngười
Lanitis mô tả một phương pháp biểu diễn khuôn mặt người với cả hai thông tin:hình dáng và cường độ Bắt đầu bằng các tập ảnh được huấn luyện với các đường viềnmẫu như là đường bao mắt, mũi, cằm/má đã được gán nhãn (phân loại) Ông dùng mộtvector các điểm mẫu để mô tả hình dáng Sau đó dùng một mô hình phân bố điểm (PointDistribution Model – PDM) để mô tả vector hình dáng qua toàn bộ các cá thể Dùng cáchtiếp cận như của Kirby và Sirovich để mô tả cường độ bề ngoài của hình dáng đã đượcchuẩn hóa Để tìm kiếm và ước lượng vị trí khuôn mặt cũng như các tham số về hìnhdáng ông sử dụng một mô hình PDM có hình dáng như khuôn mặt (xác định khuôn mặt