1. Trang chủ
  2. » Công Nghệ Thông Tin

Xác định vị trí mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da

51 459 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 51
Dung lượng 4,8 MB

Nội dung

Bài toán phá hiện mặt người được bắt đầu nghiên cứu từ những năm 1990, và đã có rất nhiều công trình nghiên cứu về phát hiện khuôn mặt trong ảnh, tuy nhiên cho đến nay, các nhà khoa học

Trang 1

MỤC LỤC

MỤC LỤC 1

Danh mỤc các hình vẼ 3

Danh mỤc các bẢng biỂu 3

LỜi cẢm ơn 4

MỞ đẦu 5

CHƯƠNG 1 BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ 7

1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số 7

1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người 7

1.3 Các ứng dụng của xác định mặt người 8

1.4 Xác định phạm vi đề tài 9

CHƯƠNG 2 CÁC KỸ THUẬT XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ 10

2.1 Hướng tiếp cận dựa trên tri thức 10

2.1.1 Tư tưởng của tiếp cận dựa trên tri thức 10

2.1.2 Các nghiên cứu liên quan 11

2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi 13

2.2.1 Các đặc trưng của khuôn mặt 13

2.2.3 Kết cấu của khuôn mặt 15

2.2.4 Mầu sắc da 15

2.2.5 Đa đặc trưng 15

2.3 Hướng tiếp cận dựa trên so sánh khớp mẫu 15

2.3.1 Tư tưởng của so sánh khớp mẫu 15

2.3.2 Xác định các mẫu 15

2.3.3 Các mẫu biến dạng 17

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA 19

3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh 19

3.1.1 Không gian màu sử dụng cho mô hình hóa màu da 20

3.1.1.1 Không gian màu RGB 20

3.1.1.2 Không gian RGB chuẩn hóa 20

3.1.1.3 HIS, HSV, HSL - Độ bão hòa của màu 21

3.1.1.4 TSL – Tint, Saturation, Lightness (sắc thái, độ bão hòa, độ dịu ) 21

3.1.1.5 YcrCb 22

3.1.1.6 Các hệ tọa độ không gian màu khác 22

Trang 2

3.1.2 Mô hình hóa màu da 22

3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da 23

3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số 23 3.1.2.3 Mô hình hóa phân phố màu da có tham số 25

3.1.3 So sánh và đánh giá các mô hình 27

3.2 Đề xuất thuật toán xác định ảnh màu dựa trên màu da 29

3.2.1 Định vị vùng khuôn mặt người trong ảnh màu 29

3.2.2 Giai đoạn tiền xử lý hình ảnh ban đầu 32

3.2.2.1 Định nghĩa của một khuôn mặt người 34

3.2.2.2 Thuật toán để xác định khuôn mặt dựa trên kỹ thuật mặt nạ 34

3.2.2.3 Xác định tọa độ của trung tâm của khuôn mặt 35

3.3 Kết quả thực nghiệm và đánh giá 42

KẾT LUẬN 45

TÀI LIỆU THAM KHẢO 49

Trang 3

DANH MỤC CÁC HÌNH VẼ

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down .11

Hình 2.2: Phương pháp chiếu: 12

Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định vị khuôn mặt của Sinha Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ ( các mũi tên) 17

Hình 3.1 Màu sắc hình ảnh và các thành phần R, G và B 29

Hình 3.2 Các thành phần của ảnh gốc trong không gian màu HSV, YCbCr và I1I2I3 30

Hình 3.3 Tiền xử lý hình ảnh ban đầu tại đầu vào hệ thống 33

Hình 3.4 Bản gốc hình ảnh tại đầu vào phát hiện và mặt nạ thích hợp xác định các khu vực của mặt người 35

Hình 3.5 Định nghĩa trung tâm của khuôn mặt 36

Hình 3.6 Ví dụ 1 về phân lớp của khuôn mặt 37

Hình 3.7 Ví dụ 2 về phân lập của khuôn mặt 37

Hình 3.8 Các phân tích của khuôn mặt và tiền xử lý mới 38

Hình 3.9a Các bước để xác định tọa độ của mắt trung tâm 38

Hình 3.9b Căn chỉnh của khuôn mặt theo yêu cầu 39

Hình 3.10 Cấu trúc hệ thống xác định và chuẩn hóa mặt người 40

Hình 3.11 Khuôn mặt trong cơ sở dữ liệu FERET 42

Hình 3.12 Kết quả phát hiện mặt người trong cơ sở dữ liệu FERET COLOR 43

Hình 3.13 Kết quả phát hiện mặt người trong cơ sở dữ liệu CAMERA 44

DANH MỤC CÁC BẢNG BIỂU Bảng 3.1 Kết quả nhận biết đúng và sai của các phương pháp 28

Trang 4

LỜI CẢM ƠN

Đầu tiên, em xin gửi lời cảm ơn sâu sắc nhất đến cán bộ hướng dẫn khoa học, thầy giáo, TS Vũ Duy Linh, người đã truyền cho em nguồn cảm hứng nghiên cứu khoa học, người đã định hướng cho em đến với lĩnh vực nghiên cứu này

Em xin bày tỏ lời cảm ơn tới các thầy giáo, cô giáo đã giảng dạy em trong suốt hai năm học qua Em cũng muốn gửi lời cảm ơn tới những thành viên lớp đã có những góp ý chuyên môn cũng như sự động viên về tinh thần rất đáng trân trọng

Em xin ghi nhận những tình cảm, sự giúp đỡ về chuyên môn của các thầy giáo trong

Bộ môn Khoa học máy tính, Khoa Công nghệ thông tin, Trường Đại học Thái Nguyên Sự quan tâm của các thầy cô đã động viên và khích lệ em rất nhiều trong thời gian qua

Cuối cùng, em xin gửi lời cảm ơn sâu sắc tới tất cả người thân trong gia đình và những bạn bè em với những động viên dành cho em trong công việc và trong cuộc sống

Học viên thực hiện luận văn

Lê Thị Phương Anh

Trang 5

MỞ ĐẦU

Công nghệ thông tin đã và đang được ứng dụng rộng rãi trong mọi lĩnh vực của cuộc sống Với một hệ thống máy tính, chúng ta có thể làm được rất nhiều việc từ đơn giản đến phức tạp Máy tính giúp con người tiết kiện thời gian và công sức khi xử lý các công việc trong thực tế Điển hình như công việc nhận dạng mặt người Trước đây, khi muốn tìm kiếm một kẻ tình nghi trong siêu thị hay sân bay, các nhân viên an ninh phải tìm kiếm trên từng màn hình của các camera theo dõi Ngày nay, công việc đấy đã được làm tự động nhờ các hệ thống nhận dạng mặt người Phát hiện mặt người trong ảnh là một phần quan trọng của hệ thống nhận dạng đó Nếu giải quyết tốt việc phát hiện mặt người sẽ giúp chúng ta tiết kiệm thời gian và nâng cao độ chính xác của việc nhận dạng khuôn mặt

Phát hiện mặt người cũng là một bài toán nhận dạng đơn giản, hệ thống chỉ cần phân loại đối tượng đưa vào có phải mặt người hay không phải mặt người Ở mức độ cao hơn, sau khi đã phát hiện được khuôn mặt, các khuôn mặt đó sẽ được so sánh với các khuôn mặt có trong dữ liệu để nhận dạng xem khuôn mặt đấy là của ai (thường áp dụng trong nhận dạng khuôn mặt của người nổi tiếng hoặc của tội phạm đang bị truy nã)

Bài toán phá hiện mặt người được bắt đầu nghiên cứu từ những năm 1990, và đã có rất nhiều công trình nghiên cứu về phát hiện khuôn mặt trong ảnh, tuy nhiên cho đến nay, các nhà khoa học vẫn không ngừng tìm các hướng tiếp cận mới, các thuật toán mới nhằm nâng cao hiệu suất của việc phát hiện khuôn mặt cũng như việc nhận dạng mặt người.Với mục tiêu chính là tìm hiểu, phân tích các thuật toán phát hiện mặt người hiện nay

và đưa ra cách tiếp cận mới để áp dụng vào bài toán phát hiện mặt người trong ảnh, luận văn được trình bày trong 3 chương với bố cục như sau:

Chương 1: Bài toán xác định mặt người trong ảnh số Giới thiệu tổng quan về bài

toán xác định mặt người trong ảnh, các ứng dụng và những khó khăn của bài toán

Chương 2: Các kỹ thuật xác định mặt người trong ảnh số Phân tích các kỹ thuật

xác định mặt người trong ảnh số

Trang 6

Chương 3: Thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da Tập chung phân tích kỹ thuật phát hiện mặt người dựa trên đặc trưng màu

da Từ đó đề xuất thuật toán xác định mặt người trong ảnh số dựa trên kỹ thuật nhận biết màu da và thực nghiệm

Cuối cùng là kết luận và hướng phát triển: Tóm tắt những kết quả đạt được, những

hạn chế và nêu lên các hướng phát triển trong tương lai

Trang 7

CHƯƠNG 1 BÀI TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

1.1 Giới thiệu về bài toán xác định mặt người trong ảnh số

Trong những năm qua, có rất nhiều công trình nghiên cứu về bài toán nhận dạng mặt người Các nghiên cứu đi từ bài toán đơn giản, từ việc nhận dạng một mặt người trong ảnh đen trắng cho đến mở rộng cho ảnh mầu và có nhiều mặt người trong ảnh Đến nay các bài toán xác định mặt người đã mở rộng với nhiều miền nghiên cứu như nhận dạng khuôn mặt, định vị khuôn mặt, xác định trạng thái mắt người, theo dõi mặt người hay nhận dạng cảm xúc mặt người…

Phát hiện mặt người trong ảnh là phần đầu tiên của một hệ thống nhận dạng mặt người Các hệ thống nhận dạng khuôn mặt được bắt đầu xây dựng từ những năm 1970, tuy nhiên do còn hạn chế về các luật xác định mặt người nên chỉ được áp dụng trong một số ứng dụng như nhận dạng thẻ căn cước Nó chỉ được phát triển mạnh mẽ từ những năm

1990 khi có những tiến bộ trong công nghệ video và ngày nay thì các ứng dụng của xác định mặt người đã trở nên phổ biến trong cuộc sống [1]

Định nghĩa bài toán xác định mặt người: Xác định khuôn mặt người là một kỹ thuật máy tính để xác định các vị trí và kích thước của các khuôn mặt người trong các ảnh số bất

kì Kỹ thuật này nhận biết các đặc trưng của khuôn mặt và bỏ qua những thứ khác xung quanh đối tượng như: tòa nhà, cây cối, cơ thể…

1.2 Những khó khăn và thách thức đối với bài toán xác định mặt người.

Việc xác định khuôn mặt người có những khó khăn nhất định như:

- Hướng (pose) của khuôn mặt đối với máy ảnh, như: nhìn thẳng, nhìn

nghiêng hay nhìn từ trên xuống Cùng trong một ảnh có thể có nhiều khuôn mặt ở những tư thế khác nhau

- Sự có mặt của các chi tiết không phải là đặc trưng riêng của khuôn mặt người, như: râu quai nón, mắt kính, …

- Các nét mặt (facial expression) khác nhau trên khuôn mặt, như: vui, buồn,

ngạc nhiên, …

Trang 8

- Mặt người bị che khuất bởi các đối tượng khác có trong ảnh.

- Sự biểu cảm của khuôn mặt: sự biểu cảm có thể làm thay đổi đáng kể các đặc trưng và thông số của khuôn mặt, ví dụ như khuôn mặt của cùng một người sẽ rất khác khi người đấy cười, tức giận hay sợ hãi …

1.3 Các ứng dụng của xác định mặt người

Xác định mặt người thường là một phần của một hệ thống (facial recognition system)

[2] Nó thường được dùng trong giám sát video, giao tiếp người máy và quản lý cơ sở dữ liệu ảnh…

Các ứng cơ bản của xác định mặt người có thể kể đến là:

- Xác minh tội phạm: Dựa vào ảnh của một người, nhận dạng xem người đấy có

phải là tội phạm hay không bằng cách so sách với các ảnh tội phạm đang được lưu trữ Hoặc có thể sử dụng camera để phát hiện tội phạm trong đám đông Ứng dụng này giúp cơ quan an ninh quản lý con người tốt hơn

- Camera chống trộm: Các hệ thống camera sẽ xác định đâu là con người và theo

dõi xem con người đó có làm gì phạm pháp không, ví dụ như lấy trộm đồ, xâm nhập bất hợp pháp vào một khu vực nào đó

- Bảo mật: Các ứng dụng về bảo mật rất đa dạng, một trong số đó là công nghệ

nhận dạng mặt người của laptop, công nghệ này cho phép chủ nhân của máy tính chỉ cần ngồi trước máy là có thể đăng nhập được Để sử dụng công nghệ này, người dùng phải sử dụng một webcam để chụp ảnh khuôn mặt của mình và cho máy “học” thuộc các đặc điểm của khuôn mặt giúp cho quá trình đăng nhập sau này

- Lưu trữ khuôn mặt: Xác định mặt người có thể được ứng dụng trong các trạm

rút tiền tự động (ATM) để lưu trữ khuôn mặt của người rút tiền Hiện nay có những người bị người khác lấy trộm thẻ ATM và mã PIN, và bị rút tiền trộm, hoặc có những chủ tài khoản đi rút tiền nhưng lại báo với ngân hàng là bị mất thẻ và bị rút tiền trộm Nếu lưu trữ được khuôn mặt của người rút tiền, ngân hàng có thể đối chứng và xử lý dễ dàng hơn

Các ứng dụng khác:

Trang 9

- Điều khiển vào ra: văn phòng, công ty, trụ sở, máy tính, Palm,…Kết hợp thêm

vân tay và mống mắt Cho phép nhân viên được ra vào nơi cần thiết

- An ninh sân bay, xuất nhập cảnh (hiện nay cơ quan xuất nhập cảnh Mỹ đã áp

dụng ) Dùng camera quan sát để xác thực người nhập cảnh và kiểm tra xem người đấy có phải là tội phạm hay phần tử khủng bố không

- Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt người trên nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyền hình,…Ví dụ: tìm các đoạn video có tổng thống Obama phát biểu, tìm các phim

có diễn viên Thành Long đóng…

- Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ trợ thông báo khi cần thiết

- Tương lai sẽ phát triển các loại thẻ thông minh có tích hợp sẵn đặc trưng của người dùng trên đó, khi bất cứ người dùng khác dùng để truy cập hay xử lý tại các hệ thống sẽ được yêu cầu kiểm tra các đặc trưng khuôn mặt so với thẻ để biết nay có phải là chủ thẻ hay không

- Hãng máy chụp hình Canon đã ứng dụng bài toán xác định khuôn mặt người vào máy chụp hình thế hệ mới để cho kết quả hình ảnh đẹp hơn, nhất là khuôn mặt người

1.4 Xác định phạm vi đề tài

Trong đề tài này, tôi tập trung vào việc xác định khuôn mặt trong ảnh dựa trên nhận biết màu da Từ đấy lưu khuôn mặt tìm được vào cơ sử dữ liệu để phục vụ cho các mục đích khác (chẳng hạn như nhận dạng mặt người hoặc ghép khuôn mặt vào bức ảnh khác…) Do các điều kiện khó khăn đã nêu ở trên tôi xin đưa ra những giả định và ràng buộc sau để giảm độ phức tạp của bài toán:

- Các khuôn mặt được chụp thẳng hoặc góc nghiêng không đáng kể (nhỏ hơn hoặc bằng 10o)

- Phông nền của ảnh không quá phức tạp

- Ảnh được chụp trong điều kiện ánh sáng bình thường

Trang 10

CHƯƠNG 2 CÁC KỸ THUẬT XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

Dựa vào tính chất của các phương pháp xác định mặt người trên ảnh, các phương pháp này được chia thành bốn loại chính, tương ứng với bốn hướng tiếp cận khác nhau Ngoài ra cũng có rất nhiều nghiên cứu mà phương pháp xác định mặt người không chỉ dựa vào một hướng mà có liên quan đến nhiều hướng

- Hướng tiếp cận dựa trên tri thức: Dựa vào các thuật toán, mã hóa các đặc trưng

và quan hệ giữa các đặc trưng của khuôn mặt thành các luật Đây là hướng tiếp cận theo kiểu top-down

- Hướng tiếp cận dựa trên đặc trưng không thay đổi: Xây dựng các thuật toán để

tìm các đặc trưng của khuôn mặt mà các đặc trưng này không thay đổi khi tư thế khuôn mặt hay vị trí đặt camera thay đổi

- Hướng tiếp cận dựa trên so sánh khớp mẫu: Dùng các mẫu chuẩn của khuôn

mặt (các mẫu này đã được chọn và lưu trữ) để mô tả các khuôn mặt hay các đặc trưng của khuôn mặt (các mẫu này được chọn tách biệt theo tiêu chuẩn đã được các tác giả đề ra để so sánh) Phương pháp này có thể dùng để xác định vị trí hay dò tìm khuôn mặt trên ảnh

- Hướng tiếp cận dựa trên diện mạo: Trái ngược với hướng tiếp cận dựa trên

khuôn mẫu, các mô hình (hay các mẫu) sẽ được học từ một tập ảnh huấn luyện

mà thể hiện tính chất tiêu biểu của sự xuất hiện của mặt người trong ảnh Sau đó

hệ thống (mô hình) sẽ xác định mặt người Phương pháp này còn được biết đến với tên gọi tiếp cận theo các phương pháp học máy

2.1 Hướng tiếp cận dựa trên tri thức

2.1.1 Tư tưởng của tiếp cận dựa trên tri thức

Trong hướng tiếp cận này, các phương pháp xác định mặt người được xây dựng dựa vào các luật, các luật này phụ thuộc vào tri thức của các tác giả nghiên cứu về bài toán xác định khuôn mặt Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng của khuôn mặt

và các quan hệ tương ứng Ví dụ, một khuôn mặt thường có hai mắt đối xứng qua trục

Trang 11

thẳng đứng giữa khuôn mặt và có một mũi một miệng Các quan hệ đặc trưng có thể là quan hệ về vị trí và khoảng cách tương đối Khó khăn của hướng tiếp cận này đó là làm thế nào để chuyển các tri thức của con người về khuôn mặt sang các luật cho máy tính một cách hiệu quả Nếu các luật này quá chi tiết, chặt chẽ thì sẽ có thể xác định thiếu các khuôn mặt có trong ảnh, nhưng nếu các luật quá tổng quát thì sẽ dẫn đến xác định sai khu vực không phải là khuôn mặt thành khuôn mặt Ngoài ra cũng khó để mở rộng phạm vi của bải toán để xác định các khuôn mặt có nhiều tư thế khác nhau.

2.1.2 Các nghiên cứu liên quan

Có nhiều cách để xây dựng chương trình xác định mặt người theo hướng tiếp cận dựa trên tri thức Thông thường chương trình sẽ được xây dựng theo hướng dựa vào một phương pháp nào đấy chọn ra các ứng viên trong bức ảnh trước, sau đó sẽ áp dụng các luật

để xác định ứng viên nào là khuôn mặt, ứng viên nào không phải là khuôn mặt Quá trình này có thể được áp dụng nhiều lần để giảm sai sót Các luật được xây dựng dựa vào tri thức của người nghiên cứu về các đặc trưng của khuôn mặt (ví dụ như cường độ phân

phôi và sự khác nhau ) của các vùng trên khuôn mặt

Hình 2.1: Một phương pháp xác định khuôn mặt điển theo hướng tiếp cận Top-down

Yang và Huang đã sử dụng hướng tiếp cận dựa trên tri thức để xác định khuôn mặt [3-4] Hệ thống của hai tác giả bao gồm ba mức luật Đầu tiên các ông sử dụng một khung cửa sổ để quét trên bức ảnh và thông qua một số tập luật để xác định các ứng viên có thể là mặt người, ví dụ như tìm phần trung tâm của khuôn mặt (phần tối hơn trong hình 2.1) Tiếp theo, dùng một tập luật để mô tả tổng quát hình dáng khuôn mặt, lọc các ứng viên ở mức một thành một tập các ứng viên mới có xác xuất là khuôn mặt cao hơn Cuối cùng, các ông lại dùng một tập luật khác để xem xét ở mức chi tiết các đặc trưng khuôn mặt (có thể là đặc trưng về mắt, mũi, miệng…), từ đó lọc ra các ứng viên chính xác nhất Có thể

Trang 12

nói cách làm của hai ông là một cách làm mịn dần để đạt được kết quả tốt nhất, mặc dù tỷ

lệ chính xác chưa cao, nhưng đây là tiền đề cho nhiều nghiên cứu sau này

Có rất nhiều công trình nghiên cứu sử dụng phương pháp chiếu để xác định khuôn mặt Kotropoulos và Pitas [5] đưa ra một phương pháp gần tương tự với Yang và Huang Đầu tiên, các vùng của khuôn mặt được định vị bởi phương pháp chiếu (đã được Kanade

sử dụng thành công) để xác định biên của khuôn mặt Với I(x,y) là giá trị xám của một

điểm trong ảnh có kích thước m x n ở tại vị trí (x,y), các hàm để chiếu ảnh theo phương ngang và thẳng đứng được định nghĩa như sau:

ta các vị trí của miệng, đỉnh mũi và hai mắt Các đặc trưng này đủ để xác định khuôn mặt Hình 2.2.a cho một ví dụ về cách xác định như trên Cách xác định này có tỷ lệ xác định chính xác là 86.5% cho trường hợp chỉ có một khuôn mặt thẳng trong ảnh và hình nền không phức tạp Nếu hình nền phức tạp như hình 2.2.b thì rất khó tìm Còn nếu ảnh có nhiều khuôn mặt (hình 2.2.c) thì sẽ không xác định được

Hình 2.2: Phương pháp chiếu: (a) Ảnh chỉ có một khuôn mặt và hình nền đơn giản;

(b) Ảnh chỉ có một khuôn mặt và hình nền phức tạp;

(c) Ảnh có nhiều khuôn mặt

Trang 13

2.2 Hướng tiếp cận dựa trên đặc trưng không thay đổi

Tiếp cận dựa trên các đặc trưng không thay đổi là tiếp cận theo kiểu Bottom-Up Dựa trên thực tế, chúng ta cố gắng tìm ra những đặc điểm không thay đổi khi của khuôn mặt khi ở các tư thế khác nhau và các điều kiện môi trường như ánh sáng khác nhau Đã có rất nhiều nghiên cứu về hướng tiếp cận này, các đặc điểm không thay đổi được tìm thấy như lông mày, mắt, mũi, miệng hay các đường viền trên tóc… Trên cơ sở các đặc trưng này, các nhà nghiên cứu xây dựng lên một mô hình thống kê mô tả quan hệ của các đặc trưng

và từ đó xác định sự xuất hiện của khuôn mặt trong bức ảnh Khó khăn của hướng tiếp cận này đó là phải mô tả các đặc trưng không thay đổi và quan hệ giữa chúng phù hợp với điều kiện ánh sáng, độ nhiễu hay bị che khuất

2.2.1 Các đặc trưng của khuôn mặt

Có rất nhiều nghiên cứu về các đặc trưng của khuôn mặt Có thể dựa vào các đặc trưng như hai mắt, hai lỗ mũi, miệng, phần nối giữa mũi và miệng…hoặc dựa vào đường viền của khuôn mặt

Leung trong [6] đã đề xuất mô hình xác xuất để xác định khuôn mặt trong ảnh có hình nền phức tạp dựa trên việc tìm kiếm các đặc trưng không thay đổi của khuôn mặt trong ảnh, sau đó dùng đồ thị ngẫu nhiên để xác định khuôn mặt Tư tưởng của phương pháp này đó là xem bài toán xác định khuôn mặt như là bài toán tìm kiếm với mục tiêu là tìm thứ tự các đặc trưng không thay đổi của khuôn mặt Dùng năm đặc trưng (hai mắt, hai

lỗ mũi, phần nối giữa mũi và miệng) để mô tả một khuôn mặt Đồng thời tính quan hệ khoảng cách cho tất cả các cặp đặc trưng (như mắt trái, mắt phải), sau đấy dùng phân bố Gauss để mô hình hóa Một mẫu khuôn mặt được đưa ra thông qua trung bình tương ứng cho một tập đa hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss Từ một ảnh, các đặc trưng của ứng viên được xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng với vector mẫu Hai ứng viên có đặc trưng đứng đầu sẽ được chọn để tìm kiếm cho các đặc trưng khác của khuôn mặt Từ các đặc trưng không thay đổi, các đặc trưng khác sẽ được xác định thông qua sự đánh giá xác xuất khoảng cách giữa các đặc trưng, hơn nữa phương sai của phép thống kê này có thể được tính toán trước để xác định các đặc trưng với xác xuất lớn Tỷ lệ chính xác của phương pháp này là 86%

Bên cạnh tính khoảng cách liên quan để mô tả quan hệ giữa các đặc trưng như Leung Kendall [6], Mardia và Dryden [7] dùng lý thuyết xác suất thống kê về hình dáng Dùng

Trang 14

hàm mật độ xác suất (Probility Density Function - PDF) qua N điểm đặc trưng, tương ứng (x i , y i ) là đặc trưng thứ i với giả sử là phân bố Gauss có 2N-chiều Các tác giả áp dụng phương thức cực đại khả năng (Maximum-Likelihood - ML) để xác định vị trí khuôn mặt

Một thuận lợi của phương pháp này là các khuôn mặt bị che khuất vẫn có thể xác định được Hạn chế phương pháp này đó là không xác định được nhiều khuôn mặt trong cùng một ảnh

Không dùng phương pháp xác suất, Sirohey đưa một phương pháp khác xác định khuôn mặt từ một ảnh có hình nền phức tạp dựa trên cạnh [8] Dùng phương pháp Candy [9] và heuristics loại bỏ các cạnh để còn lại duy nhất một đường bao xung quanh khuôn mặt Một hình ellipse dùng để bao khuôn mặt, tách biệt vùng đầu và hình nền Tỷ lệ chính xác của thuật toán là 80%

Graf đưa ra một phương pháp xác định đặc trưng rồi xác định khuôn mặt trong ảnh

xám [10] Dùng bộ lọc để làm nổi các biên, các phép toán hình thái học (morphology)

được dùng để làm nổi bật các vùng có cường độ cao và hình dáng chắc chắn (như mắt) Thông qua histogram để tìm các đỉnh nổi bật để xác định các ngưỡng chuyển ảnh xám thành hai ảnh nhị phân Các thành phần dính nhau đều xuất hiện trong hai ảnh nhị phân thì được xem là vùng của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặt không Phương pháp được kiểm tra trên các ảnh chỉ có đầu và vai của người Tuy nhiên phương pháp này còn một vấn đề đấy là sử dụng các phép toán morphology như thế nào

và làm sao xác định khuôn mặt trên các vùng ứng viên

Trong [11], Girosi dùng Gaze để tìm ứng viên góc mắt, miệng và tâm mắt Ông xây

dựng SVM (Support Vector Machine) đã được học trước đó để xác định các vị trí ứng viên

có phải là góc mắt, miệng, và tâm mắt hay không để theo vết con mắt người Juan và Narciso xây dựng một không gian màu mới YCg’Cr’ để lọc các vùng là ứng viên khuôn mặt dựa trên sắc thái của màu da người Sau khi có ứng viên, hai ông dùng các quan hệ về hình dáng khuôn mặt, mức độ cân đối của các thành phần khuôn mặt để xác định khuôn mặt người

Tương tự, Chang và Hwang cũng dùng không gian màu Ycg’Cr’ với tỷ lệ chính xác hơn 80% trong ảnh xám Jin xây dựng một bộ lọc để xác định ứng viên khuôn mặt người theo màu da người Từ ứng viên này tác giả xác định khuôn mặt người theo hình dáng

Trang 15

khuôn mặt và các quan hệ đặc trưng về thành phần khuôn mặt, với mắt phải được chọn làm gốc tọa độ để xét quan hệ Tỷ lệ chính xác cho khuôn mặt chụp thẳng trên 80%.

2.2.3 Kết cấu của khuôn mặt.

Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng để phân loại so với các đối tượng khác Từ kết cấu của khuôn mặt xây dựng lên một bộ phân loại, gọi là kết

cấu giống khuôn mặt (face-like texture).

2.2.4 Mầu sắc da

Thông thường các ảnh màu không xác định trực tiếp trên toàn bộ dữ liệu ảnh mà các tác giả dùng tính chất sắc màu của da người (khuôn mặt người) để chọn ra được các ứng viên có thể là khuôn mặt người (lúc này dữ liệu đã thu hẹp đáng kể) để xác định khuôn mặt người

2.2.5 Đa đặc trưng

Gần đây có nhiều nghiên cứu sử dụng các đặc trưng toàn cục như: màu da người, kích thước, và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó sẽ xác định ứng viên nào là khuôn mặt thông qua dùng các đặc trưng cục bộ (chi tiết) như: mắt, lông mày, mũi, miệng, và tóc Tùy mỗi tác giả sẽ sử dụng tập đặc trưng khác nhau

2.3 Hướng tiếp cận dựa trên so sánh khớp mẫu.

2.3.1 Tư tưởng của so sánh khớp mẫu

Trong hướng tiếp cận dựa trên so sánh khớp mẫu, các mẫu chuẩn của khuôn mặt (thường là khuôn mặt được chụp thẳng) sẽ được xác định trước hoặc được biểu diễn thành một hàm với các tham số cụ thể Từ một ảnh đưa vào, tính các giá trị tương quan so với các mẫu chuẩn về đường viền khuôn mặt, mắt, mũi và miệng Thông qua các giá trị tương quan này mà hệ thống sẽ quyết định có hay không có tồn tại khuôn mặt trong ảnh Hướng tiếp cận này có lợi thế là rất dễ cài đặt, nhưng không hiệu quả khi tỷ lệ, tư thế, và hình dáng thay đổi

2.3.2 Xác định các mẫu

Sakai đã cố gắng thử xác định khuôn mặt người chụp thẳng trong ảnh [12] Tác giả

dùng vài mẫu con (sub template) về mắt, mũi, miệng, và đường viền khuôn mặt để mô

hình hóa một khuôn mặt Mỗi mẫu con được định nghĩa trong giới hạn của các đoạn thẳng Các đường thẳng trong ảnh được trích bằng cách xem xét thay đổi của hệ số góc và so

Trang 16

khớp các mẫu con Đầu tiên tìm các ứng viên thông qua mối tương quan giữa các ảnh con

và các mẫu về đường viền Sau đó, so khớp với các mẫu con khác Hay nói một cách khác, giai đoạn đầu xem như là giai đoạn sơ chế để tìm ứng viên, giai đọan thứ hai là giai đoạn tinh chế để xác định ứng viên có phải là khuôn mặt hay không Ý tưởng này được duy trì cho đến các nghiên cứu sau này

Craw đưa ra một phương pháp xác định khuôn mặt người dựa vào các mẫu về hình dáng của các ảnh được chụp thẳng (dùng vẻ bề ngoài của hình dáng khuôn mặt) Đầu tiên dùng phép lọc Sobel (Phép lọc Sobel dựa vào tích vô hướng của hai vector gradient) để tìm các cạnh Các cạnh này sẽ được nhóm lại theo một số ràng buộc Sau đó, tìm đường viền của đầu, quá trình tương tự được lặp đi lặp lại với mỗi tỷ lệ khác nhau để xác định các đặc trưng khác như: mắt, lông mày, và môi Sau đó Craw mô tả một phương thức xác định dùng một tập có 40 mẫu để tìm các đặc trưng khuôn mặt và điều khiển chiến lược

dò tìm [13]

Một số nhà nghiên cứu sử dụng hình chiếu như các mẫu để xác định khuôn mặt

người Silhouettes dùng PCA (Phân tích thành phần chính-Principal Component Analysis)

để có một tập hình chiếu cơ bản từ các mẫu khuôn mặt, hình chiếu được mô tả như một mảng các bit Dùng đặc trưng hình chiếu riêng kết hợp biến đổi Hough để xác định khuôn mặt người Sau đó một phương pháp xác định dựa trên đa loại mẫu để xác định các thành phần của khuôn mặt được trình bày Phương pháp này định nghĩa một số giả thuyết để mô

tả các khả năng của các đặc trưng khuôn mặt Với một khuôn mặt sẽ có một tập giả thuyết,

lý thuyết DepsterShafer Dùng một nhân tố tin cậy để kiểm tra sự tồn tại hay không của các đặc trưng của khuôn mặt, và kết hợp nhân tố tin cậy này với một độ đo để xem xét có hay không có khuôn mặt trong ảnh

Sinha dùng một tập nhỏ các ảnh bất biến trong không gian ảnh để mô tả không gian các mẫu ảnh [15-16] Tư tưởng chính của ông dựa vào sự thay đổi mức độ sáng của các vùng khác nhau của khuôn mặt (như hai mắt, hai má, và trán), (quan hệ về mức độ sáng của các vùng còn lại thay đổi không đáng kể) Sau đấy xác định các cặp tỷ số của mức độ sáng của một số vùng (một vùng tối hơn hay sáng hơn) cho ta một lượng bất biến khá hiệu quả Ông lưu sự thay đổi độ sáng của các vùng trên khuôn mặt trong một tập thích hợp với các cặp quan hệ sáng hơn – tối hơn giữa các vùng nhỏ Một khuôn mặt được xác định nếu

nó thỏa mãn tất cả các cặp sáng hơn – tối hơn Ý tưởng này xuất phát từ sự khác biệt của

Trang 17

cường độ giữa các vùng kề cục bộ trên ảnh, sau này nó được mở rộng trên cơ sở biến đổi wavelet để xác định người đi bộ, xác định xe hơi, xác định khuôn mặt Ý tưởng của Sinha còn được áp dụng trong các nghiên cứu về thị giác của robot

Hình 2.3: Một mẫu khuôn mặt có kích thước 14 x 16 pixel được sử dụng trong phương pháp định

vị khuôn mặt của Sinha Mẫu gồm 16 vùng trên khuôn mặt và 23 quan hệ ( các mũi tên).

Hình 2.3 cho thấy mẫu khuôn mặt với 16 cùng và 23 quan hệ Các quan hệ này được dùng để phân loại, có 11 quan hệ thiết yếu (các mũi tên màu đen) và 12 quan hệ xác thực (các mũi tên mầu xám) Mỗi mũi tên là một quan hệ Một quan hệ của hai vùng thỏa mãn mẫu khuôn mặt khi tỷ lệ giữa hai vùng vượt qua một ngưỡng và một khuôn mặt được xác đinh khi có 23 quan hệ thỏa mãn điều kiện trên Một số phương pháp khác như của Froba

và Zink lọc cạnh ở độ phân giải thấp rồi dùng biến đổi Hough để so khớp mẫu theo hướng cạnh để xác định hình dáng khuôn mặt ở dạng chụp hình thẳng ở dạng xám Tỷ lệ chính xác trên 91% Ngàoi ra Shu và Jain còn xây dựng ngữ nghĩa khuôn mặt Ngữ nghĩa xây dựng theo hình dáng và vị trí các thành phần khuôn mặt Hai ông từ bộ ngữ nghĩa này tạo một đồ thị quan hệ để dễ dàng so khớp khi xác định khuôn mặt người …

nó xác định

Trang 18

Rất nhiều hướng tiếp cận dựa trên dường gấp khúc (snake) và các mẫu để xác định

khuôn mặt Đầu tiên ảnh sẽ được làm xoắn lại bởi một lọc làm mờ rồi dùng phép toán morphology để làm nổi bật cạnh lên Tiếp theo dùng một đường gấp khúc có n điểm ảnh (giá trị n nhỏ) để tìm và ước lượng các đọan cong nhỏ Mỗi khuôn mặt được xấp xỉ bằng một ellipse và biến đổi Hough, rồi tìm một ellipse nổi trội nhất Các ứng viên sẽ có bốn tham số mô tả nột ellipse (để xác định khuôn mặt) Với mỗi ứng viên, một phương thức tương tự như phương thức mẫu biến dạng được dùng để xác định các đặc trưng ở mức chi tiết Nếu tìm thấy số lượng đáng kể các đặc trưng khuôn mặt và thỏa mãn tỷ lệ cân đối thì xem như đã xác định được một khuôn mặt Lam và Yan cũng dùng đường gấp khúc để xác định vị trí đầu với thuất toán greedy để cực tiểu hóa hàm năng lượng [18]

Thay vì dùng đường gấp khúc thì Huang và Su [19] dùng lý thuyết dòng chảy để xác định đường viền khuôn mặt dựa trên đặc tính hình học Hai ông dùng lý thuyết tập hợp

đồng mức (Level Set) để loang từ các khởi động ban đầu để có được các khuôn mặt người.

Trang 19

CHƯƠNG 3: THUẬT TOÁN XÁC ĐỊNH MẶT NGƯỜI TRONG ẢNH SỐ

DỰA TRÊN KỸ THUẬT NHẬN BIẾT MÀU DA

Phát hiện mặt người trong ảnh có nhiều ứng dụng trong cuộc sống, tuy nhiên, trong luận văn này, tôi chỉ xây dựng một chương trình nhỏ để minh họa cho các lý thuyết trình bày ở trên

3.1 Các kỹ thuật nhận biết màu da dựa trên tính chất điểm ảnh

Phát hiện dựa vào màu sắc của da người cũng là một trong những phương pháp được dùng để phát hiện mặt người Tuy nhiên nếu chỉ đơn thuần sử dùng màu sắc không thôi thì rất khó có thể đạt được hiệu quả cao trong phát hiện mặt người Vì trong các khung cảnh thì có rất nhiều vật có màu sắc tương tự như màu của khuôn mặt Tuy nhiên nếu kết hợp phương pháp này với các phương pháp khác lại có thể mang lại hiệu quả cao Vì kinh nghiệm cho thấy màu da người có đặc tính màu riêng biệt, và đặc tính này cho phép dễ dàng nhận ra đâu là da người [27] Và thông thường trong hướng tiếp cận phát hiện mặt người dựa trên thông tin xuất hiện trong ảnh, thì màu da được sử dụng như một bước phân vùng các vùng ảnh có màu sắc giống màu da, điều đó cho phép giảm không gian tìm kiếm khuôn mặt, cải thiện hiệu năng của hệ thống tìm kiếm Do đó nhiều mô hình đã được xây dựng để có thể phát hiện được da người

Khi xây dựng hay mô hình hóa một hệ thống phát hiện hay phân tách vùng màu da với mục đích sử dụng cho việc phát hiện mặt người, người ta thường đặt ra ba vấn đề chính [28] sau: thứ nhất là mô hình đó được xây dựng trong không gian màu nào? thứ hai

là hàm phân phối của màu da được mô hình hóa chính xác đến mức độ nào và cuối cùng là

sẽ xử lý vùng màu da được phân vùng cho nhận biết mặt người như thế nào?

Phương pháp được được đề cập trong phần này là phương pháp phát hiện da người dựa trên đặc tính điểm ảnh, nghĩa là sẽ phân lớp điểm ảnh thành hai lớp, lớp là lớp điểm anh có thuộc màu da và lớp kia không phải là màu da Các điểm ảnh là hoàn toàn độc lập với nhau Ngược lại với phương pháp này là phương pháp dựa trên đặc tính vùng ảnh Phát hiện màu da dựa trên đặc tính điểm ảnh có một lịch sử phát triển khá dài, tuy nhiên trong khuôn khổ phần tổng quan này, chỉ đề cập và so sánh những kỹ thuật đã được công

bố và được đánh giá hiệu quả

Trang 20

Mục đích cuối cùng của phần tổng quan này là thu tập các kỹ thuật đã được công bố,

mô tả những ý tưởng chính của kỹ thuật đó, tổng hợp và đưa ra những ưu điểm, nhược điểm và những đặc trưng của từng kỹ thuật Từ đó sẽ đưa ra quyết định lựa chọn kỹ thuật phù hợp dùng để phân vùng màu da áp dụng trong luận văn

3.1.1 Không gian màu sử dụng cho mô hình hóa màu da

Trong lĩnh vực đo màu, cũng như các lĩnh vực trong truyền tín hiệu hình ảnh và video sử dụng rất nhiều không gian màu với các tính chất khác nhau Và trong số đó nhiều không gian màu được áp dụng cho vấn đề mô hình hóa màu da Sau đây là tóm lược nhóm các không gian màu được sử dụng rộng rãi nhất cũng như các tính chất của chúng

3.1.1.1 Không gian màu RGB

RGB là không gian màu cơ bản được áp dụng từ lâu cho màn hình CRT Trong không gian màu này, mỗi điểm màu là sự kết hợp của ba thành phần đơn màu (Đỏ - Red, Xanh lá cây- Green và xanh da trời: Blue) Đây là một trong những không gian màu được

sử dụng phổ biến nhất cho việc xử lý và lưu trữ dữ liệu ảnh số Tuy nhiên do tính tương quan cao giữa các kênh, giá trị cảm nhận không đồng nhất, sự pha trỗn giữa dữ liệu thành phần màu và dữ liệu về độ sáng mà không gian RGB không được ưa thích sử dụng cho việc phân tích màu cũng như trong các thuật toán nhận dạng dựa trên màu sắc

3.1.1.2 Không gian RGB chuẩn hóa

Không gian RGB chuẩn hóa là không gian màu nhận được từ không gian RGB cơ bản theo công thức chuẩn hóa đơn giản sau đây:

Có thể dễ dàng thấy rằng, trong không gian này, r+g +b = 1 Do đó chỉ cần hai trong

ba thành phần trên là đủ để biểu diễn không gian màu này, thành phần thứ ba sẽ không còn giá trị và có thể được bỏ qua, để rút ngắn được số chiều của không gian này Hai thành phần còn lại thường được gọi là các thành phần “màu tinh khiết” (“pure colors”) Thông thường, hai thành phần r và b thường được giữ lại, còn b bị rút bỏ đi Tính chất cần chú ý của không gian màu này đó là tính bất biến đối với của bề mặt Nghĩa là, nếu như không quan tâm đến ánh sáng xung quanh, thì không gian chuẩn hóa RGB là bất biến đối với sự thay đổi về hướng bề mặt liên quan đến nguồn chiếu (tất nhiên là duới một vài giả thiết

Trang 21

nhất định) Kết hợp với phép chuyển đổi đơn giản từ không gian màu RGB cơ bản mà không gian RGB chuẩn hóa này ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực, trong đó có linh vực nhận dạng.

3.1.1.3 HIS, HSV, HSL - Độ bão hòa của màu

Không gian màu dựa trên tính bão hòa màu được giới thiệu khi có những nhu cầu trong việc xác định số lượng tính chất màu Chúng miêu tả màu sắc với những giá trị thuộc về trực giác, dựa trên ý kiến của các họa sỹ về những trạng thái khác nhau của màu sắc, trạng thái bão hòa cũng như từng tông màu khác nhau Hue biểu thị cho màu trỗi (như màu đỏ, màu xanh lá cây, màu đỏ tía và màu vàng) của một vùng ảnh, saturation (độ bão hòa) là thước đo cho giới mức ngưỡng màu của một vùng ảnh

Các khái niệm như “intensity” (cường độ), “lightness” (tính dịu) hay “value”(giá trị)

liên quan đến độ sáng của màu Giá trị trực giác của các thành phần trong không gian màu này và sự phân biệt rõ ràng giữa độ sáng với cá thành phần màu của không gian màu là ưu điểm mà giúp cho không gian này được sử dụng phổ biến trong vấn đề phần vùng màu da.Công thức chuyển từ không gian RGB sang không gian này như sau:

1 313

H

R G B S

Hệ tọa độ cực giữa Hue và Saturation có thể gây ra nhiều khó khăn trong mô hình màu da, chính vì vậy người ta còn chuyển nó sang hệ tọa độ Đềcác theo công thức sau:

3.1.1.4 TSL – Tint, Saturation, Lightness (sắc thái, độ bão hòa, độ dịu )

Trang 22

Không gian chuẩn hóa thành phần màu và độ sáng TSL được chuyển từ không gian chuẩn hóa RGB theo công thức sau đây:

3.1.1.5 YcrCb

YCrCblà không gian màu được sử dụng nhiều trong vấn đề nén ảnh Màu sắc dược biểu diễn bởi luma(đó là giá trị độ sáng được tính toán từ không gian RGB), gồm ba thành phần, một thành phần là tổng các trọng số từ RGB, hai thành phần màu khác nhau Cr và

Cb được tạo ra bằng cách từ từ hai thành phần Red và Blue trong không gian màu RGB Công thức để chuyển đổi như sau:

r b

Việc chuyển đổi đơn giản, tính phân chia rõ ràng của độ sáng và các thành phần màu

là những đặc tính giúp cho không gian này lôi cuốn các nhà nghiên cứu sử dụng cho việc

mô hình hóa màu da

3.1.1.6 Các hệ tọa độ không gian màu khác

Bên cạnh YcrCb, một vài không gian màu khác đựoc tạo ra từ chuyển đổi tuyến tính không gian RGB được sử dụng trong vấn đề phát hiện màu da Như là YES, YUV hay YIQ Tuy nhiên chúng ít được sử dụng hơn

3.1.2 Mô hình hóa màu da

Mục đích cuối cùng của phát hiện màu da là xây dựng một quy tắc có tính quyết định Đây là quy tắc sẽ giúp phân biệt một điểm ảnh là da hay không phải là da người Thông thường, quy tắc này sẽ thiết lập một giá trị đo cho phép tính toán mức độ tương

Trang 23

đồng giữa một điểm ảnh màu với đặc trưng màu da Giá trị đo này được thiết lập như thế nào, công thức ra sao tùy thuộc vào từng phương pháp mô hình hóa màu da.

3.1.2.1 Xác định ngưỡng cụ thể một điểm ảnh là màu da

Trong một số không gian màu, phương pháp xây dựng và xếp lớp màu da bằng cách xác định rõ ràng (thông qua một số quy tắc) biên giới các giá trị của điểm ảnh là màu da hay không

Ví dụ như: trong không gian RGB, (R,G,B) được xếp thuộc lớp màu da nếu như:

Tuy nhiên kết quả đạt được khi phân lớp là không cao trong trường hợp tổng quát Vì vậy khó khăn chính của phương pháp này nếu muốn có được hệ số nhận dạng cao đó là phải tìm ra được một không gian màu thích hợp cũng như các quy tắc tốt để nhận biết màu

da trong không gian màu này

Hiện nay người ta đang đề xuất sử dụng thuật toán máy học để tìm ra một không gian màu thích hợp cũng như các quy tắc phân lớp màu da với mong muốn có được hệ số nhận dạng cao Tuy nhiên đó cũng chỉ mới là đề xuất và chưa có một kết quả cụ thể của một nghiên cứu nào đựoc công bố

Tuy nhiên, giữa và kết quả đạt được, chúng ta vẫn có thể tìm ra được những quy tắc cho phép nhận biết chắc chắn một điểm ảnh không phải là màu da Những quy tắc này có thể được sử dụng làm bước lọc khởi tạo cho các phương phân lớp pháp phức tạp hơn giữa vùng màu da và vùng không phải màu da Nó giúp cho quá trình phân lớp được thực hiện nhanh chóng hơn và đỡ tốn công hơn

3.1.2.2 Phương pháp mô hình hóa màu da sử dụng phân phối không tham số

Ý tưởng chính của phương pháp mô hình hóa màu da không tham số đó là ước lượng phân phối màu da từ dữ liệu huấn luyện mà không xuất phát từ một mô hình rõ ràng nào

Trang 24

của màu da Kết quả của phương pháp này thường được biểu diễn dưới dạng một bản đồ

phân bố màu da (SPM – Skin Probability Map).

Mỗi một giá trị phân bố được gán cho mỗi điểm trong không gian màu

3.1.2.2.1 Bảng tra cứu chuẩn hóa (LUT – Lookup Table)

Một số thuật toán phát hiện mặt người và bám sát mặt người sử dụng một lược đồ mức xám dựa trên hướng tiếp cận phân vùng các điểm ảnh là màu da

Không gian màu được lượng tự hóa thành từng nhóm, mỗi một nhóm đáp ứng cho một khoảng các thành phần màu Các nhóm lược đồ này được tham chiếu tới một bảng gọi

là bảng tra cứu Mỗi một nhóm lưu trữ một số lượng lần xuất hiện của một màu khi tiến hành huấn luỵện ảnh da người Sau quá trình huấn luyện, biểu đồ sẽ tính toán và chuẩn hóa, chuyển sang giá trị biểu đô trong phân phối xác suất miền rời rạc:

Trong đó, skin[c] nhận giá trị của nhóm lược đồ, đáp ứng cho véc tơ màu c, Norm là một hệ số chuẩn hóa (tổng tất cả các giá trị của các nhóm biểu đồ) hay là giá trị lớn nhất của một nhóm biểu đồ Giá trị chuẩn hóa của của bảng tra cứu các nhóm biểu đồ là căn cứ

để cho phép quyết định một màu có là màu da hay không?

3.1.2.2.2 Phân lớp Bayes (Bayes Classifier)

Giá trị của Pskin(c) trong công thức trên là một điều kiện xác suất – P(c|skin) – xác suất một màu quan sát c là một pixel màu da Và xác suất thích hợp được dùng để phát hiện màu da đó là P(skin|c) – xác suất quan sát màu được màu da khi xuất hiện một giá trị màu c rời rac Để tính giá trị này, ta sử dụng công thức Bayes quen thuộc :

Trong đó P(c|skin) và P(c|-skin) được tính trực tiếp từ biểu đồ màu da và không màu

da Xác suất toàn phần P(skin) và P(-skin) thì được ước lượng từ một số lượng các mẫu là màu da và không màu da trong tập mẫu huấn luyện

Bất đẳng thức P(skin|c) > Θ, trong đó Θ là một giá trị ngưỡng, có thẻ được sử dụng

để trở thành quy tắc trong phát hiện màu da Công thức trên đôi khi hơi phức tạp, và để có thể tránh điều này, nếu như thực sự không cần phải biết một cách chính xác suất P(skin|c)

Trang 25

và P(-skin|c) mà chỉ cần biết tỉ số giữa chúng thì người ta thường đưa vê công thức như sau:

P skin c P skin c P skin

P skin c = P c skin P skin

So sánh công thức này với một ngưỡng có thể tạo ra một quy tắc cho phép phát hiện

tỉ số màu da/không phải màu da Sau một vài phép biến đổi, chúng ta nhận được công thức

P c skin

P c skin

P skin K

3.1.2.2.3 Tổng kết phương pháp không tham số

Hai ưu điểm dễ thấy của phương pháp mô hình hóa phân phối không tham số đó là: thứ nhất, chúng có thể huấn luyện và sử dụng được một cách nhanh chóng Thứ hai, chúng độc lập với lý thuyết vè hình dạng của phân phối màu da (điều này không đúng trong mô hình hóa màu da có tham số) Tuy nhiên nhược điểm của phương pháp này đó là chúng yêu cầu nhiều bộ nhớ để lưu trữ và không có khả năng nội suy hay tạo ra dữ liệu huấn luyện Lấy ví dụ như, chúng ta lượng tử hóa điểm ảnh trong không gian RGB về 8bit cho mỗi màu, khi đó chúng ta phải cần một mảng có tới 224 phần tử để lưư trữ tập tất cả các xác suất của mô hình

Để có thể giảm bớt kích thước này bằng cách loại bỏ những dữ liệu huấn luyện nhỏ

lẻ, không gian màu thường sử dụng kích thước 128*128*128, 64*64*64, 32*32*32 Theo như nghiên cứu thì kích thước 32*32*32 là kích thước không gian mang lại hiệu quả cao nhất

3.1.2.3 Mô hình hóa phân phố màu da có tham số

Hầu hết các mô hình màu da không tham số dựa trên biểu đồ xám đều yêu cầu rất nhiều bộ nhớ và hiệu năng của chúng phụ thuộc hoàn toàn của tập ảnh huấn luyện cố định

Ngày đăng: 15/04/2017, 20:47

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w