Trích chọn hiệu quả các đặc điểm giúpcho việc nhận dạng các đối tượng ảnh chích xác, với tốc độ tính toán cao và dunglượng nhớ lưu trữ giảm, trích chọn các đặc trưng quan trọng của bức ả
Trang 1TRƯỜNG ĐẠI HỌC VINH KHOA ĐIỆN TỬ VIỄN THÔNG
Trang 2LỜI CẢM ƠN
Trong quá trình học tập và rèn luyện em đã được trang bị các kiến thức cơbản, chuyên môn cũng như kinh nghiệm thực tế để có thể hoàn thành tốt đồ án tốtnghiệp của mình
Trước hết em xin gửi lời cảm ơn đến thầy Th.S Đinh Văn Nam, người đãgiúp đỡ em rất nhiều về định hướng dẫn cho em trong suốt thời gian thực hiện đề tàinày
Cuốn đồ án này được thực hiện theo đúng thời gian quy định của nhàtrường cũng như của khoa không chỉ là sự nỗ lực của em mà còn có sự giúp đỡ, chỉbảo của thầy hướng dẫn, của quý thầy cô và các bạn sinh viên
Em xin chân thành cảm ơn quý thầy cô giáo trong khoa Điện tử - Viễnthông đã quan tâm, hướng dẫn, truyền đạt lại kiến thức và kinh nghiệm cho emtrong suốt quá trình học tập tại trường
Mặc dù đã cố gắng hoàn thành đồ án này song không tránh khỏi sai sót, emmong thầy cô và các bạn đóng góp những ý kiến quý báu để đồ án được thành cônghơn
Nghệ An, tháng 05 năm 2016Sinh viên thực hiện
Nguyễn Văn Hữu
Trang 3TÓM TẮT ĐỒ ÁN
Đồ án đi tìm hiểu thuật toán Viola-Jones Trong đó có các đặc trưng Like, thuật toán Adaboost và mô hình phân tầng Cascade để ứng dụng vào chươngtrình phát hiện khuôn mặt con người có trong bức ảnh hoặc trong Webcam Từ bàitoán phát hiện khuôn mặt có thể phát triển lên các ứng dụng điểm danh nhân viênhoặc điếm số lượng người …
Haar-Từ đó em đã thiết kế và mô phỏng thành công chương trình phát hiện vàđếm số khuôn mặt trên cơ sở thuật toán Viola-Jones
ABSTRACT
This thesis studying the Viola-Jones algorithm Including the Haar-Likefeatures, Adaboost algorithm and Cascade Classification Model to apply into FaceDetection Program in a picture or in a Webcam Frome the Face Detection Modelcan improve the roll-call applications or counting people
Conclution, I was designed and simulated successfully the detection andcounting Faces Programe based on Viola-Jones Algorithm
Trang 4MỤC LỤC
Hình 2.1 Độ phân giải của 1 ảnh; (a) Ảnh ban đầu có độ phân giải n=1;(b),(c), và (d) Ảnh có độ phân giải n=4, 8, và 16 24 Hình 2.4 Chuyển ảnh sang ảnh tích phân 31 Hình 2.13 Đặc trưng Haar-Like phát hiện khuôn mặt 34
Trang 5DANH MỤC BẢNG BIỂU
Hình 2.1 Độ phân giải của 1 ảnh; (a) Ảnh ban đầu có độ phân giải n=1;(b),(c), và (d) Ảnh có độ phân giải n=4, 8, và 16 24 Hình 2.4 Chuyển ảnh sang ảnh tích phân 31 Hình 2.13 Đặc trưng Haar-Like phát hiện khuôn mặt 34
Trang 6DANH MỤC HÌNH
Hình 2.1 Độ phân giải của 1 ảnh; (a) Ảnh ban đầu có độ phân giải n=1;(b),(c), và (d) Ảnh có độ phân giải n=4, 8, và 16 24 Hình 2.4 Chuyển ảnh sang ảnh tích phân 31 Hình 2.13 Đặc trưng Haar-Like phát hiện khuôn mặt 34
Trang 7CÁC TỪ NGỮ VIẾT TẮT
GPS Global Positioning System Hệ thống định vị toàn cầu
MATLAB Matrix Laboratory Phần mềm Matlab
API Application Program Interface Giao diện chương trình ứng
dụngMFL Mathematical Function Library Thư viện Chức năng toán học
DE Development Environment Tập hợp các công cụ
GUI Graphical User Interface Giao diện đồ họa
PCA Principal Component Analysis Phân tích thành phần chínhPDF Probility Density Function Hàm mật độ xác suất
ML Maximum Likelihood Phương thức cực đại khả năngSVM Support Vector Machine Máy vector hỗ trợ
AdaBoost Adaptive Boost Thuật toán AdaBoost
Trang 8MỞ ĐẦU
Hơn một thập kỷ qua có rất nhiều bài toán nghiên cứu về xử lý ảnh nhất lànhận diện khuôn mặt người từ ảnh đen trắng, xám đến ngày hôm nay là ảnh màu vànhận diện trực tiếp từ camera Các nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ
có một khuôn mặt người nhìn thẳng vào máy thu hình và đầu ở tư thế thẳng đứngtrong ảnh đen trắng Cho đến hôm nay có thể nhận diện được khuôn mặt từ ảnh màunhiều khuôn mặt trên cùng một bức ảnh và nhận diện được nhiều khuôn mặt từcamera Ngày nay việc thu thập thông tin qua ảnh để nhận biết đối tượng đang đượcquan tâm và ứng dụng rộng rãi, nhận diện khuôn mặt người từ camera là bước đầutiên quan trọng mở đầu cho các ứng dụng khác phát triển thêm Với sự phát triểncủa khoa học máy tình tạo môi trường thuận lợi cho bài toán nhận dạng khuôn mặtngười từ camera
Bài toán nhận dạng khuôn mặt người là bài toán thú vị, nó vận dụng linhhoạt các kiến thức trong nhiều lĩnh vực và có tính ứng dụng to lớn trong thực tế.Đây là một chủ đề khá mới, những ứng dụng mang tính công nghệ cao như: robot,các thiết bị theo dõi camera, các hệ thống bảo mật, nhận dạng…đã và đang đượcnhiều công ty lớn áp dụng như facebook…nhằm nâng cao sản phẩm của mình đểcạnh tranh với các công ty khác trong thị trường
Với những tính năng như vậy và từ nhu cầu thực tế, em đã chọn đề tài
“Nghiên cứu thuật toán Viola-Jones ứng dụng phát hiện và đếm khuôn mặt”.
Bài báo cáo được trình bày thành 3 chương như sau:
Chương 1: Tổng quan về công nghệ xử lý ảnh
Chương 2: Phương pháp phát hiện và nhận dạng ảnh
Chương 3: Thiết kế phần mềm và mô phỏng thuật toán phát hiện khuôn mặtNội dung của đề tài:
- Tìm hiểu phương pháp nhận diện ảnh
- Nghiên cứu thuật toán Viola-Jones
- Dò tìm mặt người
- Đếm số lượng khuôn mặt
Do khả năng và thời gian còn hạn chế nên đồ án này không tránh khỏi sai sót,mong nhận được sự góp ý của thầy cô và các bạn để đồ án được hoàn thiện hơn
Trang 9Em xin chân thành cảm ơn ThS Đinh Văn Nam đã tận tình hướng dẫn vềchuyên môn, phương pháp làm việc để em có thể hoàn thành đồ án theo kế hoạchđặt ra Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo, các bạn trong KhoaĐiện tử Viễn thông đã tạo mọi điều kiện giúp em hoàn thành đồ án này.
Nghệ An, tháng 05 năm 2016Sinh viên thực hiện
Nguyễn Văn Hữu
Trang 10CHƯƠNG 1 TỔNG QUAN VỀ CÔNG NGHỆ XỬ LÝ ẢNH
1.1 Giới thiệu về xử lý ảnh
Xử lý ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thì giácmáy tính, là tiền đề cho nhiều nghiên cứu thuộc lĩnh vực này Hai nhiệm vụ cơ bảncủa quá trình xử lý ảnh là nâng cao chất lượng thông tin ảnh và xử lý số liệu cungcấp cho các quá trình khác trong đó việc ứng dụng thị giác vào điều khiển
Quá trình bắt đầu từ việc thu nhận ảnh nguồn (từ các nguồn thu nhận ảnhdạng số hoặc tương tự) gửi đến máy tính Dữ liệu ảnh được lưu trữ dưới dạng phùhợp với quá trình xử lý Người lập trình sẽ tác động các thuật toán tương ứng lêngiữ liệu ảnh nhằm thay đổi cấu trúc phù hợp với các ứng dụng khác nhau
Quá trình xử lý nhận dạng được xem như là quá trình thao tác ảnh đầu vàonhằm cho kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể làmột bức ảnh đã được xử lý hoặc một kết luận
Hình 1.1 Quá trình xử lý ảnh
Con người thu nhận thông tin qua các giác quan rồi đưa các thông tin đó lênnão bộ để xử lý, trong đó thị giác đóng vai trò quan trọng nhất Trong những nămgần đây xử lý ảnh có đã phát triển một cách mạnh mẽ và có nhiều ứng dụng trongcuộc sống Xử lý ảnh đóng vai trò quan trọng trong sự tương tác người máy Quátrình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho kết quả
Các phương phát xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao chấtlượng ảnh và phân tích ảnh Ứng dụng đầu tiên được biết đến là nâng cao chấtlượng ảnh báo được truyền đi bằng cáp từ Luân Đôn đến New York từ năm 1920.Vấn đề nâng cao chất lượng ảnh có liên quan đến phân bố mức độ sang và độ phângiải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng năm 1955.Điều này có thể giải thích được vì sau thế chiến thứ 2, máy tính phát triển nhanh tạođiều kiện cho xử lý ảnh thuận lợi Năm 1964 máy tính đã có khả năng xử lý và nângcao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổiđường biên và lưu ảnh Từ năm 1964 đến nay, các phương tiện xử lý ảnh, nâng cao
Ảnh được xử lý
Kết Luận
Trang 11chất lượng phát triển và nhận dạng ảnh phát triển không ngừng Các phương phát trithức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến,các công cụ nén ảnh được xử dụng rộng rãi và thu được nhiều kết quả khả quan.
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như làđặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đốitượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2, , cn) Do
đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều
Hình 1.2 Sơ đồ tổng quát của một hệ thống xử lý ảnh
- Khối thu nhận ảnh: Có nhiệm vụ tiếp ảnh đầu vào.
- Khối tiền xử lý: Là giai đoạn đầu tiên của xử lý ảnh số Tùy thuộc vào quá
trình tiếp theo trong công đoạn này sẽ thực hiện các công đoạn khác nhau như nhiệm
vụ nâng cao chất lượng ảnh như giảm nhiễu, khôi phục ảnh, phân vùng, tìm biên…
- Khối trích chọn đặc điểm: Các đặc điểm của đối tượng được trích chọn tùy
theo mục đích nhận dạng trong xử lý ảnh Trích chọn hiệu quả các đặc điểm giúpcho việc nhận dạng các đối tượng ảnh chích xác, với tốc độ tính toán cao và dunglượng nhớ lưu trữ giảm, trích chọn các đặc trưng quan trọng của bức ảnh đã đượctiền xử lý để sử dụng trong hệ quyết định
- Khối hậu xử lý: Có nhiệm vụ xử lý các đặc điểm đã trích chọn, có thể lược
bỏ hoặc biến đổi các đặc điểm này để phù hợp với các kỹ thuật cụ thể sử dụng trong
hệ quyết định
- Khối hệ quyết định và lưu trữ: Có nhiệm vụ đưa quyết định và phân loại
dựa trên dữ liệu đã học lưu trong khối lưu trữ
- Khối quyết định: Đưa ra kết luận
1.2 Nhận dạng ảnh
Trang 12Nhận dạng ảnh là quá trình phân loại các đối tượng biểu diễn theo một môhình nào đó và gán chúng vào một lớp theo những quy luật và mẫu chuẩn Quá trìnhnhận dạng dựa vào những mẫu học biết trước gọi là nhận dạng có thầy hay Học có
giám sát; trong trường hợp ngược lại gọi là Học không giám sát Quá trình nhận
dạng gồm 3 giai đoạn chính:
- Lựa chon mô hình biểu diễn đối tượng
- Lựa chọn ra luật quyết định (phương pháp nhận dạng) và suy diễn quátrình học
- Học nhận dạng
Khi mô hình biểu diễn đã được xác định có thể định lượng (mô hình thamsố), có thể định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạnhọc Học là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việcphân hoạch tập đối tượng thành các lớp Việc nhận dạng chính là tìm ra quy luật vàcác thuật toán để có thể gán đối tượng vào một lớp hay nói một cách khác gán chođối tượng một tên
Học có giám sát là kỹ thuật phân loại nhờ kiến thức biết trước Đặc điểm cơbản của kỹ thuật này là người ta có một thư viện các mẫu chuẩn Mẫu cần nhậndạng sẽ được đem sánh với mẫu chuẩn để xem nó thuộc loại nào Vấn đề chủ yếu làthiết kế một hệ thống có thể đối sách đối tượng trong ảnh với mẫu chuẩn và quyếtđịnh gán chúng vào một lớp
Học không giám sát, kỹ thuật học này phải tự định ra các lớp khác nhau vàxác định các tham số đặc trưng cho từng lớp Kỹ thuật này khá khó khăn vì do sốlớp không được biết trước và các đặc trưng của các lớp cũng không được biết trước
Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn cách tốt nhất Bắtđầu từ tập dữ liễu, nhiễu thủ tục xử lý khác nhau nhằm phân lớp và phân cấp nhằm
để đạt được một phương phát phân loại
Nhìn chung, dù là mô hình nào hay kỹ thuật nhận dạng nào thì một hệ thốngnhận dạng có sơ đồ như sau:
Hình 1.3 Sơ đồ tổng quát của một hệ thống nhận dạng
Trang 13Xử lý ảnh thực chất là việc thực hiện cái tính toán trên từng pixel của ảnh.
Xử lý ảnh nhằm giải quết các bài toán:
- Đo lường đối tượng: Xác định vết nứt trên tường từ camera, đo lường kích
cỡ chân ic, đo khoảng cách từ đối tượng đến camera, đo lường nhịp tim, nhiệt độ…
- Bám đối tượng: Sử dụng máy bay không người lái bán theo đối tượng nào
đó, sử dụng camera để giám sát đối tượng trong một phạm vi nhất định…
- Nhận dạng: Nhận dạng biển số xe, nhận dạng mặt người, nhận dạng dấuvân tay, nhận dạng đám cháy, nhận dạng chữ viết…
- Phân loại: Phân loại sản phẩm theo màu sắc kích cỡ, đánh giá chất lượngnông sản
- Xây dựng phần mềm xử lý ảnh chuyên nghiệp như photoshop, camera360…
- Trong lĩnh vực quân sự: các hệ thống có tích hợp quang hồng ngoại có khảnăng tự động điều khiển dàn hỏa lực được đặt trên trên địa cao xạ, trên xe tăng, tàuchiến, máy bay, vệ tinh… Chúng được thanh thế, hỗ trợ các dàn radar dễ bị nhiễutrong việc tự động phát hiện, cảnh giới và bám sát mục tiêu Đặc biệt có những loạilắp trên máy bay có khả năng điều khiển hỏa lực đánh phá hàng chục mục tiêu cùngmột lúc và các đầu tự dẫn tên lửa và đạn thông minh
- Trong lĩnh vực an ninh và phòng chống tội phạm: Các hệ thống nhận dạngkhuôn mặt, nhận dạng vân tay tự động và phát hiện theo dõi cảnh bảo các âm mưu
và hoạt động của bọn khủng bố Các Robot tự hành được gắn camera cũng được sửdụng trong các môi trường độc hại, dò phá bom mìn và những nơi mà con ngườikhông thể đến được
Trang 14Hình 1.4 Robot được gắn camera
- Trong lĩnh vực hàng không vũ trụ: Các hệ thống ống kính chụp ảnh viễnthám lắp trên các vệ tinh bay quanh trái đất có thể chụp và quan sát được các vậtnhỏ kích cỡ 0.5m từ độ cao 750 Km Việc ghép nối các ống kính này với hệ thốngGPS (Global Positioning System, hệ thống định vị toàn cầu) sẽ cho phép xây dựngcác bản đồ số được ứng dụng vào nhiều lĩnh vực cực kỳ quan trọng trong an ninhquốc phòng, phát triển xã hội
- Trong lĩnh vực công nghiệp, giao thông, xây dựng: Hệ thống quang điện
tử đóng trong vai trò thị giác máy có khả năng tự động đo đạc kiểm tra chất lượngsản phẩm trong các dây chuyền sản xuất Các hệ thống quang điện tử được ứngdụng nhiều trong giao thông như đo tốc độ, tự động kiểm soát điều khiển và phânluồng giao thông
Hình 1.5 Camera bắn tốc độ
- Trong công nghiệp giải trí, truyền hình: Các hệ thống tích hợp tự độngđiều khiển Camera kích thước và khối lượng lớn bám theo các đối tượng chuyếnđộng nhanh như các cuộc đua xe, bóng bay
1.2 Giới thiệu về ảnh
1.4.1 Ảnh số
Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gầnvới ảnh thật Ảnh là một sự vật đại diện cho con người, sinh vật hay sự vật nào đó…ảnh động như ta thấy trên truyền hình thực chất là tập hợp của rất nhiều ảnh tĩnhliên tiếp Khi một ảnh được số hóa thì nó trở thành ảnh số và ảnh số này lại là mộttập hợp của rất nhiều phần tử ảnh được gọi là điểm ảnh hay là “pixel” Mỗi điểm
Trang 15ảnh lại được biểu diễn dưới dạng một số hữu hạn các bit Số điểm ảnh xác định độphân giải của ảnh Ảnh có độ phân giải càng cao thì càng thể diện rõ nét các đặcđiểm của tấm hình càng làm cho tấm ảnh trở nên thực và sắc nét hơn Ta có thể chiaảnh ra làm ba phần khác nhau:
- Ảnh đen trắng: Mỗi điểm ảnh được biểu diễn bởi một bit
- Ảnh Gray-scale: Mỗi điểm ảnh được biểu diễn bằng các mức chói khácnhau, thưởng thì ảnh này được biểu diễn bằng 256 mức chói hay là 8 bit cho mỗiđiểm ảnh
- Ảnh màu: Mỗi điểm ảnh chia ra thành tín hiệu chói và tín hiệu màu
1.4.2 Biểu diễn ảnh số
Trong biểu diễn ảnh người ta thường dùng các phần tử đặc trưng của ảnh làpixel Nhìn chung có thể xem một hàm hai biến chứa các thông tin biểu diễn củamột ảnh Các mô hình biểu diễn ảnh cho ta một mô ta logic hay định lượng các tínhchất của hàm này Việc xử lý ảnh số phải được lấy mẫu và lượng tử hóa Việc lượng
tử hóa là chuyển đổi tín hiệu tương tự sang tín hiệu số của một ảnh đã lấy sang một
số hữu hạn mức xám Một số mô hình bình thường dùng biểu diễn ảnh: mô hìnhtoán, mô hình thống kê
Phương trình màu:
Trang 16Các đặc trưng để phân biệt một màu với màu khác là : Độ sáng (Brightness),sắc màu (Hue) và độ bão hòa màu (Saturation).
- Màu sắc có liên quan đến bước sóng ánh sáng Thông thường, sắc màuchính là tên của màu
- Độ sáng thể hiện về cường độ ánh sáng: Mô tả nó sáng hay tối như thếnào
- Độ bão hòa màu : Thể hiện độ thuần khiết của màu Khi độ bão hòa cao,màu sẽ sạch và rực rỡ hơn
Có nhiều mô hình màu như RGB, CYM, YIQ, CIE… Ở đây em chỉ trình bày
về mô hình màu RGB
Trang 17Hình 1.7 Mô hình màu RGB
Các màu Red, Green, Blue nằm ở các đỉnh trên trục tọa độ của khối vuông.Màu đen nằm ở gốc tọa độ, màu trắng nằm ở góc xa nhất so với điểm gốc Thangmàu xám kéo dài từ đen đến trắng
Hình ảnh trong mô hình màu RGB bao gồm 3 mặt phẳng ảnh độc lập (dùngcho các màu sơ cấp)
Thường thì ta giả thiết tất cả cá giá trị màu được chuẩn hóa (tức khối vuông
là đơn vị ), tất cả cá giá trị màu nằm trong khoảng [0,1]
Vì vậy trong hệ màu RGB cá màu có thể mô tả như là những điểm bên tronghình lập phương Ở gốc tọa độ (0; 0; 0) là màu đen Trên các trục tọa độ dương làcác màu đỏ lục, lam Khi đó ánh sáng từ các điểm riêng biệt sẽ được cộng với nhau
để tạo ta các màu khác nhau
- (0, 0, 0) là màu đen
- (255, 255, 255) là màu trắng
- (255, 0, 0) là màu đỏ
- (0, 255, 0) là màu xanh lá cây
- (0, 0, 255) là màu xanh lam
- (255, 255, 0) là màu vàng
- (0, 255, 255) là màu xanh ngọc
- (255, 0, 255) là màu hồng sẫm
1.4.4 Các định dạng ảnh cơ bản trong xử lý ảnh
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử
lý tiếp theo hay truyền đi Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tạinhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấpxám cho đến ảnh màu: (BMP, GIF, JPEG…)
- Định dạng ảnh IMG là ảnh đen trắng Phần đầu của IMG có 16 byte chứathông tin
Trang 18- Định dạng ảnh GIF: GIF (viết tắt của Graphics Interchange Format; trong
tiếng Anh nghĩa là "Định dạng Trao đổi Hình ảnh") là một định dạng tập tin hìnhảnh bitmap cho các hình ảnh dùng ít hơn 256 màu sắc khác nhau và các hoạt hìnhdùng ít hơn 256 màu cho mỗi khung hình GIF là định dạng nén dữ liệu đặc biệthữu ích cho việc truyền hình ảnh qua đường truyền lưu lượng nhỏ Định dạng nàyđược CompuServe cho ra đời vào năm 1987 và nhanh chóng được dùng rộng rãitrên World Wide Web cho đến nay Tập tin GIF dùng nén dữ liệu bảo toàn trong đókích thước tập tin có thể được giảm mà không làm giảm chất lượng hình ảnh, chonhững hình ảnh có ít hơn 256 màu Số lượng tối đa 256 màu làm cho định dạng nàykhông phù hợp cho các hình chụp (thường có nhiều màu sắc), tuy nhiên các kiểunén dữ liệu bảo toàn cho hình chụp nhiều màu cũng có kích thước quá lớn đối vớitruyền dữ liệu trên mạng hiện nay Định dạng JPEG là nén dữ liệu thất thoát có thểđược dùng cho các ảnh chụp, nhưng lại làm giảm chất lượng cho các bức vẽ ít màu,tạo nên những chỗ nhòe thay cho các đường sắc nét, đồng thời độ nén cũng thấpcho các hình vẽ ít màu Như vậy, GIF thường được dùng cho sơ đồ, hình vẽ nút bấm
và các hình ít màu, còn JPEG được dùng cho ảnh chụp Định dạng GIF dựa vào cácbảng màu: một bảng chứa tối đa 256 màu khác nhau cho biết các màu được dùngtrong hình
Trang 19nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ nhữngthông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắtngười Phần mở rộng của các file JPEG thường có dạng jpeg, jfif, jpg, JPG, hay.JPE; dạng jpg là dạng được dùng phổ biến nhất Hiện nay dạng nén ảnh JPEG rấtđược phổ biến trong điện thoại di động cũng như những trang thiết bị lưu giữ códung lượng nhỏ
Công đoạn chính là chia nhỏ bức ảnh thành nhiều vùng nhỏ (thông thường lànhững vùng 8x8 pixel) rồi sử dụng biến đổi cosin rời rạc để biến đổi những vùngthể hiện này thành dạng ma trận có 64 hệ số thể hiện "thực trạng" các pixel Điềuquan trọng là ở đây hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khảnăng đó giảm rất nhanh với các hệ số khác Nói cách khác thì lượng thông tin của
64 pixels tập trung chủ yếu ở một số hệ số ma trận theo biến đổi trên Trong giaiđoạn này có sự mất mát thông tin, bởi không có biến đổi ngược chính xác Nhưnglượng thông tin bị mất này chưa đáng kể so với giai đoạn tiếp theo Ma trận nhậnđược sau biến đổi cosin rời rạc được lược bớt sự khác nhau giữa các hệ số Đâychính là lúc mất nhiều thông tin vì người ta sẽ vứt bỏ những thay đổi nhỏ của các hệsố
Như thế khi bung ảnh đã nén ta sẽ có được những tham số khác của cácpixel Các biến đổi trên áp dụng cho thành phần U và V của ảnh với mức độ caohơn so với Y (mất nhiều thông tin của U và V hơn) Sau đó thì áp dụng phươngpháp mã hóa của Gernot Hoffman: Phân tích dãy số, các phần tử lặp lại nhiều được
mã hóa bằng ký hiệu ngắn (marker) Khi bung ảnh người ta chỉ việc làm lại các
bước trên theo quá trình ngược lại cùng với các biến đổi ngược
Trang 20Hình 1.9 Ảnh dạng JPEG
1.4.5 Pixel và các vấn đề liên quan
Ảnh tự nhiên là ảnh liên tục về không gian và độ sáng Để xử lý bằng máytính (số), ảnh cần phải được số hóa Số hóa là sự biến đổi gần đúng một ảnh liên tụcthành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mứcxám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người khôngphân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL:Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixelứng với cặp tọa độ (x,y)
Vậy điểm ảnh là một phần tử cảu ảnh số tọa độ (x, y) với độ xám hoặc màunhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợpsao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) củaảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
Bảng 1.1 Pixel p và các pixel lân cận của p
Trang 21Bảng 1.2 Pixel p và các pixel lân cận theo chiều dọc và chiều ngang
Ngoài 4 pixel lân cận của p theo chiều dọc và chiều ngang, xung quanh pcòn có 4 pixel chéo góc có các tọa độ tương ứng là
Bảng 1.3 Pixel p và các pixel lân cận chéo góc
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đốitượng vật thể hoặc xác định vùng trong một ảnh Một liên kết được đặc trưng bởitính liền kề giữa các điểm và mức xám của chúng
Giả sử V là tập các giá trị mức xám Một ảnh có các giá trị cường độ sáng từthang mức xám từ 32 đến 64 được mô tả như sau:
V = {32,33,….,64} (1.2)
Có 3 loại liên kết đó là
- Liên kết 4: Hai điểm ảnh p và q được nói là liên kết 4 với các giá trị cường
độ sáng V nếu q nằm trong một cá lân cận của p, tức q thuộc N4(p)
- Liên kết 8: Hai điểm ảnh p và q nằm trong một các lân cận 8 của p, tức qthuộc N8(p)
- Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường
độ sáng V được nói là liên kết m nếu
Trang 221.q thuộc N4(p) hoặc
2.q thuộc NP(p)
Đo khoảng cách giữa các điểm ảnh
Định nghĩa: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa độ (s,t) là hàm.Khoảng cách (Distance) hoặc Metric nếu :
1 D(p,q) ≥ 0 (với D(p,q) = 0 khi và chỉ khi p=q)
D8(p,q) = max( |x-s| , |y-t| ) (1.5)
Trang 23CHƯƠNG 2 PHƯƠNG PHÁP PHÁT HIỆN KHUÔN MẶT
2.1 Phương pháp phát hiện khuôn mặt
2.1.1 Khái niệm phát hiện khuôn mặt
Phát hiện khuôn mặt (Face Detection) là một kỹ thuật máy tính để xác định
vị trí kích thước của mặt người trong các bức ảnh hay video Kỹ thuật này nhận biếtđược các đặc trưng của khuôn mặt mà bỏ qua các thứ khác như: Động vật, nhà , câycối…
2.1.2 Các phương pháp phát hiện khuôn mặt
Có nhiều phương pháp phát hiện khuôn mặt người, từ ảnh xám đến nay làảnh màu Dựa vào các tính chất của các phương pháp phát hiện khuôn mặt trên ảnh.Các phương pháp này được dựa trên 4 hướng tiếp cận chính Ngoài bốn hướng này,nhiều nghiên cứu có khi liên quan đến không những một hướng tiếp cận mà có liênqua nhiều hơn một hướng chính:
- Hướng tiếp cận dựa trên tri thức: Mã hóa cái hiểu biết của con người vềcác loại khuôn mặt thành các luật Thông thường các luật mô tả quan hệ của các đặctrưng
- Hướng tiếp cận dựa trên so khớp mẫu: Dùng các mẫu chuẩn của khuônmặt người (các mẫu này được chọn lựa và lưu trữ) để mô tả khuôn mặt người haycác đặc trưng của khuôn mặt (các mẫu này phải được lựa chọn làm sao cho tách biệtnhau theo tiêu chuẩn mà tác giả định ra để so sánh) Các mối quan hệ giữa dữ liệuảnh đưa vào và các mẫu dùng để xác định khuôn mặt con người
- Hướng tiếp cận dựa trên các đặc trưng không thay đổi: Mục tiêu của thuậttoán đi tìm các đặc trưng mô tả cấu trúc khuôn mặt người mà các đặc trưng này sẽkhông thay đổi khi tư thế khuôn mặt, vị trí đặt thiết bị thu hình hoặc ánh sáng thayđổi
- Hướng tiếp cận dựa trên diện mạo: Trái ngược hẳn với mô hình so khớpmẫu, các mô hình hay các mẫu được học từ các ảnh được tập huấn luyện trước đó.Sau khi hệ thống mô hình sẽ xác định khuôn mặt người Hay một số tác giả còn gọihướng tiếp cận này là hướng tiếp cận theo phương pháp học
a Hướng tiếp cận dựa trên tri thức
Trang 24Trong hướng tiếp cận này, các luật sẽ phụ thuộc rất lớn vào tri thức củanhững tác giả nghiên cứu về bài toán xác định khuôn mặt người Đây là hướng tiếpcận dạng top-down Dễ dàng xây dựng các luật cơ bản để mô tả các đặc trưng củakhuôn mặt và các quan hệ tương ứng Ví dụ, một khuôn mặt thường có hai mắt đốixứng nhau qua trục thẳng đứng ở giữa khuôn mặt và có một mũi, một miệng Cácquan hệ của các đặc trưng có thể được mô tả như quan hệ về khoảng cách và vị trí.Thông thường các tác giả sẽ trích đặc trưng của khuôn mặt trước tiên để có đượccác ứng viên, sau đó các ứng viên này sẽ được xác định thông qua các luật để biếtứng viên nào là khuôn mặt và ứng viên nào không phải khuôn mặt Thường áp dụngquá trình xác định để giảm số lượng xác định sai.
Một vấn đề khá phức tạp khi dùng hướng tiếp cận này là làm sao chuyển từtri thức con người sang các luật một các hiệu quả Nếu các luật này quá chi tiết (chặtchẽ) thì khi xác định có thể xác định thiếu các khuôn mặt có trong ảnh, vì nhữngkhuôn mặt này không thể thỏa mãn tất cả các luật đưa ra Nhưng các luật tổng quátquá thì có thể chúng ta sẽ xác định lầm một vùng nào đó không phải là khuôn mặt
mà lại xác định là khuôn mặt Và cũng khó khăn mở rộng yêu cầu từ bài toán để xácđịnh các khuôn mặt có nhiều tư thế khác nhau
Có hai tác giả Yang và Huang đã dùng một phương thức theo hướng tiếp cậnnày để xác định các khuôn mặt Hệ thống của hai tác giả này bao gồm ba mức luật
Ở mức cao nhất, dùng một khung cửa sổ quét trên ảnh và thông qua một tập luật đểtìm các ứng viên có thể là khuôn mặt Ở mức kế tiếp, hai ông dùng một tập luật để
mô tả tổng quát hình dáng khuôn mặt Còn ở mức cuối cùng lại dùng một tập luậtkhác để xem xét ở mức chi tiết các đặc trưng khuôn mặt Một hệ thống đa độ phângiải có thứ tự được dùng để xác định (hình 2.2)
Trang 25Hình 2.1 Độ phân giải của 1 ảnh; (a) Ảnh ban đầu có độ phân giải n=1;(b),(c), và
(d) Ảnh có độ phân giải n=4, 8, và 16.
Các luật ở mức cao nhất để tìm ứng viên như: “vùng trung tâm khuôn mặt(phần tối hơn trong hình 2.3) có bốn phần với một mức độ đều cơ bản”, “phần xungquanh bên trên của một khuôn mặt (phần sáng hơn trong hình 2.3) có một mức độđều cơ bản” và “mức độ khác nhau giữa các giá trị xám trung bình của phần trung
tâm và phần bao bên trên là đáng kể” Độ phân giải thấp nhất (mức mộ) của ảnh
dùng để tìm ứng viên khuôn mặt mà còn tìm ở các mức phân giải tốt hơn Ở mứchai, xem xét biểu đồ histogram của các ứng viên để loại bớt ứng viên nào khôngphải là khuôn mặt, đồng thời dò ra cạnh bao xung quanh ứng viên Ở mức cuốicùng, những ứng viên nào còn lại sẽ được xem xét các đặc trưng của khuôn mặt vềmắt và miệng Hai ông đã dùng một chiến lược “từ thô đến mịn” hay “làm rõ dần”
để giảm số lượng tính toán trong xử lý Mặc dù tỷ lệ chính xác chưa cao, nhưng đây
là tiền đề cho nhiều nghiên cứu sau này
Hình 2.2 Một loại trí thức của người nghiên cứu phân tích trên khuôn mặt
b Hướng tiếp cận dựa trên so khớp mẫu
Trong so khớp mẫu, các mẫu chuẩn của khuôn mặt (thường là khuôn mặtđược chụp thẳng) sẽ được xác định trước hoặc xác định các tham số thông qua mộthàm Từ một ảnh đưa vào, tính các giá trị tương quan so với các mẫu chuẩn vềđường viền khuôn mặt, mắt, mũi và miệng
Thông qua các giá trị tương quan này mà các tác giả quyết định có haykhông có tồn tại khuôn mặt trong ảnh Hướng tiếp cận này có lợi thế là rất dễ càiđặt, nhưng không hiệu quả khi tỷ lệ, tư thế và hình dáng thay đổi (đã được chứngminh) Nhiều độ phân giải, đa tỷ lệ, các mẫu con và các mẫu biến dạng được xemxét thành bất biến về tỷ lệ và hình dáng
Trang 26Hình chiếu được dùng như các mẫu để xác định khuôn mặt người DùngPCA (phân tích thành phần chính - Principal Component Analysis - PCA) để có mộttập hình chiếu cơ bản từ các mẫu khuôn mặt, hình chiếu được mô tả như một mảngcác bit Dùng đặc trưng hình chiếu riêng kết hợp biến đổi Hough để xác định khuônmặt người
Sau đó một phương pháp xác định dựa trên đa loại mẫu để xác định cácthành phần của khuôn mặt được trình bày Phương pháp này định nghĩa một số giảthuyết để mô tả các khả năng của các đặc trưng khuôn mặt Với một khuôn mặt sẽ
có một tập giả thuyết, lý thuyết DepsterShafer Dùng một nhân tố tin cậy để kiểmtra sự tồn tại hay không của các đặc trưng của khuôn mặt và kết hợp nhân tố tin cậynày với một độ đo để xem xét có hay không có khuôn mặt trong ảnh
Hình 2.3 Một mẫu khuôn mặt, có 16 vùng và 23 quan hệ (các mũi tên)
c Hướng tiếp cận dựa trên các đặc trưng không thay đổi
Đây là hướng tiếp cận theo kiểu Bottom-up Các tác giả cố gắng tìm các đặctrưng không thay đổi của khuôn mặt người để xác định khuôn mặt người Dựa trênnhận xét thực tế, con người dễ dàng nhận biết các khuôn mặt và các đối tượng trongcác tư thế khác nhau và điều kiện ánh sáng khác nhau, thì phải tồn tại các thuộc tínhhay các đặc trưng không thay đổi Có nhiều nghiên cứu đầu tiên xác định các đặctrưng khuôn mặt rồi chỉ ra có khuôn mặt trong ảnh hay không Các đặc trưng như:Lông mày, mắt, mũi và đường viền của tóc được trích bằng phương pháp xác địnhcạnh Trên cơ sở các đặc trưng này, xây dựng một mô hình thống kê để mô tả quan
hệ của các đặc trưng này và xác định sự tồn tại của khuôn mặt trong ảnh Một vấn
đề của các thuật toán theo hướng tiếp cận đặc trưng cần phải điều chỉnh cho phùhợp điều kiện ánh sáng, nhiều và bị che khuất Đôi khi bóng của khuôn mặt sẽ tạo
Trang 27thêm cạnh mới, mà các cạnh này lại rõ hơn cạnh thật sự của khuôn mặt, vì thế nếudùng cạnh để xác định sẽ gặp khó khăn.
Một số phương pháp xác định các đặc trưng của khuôn mặt có tỷ lệ chínhxác cao:
- Phương pháp xác định khuôn mặt từ một ảnh có hình nền phức tạp.Phương pháp này dựa trên cạnh (dùng phương pháp Candy và Heuristics) để loại bỏcác cạnh để còn lại duy nhất một đường bao xung quanh khuôn mặt Tỷ lệ chính xáccủa thuật toán là 80%
- Phương pháp xác định khuôn mặt trong ảnh xám Dùng bộ lọc để làm nổicác biên, các phép toán hình thái học (morphology) được dùng để làm nổi bật cácvùng có cường độ cao và hình dáng chắc chắn (như mắt) Thông qua histogram đểtìm các đỉnh nổi bật để xác định các ngưỡng chuyển ảnh xám thành hai ảnh nhịphân Các thành phần dính nhau đều xuất hiện trong hai ảnh nhị phân thì được xem
là vùng của ứng viên khuôn mặt rồi phân loại xem có phải là khuôn mặt không.Phương pháp được kiểm tra trên các ảnh chỉ có đầu và vai của người Tuy nhiên cònvấn đề, làm sao sử dụng các phép toán morphology và làm sao xác định khuôn mặttrên các vùng ứng viên
- Phương pháp xác định khuôn mặt dựa mô hình xác suất để xác định khuônmặt ở trong ảnh có hình nền phức tạp trên cơ sở một bộ xác định đặc trưng cục bộ
và so khớp đồ thị ngẫu nhiên Ý chính là xem bài toán xác định khuôn mặt như làbài thóa tìm kiếm với mục tiêu là tìm thứ tự các đặc trưng chắc chắn của khuôn mặt
để tạo thành giống nhất một mẫu khuôn mặt Dùng năm đặc trưng (hai mắt, hai lỗmũi, phần nối giữa mũi và miệng) để mô tả một khuôn mặt Luôn tính quan hệkhoảng cách với các đặc trưng cặp (như mắt trai, mắt phải), dùng phân bố Gauss để
mô hình hóa Một mẫu khuôn mặt được đưa ra thông qua trung bình tương ứng chomột tập đa hướng, đa tỷ lệ của bộ lọc đạo hàm Gauss Từ một ảnh, các đặc trưngứng viên được xác định bằng cách so khớp từng điểm ảnh khi lọc tương ứng vớivector mẫu (tương tự mối tương quan), chọn hai ứng viên đặc trưng đứng đầu đểtìm kiếm cho các đặc trưng khác của khuôn mặt Giống như xây dựng một đồ thìquan hệ mỗi node của đồ thị tương ứng như các đặc trưng của một khuôn mặt, đưaxác suất vào để xác định Tỷ lệ xác định chính xác là 86%
- Phương pháp xác định khuôn mặt dùng lý thuyết xác suất thống kê về hìnhdáng Dùng hàm mật độ xác suất (Probility Density Function – PDF) qua N điểm
Trang 28đặc trưng, tương ứng (xi, yi) là đặc trưng thứ i với giả sử dựa vào phân bố Gauss có2N- chiều Các tác giả áp dụng phương thức cực đại khả năng (MaximumLikelihood-ML) để xác định vị trí khuôn mặt Một thuận lợi của phương pháp này
là cá khuôn mặt bị che khuất vẫn có thể xác định được Nhưng phương pháp khôngxác định được đa khuôn mặt trong ảnh
- Phương pháp xác định khuôn mặt dựa vào đặc trưng, dùng số lượng lớncác dấu hiệu từ ảnh và cả dầu hiệu về ngữ cảnh Đầu tiên dùng bộ lọc đạo hàmGauss thứ hai, xác định các điểm mấu chốt ở tại cực đại địa phương trong bộ lọc,rồi chỉ ra nơi có thể là đặc trưng Giai đoạn hai, kiểm tra các cạnh xung quanh điểmmấu chốt và nhóm chúng lại thành các vùng Tiêu chuẩn để nhóm các cạnh là gần
và tương tự hướng và cường độ Đo lường các đặc tính vùng như: chiều dài cạnh,cường độ cạnh và biến thiên cường độ được lưu trong một vector đặc trưng Từ dữliệu đậc trưng khuôn mặt đã được huấn luyện, sẽ tính được giá trị trung bình và matrận hiệp phương sai của mỗi đặc trưng khuôn mặt Một cùng là ứng viên khuôn mặtkhi khoảng cách Mahalanobis giữa các vector đặc trưng đều dưới một ngưỡng Rồithông qua mạng Bayes để xác định ứng viên có phải là khuôn mặt không Tỷ lệchính xác là 85%, tuy nhiên mức độ sai là 28% và chỉ hiệu quả với hình khuôn mặt
có kích thước 60x60 điểm ảnh Phương pháp này được dùng thêm với mô hìnhđường viền linh hoạt
- Phương pháp xác định khuôn mặt dựa trên tính đặc trưng võng mạc và cửđộng theo dao động nhỏ của mắt Thuật toán hoạt động trên bản đồ hay vùng củacác mấu chốt, mô hình hóa lưới võng mạc Đầu tiên tính toán ước lượng thô vùngkhuôn mặt trên cơ sở bộ lọc Giai đoạn thứ hai tinh chế trên độ phân giải mịn hơn
Tỷ lệ sai là 4.69%
- Phương pháp xác định khuôn mặt dựa trên cơ sở hình thái học(morphology) để trích cá đoạn giống mắt (eye-analogue) để xác định khuôn mặtngười Phương pháp này cho rằng mắt và lông mày là đặc trưng nổi bật nhất và ổnđịnh nhất của khuôn mặt con người Các đoạn giống mắt như là các cạnh trênđường viền của mắt Đầu tiên, các phép toán morphology như đóng, cắt bỏ sai khác
và phân ngưỡng để trích các điểm ảnh có giá trị cường độ thay đổi đáng kể Cácđiểm ảnh này sẽ trở thành các điểm ảnh giống mắt Sau đó một tiến trình gán nhãn
để sinh các đoạn giống mắt Các đoạn này được dùng để chỉ dẫn tìm kiếm các vùngtiềm năng có thể là khuôn mặt qua kết hợp các đặc tính hình học của mắt, mũi, lông
Trang 29mày và miệng Các vùng này sẽ được một mạng neural xem xét có phải là khuônmặt không Tỷ lệ chính xác là 94%.
- Phương pháp xác định khuôn mặt dựa trên hình dáng và áp dụng cho cáckhuôn mặt chụp thẳng Có hai giai đoạn để xác định khuôn mặt người: tập trung vàphân loại chi tiết Làm có thứ tự các mảnh cạnh, các mảnh này được trích từ bộ xácđịnh cạnh đơn giản thông qua sự khác biệt cường độ là quá trình tập trung Khi cócác ứng viên từ quá trình trên, dùng thuật toán CART để xây dựng một cây phânloại từ các ảnh để huấn luyện, để xem xét ứng viên nào là khuôn mặt người
- Phương pháp xác định khuôn mặt dùng cấu trúc hình học của khuôn mặtngười để tìm ứng viên khuôn mặt trong ảnh xám và hình nền không phức tạp Mỗiảnh chỉ có một khuôn mặt người, nhưng tư thế điều kiện ánh sáng, không cố định
Tỷ lệ chính xác khỏang 94.25% và thời gian khá nhanh
- Phương pháp xác định khuôn mặt dùng sắc màu của da người để tìm ứngviên, bằng cách dùng mô hình màu da người trên từng phần nhỏ rồi xử lý phân đoạntrên đó Sau khi có ứng viên khuôn mặt, dùng một số đặc tính về hình dáng để xácđịnh khuôn mặt người Tỷ lệ chính xác là 85%
Khuôn mặt con người có những kết cấu riêng biệt mà có thể dùng để phânloại so với các đối tượng khác Có một số nhà nghiên cứu cho rằng hình dạng củakhuôn mặt dùng làm kết cấu phân loại, gọi là kết cấu giống khuôn mặt (face-liketexture) Tính kết cấu qua các đặc trưng thống kê thứ tự thứ hai (SGLD) trên vùng
có kích thước 16x16 điểm ảnh Có ba loại đặc trưng được xem xét: màu da, tóc vànhững thứ khác
Thông thường các ảnh màu không xác định trực tiếp trên toàn bộ dữ liệu ảnh
mà các tác giả dùng tính chất sắc màu của da người (khuôn mặt người) để chọn rađược các ứng viên có thể là khuôn mặt người (lúc này dữ liệu đã thu hẹp đáng kể)
để xác định khuôn mặt người
Gần đây có nhiều nghiên cứu sử dụng các đặc trưng toàn cục như: màu dangười, kích thước, và hình dáng để tìm các ứng viên khuôn mặt, rồi sau đó sẽ xácđịnh ứng viên nào là khuôn mặt thông qua dùng các đặc trưng cục bộ (chi tiết) như:mắt, lông mày, mũi, miệng và tóc
d Hướng tiếp cận dựa trên diện mạo
Trang 30Trái ngược với các phương pháp so khớp mẫu với các mẫu đã được địnhnghĩa trước bởi những chuyên gia, các mẫu trong hướng tiếp cận này được học từcác ảnh mẫu Một cách tổng quát, các phương pháp theo hướng tiếp cận này ápdụng các kỹ thuật theo hướng xác suất thống kê và máy học để tìm những đặc tínhliên quan của khuôn mặt và không phải là khuôn mặt Các đặc tính đã được học ởtrong hình thái các mô hình phân bố hay các hàm biệt số nên dùng có thể dùng cácđặc tính này để xác định khuôn mặt người Đồng thời, bài toán giảm số chiềuthường được quan tâm để tăng hiệu quả tính toán cũng như hiệu quả xác định.
Các tiếp cận khác trong hướng tiếp cận dựa trên diện mạo là tìm một hàmbiệt số (như là mặt phẳng quyết định, siêu phẳng để tách dữ liệu, hàm ngưỡng) đểphân biệt hai lớp dữ liệu: khuôn mặt và không phải khuôn mặt Bình thường, cácmẫu ảnh được chiếu vào không gian có số chiều thấp hơn, rồi sau đó dùng một hàmbiệt số (dựa trên các độ đo khoảng cách) để phân loại, hoặc xây dựng mặt quyếtđịnh phi tuyến bằng mạng neral đa tầng Hoặc dùng SVM (Support Vector Machine
- Máy vector hỗ trợ) và các phương thức kernel, chiếu hoàn toàn các mẫu vàokhông gian có số chiều cao hơn để dữ liệu bị rời rạc hoàn toàn và ta có thể dùngmột mặt phẳng quyết định phân loại các mẫu khuôn mặt và không phải khuôn mặt
2.1.3 Khó khăn và thử thách trong bài toán xác định khuôn mặt người
Việc xác định khuôn mặt người có những khó khăn nhất định như sau:
- Hướng (pose) của khuôn mặt đối với máy ảnh, như: Nhìn thẳng, nhìnnghiêng hay nhìn từ trên xuống Cùng trong một bức ảnh có thể có nhiều khuôn mặt
- Mặt người bị che khuất bởi các đối tượng khác trong ảnh
- Điều kiện ảnh, đặc biệt là về độ sáng và chất lượng ảnh, chất lượng thiết bịthu hình
- Trục tọa độ của máy ảnh so với ảnh
- Kích thước khác nhau của các khuôn mặt người và đặc biệt là trong cùngmột ảnh
- Màu sắc của môi trường xung quanh, hay màu sắc quần áo của ngườiđược chụp ảnh