1. Trang chủ
  2. » Luận Văn - Báo Cáo

PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH DỰA VÀO ĐẶC TRƯNG 3D

71 280 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 71
Dung lượng 3,68 MB

Nội dung

PHÁT HIỆN MẶT NGƯỜI TRONG ẢNH DỰA VÀO ĐẶC TRƯNG 3D

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC LẠC HỒNG *** TRẦN VĂN MINH PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH DỰA VÀO ĐẶC TRƢNG 3D LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Đồng Nai, Năm 2013 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC LẠC HỒNG *** TRẦN VĂN MINH PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH DỰA VÀO ĐẶC TRƢNG 3D Chuyên ngành: Công Nghệ Thông Tin Mã số: 60.48.02.01 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: PGS.TS Đỗ Năng Toàn Đồng Nai, Năm 2013 LỜI CẢM ƠN Lời cho gửi lời cảm ơn chân thành đến quý thầy cô cho có kiến thức làm tảng để đến thực luận văn ngày hôm Xin tỏ lòng biết ơn sâu sắc, chân thành đến thầy PGS.TS Đỗ Năng Toàn người tận tình giúp đỡ, dạy động viên suốt thời gian thực luận văn Con xin cảm ơn ba mẹ thành viên gia đình chia khó khăn thực luận văn Tôi xin cảm ơn anh chị đồng nghiệp tạo điều kiện giúp đỡ có khoảng thời gian để hoàn thành khóa học Qua xin gửi đến quý thầy cô ba mẹ anh chị em đồng nghiệp cành hoa để cảm ơn tốt đẹp mà người dành cho với tất lòng mình! Trân trọng ! Đồng Nai, ngày 10 tháng năm 2013 Trần Văn Minh LỜI CAM ĐOAN Tôi xin cam đoan : Luận văn công trình nghiên cứu thật cá nhân, thực hướng dẫn khoa học PGS.TS Đỗ Năng Toàn Các số liệu thông tin thứ cấp sử dụng luận văn trích dẫn rõ ràng Tôi hoàn toàn chịu trách nhiệm tính xác thực nguyên luận văn Học viên Trần Văn Minh DANH MỤC CÁC BẢNG Trang Bảng 2.1 Các thông tin vùng không gian nút 34 Bảng 2.2 Khoảng cách Euclide nút so với nút mức 34 Bảng 2.3 Vị trí tương đối nút so với nút gốc 35 Bảng 3.1 Kết thử nghiệm thư viện Markus Weber 52 Bảng 3.2 Kết thử nghiệm tập khuôn mặt 53 DANH MỤC HÌNH ẢNH Trang Hình 1.1 Mô trình xử lý ảnh Hình 1.2 Mô bước hệ thống xử lý ảnh Hình 1.3 Ví dụ hệ thống phát khuôn mặt Hình 1.4 Hệ thống kiểm soát vào dựa vào kỹ thuật phát mặt người Hình 1.5 Mô hình tổng quát phương pháp giải phát mặt người Hình 1.6 Phương pháp sử dụng đa độ phân giải 10 Hình 1.7 Tri thức chuyên gia nghiên cứu phân tích khuôn mặt 11 Hình 1.8 Mô tả phương pháp chiếu 11 Hình 1.9 Chiếu phần ứng viên để xác thực thành phần khuôn mặt 12 Hình 1.10 Mẫu so sánh khớp sử dụng 23 quan hệ 16 Hình 1.11 Mô hình mạng nơ ron Rowley 18 Hình 1.12 Kiến trúc hệ thống phát khuôn mặt dựa mạng nơ ron 19 Hình 1.13 Dùng HMM xác định khuôn mặt 22 Hình 1.14 Mô hình Markow ẩn 22 Hình 2.1 Những điểm tương quan thành phần khuôn mặt 2D 3D 25 Hình 2.2 Thông tin điểm xương rãnh ảnh vệ tinh 26 Hình 2.3 Thông tin điểm xương rãnh ảnh khuôn mặt 26 Hình 2.4 Dò tìm vùng 27 Hình 2.5 Tập lọc kích thước S 28 Hình 2.6 Tìm vùng 3D nhiều mức giá trị dò 30 Hình 2.7 Khối 3D kết xuất khung lưới tương ứng 31 Hình 2.8 Ví dụ khuôn mặt 3D kết xuất khung lưới 3D khuôn mặt 31 Hình 2.9 Cách tạo bậc D cỡ K 32 Hình 2.10 Cấu trúc rút đặc trưng 3D từ hình 2.6 33 Hình 2.11 Mô tả cách quét để lưu thông tin mức sáng 35 Hình 2.12 Một số kết xuất khung lưới 36 Hình 2.13 Các nút tạo thành từ xương rãnh rút trích theo mức 36 Hình 2.14 Ảnh phân tích 37 Hình 2.15 Tính tổng mức sáng hình chữ nhật R(l,t,r,b) 37 Hình 2.16 Một số ảnh thư viện Markus Weber 39 Hình 2.17 Mẫu hình canh biên vị trí khuôn mặt 43 Hình 2.18 Gán nhãn phương pháp thủ công 44 Hình 2.19 Các bước tiền xử lý để hiệu chỉnh độ sáng cân lược đồ 45 Hình 2.20 Kiểm tra phát khuôn mặt 46 Hình 2.21 Mô tả thuật toán giảm ứng viên trùng lắp 48 Hình 2.22 Luồng xử lý việc dò tìm khuôn mặt 50 Hình 3.1 Một số ảnh tập ảnh Markus Weber 52 Hình 3.2 Tổ chức thư viện OpenCV 53 Hình 3.3 Giao diện chương trình 54 Hình 3.4 Một số trường hợp phát 55 Hình 3.5 Một số kết phát thiếu 56 Hình 3.6 Một số kết không phát khuôn mặt 57 MỤC LỤC PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu đề tài Phạm vi nghiên cứu Những đóng góp đề tài CHƢƠNG 1: TỔNG QUAN VỀ PHÁT HIỆN KHUÔN MẶT 1.1 CÁC KHÁI NIỆM LIÊN QUAN ĐẾN XỬ LÝ ẢNH 1.1.1 XỬ LÝ ẢNH LÀ GÌ? 1.1.2 CÁC KHÁI NIỆM CƠ BẢN 1.2 BÀI TOÁN PHÁT HIỆN KHUÔN MẶT 1.2.1 GIỚI THIỆU 1.2.2 BÀI TOÁN PHÁT HIỆN KHUÔN MẶT TRONG ẢNH 1.2.3 NHỮNG KHÓ KHĂN VÀ THÁCH THỨC TRONG QUÁ TRÌNH PHÁT HIỆN KHUÔN MẶT 1.2.4 CÁC LĨNH VỰC ỨNG DỤNG BÀI TOÁN PHÁT HIỆN KHUÔN MẶT 1.3 1.2.4.1 HỆ THỐNG QUAN SÁT VÀ THEO DÕI HÀNH VI 1.2.4.2 HỆ THỐNG TƢƠNG TÁC GIỮA NGƢỜI VÀ MÁY 1.2.4.3 BẢO MẬT 1.2.4.4 MỘT SỐ ỨNG DỤNG KHÁC CÁC PHƢƠNG PHÁP PHÁT HIỆN MẶT NGƢỜI TRONG ẢNH 1.3.1 PHƢƠNG PHÁP TIẾP CẬN DỰA TRÊN CÁC LUẬT TRI THỨC 10 1.3.2 PHƢƠNG PHÁP TIẾP CẬN DỰA TRÊN CÁC ĐẶC TRƢNG BẤT BIẾN 12 1.3.2.1 CÁC ĐẶC TRƢNG KHUÔN MẶT 13 1.3.2.2 ĐẶC TRƢNG KẾT CẤU 14 1.3.2.3 ĐẶC TRƢNG SẮC MÀU CỦA DA 14 1.3.2.4 ĐA ĐẶC TRƢNG 14 1.3.3 PHƢƠNG PHÁP TIẾP CẬN DỰA TRÊN ĐỐI SÁNH MẪU 15 1.3.3.1 XÁC ĐỊNH MẪU TRƢỚC 15 1.3.3.2 CÁC MẪU BỊ BIẾN DẠNG 17 1.3.4 PHƢƠNG PHÁP TIẾP CẬN DỰA TRÊN KỸ THUẬT HỌC MÁY 18 1.3.4.1 KIẾN TRÚC HOẠT ĐỘNG CỦA HỆ THỐNG 19 1.3.4.2 TIỀN XỬ LÝ 20 1.3.4.3 XÂY DỰNG MÔ HÌNH QUÁ TRÌNH HỌC 20 1.3.4.4 SUPPORT VECTOR MACHINE (SVM) 20 1.3.4.5 MẠNG LỌC THƢA (SPARSE NETWORK OF WINNOWS – SNOW) 21 1.3.4.6 MÔ HÌNH MARKOW ẨN ( HIDDEN MARKOW MODEL – HMM) 21 1.3.4.7 PHÂN LOẠI BAYES 22 1.3.5 PHƢƠNG PHÁP TIẾP CẬN DỰA VÀO ĐẶC TRƢNG 3D 23 1.3.6 NHẬN XÉT CHUNG CÁC PHƢƠNG PHÁP TIẾP CẬN HIỆN TẠI 23 1.4 PHẠM VI CỦA ĐỀ TÀI 24 CHƢƠNG 2: PHÁT HIỆN KHUÔN MẶT DỰA VÀO ĐẶT TRƢNG 3D 25 2.1 RÖT TRÍCH CÁC ĐẶC TRƢNG 3D 25 2.1.1 ĐIỂM 3D 27 2.1.2 DÒ TÌM VÀ RÚT TRÍCH CÁC VÙNG 3D 27 2.1.3 DÒ TÌM VÀ RÚT TRÍCH CÁC VÙNG 3D Ở NHIỀU MỨC KHÁC NHAU 28 2.2 MÔ HÌNH KHUNG TRONG TIẾP CẬN 3D 31 2.2.1 MÔ HÌNH KHUNG LƢỚI 31 2.2.2 XÂY DỰNG CẤU TRÚC CÂY 3D 32 2.2.3 XÂY DỰNG KHUNG LƢỚI 35 2.2.4 TỐI ƢU HÓA VIỆC DÕ TÌM CÁC ĐẶC TRƢNG 36 2.2.5 CẮT TỈA CẤU TRÚC CÂY 3D 38 2.3 XÂY DỰNG TẬP MẪU 38 2.4 CÁC KỸ THUẬT DÒ BIÊN 39 2.4.1 KỸ THUẬT PHÁT HIỆN BIÊN TRỰC TIẾP 40 2.4.2 KỸ THUẬT PHÁT HIỆN BIÊN GIÁN TIẾP 42 2.5 GÁN NHÃN CANH BIÊN CÁC ĐẶC TRƢNG CỦA KHUÔN MẶT 42 2.5.1 ĐỊNH NGHĨA CANH BIÊN GIỮA HAI ĐIỂM ĐẶC TRƢNG 42 2.5.2 GÁN NHÃN 44 2.6 XỬ LÝ ĐỘ SÁNG VÀ ĐỘ TƢƠNG PHẢN TRÊN TẬP MẪU 44 2.7 ÁP DỤNG MÔ HÌNH THỐNG KÊ 45 2.7.1 THỐNG KÊ 45 2.7.2 ĐÁNH GIÁ DỰA TRÊN SỐ LIỆU THU THẬP ĐƢỢC 47 2.8 HUẤN LUYỆN DÒ TÌM KHUÔN MẶT 48 2.8.1 GIỚI THIỆU 48 2.8.2 HUẤN LUYỆN DÒ TÌM KHUÔN MẶT 48 2.9 QUÁ TRÌNH DÒ TÌM KHUÔN MẶT 49 CHƢƠNG 3: THỬ NGHIỆM VÀ KẾT QUẢ 50 3.1 MÔI TRƢỜNG THỬ NGHIỆM 50 3.2 KẾT QUẢ 52 3.3 NHẬN XÉT 53 3.4 GIAO DIỆN CHÍNH 53 3.5 MỘT SỐ MÀN HÌNH KẾT QUẢ VỀ 54 CHƢƠNG 4: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 58 4.1 KẾT LUẬN 57 4.2 HƢỚNG PHÁT TRIỂN 57 4.2.1 ĐẶT VẤN ĐỀ 57 4.2.2 PHƢƠNG PHÁP THỰC HIỆN 58 47 2.7.2 Đánh giá dựa số liệu thu thập đƣợc Với tập chuẩn TH, đánh giá có khả khuôn mặt hay không khuôn mặt dựa trung bình khoảng cách xét đến tất tập chuẩn TH ̅ ∑ ‖ ‖ Trong đó: ̅ (t): trung bình khoảng cách t đến tất tập chuẩn TH t : xét : tập k chuẩn Căn vào giá trị ̅ (t) để xem t có xem ứng cử viên khuôn mặt hay không sau: t Với ̅ (t) (2.9) ngưỡng thực nghiệm, ngưỡng lấy khoảng từ 0.2 đến 0.4 Cuối muốn thu kết xác hơn, kết thu từ tập hợp tập ta thấy có phần trùng lắp lên Có thể phát nhiều ứng viên cho khuôn mặt thật chúng trùng lắp tập với lên vị trí Do đó, có thuật toán tối ưu để giảm ứng viên trùng lắp Để làm việc luận văn đề xuất giảm bớt ứng viên trùng lắp cách liên kết vùng trùng lắp với Nếu hai vùng ứng viên khuôn mặt có diện tích bị trùng lắp lên 1/3 diện tích vùng xem trùng lắp liên kết thành vùng có kích thước lớn Và vùng diện tích xem nút gốc tập 48 a) Vùng ứng viên trùng lắp b) Vùng liên kết Hình 2.21 Mô tả thuật toán giảm ứng viên trùng lắp Sau liên kết vùng ứng viên khuôn mặt, thu hay nhiều vùng chứa khuôn mặt Tuy nhiên trình liên kết vùng ứng viên trùng lắp kích thước kích thước khuôn mặt nên có vùng khuôn mặt phát lớn khuôn mặt thực tế 2.8 Huấn luyện dò tìm khuôn mặt 2.8.1 Giới thiệu Phần trình bày thuật toán dựa mạng nơ ron để dò tìm cửa sổ có chứa khuôn mặt thẳng đứng ảnh Thuật toán áp dụng hay nhiều mạng nơ ron trực tiếp với phần ảnh đầu vào để kiểm tra kết chúng Mỗi mạng huấn luyện để trả kết khuôn mặt hay không khuôn mặt Việc sử dụng mạng nơ ron để tìm khuôn mặt công việc khó phải biểu diễn hai lớp ảnh khuôn mặt ảnh khuôn mặt Để tránh việc dùng tập huấn luyện có kích thước lớn ta sử dụng phương pháp boostrap nhằm giảm kích thước tập huấn luyện Việc dùng cách thức xử lý mạng nơ ron heuristic để làm rõ kết cải thiện đáng kể độ xác dò tìm 2.8.2 Huấn luyện dò tìm khuôn mặt Quá trình huấn luyện dò tìm khuôn mặt hoạt động theo hai giai đoạn, giai đoạn áp dụng tập dò tìm mạng nơ ron vào ảnh sau dùng kiểm tra để kết hợp với đầu Các dò tìm riêng lẻ khảo sát vị trí ảnh tỷ lệ khác để tìm vùng ảnh khuôn mặt Sau kiểm tra tập hợp tất kết từ dò tìm riêng lẻ để loại trừ dò tìm giống 49 Hệ thống đầu vào mạng nơ ron nhận vào vùng ảnh 20x20 pixel để tạo đầu khoảng từ -1 đến tương ứng để biểu thị có khuôn mặt hay khuôn mặt Để dò tìm tất khuôn mặt ảnh mạng nơ ron áp dụng lên toàn khung ảnh Mặc khác để dò tìm khuôn mặt có kích thước hơn liệu dò tìm ảnh giảm kích thước nhiều lần áp dụng dò tìm kích thước Sau cửa sổ 20x20 picel trích từ vị trí tỷ lệ ảnh nhập, xử lý qua bước hiệu chỉnh độ sáng cân lược đồ Cửa sổ sau xử lý truyền qua mạng nơ ron, cửa sổ chia thành bốn vùng nhỏ kích thước 10x10 picel, 16 vùng nhỏ kích thước 5x5 picel vùng chồng 20x5 picel Mỗi vùng cung cấp thông tin cho thông qua đơn vị ẩn Với cách làm sử dụng hai ba tập đơn vị ẩn Cụ thể hình vuông ngang cho ta dò tìm đặc trưng cặp mắt, miệng Trong khi, với vùng hình vuông cho ta dò tìm xác vị trí mắt, mũi khóe miệng Để sử dụng mạng nơ ron phân loại cửa sổ có phải khuôn mặt hay không khuôn mặt ta cần mẫu huấn luyện cho tập Với mẫu khuôn mặt ta sử dụng kỹ thuật canh biên gán nhãn số đặc trưng tay Sau canh biên khuôn mặt rút kích thước, vị trí hướng cửa sổ 20x20 pixel Ảnh rút với lượng ngẫu nhiên từ 1/√ đến √ việc làm giúp dò tìm khuôn mặt vị trí tỷ lệ trung bình 2.9 Quá trình dò tìm khuôn mặt Tập mẫu khuôn mặt Canh biên mẫu khuôn mặt Tiền xử lý tập Ảnh thực nghiệm khuôn mặt Lấy vị trí cửa sổ ảnh Tiền xử lý cửa sổ Với 50 ĐÚNG Hình 2.22 Luồng xử lý việc dò tìm khuôn mặt CHƢƠNG 3: THỬ NGHIỆM VÀ KẾT QUẢ 3.1 Môi trƣờng thử nghiệm Chương trình sử dụng thư viện mã nguồn mở OpenCV [10] thư viện xử lý ảnh Intel [18] cài đặt môi trường lập trình Microsoft Visual Studio 2008 sử dụng ngôn ngữ C++ Máy tính sử dụng thực nghiệm có cấu hình Core Dua 2.0 GHz, nhớ GB DDR2, hệ điều hành Microsoft Windows XP Professional Để thực nghiệm thuật toán mà luận văn đề xuất sử dụng nguồn liệu ảnh thu thập Markus Weber [9] Đây tập liệu chụp nhiều góc độ, tư khuôn mặt có nhiều kiểu có phần bị che khuất điều kiện ánh sáng đa dạng Tập ảnh có đến 450 ảnh có ảnh truyện tranh 51 a) Hình chụp người đàn ông nhà b) Hình chụp người phụ nữ nhà c)Hình chụp gần khuôn mặt d) Hình chụp khuôn mặt bị che e)Hình chụp ánh sáng mờ f) Hình chụp khuôn mặt bị biến dạng Hình 3.1 Một số ảnh tập ảnh Markus Weber OpenCV thư viện mã nguồn mở chuyên thị giác máy tính giới thiệu vào năm 1999 hoàn thiện thành phiên 1.0 năm 2006 Cung cấp khoảng 500 hàm lớp dựa thuật toán xử lý ảnh dùng ngôn ngữ C/C++ tương thích với hệ điều hành Windows, Linux, Mac OS… OpenCV thể đa dạng 52 trí tuệ nhân tạo ứng dụng nhiều toán phát hiện, nhận dạng dò tìm khuôn mặt Cấu trúc tổng quan OpenCV gồm phần mô tả sau: CV MLL HIGHGUI Các hàm xử lý ảnh giải thuật thị giác máy tính Các thuật toán máy học, bao gồm phân cụm, thống kê Các hàm, lớp làm việc với file ảnh file video CXCORE Cấu trúc liệu bản, hàm đồ họa cấu trúc XML … Hình 3.2 Tổ chức thƣc viện OpenCV 3.2 Kết Chúng thử nghiệm toàn liệu ảnh thư viện Markus Weber để đưa kết kiểm thử theo bảng sau: Bảng 3.1 Kết thử nghiệm thƣ viện Markus Weber Số ảnh Thử nghiệm Tỷ lệ Độ xác 450 Đúng Sai 431 19 95.78% 4.22% 95.78% Ngoài chương trình thử nghiệm tập liệu khuôn mặt, tập liệu đối tượng [5], tập hình ảnh bao gồm xe background nhà đồ dùng nhà Kết kiểm thử theo bảng sau: Bảng 3.2 kết thử nghiệm tập khuôn mặt 53 Loại đối tƣợng Số ảnh Đúng Sai Xe 526 526 Nhà đồ dùng 451 451 Tỷ lệ 100% 3.3 Nhận xét Chương trình cho kết tương đối tốt, dò tìm hầu hết khuôn mặt Tuy nhiên, phát thừa thiếu, điều ảnh hưởng ảnh có phức tạp độ tương phản ánh sáng thấp 3.4 Giao diện Hình 3.3 Giao diện chƣơng trình 54 3.5 Một số hình kết a) Ảnh đầu vào c) Ảnh nguồn e) Ảnh nguồn b) Ảnh kết d) Ảnh kết f) Ảnh kết Hình 3.4 Một số trƣờng hợp phát 55 a) Ảnh nguồn c)Ảnh nguồn e) Ảnh nguồn b)Ảnh kết d) Ảnh kết f) Ảnh kết Hình 3.5 Một số kết phát thiếu 56 a) Ảnh ban đầu c)Ảnh ban đầu e) Ảnh đồ dùng nhà b) Ảnh sau xử lý d) Ảnh sau xử lý f) Ảnh xe Hình 3.6 Một số kết không phát đƣợc khuôn mặt 57 CHƢƠNG KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 4.1 Kết luận Trên sở nghiên cứu toán phát mặt người ảnh dựa vào đặc trưng 3D Tôi áp dụng thành công việc xác định đặc trưng 3D vào việc phát mặt người ảnh Kết chấp nhận bước đầu để phát triển toán nhận dạng mặt người ảnh Bên cạnh đó, trình xây dựng chương trình thử nghiệm, tìm hiểu thêm thư viện mã nguồn mở OpenCV, qua biết cách sử dụng hàm có sẵn thư viện Chương trình demo cho kết tương đối tốt, dò tìm hầu hết khuôn mặt, thời gian phát nhanh ảnh mặt người chụp thẳng, chất lượng ảnh tốt Tuy nhiên, ảnh chụp nghiên 300 hay ảnh có màu sắc tối chương trình gần phát khuôn mặt ảnh Trong số trường hợp việc phát khuôn mặt xảy nhầm lẫn vùng khuôn mặt Điều xảy ảnh đầu vào có chứa nhiều vùng 3D có kết cấu gần giống khuôn mặt Vấn đề giải phương pháp tăng cường lọc nhiễu để giảm bớt khả nhận dạng vùng 3D Tuy nhiên điều làm cho việc nhận dạng vùng 3D khuôn mặt thật trở nên khó khăn Đối với ảnh webcam hiệu suất chương trình tùy thuộc theo chất lượng loại webcam sử dụng trình chụp ảnh, giống việc phát khuôn mặt ảnh kỹ thuật số chương trình phát mặt người ảnh có độ sang khuôn mặt chụp bị nghiên 300 4.2 Hƣớng phát triển 4.2.1 Đặt vấn đề Như ta biết điểm 3D mà đề cập phần chương thay đổi theo thời gian, việc sử dụng đặc trưng để phát mặt người ảnh mở hướng phát triển nhận dạng người ảnh 58 dựa vào đặc trưng 3D Khi thực ta đưa ảnh qua chương trình phát mặt người để phát nhanh khuôn mặt có ảnh, sau so sánh thông số khuôn mặt dò tìm với khuôn mặt mà chương trình học trước đó, trùng đưa thông tin khuôn mặt nhận dạng Ngoài thời gian tới áp dụng thêm số kỹ thuật nâng cao chất lượng ảnh tách ngưỡng, tăng giảm độ sáng bó cụm để tiền xử lý ảnh đầu vào để loại bỏ bớt nhiễu làm tăng khả phát đối tượng chương trình để giúp chương trình phát với ảnh có phức tạp ảnh tối.Đồng thời áp dụng số thuật toán nhận biết ảnh nghiên để canh chỉnh cho phù hợp Tôi tin toán mở rộng áp dụng cho toán nhận dạng đối tượng mức tổng quát 4.2.2 Phƣơng pháp thực Với vùng ảnh rút trích theo hình 2.15, vùng R tập hợp điểm ảnh có chung thuộc tính thuộc đối tượng ảnh Ranh giới vùng biên ảnh, đường khép kín cho phép xác định vùng ảnh Biên xác định với hai vector theo thành phần : + Độ lớn: Được tính độ lớn Gradient + Hướng: vuông góc với hướng Gradient Phân vùng ảnh: Là trình phân hoạch tập hợp điểm X thành tập vùng ảnh R Quá trình nhận dạng thực ảnh đối tượng xử lý tăng cường chất lượng, làm bật chi tiết, trích chọn đặc trưng dựa vào phân vùng ảnh đối tượng thuộc tính 3D biểu diễn đặc trưng này, cuối giai đoạn nhận dạng ảnh TÀI LIỆU THAM KHẢO [1] A Lanitis, C J Taylor, T F Cootes,"An Automatic Face Identification System Using Flexible Appearance Models", Image and Vision Computing, Vol 13, No 5, pp 390-400, 1995 [2] A Rajagopalan, K Kumar, J Karlekar, R Manivasakan,M Patil, U Desai, P Poonacha, S Chaudhuri,"Finding Faces in Photographs ", Proc 6th IEEE Conf Computer Vision, pp 640 – 645, 1998 [3] C Kotropoulos, I Pitas, "Rule – based Face Detection in Frontal Views", Proc Int’l Conf Acoustics, Speech and Signal Processing, Vol 4, pp 2630-2545, 1997 [4] Antonio M Lopez, Felipe Lumbreras, Joan Serrat, Juan J Villanueva,"Evaluation of Methods for Ridges and Valley Detection", IEEE Transaction on PAMI, pp 320-340, Vol 21, No 4, Apr 1999 [5] T K Leung, M.C Burl, P.Perona, "Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching", Proc.5th IEEE Conf Computer Vision, pp 635650,1995 [6] I Craw, D Tock, A Bennett, "Finding Face Features", Proc, 2nd European Conf Computer Vision (ECCV’92), Vol 2, pp 90-100,1992 [7] D Eberly, R Gardner, B Morse, S Pizer, C Scharlach,"Ridges for image Analysis", Journal of Mathematical imaging and Vision, pp 350- 373, Vol 4, No 2, Dec 1994 [8] D.G Kendall, “Shape Manifolds, Procrustean Metrics, and Complex Projective Shapes”, Bull London Math Soc., vol 16, pp 81-121, 1984 [9] P Viola, M Jones, "Rapid object detection using a boosted cascade of simple features", Proc,IEEE Conf Computer Vision and Pattern Recognition, pp.510-520, Dec 2001 [10] G.Yang, T S Huang, "Human Face Detection in Complex Background", Pattern Recognition, Vol 27, No 1, pp 50-65, 1994 [11] H Rowley, S Baluja, T Kanade,"Neural network-based face detection", IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol 20, No 1, pp 40-55, Jan 1998 [12] H Schneiderman, T Kanade, "Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Detection", Proc IEEE Conf Computer Vision and Pattern Recognition, pp 40-50, 1998 [13] James L Crowley, Alice C Parker,"A Representation for Shape based on Peaks and Ridges in the Difference of Low-Pass Transform", Techical Report CMU-RI-83-4, Carngie-Mellon University, May 1983 [14] James L.Crowley, Alice C Parker,"A Representation for Shape based on Peaks and Ridges in the Difference of Low-Pass Transform", IEEE Transaction on PAMI, pp 150-170, Vol 6, No 2, Mar 1984 [15] John M Gauch, Stephen M.Pizer,"Multiresolution Analysis of Ridges and Valleys in Grey-Scale Images", IEEE Transaction on PAMI, pp 630-646, Vol 15, No 6, Jun 1993 [16] Intel Image Processing Library 2.5 http://developer.intel.com/software/products/perflib/ipl/ [17] Intel Open Source Computer Vision Library – OpenCV phiên 4.0 http://www.intel.com/technology/computing/opencv/ [18] J Sobottka and I Pitas, “Segmentation and Tracking of Faces in Color Images”, Proc Second Int’l Conf Automatic Face and Gesture Recognition, pp 236-241, 1996 [19] Hai Tran, Augustin Lux,"A method for Ridge Extraction", 6th Asian Conference on Computer Vision 2004-ACCV’04, Vol 2, Feb 2004, Korea [20] Hai Tran, Augustin Lux,"Toward a ridge and peak based symbolic representation for object recognition"3rd International Conference on computer Science – RIVF’05, pp 64-70, Feb 2005, VietNam [21] Duc A Duong, Du LH Tran, Duan D Tran," Optimizing Speed for Adaptive Local Thresholding Algorithm Using Dynamic Programming", International Conference on Electronics, Information and Communications 2004-ICEIC’04, Vol 1,pp 436-442, Aug 2004 [22] K C Yow, R Cipolla, "Feature-Based Human Face Detection", Image and Vision Computing, Vol 15, No 1, pp 710-735, 1997 [23] K Lam and H Yan, “Fast Algorithm for Locating Head Boundaries”, J.Electronic Imaging, vol 3, no 4, pp 351-359, 1994 [24] K.V Mardia and I.L Dryden, “Shape Distributions for Landmark Data”, Advanced Applied Probability, vol 21, pp 742-755, 1989 [25] A Yuille, P Hallinan, and D Cohen, “Feature Extraction from Faces Using eformable Templates”, Int’l J Computer Vision, vol 8, no 2, pp 99-111, 1992 [26] M Kirby and L Sirovich, “Application of the Karhunen-LoeveProcedure for the Characterization of Human Faces”, IEEE Trans Pattern Analysis and Machine Intelligence, vol 12, no 1, pp 103-108, Jan 1990 [27] K.V Mardia and I.L Dryden, “Shape Distributions for Landmark Data”, Advanced Applied Probability, vol 21, pp 742-755, 1989 [28] Ming-Hsuan Yang, David J.Kriegman, Narendra Ahuja,"Detecting Faces in Image: A Survey", IEEE Transaction on Pattern Analysis and Machine Intelligence (PAMI), Vol.24, No 1, pp 30-49 , Jan 2012 [29] Markus Weber,"Frontal face dataset", California Institute of Technology, 2003, http://www.vision.caltech.edu/html-files/archive.html [30] P Viola, M Jones,"Robust Real Time Object Detection", Proc, IEEE ICCV Workshop on Statistical and computational Theories of Vision, Jul 2001 [31] Quan Yaun, Wen Gao, Hongxun Yao,"Robust frontal face detection in complex environment", International Conference on Pattern Recognition 2002ICPR’02, pp 25-30, Aug 2002, Canada [32] " Caltech categories", California Institute of Technology, 2005 http://www.vision.caltech.edu/html-files/archive.html

Ngày đăng: 05/11/2016, 14:04

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. A. Lanitis, C. J. Taylor, T. F. Cootes,"An Automatic Face Identification System Using Flexible Appearance Models", Image and Vision Computing, Vol. 13, No. 5, pp. 390-400, 1995 Sách, tạp chí
Tiêu đề: An Automatic Face Identification System Using Flexible Appearance Models
[2]. A. Rajagopalan, K. Kumar, J. Karlekar, R. Manivasakan,M. Patil, U. Desai, P. Poonacha, S. Chaudhuri,"Finding Faces in Photographs ", Proc. 6 th IEEE Conf.Computer Vision, pp. 640 – 645, 1998 Sách, tạp chí
Tiêu đề: Finding Faces in Photographs
[3]. C. Kotropoulos, I. Pitas, "Rule – based Face Detection in Frontal Views", Proc. Int’l Conf. Acoustics, Speech and Signal Processing, Vol. 4, pp. 2630-2545, 1997 Sách, tạp chí
Tiêu đề: Rule – based Face Detection in Frontal Views
[4]. Antonio M. Lopez, Felipe Lumbreras, Joan Serrat, Juan J. Villanueva,"Evaluation of Methods for Ridges and Valley Detection", IEEE Transaction on PAMI, pp 320-340, Vol. 21, No. 4, Apr 1999 Sách, tạp chí
Tiêu đề: Evaluation of Methods for Ridges and Valley Detection
[5]. T. K. Leung, M.C. Burl, P.Perona, "Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching", Proc.5 th IEEE Conf. Computer Vision, pp. 635- 650,1995 Sách, tạp chí
Tiêu đề: Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching
[6]. I. Craw, D. Tock, A. Bennett, "Finding Face Features", Proc, 2 nd European Conf. Computer Vision (ECCV’92), Vol. 2, pp. 90-100,1992 Sách, tạp chí
Tiêu đề: Finding Face Features
[7]. D. Eberly, R. Gardner, B. Morse, S. Pizer, C. Scharlach,"Ridges for image Analysis", Journal of Mathematical imaging and Vision, pp 350- 373, Vol. 4, No. 2, Dec 1994 Sách, tạp chí
Tiêu đề: Ridges for image Analysis
[8]. D.G. Kendall, “Shape Manifolds, Procrustean Metrics, and Complex Projective Shapes”, Bull. London Math. Soc., vol. 16, pp. 81-121, 1984 Sách, tạp chí
Tiêu đề: Shape Manifolds, Procrustean Metrics, and Complex Projective Shapes”, "Bull. London Math. Soc
[9]. P. Viola, M. Jones, "Rapid object detection using a boosted cascade of simple features", Proc,IEEE Conf. Computer Vision and Pattern Recognition, pp.510-520, Dec 2001 Sách, tạp chí
Tiêu đề: Rapid object detection using a boosted cascade of simple features
[10]. G.Yang, T. S. Huang, "Human Face Detection in Complex Background", Pattern Recognition, Vol .27, No. 1, pp. 50-65, 1994 Sách, tạp chí
Tiêu đề: Human Face Detection in Complex Background
[11]. H. Rowley, S. Baluja, T. Kanade,"Neural network-based face detection", IEEE Transaction on Pattern Analysis and Machine Intelligence, Vol. 20, No. 1, pp.40-55, Jan 1998 Sách, tạp chí
Tiêu đề: Neural network-based face detection
[12]. H. Schneiderman, T. Kanade, "Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Detection", Proc. IEEE Conf. Computer Vision and Pattern Recognition, pp. 40-50, 1998 Sách, tạp chí
Tiêu đề: Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Detection
[13]. James L. Crowley, Alice C. Parker,"A Representation for Shape based on Peaks and Ridges in the Difference of Low-Pass Transform", Techical Report - CMU-RI-83-4, Carngie-Mellon University, May 1983 Sách, tạp chí
Tiêu đề: A Representation for Shape based on Peaks and Ridges in the Difference of Low-Pass Transform
[14]. James L.Crowley, Alice C. Parker,"A Representation for Shape based on Peaks and Ridges in the Difference of Low-Pass Transform", IEEE Transaction on PAMI, pp 150-170, Vol. 6, No. 2, Mar 1984 Sách, tạp chí
Tiêu đề: A Representation for Shape based on Peaks and Ridges in the Difference of Low-Pass Transform
[15]. John M. Gauch, Stephen M.Pizer,"Multiresolution Analysis of Ridges and Valleys in Grey-Scale Images", IEEE Transaction on PAMI, pp 630-646, Vol. 15, No. 6, Jun 1993 Sách, tạp chí
Tiêu đề: Multiresolution Analysis of Ridges and Valleys in Grey-Scale Images
[18]. J. Sobottka and I. Pitas, “Segmentation and Tracking of Faces in Color Images”, Proc. Second Int’l Conf. Automatic Face and Gesture Recognition, pp.236-241, 1996 Sách, tạp chí
Tiêu đề: Segmentation and Tracking of Faces in Color Images”, "Proc. Second Int’l Conf. Automatic Face and Gesture Recognition
[19]. Hai Tran, Augustin Lux,"A method for Ridge Extraction", 6 th Asian Conference on Computer Vision 2004-ACCV’04, Vol. 2, Feb 2004, Korea Sách, tạp chí
Tiêu đề: A method for Ridge Extraction
[20]. Hai Tran, Augustin Lux,"Toward a ridge and peak based symbolic representation for object recognition"3 rd International Conference on computer Science – RIVF’05, pp 64-70, Feb 2005, VietNam Sách, tạp chí
Tiêu đề: Toward a ridge and peak based symbolic representation for object recognition
[16]. Intel Image Processing Library 2.5 http://developer.intel.com/software/products/perflib/ipl/ Link
[17]. Intel Open Source Computer Vision Library – OpenCV phiên bản 4.0 http://www.intel.com/technology/computing/opencv/ Link

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN