đề xuất phương pháp truy tìm ảnh mặt người trên video

160 489 0
đề xuất phương pháp truy tìm ảnh mặt người trên video

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

đề xuất phương pháp truy tìm ảnh mặt người trên video

Lời cám ơn  Xin chân thành cám ơn các thầy, các cô thuộc khoa Công Nghệ Thông Tin trường Đại Học Khoa Học Tự Nhiên đã tận tình dạy dỗ, truyền đạt cho chúng em nhiều kiến thức quý báu. Chúng em xin gửi lời cám ơn sâu sắc đến Thầy Lê Hoàng Thái, Thầy đã tận tình hướng dẫn, giúp đỡ chúng em trong suốt thời gian thực hiện đề tài. Xin chân thành cảm ơn các bạn trong chuyên ngành Khoa Học Máy Tính khoa Công Nghệ Thông Tin đã giúp đỡ chúng tôi rất nhiều trong quá trình thực hiện đề tài. Cuối cùng, lời cám ơn sâu sắc nhất xin gởi đến cha mẹ vì ơn sinh thành và giáo dưỡng. Xin cám ơn! Thành phố Hồ Chí Minh, tháng 7/2007 Nhóm sinh viên thực hiện Đỗ Thanh Toàn – Đoàn Ngọc Khiêm Trình bày luận văn Nội dung của luận văn được tổ chức và trình bày trong 6 chương: Chương 0: Mở đầu: Giới thiệu về đề tài. Chương 1: Tổng quan về bài toán nhận dạng mặt người và các cách tiệp cận. Chương 2:Dò tìm khuôn mặt trong ảnh. Chương 3: Trích chọn đặc trưng cho ảnh khuôn mặt. Chương 4:Nhận dạng ảnh khuôn mặt. Chương 5: Ứng dụng thử nghiệm. Chương 6: Đánh giá và hướng phát triển. 2 Mục lục Danh sách các hình Hình 1.3.1 – 1 : Mô hình tổng quát của bài toán nhận dạng mặt người 18 Hình 2.2.1 – 1 : Sơ đồ hệ dò tìm khuôn mặt bằng AdaBoost – NN 23 Hình 2.2.2 – 1 : Minh hoạ hệ dò tìm khuôn mặt bằng AdaBoost-Adaboost 24 Hình 2.3.1 – 1 : Một số ảnh có mặt người trong tập mẫu huấn luyện 24 Hình 2.3.1 – 2 : Một số ảnh không chứa mặt người trong tập mẫu huấn luyện 25 Hình 2.3.1 – 3 : Ví dụ về ảnh ngược sáng 25 Hình 2.3.1 – 4: Ví dụ về ảnh bị che khuất thành phần quan trọng 26 Hình 2.3.1 – 5 : Ví dụ về ảnh có cảm xúc đặc biệt 26 Bảng 2.3.2 – 1 : So sánh các phương pháp phát hiện + chứng thực khuôn mặt 26 Hình 2.3.2 – 1 : So sánh các phương pháp detect + chứng thực khuôn mặt 27 Hình 3.2.1 – 1 : Hướng của véc tơ riêng 28 Hình 3.2.1 – 2 : Minh hoạ phát hiện vị trí mắt, miệng trên khuôn mặt 29 Hình 3.2.1 – 3 : Minh hoạ kiểu kết hợp toàn cục và bộ phận 30 Hình 3.2.2 – 1 : . Sự phân phối dữ liệu trong không gian 3 chiều và các trục tương ứng của PCA và ICA. Mỗi trục là một cột của ma trận nghịch đảo của ma trận trộn W-1 tìm thấy bới PCA và ICA. Các trục của PCA trực giao trong khi ICA thì không, do đó khoảng cách các điểm dữ liệu sẽ thay đổi khi chiếu xuống không gian mới này 33 Hình 3.2.2 – 2 : véctơ đặc trưng cho mỗi kĩ thuật. Hàng đầu chứa 8 véctơ riêng với 8 trị riêng lớn nhất trong PCA. Hàng 2 chứa các vectơ đặc trưng trong ICA với kiến trúc I, hàng 3 chỉ ra 8 véctơ đặc trưng trong ICA với kiến trúc 2 34 Hình 3.2.2 – 3 :minh họa kiến trúc 1 trong mô hình ICA 35 3 Hình 3.2.2 – 4 :minh họa kiến trúc 2 trong mô hình ICA 36 Hình 3.2.2 – 5 :Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA 36 Hình 3.2.2 -6 :Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA trên pixel 37 Bảng 3.3.2 – 1 : Kết quả so sánh PCA và ICA trên bộ dữ liệu CalTech 39 Hình 3.3.2 – 1 :Biểu đồ kết quả thử nghiệm hai phương pháp rút trích đặc trưng PCA – ICA trên bộ dữ liệu CalTech: thống kê trên bộ test 40 Hình 3.3.2 – 2: Các ảnh với phương pháp rút trích PCA bị nhận dạng sai với bộ dữ liệu nước ngoài 41 Hình 3.3.2 – 3 : Các ảnh với phương pháp rút trích ICA bị nhận dạng sai với bộ dữ liệu nước ngoài 42 Hình 3.3.3 – 1 : Một số ảnh quay phải, trái, quá tối hoặc độ sáng không đồng đều trên khuôn mặt trong tập ảnh tự tạo 43 Bảng 3.3.4 – 1 : Kết quả so sánh PCA và ICA trên bộ dữ liệu trong nước 44 Hình 3.3.4 – 1 :Biểu đồ kết quả thử nghiệm hai phương pháp rút trích đặc trưng PCA – ICA trên bộ dữ liệu tự tạo: thống kê trên bộ test 44 Hình 3.3.4 – 2 : Các ảnh với phương pháp rút trích PCA bị nhận dạng sai với bộ dữ liệu tự tạo 45 Hình 4.2.1 – 1 :Sơ đồ hệ thống nhận dạng mặt người dùng SVM 46 Hình 4.2.2 – 1 :Sơ đồ hệ thống nhận dạng mặt người dùng mạng Nơron 48 Bảng4.3.2 – 1 : Thời gian huấn luyện SVM và NN bộ dữ liệu nước ngoài 50 Bảng 4.3.2 – 2 : Thời gian nhận dạng thư mục test nước ngoài bằng SVM và NN 51 Bảng 4.3.2 – 3 : Kết quả so sánh nhận dạng SVM và NN trên bộ dữ liệu nước ngoài 52 Hình 4.3.2 – 1 : Biểu đồ kết quả thử nghiệm hai phương pháp nhận dạng SVM và NN trên 52 bộ dữ liệu nước ngoài: thống kê trên bộ test 52 Bảng 4.3.4 - 1: Thời gian huấn luyện SVM và NN bộ dữ liệu trong nước 52 Bảng 4.3.4 - 2: Thời gian nhận dạng thư mục test trong nước bằng SVM và NN 53 Bảng 4.3.4 - 3: Kết quả so sánh SVM và NN trên bộ dữ liệu trong nước 53 Hình 4.3.4 - 1 :Biểu đồ kết quả thử nghiệm hai phương pháp nhận dạng SVM và NN 54 trên bộ dữ liệu trong nước: thống kê trên bộ test 54 4 Hình 5.2.1 – 1 : Một số ảnh train trong ứng dụng 55 Hình 5.2.1 – 2 : Một số ảnh test trong ứng dụng 56 Hình 5.2.1 – 3 : 1 đoạn Video trong ứng dụng 56 Hình 5.2.3 – 1 : Sơ đồ quá trình tách frame từ video 58 Bảng 5.3-1 : Kết quả nhận dạng trên ảnh tĩnh 59 Hình A.2.2 – 1 : Strong classifier H(x) được xây dựng bằng AdaBoost 70 Hình A.2.2 - 2: Ví dụ minh hoạ sự kết hợp của 3 phân lớp tuyến tính 71 Bảng A.2.2 – 1 : Thuật toán AdaBoost 72 Bảng A.2.2 – 2 : Một phiên bản khác của thuật toán AdaBoost 75 Hình A.2.3 - 1 : Các đặc trưng Haar-like cơ sở 76 Hình A.2.3 - 2: Các miền hình học đặc trưng Haar – like 76 Hình A.2.3 - 3: Ý nghĩa hình học của đạo hàm ảnh 77 Hình A.2.3 - 4: Cách tính giá trị một ô đặc trưng 77 Hình A.2.3 - 5: Dò tìm bàn tay bằng đặc trưng Haar – like 78 Hình A.2.3 - 6: Dò tìm khuôn mặt bằng đặc trưng haar – like 78 79 Hình A.2.4 - 1: Cascade Classifier 79 Hình A.3.3 - 1 Hướng của véc tơ riêng 82 Hình A.4.2 - 1: Hai tín hiệu nguồn ( không quan sát trực tiếp được, tức các tính hiệu ẩn là s1(t) và s2(t)), hai tín hiệu trộn (quan sát được là x1(t) và x2(t) ) 87 Hình A.4.3 - 1: Các kí hiệu trong ICA 89 Hình A.4.6 - 1: Phân bố kết hợp của hai thành phần độc lập s1, s2 có phân bố đồng nhất (trục ngang: s1, trục đứng s2) 92 Hình A.4.6 - 2: Phân bố kết hợp của các trộn lẫn x1, x2 (trục ngang x1, trục đứng x2) 92 Hình A.4.6 - 3: Phân phối kết hợp của hai biến Gauss 93 Hình A.4.7.2.1 - 1: Hàm mật độ của phân phối Laplace, một điển hình của phân phối siêu Gauss, so với phân phối Gauss ở đường gạch nét, cả hai mật độ được chuẩn hóa phương sai đơn vị 95 Hình A.4.10.2 - 1:Minh họa kiến trúc 1 trong mô hình ICA 104 5 Hình A.4.10.2 - 2: véctơ đặc trưng cho mỗi kĩ thuật. Hàng đầu chứa 8 véctơ riêng với 8 trị riêng lớn nhất trong PCA. Hàng 2 chứa các vectơ đặc trưng trong ICA với kiến trúc I, hàng 3 chỉ ra 8 véctơ đặc trưng trong ICA với kiến trúc 2 105 Hình A.4.10.2 - 3:Mô hình tổng hợp ảnh cho kiến trúc 1 của ICA 106 Hình A.4.10.3 - 1:minh họa kiến trúc 2 trong mô hình ICA 107 Hình A.4.10.3 - 2:Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA 108 Hình A.4.10.3 - 3:Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA trên pixel 108 Hình A.4.11.1- 2. Sự phân phối dữ liệu trong không gian 3 chiều và các trục tương ứng của PCA và ICA. Mỗi trục là một cột của ma trận nghịch đảo của ma trận trộn W-1 tìm thấy bới PCA và ICA. Các trục của PCA trực giao trong khi ICA thì không, do đó khoảng cách các điểm dữ liệu sẽ thay đổi khi chiếu xuống không gian mới này 110 Hình A.5.1 - 1 : Siêu mặt phân cách tuyến tính cho trường hợp phân cách được và 111 kí hiệu các support véc tơr chính là các điểm được bao bằng viền tròn 111 Hình A.6.1-1: Mô hình một Nơron thần kinh 117 Hình A.6.2.1 - 1: Mô hình Nơron nhân tạo 118 Hình A.6.2.1.1 - 1: Mô hình toán học tổng quát của một Nơron 119 Hình A.6.2.1.3 - 1: Các xử lý tương đương trong một Nơron 120 Hình A.6.2.1.4 - 1: Hoạt động tính toán của Nơron 122 Hình A.6.2.2 - 1: Năm sơ đồ liên kết cơ bản của mạng Nơron: (a) mô hình mạngtruyền thẳng một lớp; (b) mô hình mạng truyền thẳng đa lớp; (c) mô hình: một Nơron đơn với liên kết phản hồi đến chính nó; (d) mô hình: mạng lặp một lớp; (e) mô hình: mạng lặp đa lớp 125 Hình A.6.2.2 - 2: Liên kết bên trong của phản hồi 126 Hình A.6.2.3 - 1: Ma trận trọng số nối kết 127 Hình A.6.2.3 - 2 : Học có giám sát 128 Hình A.6.2.3 - 3 : Học tăng cường 128 Hình A.6.2.3 - 4: Học không giám sát 129 Hình A.6.2.3 - 5: Luật học phát sinh trọng số (di không được cung cấp trong trường hợp học không giám sát) 131 Hình A.6.2.4 - 1: Một số dạng hàm dùng trong ánh xạ từ đầu vào -> đầu ra 133 6 Bảng A.6.2.4 – 1 : Một số hàm truyền thông dụng trong mạng Nơron 134 Hình A.6.2.5 – 1 : Các loại liên kết của Nơron 135 Hình A.6.3.1 - 1 : Cấu hình mạng RBF tiêu biểu 136 Hình A.6.3.1 - 2 : Những tập phân lớp trong không gian 2 chiều 138 HìnhA.6.3.1 - 3 : Ánh xạ các tập phân lớp lên neuron RBF 139 Hình A.6.4.1-1: Minh họa mạng lan truyền thẳng ba lớp 141 Hình B.3.1 – 1: Giao diện chính của chương trình 150 Hình B.3.2 -1: Màn hình minh họa chức năng test trên video 151 Hình B.3.2 – 2 : Giao diện của chương trình khi hoạt động 152 Hình B.3.3 – 1 : Màn hình tham số huấn luyện cho mạng nơron 153 Hình B.3.4 -1 : Màn hình đọc dữ liệu đã huấn luyện 154 Hình B.3.5 – 1: Màn hình test thư mục 155 Hình B.3.6 – 1 : Màn hình nhận dạng trên ảnh tĩnh 156 7 Danh sách các bảng Hình 1.3.1 – 1 : Mô hình tổng quát của bài toán nhận dạng mặt người 18 Hình 2.2.1 – 1 : Sơ đồ hệ dò tìm khuôn mặt bằng AdaBoost – NN 23 Hình 2.2.2 – 1 : Minh hoạ hệ dò tìm khuôn mặt bằng AdaBoost-Adaboost 24 Hình 2.3.1 – 1 : Một số ảnh có mặt người trong tập mẫu huấn luyện 24 Hình 2.3.1 – 2 : Một số ảnh không chứa mặt người trong tập mẫu huấn luyện 25 Hình 2.3.1 – 3 : Ví dụ về ảnh ngược sáng 25 Hình 2.3.1 – 4: Ví dụ về ảnh bị che khuất thành phần quan trọng 26 Hình 2.3.1 – 5 : Ví dụ về ảnh có cảm xúc đặc biệt 26 Bảng 2.3.2 – 1 : So sánh các phương pháp phát hiện + chứng thực khuôn mặt 26 Hình 2.3.2 – 1 : So sánh các phương pháp detect + chứng thực khuôn mặt 27 Hình 3.2.1 – 1 : Hướng của véc tơ riêng 28 Hình 3.2.1 – 2 : Minh hoạ phát hiện vị trí mắt, miệng trên khuôn mặt 29 Hình 3.2.1 – 3 : Minh hoạ kiểu kết hợp toàn cục và bộ phận 30 Hình 3.2.2 – 1 : . Sự phân phối dữ liệu trong không gian 3 chiều và các trục tương ứng của PCA và ICA. Mỗi trục là một cột của ma trận nghịch đảo của ma trận trộn W-1 tìm thấy bới PCA và ICA. Các trục của PCA trực giao trong khi ICA thì không, do đó khoảng cách các điểm dữ liệu sẽ thay đổi khi chiếu xuống không gian mới này 33 Hình 3.2.2 – 2 : véctơ đặc trưng cho mỗi kĩ thuật. Hàng đầu chứa 8 véctơ riêng với 8 trị riêng lớn nhất trong PCA. Hàng 2 chứa các vectơ đặc trưng trong ICA với kiến trúc I, hàng 3 chỉ ra 8 véctơ đặc trưng trong ICA với kiến trúc 2 34 8 Hình 3.2.2 – 3 :minh họa kiến trúc 1 trong mô hình ICA 35 Hình 3.2.2 – 4 :minh họa kiến trúc 2 trong mô hình ICA 36 Hình 3.2.2 – 5 :Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA 36 Hình 3.2.2 -6 :Mô hình tổng hợp ảnh cho kiến trúc 2 của ICA trên pixel 37 Bảng 3.3.2 – 1 : Kết quả so sánh PCA và ICA trên bộ dữ liệu CalTech 39 Hình 3.3.2 – 1 :Biểu đồ kết quả thử nghiệm hai phương pháp rút trích đặc trưng PCA – ICA trên bộ dữ liệu CalTech: thống kê trên bộ test 40 Hình 3.3.2 – 2: Các ảnh với phương pháp rút trích PCA bị nhận dạng sai với bộ dữ liệu nước ngoài 41 Hình 3.3.2 – 3 : Các ảnh với phương pháp rút trích ICA bị nhận dạng sai với bộ dữ liệu nước ngoài 42 Hình 3.3.3 – 1 : Một số ảnh quay phải, trái, quá tối hoặc độ sáng không đồng đều trên khuôn mặt trong tập ảnh tự tạo 43 Bảng 3.3.4 – 1 : Kết quả so sánh PCA và ICA trên bộ dữ liệu trong nước 44 Hình 3.3.4 – 1 :Biểu đồ kết quả thử nghiệm hai phương pháp rút trích đặc trưng PCA – ICA trên bộ dữ liệu tự tạo: thống kê trên bộ test 44 Hình 3.3.4 – 2 : Các ảnh với phương pháp rút trích PCA bị nhận dạng sai với bộ dữ liệu tự tạo 45 Hình 4.2.1 – 1 :Sơ đồ hệ thống nhận dạng mặt người dùng SVM 46 Hình 4.2.2 – 1 :Sơ đồ hệ thống nhận dạng mặt người dùng mạng Nơron 48 Bảng4.3.2 – 1 : Thời gian huấn luyện SVM và NN bộ dữ liệu nước ngoài 50 Bảng 4.3.2 – 2 : Thời gian nhận dạng thư mục test nước ngoài bằng SVM và NN 51 Bảng 4.3.2 – 3 : Kết quả so sánh nhận dạng SVM và NN trên bộ dữ liệu nước ngoài 52 Hình 4.3.2 – 1 : Biểu đồ kết quả thử nghiệm hai phương pháp nhận dạng SVM và NN trên 52 bộ dữ liệu nước ngoài: thống kê trên bộ test 52 Bảng 4.3.4 - 1: Thời gian huấn luyện SVM và NN bộ dữ liệu trong nước 52 Bảng 4.3.4 - 2: Thời gian nhận dạng thư mục test trong nước bằng SVM và NN 53 Bảng 4.3.4 - 3: Kết quả so sánh SVM và NN trên bộ dữ liệu trong nước 53 Hình 4.3.4 - 1 :Biểu đồ kết quả thử nghiệm hai phương pháp nhận dạng SVM và NN 54 9 trên bộ dữ liệu trong nước: thống kê trên bộ test 54 Hình 5.2.1 – 1 : Một số ảnh train trong ứng dụng 55 Hình 5.2.1 – 2 : Một số ảnh test trong ứng dụng 56 Hình 5.2.1 – 3 : 1 đoạn Video trong ứng dụng 56 Hình 5.2.3 – 1 : Sơ đồ quá trình tách frame từ video 58 Bảng 5.3-1 : Kết quả nhận dạng trên ảnh tĩnh 59 Hình A.2.2 – 1 : Strong classifier H(x) được xây dựng bằng AdaBoost 70 Hình A.2.2 - 2: Ví dụ minh hoạ sự kết hợp của 3 phân lớp tuyến tính 71 Bảng A.2.2 – 1 : Thuật toán AdaBoost 72 Bảng A.2.2 – 2 : Một phiên bản khác của thuật toán AdaBoost 75 Hình A.2.3 - 1 : Các đặc trưng Haar-like cơ sở 76 Hình A.2.3 - 2: Các miền hình học đặc trưng Haar – like 76 Hình A.2.3 - 3: Ý nghĩa hình học của đạo hàm ảnh 77 Hình A.2.3 - 4: Cách tính giá trị một ô đặc trưng 77 Hình A.2.3 - 5: Dò tìm bàn tay bằng đặc trưng Haar – like 78 Hình A.2.3 - 6: Dò tìm khuôn mặt bằng đặc trưng haar – like 78 79 Hình A.2.4 - 1: Cascade Classifier 79 Hình A.3.3 - 1 Hướng của véc tơ riêng 82 Hình A.4.2 - 1: Hai tín hiệu nguồn ( không quan sát trực tiếp được, tức các tính hiệu ẩn là s1(t) và s2(t)), hai tín hiệu trộn (quan sát được là x1(t) và x2(t) ) 87 Hình A.4.3 - 1: Các kí hiệu trong ICA 89 Hình A.4.6 - 1: Phân bố kết hợp của hai thành phần độc lập s1, s2 có phân bố đồng nhất (trục ngang: s1, trục đứng s2) 92 Hình A.4.6 - 2: Phân bố kết hợp của các trộn lẫn x1, x2 (trục ngang x1, trục đứng x2) 92 Hình A.4.6 - 3: Phân phối kết hợp của hai biến Gauss 93 Hình A.4.7.2.1 - 1: Hàm mật độ của phân phối Laplace, một điển hình của phân phối siêu Gauss, so với phân phối Gauss ở đường gạch nét, cả hai mật độ được chuẩn hóa phương sai đơn vị 95 10 [...]... khuôn mặt  Trong nước: • Nhận dạng mặt người dựa vào thông tin dựa vào thông tin khuôn mặt xuất hiện trên ảnh Sử dụng phương pháp SVM và HMM [2] • Nhận dạng mặt người dựa trên FSVM và AdaBoost [1] • Đề xuất phương pháp rút trích đặc trưng hình học (phát hiện mắt, miệng) cho bài toán nhận dạng mặt người [3] Ở giai đoạn dò tìm khuôn mặt phần lớn chỉ áp dụng phương pháp Adaboost, tuy nhiên phương pháp. .. ngăn chặn truy cập bất hợp pháp, … Đó chính là nội dung đề tài khóa luận của chúng tôi: Đề xuất phương pháp truy tìm ảnh mặt người trên video Về nội dung, luận văn tập trung vào các vấn đề sau:  Tìm hiểu cơ sở lý thuyết áp dụng cho bài toán nhận dạng: AdaBoost, PCA, ICA, SVM, Mạng Nơron  Dò tìm và chứng thực khuôn mặt: Adaboost, Mạng Nơron truy n thẳng ba lớp, mạng nơron RBF  Áp dụng phương pháp trích... các ảnh có chứa khuôn mặt: gồm có 2429 ảnh mặt người nhìn thẳng (frontal face) Hình 2.3.1 – 1 : Một số ảnh có mặt người trong tập mẫu huấn luyện  Tập con các ảnh không chứa khuôn mặt: gồm 4548 ảnh không chứa mặt 24 người được lấy ngẫu nhiên từ các ảnh phong cảnh, thú vật, … Hình 2.3.1 – 2 : Một số ảnh không chứa mặt người trong tập mẫu huấn luyện Tập ảnh dùng để test: CalTech[4], Tập ảnh gồm 450 ảnh. .. thống đề xuất cũng được kiểm chứng thông qua một ứng dụng thực tế: truy tìm đối tượng trong video Cụ thể, bài toán có thể phát biểu ngắn gọn như sau: Cho trước một CSDL ảnh mặt người các đối tượng cần truy tìm và một đoạn video quay lại khu vực cần kiểm soát Vấn đề đặt ra là: xây dựng hệ thống truy tìm tự động trả lời câu hỏi: ảnh mặt nguời các đối tượng cần truy tìm có xuất hiện trong đoạn video đã... giải quyết bài toán dò tìm khuôn mặt của đối tượng nằm tại vị trí nào trong ảnh 2.2 Đề xuất phương pháp: 2.2.1 Các phương pháp đã được thực hiện [1][3][12][27]: Quá trình dò tìm khuôn mặt trước tiên được thực hiện bởi bộ dò tìm khuôn mặt Adaboost Phương pháp AdaBoost [phụ lục A.2] được đánh giá là nhanh nhất trong các thuật toán dò tìm khuôn mặt hiện nay Tuy nhiên những khuôn mặt tìm được có độ chính... sai ảnh khuôn mặt 13 Có nhiều phương pháp chứng thực lại ảnh khuôn mặt sau khi được phát hiện bởi Adaboost, trong luận văn chúng tôi so sánh các phương pháp đã được thực hiện là Adaboost, Adaboost + NN, Adaboost + RBF và đề xuất của chúng tôi là Adaboost + Adaboost Sau khi dò tìm được khuôn mặt, phương pháp trích chọn đặc trưng truy n thống được sử dụng là phương pháp chia ô lưới thông thường, hoặc phương. .. Phương pháp đề xuất trong luận văn: Ngoài việc dùng mạng nơron cho việc chứng thực, trong luận văn chúng tôi cũng áp dụng Adaboost cho việc chứng thực khuôn mặt, tức là ảnh sau khi qua Adaboost sẽ được các ảnh ứng viên khuôn mặt, các ảnh ứng viên khuôn mặt này sẽ được đưa qua Adaboost lần thứ hai để truy tìm, nếu lần truy tìm khuôn mặt lần thứ hai này Adaboost 23 vẫn báo ảnh ứng viên là ảnh khuôn mặt. .. nhận dạng mặt người 17 1.3.1 Mô hình tổng quát của bài toán nhận dạng mặt người: Hình 1.3.1 – 1 : Mô hình tổng quát của bài toán nhận dạng mặt người 1.3.2 Các công trình nghiên cứu về phương pháp dò tìm và nhận dạng khuôn mặt: Bài toán nhận dạng khuôn mặt cần xác định bốn vấn đề chính: + Dùng phương pháp nào để xác định khuôn mặt nằm tại vị trí nào trong ảnh + Dùng đặc trưng nào trên khuôn mặt để rút... có và các phương pháp do chúng tôi đề xuất - Từ kết quả so sánh, tiến tới xây dựng mô hình hoàn chỉnh cho bài toán nhận dạng mặt người - So sánh, đánh giá mô hình đề xuất với một số mô hình truy n thống trên CSDL ứng dụng cụ thể, từ đó chỉ ra tính ưu việt của mô hình đề xuất, từ đó đưa ra lớp bài toán thích hợp với mô hình đề xuất 21 Cụ thể trong từng vấn đề:  Để detect khuôn mặt trong ảnh, luận văn... California Sau khi qua bộ dò tìm Adaboost thì ta được 441 ảnh mặt người lẫn không phải mặt người Nhận xét về tập ảnh CalTech: Hầu hết các ảnh có môi trường độ sang không đồng đều, có ảnh quá sáng hoặc quá tối, có ảnh thì bị che khuất thành phần quan trọng như mắt, một số ảnh có các trạng thái khuôn mặt khác nhau Ví dụ một số ảnh khó xử lý trong tập ảnh CalTech: Hình 2.3.1 – 3 : Ví dụ về ảnh ngược sáng 25 Hình . dạng mặt người dựa vào thông tin dựa vào thông tin khuôn mặt xuất hiện trên ảnh. Sử dụng phương pháp SVM và HMM [2]. • Nhận dạng mặt người dựa trên FSVM và AdaBoost [1]. • Đề xuất phương pháp. pháp, … Đó chính là nội dung đề tài khóa luận của chúng tôi: Đề xuất phương pháp truy tìm ảnh mặt người trên video Về nội dung, luận văn tập trung vào các vấn đề sau:  Tìm hiểu cơ sở lý thuyết. + Adaboost. Sau khi dò tìm được khuôn mặt, phương pháp trích chọn đặc trưng truy n thống được sử dụng là phương pháp chia ô lưới thông thường, hoặc phương pháp PCA, tuy nhiên các phương pháp này còn có

Ngày đăng: 08/11/2014, 10:26

Từ khóa liên quan

Mục lục

  • SVM là phương pháp phân lớp nhị phân được áp dụng trên nhiều lớp nên ở đây ta sẽ xét từng cặp, gọi là phương pháp phân lớp theo cặp

  • Ta có c = 26 phân lớp đối với bộ dữ liệu nước ngoài và c = 19 phân lớp đối với bộ dữ liệu trong nước. Mẫu cần nhận dạng (phân lớp) là mẫu X là người cần xác định người này thuộc về lớp nào trong c lớp đã được huấn luyện .

  • Xác định hàm phân loại SVM(i,j) giữa hai phân lớp i,j bất kỳ (1,2),(1,3), . .,(c-1,c) như vậy ta có tổng cộng c(c-1)/2 = 26(26-1)/2 = 325 hàm phân loại SVM cho trường hợp bộ dữ liệu nước ngoài và 20(20-1)/2 = 190 cho trường hợp bộ dữ liệu trong nước.

  • Khởi tạo mảng int vote[c] gồm c phần tử với giá trị ban đầu bằng 0 :vote[0]=0, . . , vote[c-1]=0;

  • Với mỗi cặp (i,j) hàm phân loại SVM xác định mẫu X thuộc về lớp i hay lớp j .Nếu thuộc về lớp i thì vote[i]++ còn ngược lại vote[j]++;

  • Giá trị lớn nhất của phần tử nào trong mảng vote sẽ cho biết mẫu X thuộc về lớp đó.

  • Các tham số của phương pháp phân loại SVM trong luận văn:

  • Số lớp huấn luyện :

  • Bộ dữ liệu trong nước : 19

  • Bộ dữ liệu ngoài nước : 26

  • Tổng số véc tơ hỗ trợ :

  • Bộ dữ liệu trong nước : 83

  • Bộ dữ liệu ngoài nước : 120

  • Kiểu mô hình SVM : c_svc

  • Hàm Kernel RBF (Radial Basis Function)

  • Hằng số cân bằng độ phức tạp giữa hệ và tỉ lệ lỗi C=5

  • Gamma = 0.3

  • FANN được áp dụng để phân loại một lớp với tất cả các lớp còn lại.

  • Ta có n = c = 26 phân lớp đối với bộ dữ liệu nước ngoài và c = 19 phân lớp đối với bộ dữ liệu trong nước. Mẫu cần nhận dạng (phân lớp) là mẫu X là người cần xác định người này thuộc về lớp nào trong c lớp đã được huấn luyện .

Tài liệu cùng người dùng

Tài liệu liên quan