luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

101 20 0
luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Lời cảm ơn 1 Lời cảm ơn 2 Lời mở đầu Sự ra đời của chiếc máy vi tính là một đột phá trong lịch sử loài người, một bước tiến lớn trong khoa học Máy vi tính đã giúp đỡ con người hoàn thành từ những công việc nhỏ nhặt như tính toán vài con số đến những nhiệm vụ to lớn như đưa con người lên mặt trăng một cách thuận lợi Công dụng của máy vi tính vô cùng đa dạng Sự đa dạng này là do con người đã tận dụng khả năng xử lý, tính toán và lưu trữ của máy để linh hoạt sáng tạo ra các ứng dụng khác nhau phục.

Lời cảm ơn Lời mở đầu Sự đời máy vi tính đột phá lịch sử loài người, bước tiến lớn khoa học Máy vi tính giúp đỡ người hồn thành từ cơng việc nhỏ nhặt tính tốn vài số đến nhiệm vụ to lớn đưa người lên mặt trăng cách thuận lợi Cơng dụng máy vi tính vơ đa dạng Sự đa dạng người tận dụng khả xử lý, tính tốn lưu trữ máy để linh hoạt sáng tạo ứng dụng khác phục vụ cho mục tiêu riêng biệt Nhận dạng khuôn mặt người ứng dụng tuyệt vời thị giác máy tính nói riêng khoa học máy tính nói chung Bài tốn nhận dạng khn mặt người vốn nghiên cứu từ năm 1970 nay, nhiều nghiên cứu lẫn ứng dụng cho toán đời Tuy nhiên, tốn nhận dạng khn mặt người nhiều thử thách luận văn này, đề xuất hướng giải cho tốn, là: NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST Với hướng giải này, chúng tơi lập trình ứng dụng để thực nghiệm, qua thấy rõ hiệu hướng giải Luận văn gồm chương, bố cục sau: • Chương – Tổng quan: Giới thiệu tốn nhận dạng khn mặt người, hướng tiếp cận toán đề xuất hướng tiếp cận luận văn • Chương – Cơ sở lý thuyết: Trình bày sở lý thuyết Gabor wavelet, phương pháp học AdaBoost phương pháp gom nhóm • Chương – Xây dựng thuật giải: Nhận dạng mặt người với đặc trưng Gabor wavelet kết hợp AdaBoost, đưa mơ hình giải tốn • Chương – Cài đặt chương trình thực nghiệm, kết đánh giá: Thiết kế chương trình ứng dụng, giới thiệu tập mẫu huấn luyện, số đặc trưng cần lựa chọn; kết huấn luyện kết kiểm tra; đưa nhận xét hướng phát triển tương lai Dù cố gắng viết khó tránh khỏi sai sót Xin gửi phản hồi ý kiến đóng góp cho chúng tơi để đề tài ngày hồn thiện Mọi góp ý xin liên hệ nhóm tác giả: Mục lục Lời cảm ơn Lời mở đầu Mục lục Danh sách hình Danh sách bảng Chương 1: Tổng quan 10 1.1 Giới thiệu 10 1.1.1 Nhu cầu thực tế 10 1.1.2 Bài toán nhận dạng mặt người 10 1.1.3 Các ứng dụng 12 1.1.4 Những khó khăn toán nhận dạng mặt người 13 1.2 Các hướng tiếp cận toán nhận dạng mặt người 14 1.2.1 Các hướng tiếp cận 14 1.2.2 Một số cơng trình nghiên cứu 15 1.3 Đề xuất hướng tiếp cận luận văn 17 Chương 2: Cơ sở lý thuyết 20 2.1 Gabor wavelet 20 2.1.1 Wavelet gì? 20 2.1.2 Hàm sở - Hàm sở biến thiên tỉ lệ 23 2.1.3 Giải tích Fourier 24 2.1.4 Biến đổi Wavelet biến đổi Fourier 26 2.1.5 Giải tích Wavelet 28 2.1.6 Gabor wavelet 30 2.1.7 Chọn Gabor wavelet biểu diễn khuôn mặt người 36 2.2 Tổng quan AdaBoost 39 2.2.1 Giới thiệu 39 2.2.2 Phương pháp Boosting 39 2.2.3 AdaBoost 41 2.3 Tổng quan phương pháp gom nhóm 53 2.3.1 Giới thiệu 53 2.3.2 Phương pháp gom nhóm 53 2.3.3 Thuật tốn k-means 57 Chương 3: Xây dựng thuật giải 69 3.1 Vector Đặc trưng Gabor 69 3.1.1 Gabor wavelet 70 3.1.2 Đại diện cho ảnh khuôn mặt dùng Gabor wavelet 70 3.2 Không gian intra-personal không gian extra-personal 74 3.3 Chọn lựa đặc trưng phân lớp AdaBoost 76 3.4 Gom nhóm sở liệu 81 Chương 4: Cài đặt chương trình thực nghiệm, kết đánh giá 85 4.1 Thu thập chuẩn hóa tập liệu 85 4.2 Cài đặt chương trình thực nghiệm 87 4.3 Giao diện chương trình 88 4.4 Kết 91 4.5 Đánh giá 92 4.5.1 Ưu điểm 92 4.5.2 Khuyết điểm 93 4.5.3 Hướng phát triển 95 Tài liệu tham khảo 99 Danh sách hình Hình 1.1 – Một hệ thống nhận dạng mặt người 11 Hình 2.1 – Hàm sở Fourier, trục thời gian – tần số độ phủ mặt phẳng 27 Hình 2.2 – Hàm sở wavelet Daubechies, trục thời gian – tần số độ phủ mặt phẳng 28 Hình 2.3 – (Trái) Một họ Gabor wavelet; (Phải) Độ phủ mặt phẳng 35 Hình 2.4 – Một tập nhỏ đặc trưng nhận dạng mặt người 35 Hình 2.5 – Phần thực 40 lọc Gabor theo tỉ lệ hướng 38 Hình 2.6 – Ví dụ ảnh mặt người phản ứng lọc Gabor 38 Hình 2.7 – Minh họa Boosting tập mẫu điểm hai chiều 42 Hình 2.8 – Quá trình cập nhật lại trọng số xây dựng phân loại mạnh H 44 Hình 2.9 – Minh họa thuật tốn AdaBoost tập mẫu điểm hai chiều 48 Hình 2.10 – Các cách chia nhóm khác tập điểm 54 Hình 2.11 – Minh họa thuật tốn gom nhóm k-means 56 Hình 2.12 – Minh họa gom nhóm dựa phương pháp phân cấp 56 Hình 2.13 – Hai loại phương pháp tạo kiến trúc phân cấp nhóm 57 Hình 2.14 – Gom tập liệu thành nhóm dùng thuật tốn k-means 61 Hình 2.15 – Gom nhóm tối ưu khơng tối ưu 64 Hình 2.16 – Chọn trọng tâm ban đầu tốt 65 Hình 2.17 – Chọn trọng tâm ban đầu không tốt 66 Hình 2.18 – Hai cặp nhóm vói cặp trọng tâm ban đầu thuộc nhóm 67 Hình 2.19 – Hai cặp nhóm, cặp có nhiều hai trọng tâm ban đầu 67 Hình 3.1 – Đại diện Gabor wavelet cho ảnh khuôn mặt 73 Hình 3.2 – Một mẫu khơng gian IS 75 Hình 3.3 – Một mẫu khơng gian ES 75 Hình 3.4 – Mơ hình q trình huận luyện dùng AdaBoost 79 Hình 3.5 – Mơ hình q trình huấn luyện gom nhóm dùng k-means 83 Hình 3.6 – Mơ hình q trình kiểm tra 84 Hình 4.1 – Tập liệu thực nghiệm 86 Hình 4.2 – Giao diện chương trình thực nghiệm 88 Hình 4.3 – Phần thực 40 lọc Gabor 89 Hình 4.4 – Đại diện Gabor cho ảnh 90 Hình 4.5 – Kết nhận dạng 90 Hình 4.6 – Các vị trí ảnh lựa chọn 91 Hình 4.7 – Năm lọc Gabor chọn 91 Danh sách bảng Bảng 1: Thuật toán AdaBoost 44 Bảng 2: Thuật toán k-means 58 Bảng 3: Bảng ký hiệu 62 Bảng 4: Thuật toán AdaBoost dùng để chọn lựa đặc trưng 78 Bảng 5: Bảng ký hiệu 82 Bảng 6: Kết huấn luyện 92 Bảng 7: Kết AdaBoost AdaBoost kết hợp k-means 92 Bảng 8: Mơ hình phân tầng AdaBoost 97 Chương Tổng quan 1.1 Giới thiệu 1.1.1 Nhu cầu thực tế Hiện nay, xã hội ngày phát triển kéo theo quan hệ người người mở rộng Con người vừa phải tất bật làm việc, vừa chăm lo cho mối quan hệ quanh Có nhiều điều cần phải biết, nhiều thứ cần phải nhớ trí não người khơng thể chứa hết Do đó, người đành nhờ đến trợ giúp khoa học kỹ thuật, cụ thể máy tính Trong sống, bạn phải giao tiếp với nhiều người, chí lên đến hàng trăm người Hiển nhiên việc nhớ tên tất điều khó khăn Đây mục tiêu mà đề tài chúng tơi nhắm đến Một chương trình cung cấp cho bạn tên người bạn cần thông qua hình ảnh người với sở liệu gồm ảnh người định danh Với chương trình này, bạn khơng cịn phải nhớ tất khn mặt tên người quen nữa, đồng thời nhanh chóng biết bạn có quen biết đối phương khơng Tất nhiên để xây dựng chương trình vậy, trước hết ta cần xác định rõ toán xuyên suốt luận văn này: toán nhận dạng khn mặt người 1.1.2 Bài tốn nhận dạng mặt người Hệ thống sinh trắc học hệ thống thiết kế để xác minh nhận dạng người dựa vào đặc trưng sinh học người Hệ thống nhận dạng mặt người hệ thống sinh trắc học thiết kế để tìm thông tin người Kỹ thuật nhận dạng kiểm tra phù hợp dựa 10 4.2 Cài đặt chương trình thực nghiệm Chúng tơi cài đặt chương trình ứng dụng Matlab, version 7.0.1.24704 (R14) Service Pack Chúng tơi sử dụng Matlab Matlab có thư viện hàm hỗ trợ tốt cho việc xử lý ảnh Chương trình ứng dụng nhằm kiểm tra xem người cần nhận dạng có tập liệu hay khơng? Nếu có xuất ảnh tên người tập liệu, ngược lại thơng báo người khơng có tập liệu Đối với ảnh đem huấn luyện, chúng tơi sử dụng 40 lọc Gabor để rút trích đặc trưng cho ảnh Mỗi vector đặc trưng Gabor ảnh có số chiều 32.32.40 = 40960 (chiều) Mỗi vector vậy, ghi chúng thành file text để tiện cho việc sử dụng lại sau này, sau dùng AdaBoost để chọn lựa đặc trưng quan trọng để biểu diễn lại cho ảnh, ta khơng cần tính tốn lại mà duyệt tìm vị trí đặc trưng vector đặc trưng Gabor có số chiều 40960 Như vậy, chúng tơi có tất 120 vector đặc trưng Gabor có số chiều 40960 để đại diện tạm thời cho 120 ảnh đem huấn luyện Để tiến hành chọn lựa đặc trưng tìm phân loại mạnh cách dùng AdaBoost cần xây dựng nên tập mẫu hai lớp đem huấn luyện Số lượng mẫu khơng gian IS (mẫu dương tính) mà chọn 3 40    = 120 mẫu Ta biết số lượng mẫu khơng gian ES (mẫu âm tính)  2  40   3  − 40    = 7020 mẫu Do đó, để   2 lớn so với số lượng mẫu IS cụ thể  2 xây dựng nên tập mẫu huấn luyện AdaBoost, tiến hành chọn ngẫu nhiên 1600 mẫu từ 7020 mẫu âm tính khơng gian ES Như vậy, tập mẫu huấn luyện AdaBoost bao gồm 1720 mẫu, có 120 mẫu dương tính cịn lại 1600 mẫu âm tính 87 Ta biết số lượng đặc trưng quan trọng cần chọn sau huấn luyện AdaBoost số vịng lặp T q trình huấn luyện Ở đây, chúng tơi chọn T = 200, nghĩa ta cần 200 đặc trưng Gabor để đại diện cho ảnh tập liệu đem huấn luyện tập liệu đem kiểm tra 4.3 Giao diện chương trình Chương trình ứng dụng chúng tơi có giao diện đơn giản, hình 4.2 Hình 4.2 – Giao diện chương trình thực nghiệm Chương trình bao gồm nút : • Nút “Load” – nhấp vào nút để tìm ảnh mà cần nhận dạng • Nút “Gabor Wavelet” – nhấn vào nút phần thực 40 lọc Gabor sử dụng để rút trích đặc trưng • Nút “Gaborface” – nhấn vào nút đại diện Gabor cho ảnh (hay vector đặc trưng Gabor có số chiều 40960) 88 • Nút “Recognize” – nhấn vào nút để kiểm tra ảnh cần nhận dạng có nằm tập liệu hay khơng? Nếu có xuất ảnh tên người bên dưới, ngược lại thơng báo người khơng có tập liệu • Nút “Exit” – nhấn vào nút đóng lại chương trình Nhấn nút “Gabor Wavelet”, hình 4.3 Nhấn nút “Gaborface”, hình 4.4 Nhấn nút “Recognize”, hình 4.5 Hình 4.3 – Phần thực 40 lọc Gabor 89 Hình 4.4 – Đại diện Gabor cho ảnh Hình 4.5 – Kết nhận dạng 90 4.4 Kết Với số lượng tập mẫu đem huấn luyện 1720 (gồm 120 mẫu dương tính 1600 mẫu âm tính) số đặc trưng lựa chọn T = 200 thời gian huấn luyện 10.741giây với lỗi huấn luyện 6,686% , tương ứng 93,313% mẫu huấn luyện phân loại lớp Trong đó, tất mẫu dương tính phân lớp có 115 mẫu âm tính bị phân loại sai lớp, bảng Việc chọn lựa 200 đặc trưng quan trọng để đại diện lại cho ảnh lại việc ta lựa chọn vị trí ảnh lựa chọn lọc Gabor số 40 lọc Gabor sử dụng Qua kết huấn luyện chọn 200 đặc trưng Gabor, ta thấy vị trí chọn ảnh phần lớn tập trung vùng mắt, chân mày, mũi, miệng,… vị trí điều vị trí đặc biệt quan trọng để phân biệt khn mặt với nhau, hình 4.6, hình 4.7 Hình 4.6 – Các vị trí ảnh lựa chọn Hình 4.7 – Năm lọc Gabor chọn Sử dụng k-means để gom nhóm tập ảnh huấn luyện gồm 120 ảnh với k = 40 , kết có 11 ảnh bị gom sai nhóm Q trình nhận dạng có 80 ảnh cần kiểm tra kết cho thấy có 69 ảnh nhận dạng xác có 11 ảnh nhận dạng khơng xác Do đó, tỉ lệ nhận dạng xác đến 86,25% Nếu khơng sử dụng k-means để gom nhóm tập huấn luyện trình kiểm tra 80 ảnh có kết 72 ảnh nhận dạng xác có ảnh 91 nhận dạng khơng xác Do đó, tỉ lệ nhận dạng xác đến 90% Tuy nhiên, thực thi chương trình lâu Ta có bảng thống kê kết hai trường hợp, bảng Mẫu IS Mẫu ES 120 Mẫu huấn luyện 1600 1720 Số đặc trưng chọn (T) 200 Thời gian huấn luyện 10.741 giây Mẫu bị phân sai lớp Mẫu IS Mẫu ES 115 Lỗi huấn luyện 6,686% Bảng 6: Kết huấn luyện Số ảnh Số ảnh Số ảnh cần nhận nhận dạng nhận dạng dạng sai 80 69 11 86,25 80 72 90 AdaBoost kết hợp k-means AdaBoost Tỉ lệ xác (%) Thời gian trung bình 0.1 giây giây Bảng 7: Kết AdaBoost AdaBoost kết hợp k-means 4.5 Đánh giá 4.5.1 Ưu điểm Trong đề tài này, sở tìm hiểu phương pháp học AdaBoost, Gabor wavelet phương pháp gom nhóm, chúng tơi kết hợp phương pháp lại với áp dụng để giải tốn nhận dạng khn mặt người Khi tìm hiểu tốn nhận dạng khn mặt người, tiếp cận với phương pháp nhận dạng AdaBoost phương pháp chọn đặc trưng cho AdaBoost Gabor wavelet 92 Đối với người, việc nhận dạng khn mặt việc khơng khó Tuy nhiên, với máy tính việc nhận dạng tự động không dễ thực Việc chọn phương pháp để biểu diễn thông tin ảnh cho máy lưu trữ để nhận dạng nghiên cứu từ lâu Trong đề tài này, chọn Gabor wavelet để rút trích đặc trưng ảnh thành phần họ Gabor wavelet mơ hình cấu trúc không gian vùng tiếp thu tế bào đơn vỏ não nguyên thủy động vật có vú Phân tích Gabor xem kính hiển vi nhạy cảm với hướng tỷ lệ [5, 6] Do đó, việc chọn Gabor wavelet hợp lý cho vấn đề Đồng thời, việc sử dụng Gabor wavelet để rút trích vectơ đặc trưng Gabor cho ảnh thực nhanh Từ AdaBoost đời, sử dụng phổ biến nhiều lĩnh vực, đặc biệt lĩnh vực phân loại mẫu nhận dạng mẫu Với thành công lớn hai lĩnh vực lựa chọn AdaBoost cơng cụ để giải tốn nhận dạng mặt người Ngoài việc xây dựng nên phân loại mạnh dùng q trình phân lớp, AdaBoost cịn hữu ích việc chọn lựa đặc trưng quan trọng để xây dựng nên vectơ đặc trưng có số chiều nhỏ đại diện cho ảnh Bên cạnh đó, chúng tơi áp dụng phương pháp gom nhóm dùng thuật tốn k-means để giúp cho q trình kiểm tra có thời gian xử lý nhanh thay phải duyệt hết tất ảnh sở liệu, đồng thời k-means giúp hạn chế việc phân loại sai lớp Tập liệu chọn tương đối đa dạng, khn mặt ảnh có biến đổi phong phú (chẳng hạn, có đeo kính, có râu, có cảm xúc khác nhau,…) Chương trình ứng dụng nhận dạng tốt với tỉ lệ nhận dạng xác 86.25% việc chọn lựa đặc trưng Gabor vị trí phù hợp với đặc trưng khuôn mặt người (chẳng hạn vùng mắt , mũi ,…) 4.5.2 Khuyết điểm 93 Hệ thống nhận dạng với cách tiếp cận so khớp đặc trưng từ phương pháp học mạnh tích chặt chẽ mặt tốn học chưa cao, nhiều trường hợp tối ưu hóa địi hỏi phải thử nghiệm nhiều lần với nhiều tham số khác Khi sử dụng Gabor wavelet, phải đối diện với vấn đề lựa chọn thông số nhân Gabor, chẳng hạn hướng, tỉ lệ, tần số sóng, khoảng cách nhân Gabor miền tần số,… Việc lựa chọn thông số thực tổng quát Tùy vào ứng dụng cụ thể tập cở sở liệu mẫu dùng toán khác mà ta có cách lựa chọn khác Thơng qua q trình thực nghiệm lâu dài, nhà nghiên cứu lựa chọn thơng số trình bày áp dụng cho Gabor wavelet thấy việc chọn thơng số có kết tốt Khi sử dụng AdaBoost, số khó khăn đặt việc lựa chọn số lượng mẫu thời gian huấn luyện AdaBoost địi hỏi phải có số lượng mẫu lớn để huấn luyện phân loại đạt hiệu Viola Jones [20] cần đến 4916 ảnh mặt người để huấn luyện cho hệ thống xác định khuôn mặt người dùng AdaBoost Khi sử dụng hai không gian IS ES, phải đối diện với vấn đề cân đối số lượng mẫu hai không gian Số lượng mẫu không gian IS lại nhỏ so với số lượng mẫu khơng gian ES, việc chọn số lượng mẫu không gian ES kết hợp với mẫu không gian IS để xây dựng nên tập mẫu đem huấn luyện cho AdaBoost vấn đề chưa giải triệt để Nếu lựa chọn tất mẫu không gian ES để kết hợp với tất mẫu khơng gian IS để đem huấn luyện tập mẫu huấn luyện có kích thước q lớn, bên cạnh số lượng vectơ đặc trưng mẫu lại có số chiều lớn, điều đòi hỏi thời gian huấn luyện lâu Một cách khắc phục, chọn ngẫu nhiên số lượng mẫu không gian ES (có thể chọn lớn gấp 10 lần số lượng mẫu không gian IS) để kết hợp với mẫu không gian IS làm tập mẫu huấn luyện Tuy nhiên điều đôi 94 ảnh hưởng xấu đến kết phân loại huấn luyện lượng mẫu chọn ngẫu nhiên lần không gian ES không bao quát đầy đủ thông tin tất khác biệt ảnh trình huấn luyện thực lần để tìm phân loại mạnh, dẫn đến việc mẫu bị phân loại sai lớp không huấn luyện lại Do đó, cần phải có phương pháp tốt để khắc phục hạn chế định chọn phương pháp sử dụng cấu trúc phân tầng Đây hướng phát triển chúng tơi cho đề tài Trong q trình sử dụng thuật tốn k-means để tiến hành phân nhóm sở liệu ảnh phục vụ trình kiểm tra Việc chọn số nhóm k để phân nhóm, chọn ngẫu nhiên trọng tâm ban đầu nhóm phụ thuộc cách chủ quan người giám sát Như trình bày cách chọn hai thơng số trên, thật ý tưởng chúng tơi đưa lúc đầu Do đó, để đạt kết tối ưu phải trải qua thực nghiệm với nhiều hệ số khác nhau, ta tìm phương án hợp lý xác Độ lớn tập sở liệu hạn chế, thử nghiệm 200 ảnh 40 người Số lượng ảnh người có nhiều biến đổi khơng q nhiều (chưa có trường hợp nghiêng 45o trở lên), điều làm giảm chất lượng hệ thống nhận dạng áp dụng giới thực mà khn mặt môi trường thay đổi liên tục 4.5.3 Hướng phát triển Ta biết tốn nhận dạng khn mặt người vốn nghiên cứu từ năm 1970, nay, nhiều nghiên cứu lẫn ứng dụng cho toán đời Tuy nhiên, toán nhận dạng khn mặt người cịn nhiều khó khăn , thử thách biến đổi đa dạng, phong phú khn mặt Do đó, có nhiều phương pháp khác để giải toán Với cách giải dùng Gabor Wavelet AdaBoost mà áp dụng chuyên gia tiến hành nghiên cứu khoảng chục năm trở lại Với 95 hạn chế mặt kiến thức, trình độ thời gian thực hiện, kết thúc đề tài với nghiên cứu phần nhỏ toán nhận dạng mẫu thị giác máy tính khoa học máy tính nói chung Những định hướng đưa đây, hy vọng thực để ngày hoàn thiện khả tương tác người máy tính thơng qua hệ thống nhận dạng khn mặt Để tìm phân loại tốt đạt hiệu cao nhất, đồng thời cố gắng tận dụng tối đa số lượng mẫu không gian ES để kết hợp với mẫu không gian IS tạo thành tập huấn luyện cho AdaBoost Chúng sử dụng cấu trúc phân tầng để tìm phân loại mạnh dùng cho trình phân lớp Cấu trúc phân tầng áp dụng thành công vào ứng dụng khác Hệ thống Rowley [9] để giải toán xác định vị trí khn mặt người mơt cấu trúc phân tầng với hai mạng nơron nhân tạo: mạng nơron nhân tạo thứ đơn giản nhằm mục đích loại bỏ hình có độ khó thấp, mạng nơron nhân tạo thứ hai phức tạp hơn, đảm nhiệm việc nhận dạng mẫu qua mạng nơron nhân tạo thứ Điều chứng tỏ cách tổ chức phân tầng nhằm loại nhanh mẫu có độ phức tạp thấp thực đẩy nhanh tốc độ hệ thống, ngồi cịn có mơ hình Cascade of Boosted Classifiers Viola Jones đưa để giải tốn xác định vị trí khn mặt người, Cascade of Boosted Classifiers mơ hình Cascade of Classifers với phân loại xây dựng AdaBoost sử dụng Haar Feature [8, 20] Chúng sử dụng cấu trúc phân tầng bao gồm nhiều tầng, tầng huấn luyện AdaBoost, tầng tập mẫu huấn luyện chọn lại, ta gọi q trình tái lấy mẫu, mẫu khơng gian IS cố định không đổi, mẫu khơng gian ES tái lấy mẫu Trên tầng xây dựng phân loại mạnh Hi phân loại mạnh thu sau trình huấn luyện đa tầng kết hợp tuyến tính từ phân loại mạnh tầng: 96 c H =  Hi i =1 (4.1) c số tầng Mơ hình phân tầng để huấn luyện mơ tả bảng Tạo ngẫu nhiên tập S làm tập mẫu huấn luyện Trong S bao gồm tất mẫu dương tính khơng gian IS chọn ngẫu nhiên mẫu không gian ES làm mẫu âm tính có số lượng gấp 12 lần số lượng mẫu dương tính Gọi N kích thước tập mẫu For i = : c 2.1 Dùng AdaBoost huấn luyện phân loại mạnh Hi dựa tập mẫu S 2.2 Tái lấy mẫu, cập nhật lại S Tập S lúc bao gồm mẫu dương tính giống tầng trước, mẫu âm tính chọn ngẫu nhiên khơng gian ES thỏa điều kiện mẫu bị phân loại sai lớp phân loại mạnh tầng trước Tập S có kích thước N Bộ phân loại mạnh H : c H =  Hi i =1 hay :  c  T  H ( x) = sign     t h t ( x)   i   i =1  t =1 Bảng 8: Mơ hình phân tầng AdaBoost 97 Trong nhiều trường hợp, huấn luyện phân lớp mạnh mà khơng sử dụng cấu trúc phân tầng đạt kết tốt Tuy nhiên, sử dụng cấu trúc phân tầng, phân loại mạnh cuối đạt hiệu tốt hẳn đồng thời phân loại yếu học nhiều đặc trưng Gabor Do đó, ta chọn lựa nhiều đặc trưng Gabor so với việc không dùng cấu trúc phân tầng để xây dựng nên vectơ đặc trưng đại diện cho ảnh Có hạn chế nhỏ dùng cấu trúc phân tầng phân loại yếu tầng sau phải tính lại hồn tồn mà khơng kế thừa từ tầng trước Ngồi ra, q trình gom nhóm sở liệu đạt hiệu độ xác cao Chúng tơi đề hướng phát triển sử dụng biến thể thuật toán k-means bisecting k-means [22] Bisecting k-means dạng mở rộng k-means, bisecting k-means bị ảnh hưởng vấn đề khởi tạo trọng tâm ban đầu đạt hiệu cao so với k-means, đồng thời làm tăng tốc độ k-means cách giảm số lượng tính tốn lân cận trọng tâm đối tượng khác Tìm hiểu thêm phương pháp chọn đặc trưng khác để biểu diễn cho ảnh, phương pháp học khác để tìm phân loại dùng để phân lớp Chẳng hạn dùng phép biến đổi Haar-like để rút trích đặc trưng Haar đại diện cho ảnh, dùng phương pháp học SVM để phân lớp ảnh khuôn mặt Đánh giá phương pháp với phương pháp đề xuất đề tài để thấy ưu điểm hạn chế mà sau đề xuất phương pháp tốt Sử dụng tập liệu lớn hơn, tăng số người số ảnh lên nhiều hơn, tăng dần số mẫu học đặc biệt biến đổi khn mặt phong phú đa dạng ta đánh giá xác hệ thống nhận dạng nâng cao khả nhận dạng tổng quát cho hệ thống, đáp ứng nhu cầu thực tế từ giới thực mà số người cần phân loại lên đến hàng nghìn, hàng triệu hàng tỉ người Phát triển thành sản phẩm ứng dụng đời sống xã hội 98 Tài liệu tham khảo [1] W Zhao, R Chellappa, P J Phillips and A Rosenfeld, “Face Recognition: A Literature Survey”, In ACM Computing Surveys, Vol.35, No.4, pages 399-458, 2003 [2] Phạm Thế Bảo, Nguyễn Thành Nhựt, Cao Minh Thịnh, Trần Anh Tuấn Phan Phúc Dỗn, “Tổng quan phương pháp xác định khn mặt người”, Tạp chí Cơng nghệ thơng tin & Truyền thông, http://www.tapchibcvt.gov.vn [3] Julien Meynet, “Fast Face Detection Using AdaBoost”, http://infoscience.epfl.ch/record/86954/files/Meynet2003_923.pdf, 95 pages, 16th July 2003 [4] Yoav Freund and Robert E Schapire, “A decision-theoritic generalization of online learning and an application to boosting”, In Journal of Computer and System Sciences, 55(1): 119-139, 1997 [5] Burcu Kepenekci, “Face Recognition Using Gabor Wavelet Transform”, A Thesis Submitted To The Graduate School Of Natural Sciences Of The Middle East Technical University, September 2001 [6] Javier R Movellan, “Tutorial on Gabor Filters”, Technical Report, MPLab Tutorials, Univ of California, San Diego, 2005 [7] Ulas, Bagci and Li Bai, “Parallel AdaBoost Algorithm For Gabor Wavelet Selection In Face Recognition”, Computer Research Repository (CoRR), July 2009 [8] Lu Boun Vinh Hoàng Phương Anh, “Nghiên cứu xây dựng hệ thống nhận dạng mặt người dựa FSVM AdaBoost”, Đề tài luận văn tốt nghiệp cử nhân tin học, Khoa công nghệ thông tin, Trường Đại Học Khoa Học Tự Nhiên TP.HCM, 2004 99 [9] Đinh Bá Thắng Đặng Bác Văn, “Tìm hiểu kỹ thuật áp dụng cho toán nhận dạng ký hiệu người câm”, Đề tài luận văn tốt nghiệp cử nhân tin học, Khoa công nghệ thông tin , Trường Đại Học Khoa Học Tự Nhiên TP.HCM, 2005 [10] Peng Yang, Shiguang Shan, Wen Gao, Stan Z Li and Dong Zhang, “Face Recognition Using Ada-Boosted Gabor Features”, Proceeding of the 6th IEEE International Conference on Automatic Face and Gesture Recognition, pp 356361, Korea, May 2004 [11] M Zhou and H Wei, “Face verification using Gabor Wavelets and AdaBoost”, 18th International Conference on Pattern Recognition, pp 404-407, 2006 [12] Boris Ruf, “Face recognition using boosting”, M.S thesis, Ecole Polytechnique F´ed´erale de Lausanne, Lausanne, Switzerland, 2007 [13] Yoav Freund and Robert E Schapire, “A Short Introduction to Boosting”, Journal of Japanese Society for Artificial Intelligence, 14(5):771-780, September 1999 [14] LE DINH DUY, “ Human Face Processing Techniques With Application To Large Scale Video Indexing”, Ph.D Thesis, Department of Informatics, School of Multidisciplinary Sciences, The Graduate University for Advanced Studies (SOKENDAI), September 2006 [15] A.K.Jain and R.C.Dubes, “Algorithms for Clustering Data”, Prentice Hall Advanced Reference Series, Prentice Hall, March 1988 [16] Marios Kyperountas, Anastasios Tefas and Ioannis Pitas, “Face Recognition via Adaptive Discriminant Clustering”, 15th IEEE International Conference on Image Processing, 2008 [17] Youngjin Lee and Seungjin Choi, “Minimum entropy, k-means, spectral cluster-ing”, Proceedings of the International Joint Conference on Neural Networks (IJCNN), pp 117-122, Budapest, Hungary, July 25-29, 2004 100 [18] M Zhou, H Wei and S J Maybank, “Gabor Wavelets and AdaBoost in Feature Selection for Face Verification”, Applications of Computer Vision 2006 workshop in conjuction with ECCV 2006, pp 101-109 Graz, Austria, 12 May 2006 [19] Linlin Shen, Li Bai and Daniel Bardsley, Yangsheng Wang, “Gabor Feature Selection for Face Recognition using Improved AdaBoost Learning”, Proceedings of International Workshop on Biometric Recognition System, in conjunction with ICCV’05, 2005 [20] P Viola and M J Jones, “Robust real-time face detection”, International Journal of Computer Vision, 57(2):137 154, May 2004 [21] Lei Zhang, Stan Z Li, Zhi Yi Qu and Xiangsheng Huang, “Boosting Local Feature Based Classifiers for Face Recognition”, In Proc of CVPR Workshop on Face Processing in Video, Washington DC, pp 87-93, 2004 [22] Pang-Ning Tan, Michael Steinbach and Vipin Kumar, “Introduction to Data Mining”, Chapter - Cluster Analysis: Basic Concepts and Algorithms, Pearson Addison-Wesley, pp 488-568, 2006 [23] Baback Moghaddam, Wasiuddin Wahid and Alex Pentland, “Beyond Eigenfaces: Probabilistic Matching for Face Recognition”, the 3rd IEEE Int’l Conference on Automatic Face & Gesture Recognition, Nara, Japan, April , 1998 [24] Graps A.L., “An Introduction to Wavelets”, IEEE Computational Sciences and Engineering, Volume 2, Number 2, pp 50-61, Summer 1995 101 ... suốt luận văn này: tốn nhận dạng khn mặt người 1.1.2 Bài toán nhận dạng mặt người Hệ thống sinh trắc học hệ thống thiết kế để xác minh nhận dạng người dựa vào đặc trưng sinh học người Hệ thống nhận. .. hướng giải cho tốn, là: NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST Với hướng giải này, lập trình ứng dụng để thực nghiệm, qua thấy rõ hiệu hướng giải Luận văn gồm chương, bố... hướng cho tốn nhận dạng khn mặt người nhận dạng khuôn mặt theo thời gian, kết hợp với nghề nghiệp môi trường làm việc, hay chủng tộc,… 1.1.3 Các ứng dụng Bài toán nhận dạng mặt người áp dụng

Ngày đăng: 28/04/2022, 07:25

Hình ảnh liên quan

Hình 1.1 – Một hệ thống nhận dạng mặt người. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 1.1.

– Một hệ thống nhận dạng mặt người Xem tại trang 11 của tài liệu.
Hình 2.4 – Một tập nhỏ các đặc trưng có thể nhận dạng mặt người và các vùng tiếp thu được đối chiếu với vài đặc trưng địa phương trên khuôn mặt (a)  miệng, (b) mũi, (c) mi mắt, (d) đường viền hàm dưới, (e) gò má - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.4.

– Một tập nhỏ các đặc trưng có thể nhận dạng mặt người và các vùng tiếp thu được đối chiếu với vài đặc trưng địa phương trên khuôn mặt (a) miệng, (b) mũi, (c) mi mắt, (d) đường viền hàm dưới, (e) gò má Xem tại trang 35 của tài liệu.
Hình 2.3 – (Trái) Một họ Gabor wavelet; (Phải) Độ phủ của nó trong mặt phẳng tần số.  - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.3.

– (Trái) Một họ Gabor wavelet; (Phải) Độ phủ của nó trong mặt phẳng tần số. Xem tại trang 35 của tài liệu.
Hình 2.6 – Ví dụ của ảnh mặt người phản ứng trên bộ lọc Gabor, (a) ảnh mặt người gốc; (b) phản ứng của bộ lọc - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.6.

– Ví dụ của ảnh mặt người phản ứng trên bộ lọc Gabor, (a) ảnh mặt người gốc; (b) phản ứng của bộ lọc Xem tại trang 38 của tài liệu.
Hình 2.5 – Phần thực của 40 bộ lọc Gabor theo 5 tỉ lệ và 8 hướng. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.5.

– Phần thực của 40 bộ lọc Gabor theo 5 tỉ lệ và 8 hướng Xem tại trang 38 của tài liệu.
Hình 2.7 – Minh họa Boosting trên tập mẫu là các điểm hai chiều. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.7.

– Minh họa Boosting trên tập mẫu là các điểm hai chiều Xem tại trang 42 của tài liệu.
Hình 2.8 – Quá trình cập nhật lại trọng số và xây dựng bộ phân loại mạnh H. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.8.

– Quá trình cập nhật lại trọng số và xây dựng bộ phân loại mạnh H Xem tại trang 44 của tài liệu.
Hình 2.9 – Minh họa thuật toán AdaBoost trên tập mẫu là các điểm hai chiều. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.9.

– Minh họa thuật toán AdaBoost trên tập mẫu là các điểm hai chiều Xem tại trang 48 của tài liệu.
Hình 2.12 – Minh họa gom nhóm dựa trên phương pháp phân cấp. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.12.

– Minh họa gom nhóm dựa trên phương pháp phân cấp Xem tại trang 56 của tài liệu.
Hình 2.11 – Minh họa thuật toán gom nhóm k-means. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.11.

– Minh họa thuật toán gom nhóm k-means Xem tại trang 56 của tài liệu.
Hình 2.13 – Hai loại phương pháp tạo kiến trúc phân cấp nhóm. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.13.

– Hai loại phương pháp tạo kiến trúc phân cấp nhóm Xem tại trang 57 của tài liệu.
Hình 2.14 – Gom tập dữ liệu thành 3 nhóm dùng thuật toán k-means. •Gán các đối tượng đến trọng tâm gần nhất  - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.14.

– Gom tập dữ liệu thành 3 nhóm dùng thuật toán k-means. •Gán các đối tượng đến trọng tâm gần nhất Xem tại trang 61 của tài liệu.
Bảng 3: Bảng ký hiệu 1. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Bảng 3.

Bảng ký hiệu 1 Xem tại trang 62 của tài liệu.
Hình 2.17 – Chọn trọng tâm ban đầu không tốt. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.17.

– Chọn trọng tâm ban đầu không tốt Xem tại trang 66 của tài liệu.
Hình 2.18 – Hai cặp nhóm vói mỗi cặp trọng tâm ban đầu thuộc một nhóm. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.18.

– Hai cặp nhóm vói mỗi cặp trọng tâm ban đầu thuộc một nhóm Xem tại trang 67 của tài liệu.
Hình 2.19 – Hai cặp nhóm, mỗi cặp có ít hơn hoặc nhiều hơn hai trọng tâm ban đầu.  - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 2.19.

– Hai cặp nhóm, mỗi cặp có ít hơn hoặc nhiều hơn hai trọng tâm ban đầu. Xem tại trang 67 của tài liệu.
Hình 3.1 – Đại diện Gabor wavelet cho một bức ảnh khuôn mặt. (a) Phần thực của Gabor wavelet đại diện - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 3.1.

– Đại diện Gabor wavelet cho một bức ảnh khuôn mặt. (a) Phần thực của Gabor wavelet đại diện Xem tại trang 73 của tài liệu.
Hình 3.3 – Một mẫu trong không gian ES. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 3.3.

– Một mẫu trong không gian ES Xem tại trang 75 của tài liệu.
Hình 3.2 – Một mẫu trong không gian IS - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 3.2.

– Một mẫu trong không gian IS Xem tại trang 75 của tài liệu.
Bảng 4: Thuật toán AdaBoost dùng để chọn lựa đặc trưng Mô hình quá trình huấn luyện được mô tả như hình 3.4  - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Bảng 4.

Thuật toán AdaBoost dùng để chọn lựa đặc trưng Mô hình quá trình huấn luyện được mô tả như hình 3.4 Xem tại trang 78 của tài liệu.
Hình 3.4 – Mô hình quá trình huận luyện dùng AdaBoost. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 3.4.

– Mô hình quá trình huận luyện dùng AdaBoost Xem tại trang 79 của tài liệu.
Bảng 5: Bảng ký hiệu 2. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Bảng 5.

Bảng ký hiệu 2 Xem tại trang 82 của tài liệu.
Mô hình minh họa cho quá trình gom nhóm và quá trình kiểm tra lần lượt được mô tả như hình 3.5 và hình 3.6 - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

h.

ình minh họa cho quá trình gom nhóm và quá trình kiểm tra lần lượt được mô tả như hình 3.5 và hình 3.6 Xem tại trang 83 của tài liệu.
Hình 3.6 – Mô hình quá trình kiểm tra. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 3.6.

– Mô hình quá trình kiểm tra Xem tại trang 84 của tài liệu.
Chương trình ứng dụng của chúng tôi có giao diện đơn giản, hình 4.2. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

h.

ương trình ứng dụng của chúng tôi có giao diện đơn giản, hình 4.2 Xem tại trang 88 của tài liệu.
Nhấn nút “Gaborface”, hình 4.4. Nhấn nút “Recognize”, hình 4.5.   - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

h.

ấn nút “Gaborface”, hình 4.4. Nhấn nút “Recognize”, hình 4.5. Xem tại trang 89 của tài liệu.
Hình 4.4 – Đại diện Gabor cho ảnh. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 4.4.

– Đại diện Gabor cho ảnh Xem tại trang 90 của tài liệu.
Hình 4.5 – Kết quả nhận dạng. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Hình 4.5.

– Kết quả nhận dạng Xem tại trang 90 của tài liệu.
Bảng 6: Kết quả huấn luyện - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

Bảng 6.

Kết quả huấn luyện Xem tại trang 92 của tài liệu.
Mô hình phân tầng để huấn luyện được mô tả trong bảng 8. - luận văn NHẬN DẠNG MẶT NGƯỜI VỚI ĐẶC TRƯNG GABOR WAVELET KẾT HỢP ADABOOST

h.

ình phân tầng để huấn luyện được mô tả trong bảng 8 Xem tại trang 97 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan