tóm tắt luận văn thạc sĩ xây dựng hệ thống tìm kiếm ảnh theo nội dung tóm tắt luận văn thạc sĩ xây dựng hệ thống tìm kiếm ảnh theo nội dung tóm tắt luận văn thạc sĩ xây dựng hệ thống tìm kiếm ảnh theo nội dung tóm tắt luận văn thạc sĩ xây dựng hệ thống tìm kiếm ảnh theo nội dung tóm tắt luận văn thạc sĩ xây dựng hệ thống tìm kiếm ảnh theo nội dung tóm tắt luận văn thạc sĩ xây dựng hệ thống tìm kiếm ảnh theo nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Vũ Minh Đức XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2015 CHƯƠNG 1: TỔNG QUAN 1.1. Đặt vấn đề Trong chủ đề thuộc lĩnh vực xử lý nhận dạng hình ảnh, tìm kiếm ảnh theo nội dung toán đặt để thay cho phương pháp tìm kiếm ảnh thông thường dựa từ khóa mô tả ảnh. Khác với phương pháp tìm kiếm ảnh từ khóa, tìm kiếm theo nội dung tức thân ảnh phân tích để phục vụ cho việc tìm kiếm. Nội dung ảnh đối tượng, kết cấu, đặc trưng khác trích xuất từ ảnh. 1.2. Mục tiêu đề tài Nội dung ảnh đề cập luận văn xoay quanh khuôn mặt trực diện người động vật có vú. Để trích rút nội dung ảnh liên quan đến khuôn mặt, luận văn nghiên cứu thuật toán cho phép xác định vị trí khuôn mặt diện người động vật có vú. Luận văn nghiên cứu thuật toán học máy cho phép nhận diện danh tính khuôn mặt (đã xác định vị trí trước). Từ sở giải hai toán đó, luận văn xây dựng hệ thống tìm kiếm ảnh tìm ảnh người động vật có vú, ảnh trực diện người vật thuộc loài có vú, tìm ảnh có số lượng người số lượng động vật có vú, tìm ảnh có người động vật có vú giống hệt khác biệt kích thước màu sắc. 1.3. Đối tượng phương pháp nghiên cứu Đối tượng nghiên cứu luận văn nghiên cứu đặc trưng khuôn mặt người động vật có vú thể Phương pháp nghiên cứu dựa vào công cụ xử lý ảnh OpenCV có sẵn để xây dựng hệ thống tìm kiếm ảnh xoay quanh khuôn mặt người động vật có vú. CHƯƠNG 2: CÁC THUẬT TOÁN NHẬN DẠNG KHUÔN MẶT ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG. 2.1. Thuật toán xác định vị trí khuôn mặt 2.1.1. Một số thuật toán xác định vị trí khuôn mặt thường gặp Xác định vị trí vật thể nói chung khuôn mặt nói riêng chủ đề nghiên cứu nhiều giới. Turk Pentland đề xuất sử dụng PCA để huấn luyện ảnh khuôn mặt sử dụng eigenfaces làm mẫu. Viola Jones đề xuất phương pháp sử dụng đại diện ảnh tập đặc trưng gọi đặc trưng Haar. Lienhart et al. đề xuất mở rộng đặc trưng Haar, thêm vào thuộc tính bị xoay góc 45 độ. 2.1.2. Đặc trưng theo mẫu nhị phân cục (LBP) 2.1.2.1. Mẫu nhị phân cục nguyên Mẫu nhị phân cục nguyên tính toán chuỗi nhị phân cho điểm ảnh ảnh điểm ảnh lân cận xung quanh Công thức tính toán sau: Công thức 2.1: Công thức tính LBP ðiểm ảnh Với ic giá trị độ xám (xc, yc), in giá trị độ xám điểm ảnh (xn, yn) lân cận (xc, yc). Hàm s(x) định nghĩa sau: 2.1.2.2. Mẫu nhị phân vùng cục (MB-LBP) Để giải vấn đề với nhiễu, khác với LBP nguyên bản, MBLBP không sử dụng trực tiếp giá trị cấp độ xám điểm ảnh. Thay vào đó, điểm ảnh chia thành vùng. Trong vùng có giá trị cấp độ xám đại diện giá trị trung bình tất điểm ảnh vùng đó. Tiếp theo, ta coi vùng điểm ảnh phương pháp tính LBP nguyên bản. Giá trị LBP đại diện cho vùng ảnh không đại diện cho điểm ảnh trước Các chuỗi nhị phân tính theo công thức có bit. Tổng số lượng chuỗi nhị phân xuất 28 = 256. Liao chứng minh 63 cột cao biểu đồ tần xuất mã nhị phân tương ứng với N = 63 chuỗi nhị phân đồng có ý nghĩa việc phân lớp khuôn mặt. Theo ta cần để ý tới LBP chuỗi nhị phân l sau: Trong Rank[H(l)] thứ tự giá trị tần xuất xuất l biểu đồ tần xuất. N = 58. 2.1.3. Các phân lớp yếu huấn luyện chồng tầng 2.1.3.1. Các phân lớp yếu Một phân lớp yếu hp(x) chứa bảng 63 giá trị trọng số chuỗi nhị phân tương ứng. 63 giá trị có liên kết với vùng ảnh có vị trí p. Cho ảnh đầu vào phân lớp yếu hp(x), vị trí p, đầu hp(x) giá trị trọng số tương ứng với mã nhị phân x. Hn(X) phân lớp tổng hợp tầng n: Công thức 2.2: Công thức phân lớp yếu Trong đó, Wn tập điểm ảnh tầng n. 2.1.3.2. Huấn luyện chồng tầng Ý tưởng huấn luyện phân lớp chồng tầng phân lớp tổng hợp nhiều phân lớp yếu (nhiều tầng). Tuy kết cuối cho kết xác. Thuật toán phân lớp sau: Với phân lớp yếu (tầng) n, số lượng Pn tập vùng ảnh thuộc Wn cố định. Số vòng lặp huấn luyện Tn cố định. Với vòng lặp t, bảng Lppos Lpneg gán cho vùng ảnh Wn. Sau đó, với vị trí vùng ảnh p, toán tử MB-LBP thực tập ảnh khuôn mặt mẫu. Với ảnh mẫu, mã nhị phân MB-LBP tính vùng ảnh tương ứng với vị trí p. Bảng Lp tính theo công thức: Công thức 2.3: Công thức tính bảng trọng số mã nhị phân ðiểm ảnh p Tới cuối cùng, mã nhị phân x điểm ảnh có vị trí p có trọng số tổng giá trị trọng số Lp[x] vòng lặp. 2.2. Thuật toán học bán giám sát Bootstrapping Thuật toán học máy có giám sát để xác định khuôn mặt cần số lượng lớn liệu tập ảnh khuôn mặt tập ảnh khuôn mặt lọc xử lý trước thủ công. Việc chuẩn bị liệu tốn công sức thời gian. Luận văn để xuất phương pháp cho phép cẩn chuẩn bị tập nhỏ liệu huấn luyện lọc xử lý trước mà huấn luyện phân lớp xác định vị trí khuôn mặt xác gọi thuật toán Bootstrapping. Hình 2.6: Thuật toán huấn luyện bán giám sát bootstrapping 2.3. Thuật toán nhận diện khuôn mặt theo biểu đồ tần suất mẫu nhị phân cục (LBPH) Nhận diện khuôn mặt toán cần giải hệ thống tìm kiếm ảnh theo nội dung. Ta cần tìm đặc trưng để huấn luyện phân lớp nhận diện danh tính khuôn mặt. 2.3.1. Sơ lược thuật toán Eigenfaces (các khuôn mặt đặc biệt) Eigenfaces phát triển để sử dụng nhận dạng Sirovich Kirby. Sau Mattheww Turk Alex Pentland sử dụng vào nhận dạng khuôn mặt. Tuy eigenfaces gặp vấn đề gặp điều kiện ánh sáng khác chiếu lên khuôn mặt người . 2.3.2. Thuật toán nhận dạng khuôn mặt sử dụng biểu đồ tần suất mẫu nhị phân cục Thuật toán nhận dạng khuôn mặt sử dụng biểu đồ tần xuất mẫu nhị phân cục (LBPH) hạn chế việc nhận dạng sai ảnh hưởng ánh sáng lên ảnh. Sử dụng cách tính toán tử nguyên LBP cách loại bỏ mã nhị phân không cần thiết phần đề cập, ta có cách tính biểu đồ tần xuất ảnh gán nhãn fi(x, y) sau . Công thức 2.4: Công thức tính biểu đồ tần xuất ảnh Với n số lượng mã nhị phân khác tính toán tử LBP Ta chia ảnh lớn thành vùng nhỏ R0,…Rm – để đạt mục đích giữ thông tin không gian. Khi biểu đồ tần suất Hi, j tính công thức: Công thức 2.5: Công thức tính biểu đồ tần xuất ảnh chia nhỏ thành vùng Để phân lớp, ta sử dụng phương pháp tính khoảng cách biểu đồ tần suất mẫu huấn luyện với biểu đồ tần suất ảnh cần nhận diện khuôn mặt. Mức độ tương giao hai histogram: Công thức 2.6: Công thức tính độ tương giao hai biểu đồ tần xuất Thống kê Chi square Công thức 2.7: Công thức thống kê Chi square hai biểu đồ tần xuất Như vậy, khoảng cách hai histogram ảnh hai khuôn mặt nhỏ ngưỡng định ta kết luận hai khuôn mặt người. Ta có sơ đồ bước thuật toán nhận diện khuôn mặt sau: 10 Hình 3.4: Các bước thực thi tính tìm kiếm ảnh xuất khuôn mặt 3.2.2.2. Tìm kiếm ảnh giống khác kích thước màu sắc 15 Tính cho phép tìm kiếm ảnh giống khác màu sắc kích thước. Các bước thực thi tính sau Hình 3.6: Các bước thực thi tính tìm kiếm ảnh giống khác kích thước màu sắc 3.2.2.3. Tìm kiếm ảnh có số lượng người ảnh 16 Hình 3.8: Các bước thực thi tính tìm kiếm ảnh có số lượng người ảnh 3.2.2.4. Tìm kiếm khuôn mặt giống khuôn mặt cho 17 18 Hình 3.10: Các bước thực thi tính tìm kiếm khuôn mặt giống khuôn mặt cho. CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM 4.1. Thí nghiệm 1: 4.1.1. Mục đích thực nghiệm: Đo đạc độ xác thuật toán xác định vị trí khuôn mặt sử dụng phân lớp liệu khuôn mặt diện người. So sánh kết với kết hợp với thuật toán huấn luyện bán giám sát bootstrapping. 4.1.2. Bố trí thí nghiệm: Chuẩn bị liệu gán nhãn tọa độ gồm 9996 ảnh chứa khuôn mặt chụp diện nghiêng nhẹ mèo thành tập ảnh A, T có số lượng 8996, 1000: Trong đó: • A đóng vai trò tập huấn luyện cho phân lớp; • T tập liệu kiểm thử để đánh giá độ xác cuối cùng. Bổ sung 500 ảnh không chứa khuôn mặt mèo vào tập T. Sử dụng liệu G gồm 5070 ảnh không chứa khuôn mặt mèo để làm ảnh huấn luyện. Tập ảnh A T lấy nguyên vẹn từ ảnh khuôn mặt trực diện mèo Microsoft (Microsoft Cat Dataset 2008). Tập ảnh G lấy từ nguồn 450 ảnh liệu khuôn mặt trực diện Caltech ảnh PASCAL VOC 2007 ta tiến hành thí nghiệm sau: 19 Hình 4.1: bước thực thí nghiệm 4.1.3. Kết thí nghiệm: 20 Dữ liệu Dương tính Dương tính Âm tính - Âm tính - Đúng - Sai Đúng Sai Đủ góc 170 26 490 314 Đã 270 xoay thẳng 26 490 214 Bảng 4.1: Kết thí nghiệm 4.2. Thí nghiệm 2: 4.2.1. Mục đích thực nghiệm: Đo đạc độ xác thuật toán xác định vị trí khuôn mặt sử dụng phân lớp chồng tầng dựa đặc trưng MB-LBP liệu khuôn mặt diện nghiêng nhẹ loài mèo. So sánh kết huấn luyện phân lớp hoàn toàn liệu huấn luyện xác định vị trí khuôn mặt theo cách thủ công với áp dụng kết hợp với thuật toán huấn luyện bán giám sát bootstrapping. 4.2.2. Bố trí thí nghiệm: Chia liệu gồm 9996 ảnh chứa khuôn mặt chụp diện nghiêng nhẹ mèo thành tập ảnh A 1, A2, B, T có số lượng 2000, 500, 6996, 500: Trong đó: o A1, A2 đóng vai trò tập huấn luyện mồi tập huấn luyện kiểm thử vòng lặp thuật toán bootstapping; 21 o B tập liệu không xác định vị trí khuôn mặt sử dụng để mở rộng liệu huấn luyện tự động vòng lặp thuật toán bootstrapping o T tập liệu kiểm thử để đánh giá độ xác cuối cùng. Bổ sung 500 ảnh không chứa khuôn mặt mèo vào tập T. Sử dụng liệu G gồm 5070 ảnh không chứa khuôn mặt mèo để làm ảnh huấn luyện. Tập ảnh A1, A2, B T lấy nguyên vẹn từ ảnh khuôn mặt trực diện mèo Microsoft (Microsoft Cat Dataset 2008). Tập ảnh G lấy từ nguồn 450 ảnh liệu khuôn mặt trực diện Caltech ảnh PASCAL VOC 2007 Để so sánh kết việc sử dụng phân lớp chồng tầng dựa đặc trưng MB-LBP với kết hợp với thuật toán bootstapping, ta tiến hành thí nghiệm sau. Ta tiến hành thí nghiệm sau: 22 23 Hình 4.2: bước thực thí nghiệm 4.2.3. Kết thí nghiệm Âm tính - Âm tính Đúng - Sai Vòng lặp Số mẫu Tổng số Dương Dương gán nhãn mẫu gán tính - tính - Sai tự động nhãn Đúng tăng thêm 2000 28 500 25 2643 4643 111 11 498 Bảng 4.2: Kết thí nghiệm 4.3. Thí nghiệm 3: 4.3.1. Mục đích thí nghiệm: Đo đạc độ xác thuật toán nhận diện danh tính khuôn mặt sử dụng phân lớp LBPH liệu khuôn mặt diện loài người. 24 Người 4.3.2. Bố trí thí nghiệm: Chuẩn bị sẵn tập 450 khuôn mặt nhiều người, người xuất nhiều ảnh. Tập ảnh lấy từ nguồn 450 ảnh liệu khuôn mặt trực diện Caltech. Các bước thí nghiệm sau: Hình 4.3: Các bước thí nghiệm 4.3.3. Kết thực nghiệm Tổng số ảnh xuất 21 20 Dương Đúng 14 14 tính - Dương tính - Sai 26 Âm tính Đúng 432 404 445 - Âm tín 25 10 11 12 13 14 15 16 17 18 19 20 21 22 23 22 21 23 20 21 5 20 21 25 22 19 20 20 20 22 21 22 14 19 10 21 12 20 12 14 18 17 9 24 0 24 0 23 32 16 1 Bảng 4.3: Kết thí nghiệm 404 429 427 429 445 405 443 444 445 430 429 402 421 399 430 414 422 427 429 428 16 10 15 10 17 12 11 13 26 CHƯƠNG 5: KẾT LUẬN 5.1. Các kết đạt hạn chế - Luận văn nghiên cứu kỹ lưỡng thuật toán cho phép trích chọn yếu tố ảnh thuật toán hàm phân lớp chồng tầng dựa vào đặc trưng MB-LBP để xác định xác vị trí khuôn mặt người động vật có vú. - Luận văn đề xuất phương pháp áp dụng học máy bán giám sát bootstrapping vào trình huấn luyện hàm phân lớp, cho phép rút bớt công sức chuẩn bị thủ công liệu huấn luyện - Luận văn nghiên cứu, áp dụng thuật toán phân lớp LBPH vào việc nhận dạng khuôn mặt ảnh. Từ kết nghiên cứu thuật toán liên quan đến khuôn mặt, luận văn xây dựng hệ thống tìm kiếm ảnh theo nội dung xoay quanh nội dung liên quan đến khuôn mặt người động vật có vú. Tuy vậy, luận văn hạn chế Hạn chế việc ứng dụng phân lớp chồng tầng sử dụng đặc trưng MB-LBP vào việc xác định vị trí khuôn mặt người động vật có vú. Điểm hạn chế khác hệ thống tìm kiếm ảnh theo nội dung độ xác phân lớp LBPH chưa cao lắm.Một hạn chế 27 hệ thống chưa sử dụng sở liệu để lưu trữ nội dung ảnh trích xuất được. Hệ thống hoàn toàn làm việc thư mục ảnh. 5.2. Các công việc tương lai - Tiếp tục nghiên cứu cách thức áp dụng phân lớp vào việc xác định vị trí nhiều đối tượng - Tiếp tục nghiên cứu cụ thể cách thức áp dụng thuật toán học bán giám sát bootstrapping bổ trợ cho phân lớp LBPH mà không làm ảnh hưởng nhiều đến tốc độ thực thi. - Phát triển tiếp hệ thống, lưu trữ lại nội dung trích rút từ ảnh vào sở liệu. TÀI LIỆU THAM KHẢO [1] Shengcai Liao, Xiangxin Zhu, Zhen Lei, Lun Zhang, and Stan Z. Li (2007); Learning Multi-scale Block Local Binary Patterns for Face Recognition, Center for Biometrics and Security Research & National Laboratory of Pattern Recognition,Institute of Automation, Chinese Academy of Sciences, 95 Zhongguancun Donglu, Beijing 100080, China. Springer Lecture Notes in Computer Science Volume 4642, 2007, pp 828-837 [2] Ahonen, T., Hadid, A., Pietikainen, M. (2004) Face recognition with local binary patterns. In: Proceedings of the European Conference on Computer Vision, Prague, Czech, pp. 469–481. [3] Belhumeur, P.N., Hespanha, J.P., Kriegman, D.J. (1997): Eigenfaces vs. Fisherfaces: Recognition using class specific linear 28 projection. IEEE Transactions on Pattern Analysis and Machine Intelligence 19(7), 711–720. [4] Rainer Lienhart, Alexander Kuranov, Vadim Pisarevsky; (2003) Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection; Springer, Lecture Notes in Computer Science Volume 2781, 2003, pp 297-304. [5] Yann RODRIGUEZ (2006) Face Detection and Verification using Local Binary Patterns, ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE. [6] Yakowsky, David (1995); Unsupervised Word Sense Disambiguation Rivaling Supervised Methods ; Department of Computer and Information Science, University of Pennsylvania, Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics. Cambridge, MA, pp. 189–196. [7] Ojala, T., Pietikainen, M., Harwood, D. (1996): A comparative study of texture measureswith classification based on feature distributions. Pattern Recognition 29(1), 51–59. [8] Ojala, T., Pietikainen, M., Maenpaa, M. (2002): Multiresolution gray-scale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence 24(7), 971–987. [9] Phillips, P.J., Flynn, P.J., Scruggs, T., Bowyer, K.W., Chang, J., Hoffman, K., Marques, J., Min, J., Worek, W. (2005): Overview of the face recognition grand challenge. In: Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition. IEEE Computer Society Press, Los Alamitos. 29 [10] Turk, M.A., Pentland, A.P. (1991): Eigenfaces for recognition. Journal of Cognitive Neuroscience 3(1), 71–86. [11] Viola, P., Jones, M. (2001): Robust real time object detection. In: IEEE ICCV Workshop on Statistical and Computational Theories of Vision, Vancouver, Canada, July 13, 2001. [12] Zhang, G., Huang, X., Li, S.Z., Wang, Y., Wu, X. (2004): Boosting local binary pattern (LBP)-based face recognition. In: Li, S.Z., Lai, J.-H., Tan, T., Feng, G.-C., Wang, Y. (eds.) SINOBIOMETRICS 2004. LNCS, vol. 3338, pp. 180–187. Springer, Heidelberg. [13] M Jones, P. Viola (2003). Fast multi-view face detection. In IEEE Conference on Computer Vision and Pattern Recognition. [14] R. Meir and G. Rätsch (2003). An introduction to Boosting and Leveraging. Springer. [15] http://docs.opencv.org/modules/contrib/doc/facerec/facerec_tutorial.htm l 30 [...]... CHƯƠNG 3: HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG 3.1 Bộ công cụ OpenCV OpenCV là một thư viện mã nguồn mở phục vụ cho việc nghiên cứu hay phát triển về thị giác máy tính Luận văn sử dụng bộ công cụ này để xây dựng hệ thống tìm kiếm 3.2 Hệ thống tìm kiếm ảnh theo nội dung của ảnh Dựa vào các thuật toán đã nghiên cứu liên quan đến khuôn mặt, hệ thống tìm kiêms sẽ trích rút được các nội dung như: một bức ảnh có... công cụ huấn luyện mô hình phân lớp xác định vị trí khuôn mặt 3.2.2 Hệ thống tìm kiếm ảnh theo nội dung 3.2.2.1 Tìm kiếm ảnh xuất hiện khuôn mặt 14 Hình 3.4: Các bước thực thi của tính năng tìm kiếm ảnh xuất hiện khuôn mặt 3.2.2.2 Tìm kiếm các ảnh giống nhau nhưng khác về kích thước và màu sắc 15 Tính năng này cho phép tìm kiếm các ảnh giống nhau nhưng khác về màu sắc hoặc kích thước Các bước thực thi... chuẩn bị thủ công dữ liệu huấn luyện - Luận văn đã nghiên cứu, áp dụng được thuật toán phân lớp LBPH vào việc nhận dạng các khuôn mặt trong các bức ảnh Từ những kết quả nghiên cứu các thuật toán liên quan đến khuôn mặt, luận văn đã xây dựng được một hệ thống tìm kiếm ảnh theo nội dung xoay quanh các nội dung liên quan đến khuôn mặt người và động vật có vú Tuy vậy, luận văn vẫn còn những hạn chế Hạn chế... việc xác định vị trí khuôn mặt người và động vật có vú Điểm hạn chế khác của hệ thống tìm kiếm ảnh theo nội dung đó là độ chính xác của bộ phân lớp LBPH vẫn chưa cao lắm.Một hạn chế 27 nữa của hệ thống là chưa sử dụng cơ sở dữ liệu để lưu trữ các nội dung của ảnh đã trích xuất ra được Hệ thống vẫn hoàn toàn làm việc trên thư mục ảnh 5.2 Các công việc trong tương lai - Tiếp tục nghiên cứu cách thức áp dụng... Hình 3.6: Các bước thực thi của tính năng tìm kiếm các ảnh giống nhau nhưng khác về kích thước và màu sắc 3.2.2.3 Tìm kiếm các ảnh có cùng số lượng người trong ảnh 16 Hình 3.8: Các bước thực thi của tính năng tìm kiếm các ảnh có cùng số lượng người trong ảnh 3.2.2.4 Tìm kiếm khuôn mặt giống khuôn mặt đã cho 17 18 Hình 3.10: Các bước thực thi của tính năng tìm kiếm khuôn mặt giống khuôn mặt đã cho CHƯƠNG... xác cuối cùng Bổ sung 500 ảnh không chứa khuôn mặt của mèo vào tập T Sử dụng bộ dữ liệu G gồm 5070 ảnh không chứa khuôn mặt mèo để làm các ảnh nền trong khi huấn luyện Tập ảnh A1, A2, B và T được lấy nguyên vẹn từ bộ ảnh khuôn mặt trực diện của mèo của Microsoft (Microsoft Cat Dataset 2008) Tập ảnh G được lấy từ các nguồn 450 ảnh dữ liệu khuôn mặt trực diện của Caltech và bộ ảnh PASCAL VOC 2007 Để so... thống tìm kiêms sẽ trích rút được các nội dung như: một bức ảnh có xuất hiện khuôn mặt hay không, số lượng khuôn mặt xuất hiện trong bức ảnh là bao nhiêu, danh tính của các khuôn mặt trong bức ảnh và bản thân toàn bộ bức ảnh cũng coi là một nội dung được trích rút từ bức ảnh 3.2.1 Các công cụ chuẩn bị dữ liệu 3.2.1.1 Công cụ chuẩn bị dữ liệu xác định vị trí khuôn mặt thủ công làm dữ liệu huấn luyện cho... 2 4 8 15 5 10 5 17 2 12 5 11 13 26 CHƯƠNG 5: KẾT LUẬN 5.1 Các kết quả đạt được và hạn chế - Luận văn nghiên cứu kỹ lưỡng về các thuật toán cho phép trích chọn các yếu tố của bức ảnh và thuật toán của các hàm phân lớp chồng tầng dựa vào đặc trưng MB-LBP để có thể xác định được khá chính xác vị trí của các khuôn mặt của người và động vật có vú - Luận văn cũng đã đề xuất được phương pháp áp dụng học máy... tượng hơn nữa - Tiếp tục nghiên cứu cụ thể về cách thức áp dụng thuật toán học bán giám sát bootstrapping bổ trợ cho bộ phân lớp LBPH mà không làm ảnh hưởng nhiều đến tốc độ thực thi - Phát triển tiếp hệ thống, lưu trữ lại những nội dung đã trích rút từ ảnh vào cơ sở dữ liệu TÀI LIỆU THAM KHẢO [1] Shengcai Liao, Xiangxin Zhu, Zhen Lei, Lun Zhang, and Stan Z Li (2007); Learning Multi-scale Block Local... dụng bộ dữ liệu G gồm 5070 ảnh không chứa khuôn mặt của mèo để làm các ảnh nền trong khi huấn luyện Tập ảnh A và T được lấy nguyên vẹn từ bộ ảnh khuôn mặt trực diện của mèo của Microsoft (Microsoft Cat Dataset 2008) Tập ảnh G được lấy từ các nguồn 450 ảnh dữ liệu khuôn mặt trực diện của Caltech và bộ ảnh PASCAL VOC 2007 ta tiến hành thí nghiệm như sau: 19 Hình 4.1: các bước thực hiện thí nghiệm 1 4.1.3 . HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Vũ Minh Đức XÂY DỰNG HỆ THỐNG TÌM KIẾM ẢNH THEO NỘI DUNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG. xây dựng hệ thống tìm kiếm. 3.2. Hệ thống tìm kiếm ảnh theo nội dung của ảnh. Dựa vào các thuật toán đã nghiên cứu liên quan đến khuôn mặt, hệ thống tìm kiêms sẽ trích rút được các nội dung như:. 3.2.2. Hệ thống tìm kiếm ảnh theo nội dung 3.2.2.1. Tìm kiếm ảnh xuất hiện khuôn mặt 14 Hình 3.4: Các bước thực thi của tính năng tìm kiếm ảnh xuất hiện khuôn mặt 3.2.2.2. Tìm kiếm các ảnh giống