Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 20 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
20
Dung lượng
550,33 KB
Nội dung
ĐẠI HỌC HỌC HUẾ HUẾ ĐẠI TRƯỜNG ĐẠI ĐẠI HỌC HỌC KHOA KHOA HỌC HỌC TRƯỜNG KHOA CÔNG NGHỆ THÔNG TIN VĂN THẾ THÀNH CHUYÊN ĐỀ 01 Ngành: Khoa học máy tính Mã ngành: 62.48.01.01 TÌMKIẾMẢNH NGHIÊN CỨU TRUY TRÊNDỰATRÊNĐỒ THỊVẤN CHỮẢNH KÝDỰANHỊPHÂNCHỮKÝNHỊPHÂN VÀ CÂY S-Tree Học viên thực hiện: Văn Thế Thành Người hướng dẫn khoa học: PGS TS Lê Mạnh Thạnh LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Huế HUẾ - NĂM 2017 ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC VĂN THẾ THÀNH TÌMKIẾMẢNHDỰATRÊNĐỒTHỊCHỮKÝNHỊPHÂN Chuyên ngành: Khoa học máy tính Mã ngành: 62.48.01.01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: PGS TS Lê Mạnh Thạnh HUẾ - NĂM 2017 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Nội dung tham khảo từ cơng trình khác trích dẫn rõ ràng Các kết viết chung với tác giả khác đồng ý trước đưa vào luận án Các kết luận án trung thực chưa công bố công trình khác ngồi cơng trình tác giả Tác giả Văn Thế Thành Lời cảm ơn Đầu tiên, em xin chân thành gửi lời cảm ơn Thầy PGS TS Lê Mạnh Thạnh hướng dẫn tận tình khoa học Thầy dẫn dắt em bước đường nghiên cứu khoa học; Thầy hướng dẫn tận tình phương pháp nghiên cứu, phương pháp viết báo khoa học phương pháp tổng hợp tri thức trình học tập, nghiên cứu Em xin chân thành gửi lời cảm ơn đến Phòng Đào tạo Sau Đại học, Ban Giám hiệu Trường Đại học Khoa học - Đại học Huế tạo điều kiện thuận lợi cho em suốt trình học tập thực luận án Em xin chân thành gửi lời cảm ơn đến tập thể thầy cô giáo Khoa Công nghệ Thông tin, Trường Đại học Khoa học - Đại học Huế có góp ý, giúp đỡ động viên kịp thời trình học tập nghiên cứu Em xin chân thành gửi lời cảm ơn đến Giáo sư Đại học Eötvös Loránd, Hungary phản biện ẩn danh có đề nghị khoa học giá trị nội dung nghiên cứu Tôi xin gửi lời cảm ơn đến đồng nghiệp cán bộ, giảng viên Trường Đại học Công nghiệp Thực phẩm Tp.HCM cổ vũ động viên sát cánh bên tơi q trình học tập nghiên cứu Tôi xin gửi lời cảm ơn đến tất bạn bè người xung quanh chia sẻ, động viên lúc khó khăn Xin gửi lời cảm ơn đến người vợ thân yêu hỗ trợ chu toàn sống hàng ngày để anh thực trình học tập, nghiên cứu Cuối cùng, xin bày tỏ lòng biết ơn vơ hạn cha mẹ gia đình ln ủng hộ, giúp đỡ suốt trình thực luận án i MỤC LỤC Lời cảm ơn i DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv DANH MỤC HÌNH ẢNH v DANH MỤC BẢNG BIỂU vii PHẦN MỞ ĐẦU Chương Tổng quan tìmkiếmảnh theo nội dung dựachữkýnhịphân 1.1 Mở đầu 1.2 Tổng quan công trình nghiên cứu 1.3 Định hướng nghiên cứu 12 1.4 Các đối tượng sở 12 1.4.1 Tạo dải màu sở 12 1.4.2 Thực nghiệm tạo dải màu sở 13 1.4.3 Trích xuất lược đồ màu 16 1.4.4 Trích xuất đặc trưng SIFT 16 1.4.5 Thực nghiệm trích xuất đặc trưng SIFT 19 1.4.6 Trích xuất đối tượng đặc trưng .19 1.4.7 Chữkýnhịphân 22 1.4.8 Chữkýnhịphân hình ảnh 24 1.4.9 Các giá trị đánh giá hiệu suất 25 1.4.10 Môi trường thực nghiệm 25 1.5 Tổng kết chương 27 Chương Cải tiến phương pháp tìmkiếmảnhdựa S-Tree 28 2.1 Giới thiệu 28 2.2 Tạo chữkýnhịphân hình ảnh 30 2.2.1 Tạo chữkýnhịphândựa đặc trưng màu toàn cục 30 2.2.2 Tạo chữkýnhịphândựa đặc trưng màu cục 32 2.3 Độđo EMD 32 2.3.1 Tổng quan độđo EMD 32 2.3.2 Áp dụng độđo EMD cho chữkýnhịphân 32 2.4 Độđo Hamming áp dụng cho chữkýnhịphân 36 2.5 Cây S-Tree 36 2.6 Cây Sig-Tree 37 2.6.1 Giới thiệu Sig-Tree 37 2.6.2 Thiết kế cấu trúc liệu Sig-Tree 37 ii 2.6.3 Phép tổ hợp chữký Sig-Tree 38 2.6.4 Phép tách nút Sig-Tree 39 2.6.5 Phép loại bỏ chữký Sig-Tree 41 2.6.6 Phép chèn chữký Sig-Tree 42 2.6.7 Tìmkiếm Sig-Tree 43 2.7 Tìmkiếmảnhdựa Sig-Tree 44 2.7.1 Mơ hình tìmkiếmảnhdựa lược đồ màu tồn cục 44 2.7.2 Tìmkiếmảnhdựa lược đồ màu cục 45 2.7.3 Các chương trình tìmkiếmảnhdựa Sig-Tree 46 2.7.4 Thời gian tìmkiếm phương pháp theo thực nghiệm 50 2.7.5 Đánh giá phương pháp thực nghiệm 50 2.8 Tổng kết chương 53 Chương Đề xuất phương pháp tìmkiếmảnhdựađồthịchữký 54 3.1 Giới thiệu 54 3.2 Chữkýnhịphân hình ảnh 54 3.3 Độđo tương tự 56 3.4 Tìmkiếmảnhdựa gom cụm chữkýnhịphân 57 3.4.1 Gom cụm chữkýnhịphân 57 3.4.2 Thuật tốn tìmkiếmảnhdựa gom cụm chữkýnhịphân 60 3.4.3 Thực nghiệm tìmkiếmảnhdựa gom cụm chữkýnhịphân 60 3.5 Xây dựng đồthị S-kGraph 68 3.5.1 Cấu trúc đồthị S-kGraph 68 3.5.2 Thuật toán tạo đồthị S-kGraph 72 3.5.3 Thuật tốn tìmkiếmảnhđồthị S-kGraph 74 3.5.4 Phân rã cụm đồthị S-kGraph 75 3.5.5 Thực nghiệm tìmkiếmảnhđồthị S-kGraph 76 3.6 Xây dựng đồthị S-kGraph dựa mạng Sig-SOM 88 3.6.1 Xây dựng cấu trúc mạng Sig-SOM 88 3.6.2 Thuật toán huấn luyện mạng Sig-SOM 91 3.6.3 Thuật tốn tìmkiếmảnh mạng Sig-SOM 94 3.6.4 Thực nghiệm tìmkiếmảnh mạng Sig-SOM 95 3.7 Tổng kết chương 107 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 108 Danh mục cơng trình tác giả liên quan đến luận án 110 TÀI LIỆU THAM KHẢO 112 iii DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu BSSF CBIR CBMIR CBSSF DoG DWF DWT EMD IPT JPEG KMCC LoG GIS RBIR ROC RF SSF SOM SIFT Sig-SOM Sig-Tree S-kGraph SG S-Tree SURF SVM TBIR WWW Diễn giải tiếng Anh Bit-Slice Signature File Content-Based Image Retrieval Content-Based Medical Image Retrieval Compressed Bit-Sliced Signature File Difference of Gaussian Discrete Wavelet Frame Discrete Wavelet Transform Earth Mover’s Distance Image Processing Toolbox Joint Photographic Experts Group K-Means with Connectivity Constraint Laplace of Gaussian Geographic Information System Region-Based Image Retrieval Receiver Operating Characteristic Relevance Feedback Sequential Signature File Self Organizing Map Scale Invariant Features Transform Signature - Self Organizing Map Signature - Tree Signature -kGraph Signature Graph Signature Tree Speeded Up Robust Feature Support Vector Machine Text-Based Image Retrieval World Wide Web iv Diễn giải tiếng Việt Tập tin chữkýphân mảnh Tìmkiếmảnh theo nội dung Tìmkiếmảnh y khoa theo nội dung Tập tin chữkýphân mảnh dạng nén Đạo hàm Gauss Phép biến đổi DWF Phép biến đổi Wavelet rời rạc Độđo EMD Công cụ xử lý ảnh Matlab Chuẩn nén ảnh JPEG Gom cụm K-mean miền liên thông Phép biến đổi Laplace Gauss Hệ thống thơng tin địa lý Tìmkiếmảnh vùng cục Đồthị đặc tính Phương pháp phản hồi liên quan Tập tin chữký Bản đồ tự tổ chức Đặt trưng hình ảnh SIFT Bản đồchữkýnhịphân Cây chữký Sig-Tree Đồthịchữký gom cụm Đồthịchữký Cây chữký S-Tree Đặc trưng hình ảnh SURF Vec-tơ hỗ trợ SVM Tìmkiếmảnhdựa văn Mạng tồn cầu WWW DANH MỤC HÌNH ẢNH Hình 1.1 Mơ hình tổng qt cho tìmkiếmảnhdựachữkýnhịphân Hình 1.2 Kết tạo dải màu gồm: 32 màu, 64 màu, 128 màu, 256 màu 15 Hình 1.3 Một số kết trích xuất lược đồ màu hình ảnh 16 Hình 1.4 Một số kết trích xuất đặc trưng SIFT 19 Hình 1.5 Ví dụ ảnh tách thành 11 khối 20 Hình 1.6 Một số ví dụ mặt nạ phân đoạn 22 Hình 1.7 Một số kết phân đoạn ảnh, gồm: ảnh gốc, mặt nạ ảnhphân đoạn 22 Hình 1.8 Mơ tả chữkýnhịphân đối tượng liệu 23 Hình 1.9 Mơ tả chữkýnhịphân hình ảnh 24 Hình 1.10 Độ phủ recall độ xác precision 25 Hình 2.1 Minh họa cấu trúc liệu Sig-Tree 37 Hình 2.2 Minh họa nút gốc nút Sig-Tree 38 Hình 2.3 Mơ hình tìmkiếmảnhdựa lược đồ màu tồn cục 45 Hình 2.4 Mơ hình tìmkiếmảnhdựa đặc trưng cục 45 Hình 2.5 Một kết tìmkiếm chương trình H-MPEG7 48 Hình 2.6 Một kết tìmkiếm chương trình HR-MPEG7 48 Hình 2.7 Một kết tìmkiếm chương trình E-MPEG7 48 Hình 2.8 Một kết tìmkiếm chương trình ER-MPEG7 49 Hình 2.9 Một kết tìmkiếm chương trình EP-64 49 Hình 2.10 Một kết tìmkiếm chương trình EP-256 49 Hình 2.11 Thời gian tìmkiếm phương pháp tập ảnh COREL 50 Hình 2.12 Thời gian tìmkiếm phương pháp tập ảnh WANG 50 Hình 2.13 Thời gian tìmkiếm phương pháp tập ảnh ImgColl01 50 Hình 2.14 Hiệu suất tìmkiếm Sig-Tree tập ảnh COREL 51 Hình 2.15 Hiệu suất tìmkiếm Sig-Tree tập ảnh WANG 51 Hình 2.16 Hiệu suất tìmkiếm Sig-Tree tập ảnh ImgColl01 51 Hình 3.1 Minh họa chữkýnhịphân đối tượng đặc trưng 55 Hình 3.2 Mơ hình tìmkiếmảnhdựa gom cụm chữkýnhịphân 61 Hình 3.3 Một kết gom cụm tập ảnh COREL 61 Hình 3.4 Dữ liệu cụm sau phân hoạch tập ảnh COREL 61 Hình 3.5 Một kết tìmkiếmdựa gom cụm tập ảnh COREL 63 Hình 3.6 Thời gian tìmkiếm trung bình dựa gom cụm tập ảnh COREL 63 Hình 3.7 Thời gian tìmkiếm trung bình dựa gom cụm tập ảnh WANG 64 Hình 3.8 Thời gian tìmkiếm trung bình dựa gom cụm tập ảnh CBIRimages 64 v Hình 3.9 Hiệu suất tìmkiếmdựa gom cụm tập ảnh CBIRimages 64 Hình 3.10 Hiệu suất tìmkiếmdựa gom cụm tập ảnh COREL WANG 65 Hình 3.11 Minh họa đồthị S-kGraph 69 Hình 3.12 Minh họa quy tắc phân bố hình ảnh vào đồthị S-kGraph 70 Hình 3.13 Minh họa cụm lớn phân rã thành nhiều cụm nhỏ 76 Hình 3.14 Mơ hình tìmkiếmảnhdựađồthị S-kGraph 77 Hình 3.15 Một kết tìmkiếmđồthị S-kGraph tập ảnh MSRDI 77 Hình 3.16 Thời gian tìmkiếmđồthị S-kGraph tập ảnh COREL 78 Hình 3.17 Thời gian tìmkiếmđồthị S-kGraph tập ảnh WANG 78 Hình 3.18 Thời gian tìmkiếmđồthị S-kGraph tập ảnh CBIRimages 78 Hình 3.19 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh CBIRimages 78 Hình 3.20 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh COREL WANG 79 Hình 3.21 Thời gian tìmkiếmđồthị S-kGraph tập ảnh MSRDI 80 Hình 3.22 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh MSRDI 80 Hình 3.23 Thời gian tìmkiếmđồthị S-kGraph tập ảnh ImageCLEF 80 Hình 3.24 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh ImageCLEF 81 Hình 3.25 Thời gian tìmkiếmđồthị S-kGraph tập ảnh ImgColl02 81 Hình 3.26 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh ImgColl02 82 Hình 3.27 Mơ hình mạng Sig-SOM 88 Hình 3.29 Mơ hình tìmkiếmảnhdựa mạng Sig-SOM 95 Hình 3.30 Một kết tìmkiếm mạng Sig-SOM tập ảnh MSRDI 95 Hình 3.31 Thời gian tìmkiếm mạng Sig-SOM tập ảnh COREL 96 Hình 3.32 Thời gian tìmkiếm mạng Sig-SOM tập ảnh CBIRimages 96 Hình 3.33 Thời gian tìmkiếm mạng Sig-SOM tập ảnh WANG 96 Hình 3.34 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh CBIRimages 96 Hình 3.35 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh COREL WANG 97 Hình 3.36 Thời gian tìmkiếm mạng Sig-SOM tập ảnh MSRDI 98 Hình 3.37 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh MSRDI 98 Hình 3.38 Thời gian tìmkiếm mạng Sig-SOM tập ảnh ImageCLEF 98 Hình 3.39 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh ImageCLEF 99 Hình 3.39 Thời gian tìmkiếm mạng Sig-SOM tập ảnh ImgColl02 99 Hình 3.41 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh ImgColl02 100 vi DANH MỤC BẢNG BIỂU Bảng 1.1 Một kết gom cụm dải màu không gian CIE-L*a*b* RGB 14 Bảng 1.2 Các tập liệu ảnh thực nghiệm luận án 26 Bảng 2.1 Mơ tả chương trình tìmkiếmảnhdựa Sig-Tree 46 Bảng 2.2 Đánh giá hiệu suất phương pháp tập liệu ảnh 52 Bảng 2.3 So sánh hiệu suất tìmkiếm phương pháp 52 Bảng 3.1 Hiệu suất tìmkiếmdựa gom cụm tập ảnh COREL 66 Bảng 3.2 Hiệu suất tìmkiếmdựa gom cụm tập ảnh CBIRimages 66 Bảng 3.3 Hiệu suất tìmkiếmdựa gom cụm tập ảnh WANG 66 Bảng 3.4 Hiệu suất tìmkiếm trung bình dựa gom cụm tập ảnh 67 Bảng 3.5 So sánh độ xác tìmkiếm tập ảnh COREL 67 Bảng 3.6 So sánh thời gian tìmkiếm tập ảnh COREL 67 Bảng 3.7 So sánh hiệu suất tìmkiếm tập ảnh CBIRimages 67 Bảng 3.8 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh COREL 83 Bảng 3.9 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh CBIRimages 83 Bảng 3.10 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh WANG 83 Bảng 3.11 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh MSRDI 84 Bảng 3.12 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh ImageCLEF 84 Bảng 3.13 Hiệu suất tìmkiếmđồthị S-kGraph tập ảnh ImgColl02 85 Bảng 3.14 Hiệu suất tìmkiếmđồthị S-kGraph tập liệu ảnh 86 Bảng 3.15 So sánh độ xác tìmkiếm tập ảnh COREL 86 Bảng 3.16 So sánh thời gian tìmkiếm tập ảnh COREL 86 Bảng 3.17 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh COREL 101 Bảng 3.18 Hiệu suất tìmkiếm mạng Sig-SOM tập CBIRimages 101 Bảng 3.19 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh WANG 101 Bảng 3.20 Hiệu suất tìmkiếm mạng Sig-SOM tập ImgColl02 102 Bảng 3.21 Hiệu suất tìmkiếm mạng Sig-SOM tập ảnh MSRDI 103 Bảng 3.22 Hiệu suất tìmkiếm mạng Sig-SOM tập ImageCLEF 103 Bảng 3.23 Hiệu suất tìmkiếm mạng Sig-SOM tập liệu ảnh 104 Bảng 3.24 So sánh độ xác tìmkiếm mạng Sig-SOM tập ảnh COREL 104 Bảng 3.25 So sánh hiệu suất phương pháp đề xuất 105 vii PHẦN MỞ ĐẦU Tính cấp thiết luận án Ngày nay, liệu đa phương tiện (văn bản, hình ảnh, âm thanh, video) lưu trữ ứng dụng rộng rãi nhiều hệ thống như: hệ thống thông tin WWW, hệ thống thư viện số, hệ thống tra cứu video, hệ thống thông tin địa lý, nghiên cứu thiên văn học, hệ thống quan sát vệ tinh, hệ thống điều tra hình sự, ứng dụng y sinh, giáo dục đào tạo, giải trí, v.v Lyman cộng ước tính dung lượng thơng tin tồn cầu có exabyte (1 exabyte = tỷ gigabyte) vào năm 2000 [71] Hilbert López ước tính dung lượng thơng tin tồn cầu năm 2007 khoảng 1,15 zettabyte (1 zettabyte = 1.000 exabyte) [37] Bohn Short ước tính dung lượng thơng tin tồn cầu năm 2008 khoảng 3,6 zettabyte kích thước gia tăng năm 2011 khoảng 1.800 exabyte, gấp 700 lần so với dung lượng gia tăng năm 2002 (khoảng 2-3 exabyte) [78] Theo số liệu hiệp hội ACI (Airports Council International), năm 2014, trung bình phút có 2,5 triệu nội dung chia sẻ Facebook, gần 300.000 tin nhắn Twitter, khoảng 220.000 hình ảnh Instagram, khoảng 72 nội dung video đăng tải YouTube, gần 50.000 ứng dụng tải từ Apple, 200 triệu Email [3] Theo tập đoàn liệu giới IDC (International Data Corporation), dung lượng liệu gia tăng năm 2012 2.800 exabyte ước tính dung lượng gia tăng đến năm 2020 40 zettabyte [42] Dữ liệu đa phương tiện, đặc biệt ảnh số trở nên thân thuộc với sống hàng ngày sử dụng nhiều thiết bị khác camera, mobile, smartphone, v.v Theo báo cáo IDC, năm 2015 giới tạo chia sẻ 1,6 nghìn tỷ hình ảnh, 70% hình ảnh tạo từ thiết bị mobile [25] Việc số hóa liệu đa phương tiện tạo sở liệu khổng lồ làm cho tốn tìmkiếm đối tượng trở nên phức tạp có nhiều thách thức như: truy xuất theo nội dung đối tượng, tìmkiếm nhanh đối tượng liên quan, v.v Trong vấn đề truy vấn liệu, đặc biệt liệu ảnh, toán tìmkiếm hình ảnh tương tự tốn quan trọng [2, 28] Các kết khảo sát dự báo nghiên cứu gần cho thấy việc tìmkiếm hình ảnh liên quan với yêu cầu người dùng toán phù hợp với nhu cầu xã hội đại [3] Động lực nghiên cứu Từ thập niên 1980 nay, nhiều cơng trình ứng dụng chữkýnhịphân vào toán khác như: truy vấn đối tượng liệu [13, 30], tra cứu liệu đa phương tiện dựachữkýnhịphân [91], tra cứu ảnh theo nội dung dựachữkýnhịphân [22], tìmkiếmảnhdựa cấu trúc tập tin chữký đa cấp [33], tra cứu ảnhdựađộđo Hamming chữkýnhịphân [14, 55], tra cứu ảnhdựachữkýnhịphân mô tả đặc trưng SIFT cho hình ảnh [94], gom nhóm liệu video qua chữkýnhịphân [85],… Bên cạnh đó, cấu trúc liệu lưu trữ chữkýnhịphân đề nghị S-Tree, SD-Tree, v.v [24, 26, 47, 79, 107], Bài tốn tìmkiếmảnh chia thành hai lớp [2, 74, 78, 113]: (1) Tìmkiếmảnhdựa văn TBIR (Text-Based Image Retrieval) tốn thời gian mô tả mục hình ảnh dạng văn có nhiều hạn chế định tính chủ quan người; (2) Tìmkiếmảnhdựa nội dung CBIR (Content-Based Image Retrieval), tức tìm tập hình ảnh tương tự với nội dung hình ảnh cho trước Phương pháp CBIR thực tìmkiếmdựa đặc trưng thị giác hình ảnh, vượt qua hạn chế phương pháp tìmkiếm TBIR Tuy nhiên, phương pháp tìmkiếm CBIR đối diện với vấn đề khó khăn như: trích xuất tự động đặc trưng thị giác, tạo mục đa chiều đưa phương pháp tìmkiếmảnh tương tự Vì vậy, phương pháp tìmkiếmảnh theo nội dung kết hợp lĩnh vực như: xử lý ảnh, thị giác máy tính, truy hồi thông tin, v.v [58, 74] Việc thiết kế mục, xây dựng cấu trúc liệu đưa thuật tốn tìmkiếm tập ảnh tương tự trọng tâm tốn tìmkiếmảnh [77, 78, 89, 113] Vấn đề đặt xây dựng phương pháp tìmkiếmảnh hiệu quả, nghĩa tìmkiếm nhanh hình ảnh tương tự tập liệu ảnh lớn với độ xác cao Vì nội dung hình ảnh có tính chất trực quan [2] nên tốn khai phá liệu ảnh có nhiều thách thức động lực để truy tìm thơng tin hữu ích từ tập liệu ảnh lớn Động lực luận án xây dựng phương pháp tìmkiếm hình ảnh tương tự qua nội dung dựa mục nhị phân, gọi chữkýnhịphân (binary signature) Thách thức phương pháp tạo chữkýnhịphân phải mơ tả đặc trưng thị giác hình ảnh để từ làm sở đối sánh tìm tập hình ảnh tương tự Thách thức thứ hai thiết kết cấu trúc liệu phù hợp để lưu trữ chữkýnhị phân, từ tạo thuận lợi q trình tìmkiếmảnh tương tự Thách thức thứ ba áp dụng phương pháp khai thác liệu thuật toán phù hợp cấu trúc liệu để tìm tập hình ảnh tương tự Với mong muốn đóng góp phương pháp tìmkiếmảnh hiệu quả, luận án giải thách thức để làm định hướng nghiên cứu lĩnh vực Mục tiêu luận án Mục tiêu luận án tìmkiếmảnh tương tự theo nội dung dựachữkýnhịphân nhằm tăng tốc độtìmkiếm đảm bảo độ xác cao Vì vậy, luận án thực mục tiêu cụ thể gồm: (1) Tạo chữkýnhịphân để mô tả đặc trưng thị giác hình ảnh; (2) Đánh giá độ tương tự hai hình ảnhdựachữkýnhị phân; (3) Xây dựng cấu trúc liệu để lưu trữ chữkýnhị phân; (4) Đề xuất thuật tốn cho tốn tìmkiếmảnh tương tự; (5) Xây dựng thực nghiệm tìmkiếmảnhdựachữkýnhịphân Phƣơng pháp nghiên cứu Phương pháp lý thuyết: Tổng hợp số công bố liên quan đến tìmkiếm ảnh; nghiên cứu chữkýnhịphân mô tả nội dung ảnh, cấu trúc liệu lưu trữ chữkýnhị phân, độđo tương tự chữkýnhịphân thuật tốn tìmkiếmảnh theo nội dung Trên sở phân tích, đánh giá ưu khuyết điểm cơng trình cơng bố, luận án phát triển phương pháp tạo chữkýnhịphân mô tả nội dung hình ảnh đề xuất cấu trúc liệu lưu trữ chữkýnhịphân Một số thuật toán xây dựng cấu trúc liệu tìmkiếmảnh phát triển Phương pháp thực nghiệm: Thực việc cài đặt thuật toán luận án nhằm minh chứng tính hiệu độ xác tốc độtìmkiếm Các tập liệu ảnh sử dụng cho cài đặt thực nghiệm bao gồm: COREL, CBIRimages, WANG, ImageCLEF, MSRDI, ImgColl01, ImgColl02 Trên sở số liệu thực nghiệm, luận án thực phân tích, đánh giá so sánh với cơng trình khác Nội dung bố cục luận án Nội dung luận án tổ chức thành ba chương sau: Chƣơng trình bày sở lý thuyết cho tìm tốn kiếmảnhdựachữkýnhịphân Chương tiếp cận toán tìmkiếmảnh theo nội dung; khảo sát, phân tích cơng trình nghiên cứu liên quan; đưa mơ hình tìmkiếmảnhdựachữkýnhịphân Các đối tượng sở cho tìmkiếmảnh theo nội dung dựachữkýnhịphân nghiên cứu gồm: Các đặc trưng hình ảnh; chữkýnhịphân hình ảnh; giá trị đánh giá hiệu suất, mơi trường thực nghiệm Từ đó, luận án đưa định hướng xây dựng phương pháp tìmkiếmảnhdựachữkýnhịphân Chƣơng đưa số cải tiến cho tìmkiếmảnhdựa S-Tree Nội dung chương mô tả phương pháp tạo chữkýnhịphân từ đặc tính thị giác hình ảnh, ứng dụng độđo EMD, Hamming để đánh giá độ tương tự hình ảnhDựa cấu trúc S-Tree, chương thiết kế cấu trúc Sig-Tree để xây dựng phương pháp tìmkiếmảnhdựa đặc trưng thị giác toàn cục cục hình ảnh Để minh họa sở lý thuyết xây dựng, chương xây dựng thực nghiệm tập liệu ảnh COREL, WANG, ImgColl01 Phần cuối chương đưa kết luận định hướng cải tiến Chƣơng đề xuất phương pháp tìmkiếmảnhđồthịchữkýnhịphân Chương đưa phương pháp tạo chữkýnhịphân mơ tả vị trí, hình dạng, màu sắc đối tượng đặc trưng hình ảnh; tiếp cận độđo tương tự chữkýnhị phân, xây dựng cấu trúc liệu đồthị S-kGraph mạng Sig-SOM Nội dung chương mơ tả thuật tốn xây dựng cấu trúc liệu đồthị S-kGraph mạng Sig-SOM để xây dựng phương pháp tìmkiếmảnh theo nội dung dựachữkýnhịphân Nhằm minh chứng sở lý thuyết xây dựng, phần thực nghiệm đánh giá kết tập liệu ảnh COREL, CBIRimages, WANG, ImageCLEF, MSRDI, ImgColl02 trình bày tương ứng Đóng góp luận án Đóng góp luận án xây dựng phương pháp tìmkiếm nhanh hình ảnh tương tự theo nội dung với độ xác cao Các đóng góp cụ thể bao gồm: - Đề xuất số cải tiến cho S-Tree thiết kế cấu trúc Sig-Tree nhằm xây dựng phương pháp tìmkiếmảnh theo nội dung dựachữkýnhị phân; - Xây dựng cấu trúc liệu đồthịchữký S-kGraph phương pháp tìmkiếmảnh theo nội dung dựachữkýnhị phân; - Xây dựng cấu trúc mạng Sig-SOM phương pháp tìmkiếmảnh theo nội dung dựachữkýnhị phân; - Đề xuất thuật toán dựa sở lý thuyết cho phương pháp tìmkiếmảnh theo nội dung dựachữkýnhịphân Chƣơng TỔNG QUAN VỀ TÌMKIẾMẢNH THEO NỘI DUNG DỰATRÊNCHỮKÝNHỊPHÂN 1.1 Mở đầu Tìmkiếmảnh tra cứu hình ảnh liên quan từ tập liệu hình ảnh [113] Tìmkiếmảnh theo nội dung gồm tập kỹ thuật tìmkiếm hình ảnh liên quan từ tập liệu hình ảnhdựa trích xuất tự động đặc trưng hình ảnh màu sắc, cấu trúc, hình dạng, v.v [111, 113] Luận án xây dựng phương pháp tìmkiếmảnhdựachữkýnhịphân theo mơ hình tổng qt Hình 1.1 Mơ hình tìmkiếmảnh gồm hai giai đoạn: tiền xử lý tìmkiếmảnh tương tự Bước giai đoạn tiền xử lý chuyển đổi tập liệu ảnh trở thành tập chữkýnhị phân; bước thứ hai xây dựng cấu trúc liệu để lưu trữ tập chữkýnhịphân Bước giai đoạn tìmkiếmảnh chuyển đổi hình ảnh trở thành chữkýnhị phân; bước giai đoạn tìmkiếmảnh tương tự dựa thuật toán cấu trúc liệu thiết kế; bước cuối đưa tập ảnh tương tự với ảnh tra cứu Có bốn cơng việc quan trọng mơ hình là: (1) Tạo chữkýnhịphân mô tả đặc trưng hình ảnh; (2) Đánh giá độ tương tự hai hình ảnhdựachữkýnhị phân; (3) Thiết kế cấu trúc liệu lưu trữ chữkýnhị phân; (4) Đề xuất thuật tốn tìmkiếmảnh Hình 1.1 Mơ hình tổng qt cho tìmkiếmảnhdựachữkýnhịphân 1.2 Tổng quan cơng trình nghiên cứu Tìmkiếmảnh theo nội dung giới thiệu vào thập niên 1980 [6, 68] Một số ứng dụng tìmkiếmảnh theo nội dung công bố như: QBIC, Photobook, Visual-Seek, CIRES, PicSOM, PicHunter, Virage, SIMPLIcity, v.v [6, 77, 113] Từ năm 1980 có nhiều nghiên cứu ứng dụng chữkýnhịphân cho tốn tìmkiếm đối tượng liệu Các cơng trình hạn chế độ xác kết truy vấn tốn nhiều chi phí xử lý cấu trúc liệu lưu trữ chữkýnhị phân, tiêu biểu sau: Uwe Deppisch tiếp cận cấu trúc S-Tree thao tác sở nhằm thực tìmkiếm đối tượng liệu thông qua chữkýnhịphân [30] Trong cơng trình này, S-Tree kế thừa từ cấu trúc B+-Tree giải toán tra cứu đối tượng liệu nút Thao tác tra cứu S-Tree thực theo cấu trúc đệ quy duyệt theo nhiều hướng nhánh khác Phép hiệu chỉnh nút tốn nhiều chi phí phải thực phép tìmkiếm nút cha tương ứng Walter W Chang Hans J Schek tiếp cận phương pháp tạo chữkýnhịphân cho tốn tìmkiếm sở liệu lớn dựa cấu trúc tập tin chữký đa cấp (multi-level signature file) [13] Trong cấu trúc liệu này, chữký nút cha liên kết đến nút đến nút Thao tác truy vấn liệu thực từ nút cha đến nút Nếu liệu tăng trưởng nút tăng số lượng phần tử Khi đó, chữký nút cha cập nhật lại cách hội chữký nút dẫn đến chữký nút cha chứa nhiều bit ‘1’ Do đó, lần truy vấn theo nhiều nhánh kết bị nhầm lẫn (false drop) Trong thập niên 1990, nhiều nghiên cứu sử dụng chữkýnhịphân cho tốn tìmkiếm liệu đa phương tiện dựa cấu trúc liệu cải tiến Tuy nhiên, cơng trình tốn nhiều chi phí tính tốn độ xác hạn chế, tiêu biểu sau: F Rabitti P Zezulu tiếp cận kỹ thuật tạo chữkýnhịphân cho đối tượng liệu đa phương tiện dựa hàm băm mã hóa, từ thực tìmkiếm đối tượng dựa cấu trúc tập tin chữký [91] Trong phương pháp này, chữkýnhịphân chia thành nhiều phần mơ tả đặc tính khác đối tượng văn hình ảnh Việc truy vấn thực qua hàm lọc liệu để xác định tập tin chứa đối tượng liệu Phương pháp phải phân loại đối tượng theo nhóm, nhóm lưu trữ vào tập tin mục Nếu liệu thay đổi đặc trưng nhóm đối tượng thay đổi dẫn đến tốn chi phí tính tốn để tạo thành điều kiện lọc cho tập tin nhóm đối tượng Wiebren de Jonge cộng xây dựng cấu trúc S +-tree nhằm lưu trữ mục nhịphân cho tốn tìmkiếm liệu hình ảnh [47] Trong cấu trúc liệu này, nút liên kết với để tăng tốc độ truy vấn Mỗi phần tử nút gồm chữkýnhịphân kết hợp với số thuộc tính, điều giúp xác định đối tượng cần tra cứu Nếu tra cứu nhóm đối tượng tương tự phương pháp tốn chi phí tìmkiếmdựa liên kết nút Độ xác phụ thuộc vào điều kiện đánh giá độ tương tự đối tượng liệu Suh-Yin Lee cộng xây dựng tập tin chữkýnhịphândựa chuỗi đối tượng sở để từ xây dựng ứng dụng tìmkiếmảnh [57] Phương pháp tốn nhiều chi phí cho việc nhận diện đối tượng sở hình ảnh Vì tập đối tượng sở thay đổi theo tập liệu hình ảnh nên ứng với tập ảnh khác phải xây dựng lại đối tượng sở để từ tạo chữký cho hình ảnh Trong giai đoạn từ năm 2000 đến 2012, nhiều cơng trình sử dụng chữkýnhịphân để mơ tả đặc trưng hình ảnh ứng dụng cấu trúc liệu khác cho tốn tìmkiếmảnh chưa tập trung nghiên cứu cải tiến cấu trúc liệu nhằm tra cứu nhanh hình ảnh tương tự theo nội dung, tiêu biểu sau: Vishal Chitkara cộng cơng bố tài liệu kỹ thuật tìmkiếmảnh theo nội dung sử dụng chữkýnhịphân Đại học Alberta, Canada [22] Cơng trình đề xuất phương pháp tạo chữkýnhịphân cho ảnh màu đưađộđo tương tự chữkýnhịphân nhằm phục vụ cho tốn tìmkiếmảnh Cơng trình đánh giá độ xác thực nghiệm tập liệu ảnh lớn để minh chứng tính khả thi phương pháp Chữkýnhịphân tạo dựa tỉ lệ phần trăm theo tập màu ưu hình ảnhĐộđo tương tự tổng bình phương độ lệch vị trí bit ‘1’ theo nhóm bit hai chữkýnhịphân Nếu hai hình ảnh có tỉ lệ màu chiếm ưu giống vị trí phân bố màu sắc khác phương pháp có kết khơng xác Essam A El-Kwae cộng đưa phương pháp tìmkiếmảnhdựachữkýnhịphân cấu trúc tập tin chữký đa cấp [32, 33] Cấu trúc tập tin lưu trữ chuỗi đối tượng nút lá, nút lại lưu trữ chữký để tra cứu đối tượng ảnh Trong cơng trình này, tác giả phân tích sở lý thuyết đồng thời mơ tả thực nghiệm tìmkiếm sở liệu ảnh lớn Tuy nhiên, cơng trình chưa cải tiến cấu trúc liệu nhằm giảm chi phí tìmkiếmảnh tập tin chữký Václav Snášel ứng dụng chữký mờ cấu trúc S-Tree cho tốn tìmkiếmảnh tương tự Thực nghiệm so sánh với phương pháp khác cho thấy tính hiệu thời gian truy vấn phương pháp đề xuất [102] Trong cơng trình này, phép xóa phần tử S-Tree tốn nhiều chi phí tái tạo lại tồn chữkýnhịphân chưa mơ tả đặc tính hình ảnh Aaron Davidson cộng sử dụng S-Tree lưu trữ chữkýnhịphân kết hợp xử lý song song để tìmkiếmảnh theo nội dung nhằm tăng tốc độtìmkiếm hình ảnh tương tự [26] Thực nghiệm báo cho thấy tốc độtìmkiếm cải thiện đáng kể độ xác hạn chế chữkýnhịphân tạo từ tỉ lệ màu ưu cấu trúc liệu S-Tree chưa cải tiến Nascimento Chitkara tiếp cận kỹ thuật tìmkiếmảnhdựachữkýnhịphân Thực nghiệm cho thấy tính hiệu thời gian tập liệu ảnh lớn [80] Cơng trình đưa phương pháp tạo chữkýnhịphândựa tỉ lệ màu ưu Độđo tương tự hai chữkýnhịphân đánh giá dựa vị trí bit ‘1’ Tuy nhiên, cơng trình chưa đưa cấu trúc liệu cho toán tra cứu ảnh mà chủ yếu dựa vào việc truy xuất tập tin chữký Một cải tiến cơng trình ứng dụng cấu trúc liệu S-Tree lưu trữ chữkýnhịphân nhằm tăng tốc độ tra cứu hình ảnh [81] Trong phân tích tính hiệu quả, phương pháp giảm nhớ lưu trữ tăng tốc độ tra cứu hình ảnh Cả hai cơng trình sử dụng tỉ lệ màu sắc để tạo chữkýnhịphân dẫn đến kết thiếu xác hình ảnh có màu sắc phân bố rải rác Độđo tương tự dựa vị trí bit ‘1’ nên đánh giá sai phân bố vị trí màu sắc hình ảnh Các phép tốn cấu trúc liệu S-Tree sử dụng cơng trình chủ yếu thực qua phép toán đệ quy tốn nhiều chi phí ngược từ nút đến nút cha Cây S-Tree phân phối liệu nút dựaphân cấp nút cha nút Do đó, S-Tree phân thành nhiều cấp việc truy vấn theo nhiều nhánh kết trình tra cứu bị sai lệch so với yêu cầu người dùng Yannis Manolopoulos mô tả chữkýnhịphân cho đối tượng liệu ứng dụng cấu trúc S-Tree cho tốn tìmkiếm liệu đa phương tiện, đặc biệt liệu ảnh [73] Thao tác tách nút S-Tree thực theo phương pháp tách nút bậc hai, bậc ba gom cụm theo phân cấp Thao tác truy xuất phần tử thực từ nút gốc đến nút dẫn đến việc tách nút theo hướng ngược lại (từ nút đến nút gốc) tốn nhiều chi phí xác định phần tử cha nút Vì vậy, thao tác khác tổ hợp, chèn phần tử, xóa phần tử,… tốn nhiều chi phí truy tìmphần tử Imran Ahmad William I Grosky sử dụng chữkýnhịphân để làm mục ứng dụng cho tốn tìmkiếmảnhdựa tứ phân [4] Chữkýnhịphân không mô tả màu sắc cấu trúc ảnh mà dựa đối tượng sở theo vị trí hình dạng Do đó, áp dụng phương pháp cho ảnh màu độ xác có nhiều hạn chế Hơn nữa, chi phí độ xác phương pháp phụ thuộc nhiều vào toán nhận diện đối tượng sở tập ảnh cho trước B.G Prasad cộng cơng bố cơng trình tìmkiếmảnh sử dụng mục nhịphân nhằm mô tả đặc trưng cấp thấp hình ảnh [88] Theo thực nghiệm cho thấy tính hiệu độ xác sử dụng chữkýnhịphân để làm mục mô tả đặc trưng màu sắc đối tượng đặc trưng cho tốn tìmkiếmảnh tương tự Tuy nhiên, cơng trình chưa nêu rõ cấu trúc liệu lưu trữ chữkýnhịphân nhằm giải vấn đề tốc độ tra cứu ảnh J Landre F Truchetet cơng bố cơng trình tìmkiếmảnhdựa cấu trúc chữkýnhịphânphân cấp độđo tương tự Hamming [55] Chữkýnhịphân sử dụng để mô tả đặc trưng cấu trúc, hình dạng màu sắc hình ảnh Cơng trình thực tốn tìmkiếmảnhdựa đối sánh trực tiếp tập chữkýnhịphânđộđo Hamming chưa tập trung nghiên cứu cấu trúc liệu lưu trữ nhằm tra cứu nhanh hình ảnh tương tự theo nội dung Abdelhamid Abdesselam cộng tìmkiếmảnh theo nội dung dựa chuỗi bit nhịphân mô tả đối tượng đặc trưng ảnh Cơng trình đề xuất độđo tương tự dựađộ khác biệt chuỗi bit Thực nghiệm cơng trình đánh giá tính hiệu q trình tìmkiếm theo độ xác [1] Tuy nhiên, cơng trình chưa tập trung nghiên cứu ứng dụng cấu trúc liệu lưu trữ chữkýnhịphân nhằm giải tốn tăng tốc độtìmkiếmảnh tương tự Năm 2013, Timothy Chappell Shlomo Geva tiếp cận tìmkiếmảnh tương tự dựachữkýnhịphân [14] Cơng trình đưa tính hiệu tốc độtìmkiếm hình ảnh ứng dụng độđo Hamming để đánh giá độ tương tự chữkýnhịphân Cơng trình chưa áp dụng cấu trúc liệu để lưu trữ chữkýnhịphân nhằm phục vụ tốn tìmkiếmảnh Năm 2014, Guangxin Ren cộng đề xuất phương pháp tìmkiếmảnh tương tự dựa chuỗi nhịphân mô tả đặc trưng SIFT để tạo mục cho hình ảnh [94] Phương pháp tra cứu hình ảnhdựa việc đối sánh hai chữkýnhịphân tập tin dạng văn chưa cải tiến cấu trúc liệu lưu trữ Năm 2014, Junjie Cai cộng sử dụng chuỗi nhịphân để tạo mục cho đặc trưng thị giác hình ảnh Phương pháp tăng tốc độtìmkiếmảnh tương tự [12] Cấu trúc liệu sử dụng cơng trình bảng tra cứu phân đoạn chữkýnhịphân để tìmkiếm hình ảnh Cấu trúc bảng dùng để lưu trữ khơng có thao tác bảng liệu thay đổi Phương pháp không thực qua độđo tương tự mà đối sánh chữkýnhịphân Năm 2015, Li Liu cộng sử dụng phương pháp chữkýảnhdựa chuỗi nhịphân dùng độđo EMD để đối sánh hình ảnh Cơng trình chứng minh tính hiệu độ xác ứng với chữkýảnh có kích thước thay đổi thực nghiệm với nhiều dạng hình ảnh khác [66] Trong cơng trình này, cấu trúc liệu lưu trữ chữkýnhịphân chưa nghiên cứu nhằm phục vụ cho toán tìmkiếmảnh tương tự Vào năm 2012, 2013, 2014, 2015, Wengang Zhou cộng công bố cơng trình tìmkiếmảnh tương tự dựachữkýnhịphân mơ tả đặc trưng SIFT hình ảnh Thực nghiệm chứng minh tính hiệu mặt thời gian độ xác tốn tìmkiếm tập liệu ảnh lớn [125-130] Các cơng trình lưu trữ chữkýnhịphân dạng tập tin mục nhị phân, chưa tập trung nghiên cứu cấu trúc liệu độđo tương tự cho chữkýnhịphân Vào năm 2012, 2013, 2014, 2015 có nhiều cơng trình liên quan đến tìmkiếmảnhdựachữkýnhịphân [5, 69, 70, 85, 123, 127, 131] Năm 2012, 2013, 2014, nhiều cơng trình liên quan đến chữkýảnh công bố kết thực nghiệm cho thấy tính hiệu phương pháp độ xác thời gian truy vấn [11, 64, 65, 86, 112] 10 ... tin chữ ký Bản đồ tự tổ chức Đặt trưng hình ảnh SIFT Bản đồ chữ ký nhị phân Cây chữ ký Sig-Tree Đồ thị chữ ký gom cụm Đồ thị chữ ký Cây chữ ký S-Tree Đặc trưng hình ảnh SURF Vec-tơ hỗ trợ SVM Tìm. .. dung dựa chữ ký nhị phân; - Đề xuất thuật toán dựa sở lý thuyết cho phương pháp tìm kiếm ảnh theo nội dung dựa chữ ký nhị phân Chƣơng TỔNG QUAN VỀ TÌM KIẾM ẢNH THEO NỘI DUNG DỰA TRÊN CHỮ KÝ NHỊ PHÂN... quan đến tìm kiếm ảnh; nghiên cứu chữ ký nhị phân mô tả nội dung ảnh, cấu trúc liệu lưu trữ chữ ký nhị phân, độ đo tương tự chữ ký nhị phân thuật tốn tìm kiếm ảnh theo nội dung Trên sở phân tích,