Nghiên cứu các kỹ thuật lập chỉ mục dữ liệu và ứng dụng trong bài toán đối sánh ảnh nhanh

BỘ GIÁO DỤC VÀ ĐÀO TẠO UBND TỈNH THANH HÓA TRƯỜNG ĐẠI HỌC HỒNG ĐỨC - - NGUYỄN THỊ YẾN NGHIÊN CỨU CÁC KỸ THUẬT LẬP CHỈ MỤC DỮ LIỆU VÀ ỨNG DỤNG TRONG BÀI TOÁN ĐỐI SÁNH ẢNH NHANH LUẬN VĂN THẠC SĨ MÁY TÍNH Chun ng nh: Kho học máy tính M số: 8 Người hướng dẫn khoa học: PGS.,TS Phạm Thế Anh TH NH H NĂM LỜI CAM ĐOAN Tơi xin c m đo n l cơng trình nghiên cứu củ thân Các kết nghiên cứu v kết luận luận văn n y l trung thực không s o chép từ nguồn n o v hình thức n o Việc th m khảo nguồn t i liệu (nếu có) đ thực trích dẫn v ghi nguồn t i liệu th m khảo quy định Ngƣời cam đoan Nguyễn Thị Yến i LỜI CẢM ƠN Để hoàn thành đề tài luận văn n y, tơi xin bày tỏ lịng biết ơn chân th nh v sâu sắc đến PGS.,TS Phạm Thế Anh, Trường Đại học Hồng Đức đ tận tình hướng dẫn, tạo điều kiện tốt suốt trình thực luận văn Nhân dịp n y tơi xin gửi lời cảm ơn đến B n l nh đạo, thầy cô, cán Bộ môn Khoa học máy tính, Khoa Cơng nghệ Thơng tin & Truyền thơng, Phịng Quản lý đ o tạo S u đại học Trường Đại học Hồng Đức; bạn đồng nghiệp gi đình v người thân đ động viên giúp đỡ tơi hồn thành luận văn n y Thanh Hóa, ngày 05 tháng năm 2021 Tác giả Nguyễn Thị Yến ii MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CHỮ VIẾT TẮT VÀ KÍ HIỆU v DANH MỤC HÌNH VẼ vi MỞ ĐẦU 1 Tính cấp thiết củ đề tài Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu Nội dung nghiên cứu: Phương pháp nghiên cứu Dự kiến kết đạt Chƣơng GIỚI THIỆU BÀI TOÁN LẬP CHỈ MỤC Thị giác máy Đối sánh v nhận dạng mẫu 1.3 Lập mục vector đặc trưng 1.4 Một số ứng dụng đặc thù Chƣơng TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU 12 Phương pháp dự h m băm 12 2.1.1 Locality-Sensitive Hashing (LSH) 12 2.1.2 Multi-probe LSH 13 2.1.3 Beyond LSH 14 2.1.4 Kernelized LSH (K-LSH) 14 Phương pháp dựa phân cụm 14 2.2.1 Cây phân cụm (Clustering Tree) 14 2.2.2 Lượng tử tích đề (Product quantization ) 16 2.2.3 Optimized product quantization 17 iii Phương pháp phân hoạch không gian 19 2.3.1 Cây KD- tree 19 2.3.2 Randomized KD-trees 22 2.3.3 Trinary-projection-tree 23 2.4 Các kỹ thuật khác 23 Đánh giá so sánh phương pháp 24 Chƣơng NGHIÊN CỨU LƢỢC ĐỒ LẬP CHỈ MỤC THỜI GIAN THỰC 26 3.1 Yêu cầu hệ thống lập mục 26 3.2 Lựa chọn thuật toán lập mục tối ưu 27 3.3 Sử dụng thông tin tiền nghiệm 31 Phương pháp đánh giá hiệu v độ đo 33 3.5 Thực nghiệm v đánh giá kết 34 3.6 Ứng dụng nhận dạng mẫu 36 KẾT LUẬN VÀ KIẾN NGHỊ 43 Kết luận 43 Kiến nghị 43 TÀI LIỆU THAM KHẢO 45 iv DANH MỤC CHỮ VIẾT TẮT VÀ KÍ HIỆU AI : Trí tuệ nhân tạo ANN : Xấp xỉ nhanh CSDL: Cơ sở liệu LOPQ: Lượng tử hoá sản phẩm tối ưu hoá cục LSH : Họ h m băm OPQ : Lượng tử hoá sản phẩm tối ưu hố PDS : Tìm kiếm khoảng cách phận PQ : Lượng tử tích đề PSVQ : Thuật toán lập mục VQ : Lượng tử hoá vector v DANH MỤC HÌNH VẼ Hình Sơ đồ lập mục vector đặc trưng Hình Ý tưởng củ Multi-probe LSH: gi(q) l khó băm củ đối tượng cần truy vấn q (các ô m u x nh) gi(q) + ∆i l liền kề cần thăm dị 13 Hình Minh họ trình tạo phân cấp 15 Hình Minh họ trình tạo phân cấp từ điển 15 Hình Hình Hiệu củ kỹ thuật phân cụm 16 Minh họ h m khoảng cách sử dụng PQ: đối xứng (trái) v bất đối xứng (phải) 17 Hình Minh họ ý tưởng củ kỹ thuật: PQ OPQ Loc l OPQ 18 Hình Minh họ trình tạo KD-tree cho trường hợp D: 20 Hình 2.8 Minh họa trình tìm kiếm KD-tree: tìm kiếm vùng có giao với hình trịn (hay siêu cầu Hình ) 21 Minh họ ý tưởng xây dựng KD-tree, Randomized KD-trees, LM-tree 23 Hình Ảnh đầu v o bên trái v mô tả GIST (5 chiều) cho thấy nhiều th nh phần có giá trị m u sắc tương tự nh u 28 Hình S i số lượng tử cho đặc trưng SIFT (trái) v GIST (phải) với giá trị khác nh u củ h 30 Hình 3 Ảnh đầu v o (trái) v minh họ trình xây dựng mơ tả SIFT vị trí (đánh dấu chấm v ng) 32 Hình Hiệu củ PSVQ so với hệ mục khác 35 Hình Đánh giá độ xác v tốc độ củ PSVQ so với thuật toán lập mục khác 36 Hình Kiến trúc hệ thống nhận mẫu 37 Hình Minh họ ảnh truy vấn v ảnh CSDL 38 Hình Các đặc trưng SURF tìm h i ảnh (các vịng trịn nhỏ) 38 Hình Các đối sánh trước áp dụng R NS C 39 Hình Các đối sánh trước áp dụng R NS C 39 vi MỞ ĐẦU Tính cấp thiết đề tài Thị giác máy (Computer Vision) l hướng nghiên cứu trọng tâm củ ng nh Kho học máy tính nhằm giải b i toán nhận dạng giúp máy tính có khả “nhìn” v nhận dạng đối tượng thơng qu ảnh chụp h y video Để phân tích v nhận dạng đối tượng chương trình máy tính phải trích chọn tập đặc trưng (Fe ture Vector) h y mô tả (Descriptors) đối tượng ảnh Các mô tả s u đối sánh (M tching) với sở liệu mẫu để tìm kiếm đối tượng gần Để tối ưu hó thời gi n đối sánh mẫu đặc trưng ảnh thường lập mục (fe ture indexing) nhằm tăng tốc độ đối sánh sở liệu mẫu Trong lĩnh vực thị giác máy đặc biệt l b i toán nhận dạng chúng t thường phải đối sánh đối tượng với tập mẫu đ có Thơng thường số lượng mẫu l tương đối lớn (h ng tỉ ghi) Vì thời gi n đối sánh l vấn đề qu n trọng cần phải giải đặc biệt l ứng dụng thời gi n thực Mục tiêu củ việc lập mục l xếp tổ chức lại sở liệu mẫu v xây dựng thuật toán đối sánh hiệu s o cho trình đối sánh cần thực phần nhỏ mẫu tiềm m không cần phải duyệt to n sở liệu (bruteforce search) Xuất phát từ vấn đề nêu đề t i n y tập trung giải b i tốn tối ưu hó trình đối sánh mẫu cách xây dựng phương pháp lập mục cách hiệu đặc trưng ảnh (h y vector đặc trưng) Các kỹ thuật mục đề xuất phải đảm bảo tính xác c o có chi phí nhớ thấp hỗ trợ việc tìm kiếm v đối sánh mẫu cách nh nh chóng v hiệu Các kỹ thuật đề xuất phải có khả l m việc với sở liệu đặc trưng lớn (h ng tỉ ghi) vector đặc trưng có số chiều lớn ( -5000 features) Mục tiêu nghiên cứu Mục tiêu củ đề t i l nghiên cứu tìm hiểu kỹ thuật lập mục hiệu cho b i toán đối sánh vector đặc trưng không gi n nhiều chiều v đặc biệt l ứng dụng lĩnh vực thị giác máy tính Bộ mục đề xuất l m việc hiệu ng y sở liệu d n - nở theo thời gi n (tăng lên số lượng vector v số chiều vector) Các phương pháp lập mục nghiên cứu cần có độ xác c o v thời gi n đối sánh nh nh: độ xác củ trình đối sánh (tìm kiếm xấp xỉ nh nh cần đủ lớn ví dụ se rch precision > %) thời gi n đối sánh v tìm kiếm mẫu cải thiện đáng kể so với kỹ thuật tìm kiếm h y kỹ thuật mục khác Ngo i r lược đồ mục đề xuất có tính cộng tác: thuật tốn lập mục đề xuất kết hợp lại với nh u để cải thiện hiệu tìm kiếm không yêu cầu c o nhớ lưu trữ v thời gi n xử lý Trên sở lý thuyết lập mục đề t i nhằm giải hiệu th nh phần qu n trọng củ hệ thống nhận dạng mẫu đối sánh mẫu Đối tƣợng, phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu - Các lược đồ lập mục - Các h m đo khoảng cách độ đo (metrics) vectors - Cơ sở liệu nhiều chiều không gian vector - Các thuật toán đối sánh lĩnh vực thị giác máy - Các mơ tả trích chọn đặc trưng phổ biến 3.2 Phạm vi nghiên cứu - Các sở liệu đặc trưng nhiều chiều không gian vector - Phạm vi ứng dụng giới hạn lĩnh vực thị giác máy tính, nhận dạng mẫu Nội dung nghiên cứu Trong phạm vi đề t i n y thực nội dung nghiên cứu s u đây: - Tìm hiểu tổng qu n kỹ thuật v phương pháp lập mục vector đặc trưng v ngo i nước Cụ thể tập trung v o kỹ thuật thuộc nhóm giải pháp: kỹ thuật băm phân cụm lượng tử hó v phân hoạch khơng gi n - Tìm hiểu v xây dựng kỹ thuật bảng tr (lookups) nhằm cải tiến q trình tính tốn khoảng cách từ truy vấn đến vector đ lập mục sở liệu Đây l vấn đề qu n trọng áp dụng bước đối sánh (online) Vì việc tính tốn độ đo v khoảng cách cần thực cách hiệu v thuận tiện - Thiết kế chiến lược tối ưu hó mục cách kết hợp sức mạnh tìm kiếm củ nhiều mục đơn lẻ Các yêu cầu kết hợp nhiều mục l đảm bảo khơng tăng nhiều chi phí nhớ lưu trữ v thời gi n xử lý mục th nh phần - C i đặt v tiến h nh thử nghiệm cần thiết v đánh giá hiệu củ lược đồ lập mục xây dựng ứng dụng demo tính đối sánh vector đặc trưng cách hiệu - Viết báo cáo khó luận đề t i kết đạt Phƣơng pháp nghiên cứu Quá trình thực đề tài sử dụng h i phương pháp nghiên cứu l : phương pháp nghiên cứu tài liệu v phương pháp nghiên cứu thực nghiệm - Phương pháp nghiên cứu tài liệu: Tìm hiểu thuật tốn lược đồ lập mục vector đặc trưng độ đo khoảng cách khơng gian nhiều chiều Phân tích đánh giá ưu nhược điểm thuật toán - Phương pháp thực nghiệm: C i đặt lược đồ lập mục làm thực nghiệm sở liệu chuẩn đánh giá hiệu thực tế Hình 3.5 Đánh giá độ xác tốc độ PSVQ so với thuật toán lập mục khác Trong thử nghiệm này, PSVQ (phiên PSVQ ) kết hợp với lược đồ lập mục đề xuất [45] (dựa K-means) Kết Hình 3.5 cho thấy PSVQ cho tốc độ đối sánh nh nh hầu hết thuật toán khác với mức củ độ xác Ví dụ, chọn precision = 85% trình đối sánh củ PSVQ nh nh gấp 500 lần liệu GIST 365 lần liệu SIFT so với thuật tốn vét cạn hay tìm kiếm Ngo i r PSVQ nh nh từ đến 3.0 lần so với thuật toán K- means tree (là thuật toán tốt thư viện FLANN4) Rõ ràng PSVQ thể tiềm lớn cho toán cần yếu tố đối sánh nh nh Hơn nữa, chọn m = 16, kết tốc độ đối sánh PSVQ tăng lên rõ chất lượng lượng tử hó cải thiện 3.6 Ứng dụng nhận dạng mẫu Trong phần này, ứng dụng kỹ thuật lập mục PSVQ để giải b i toán đối sánh nhận dạng mẫu, từ phát triển ứng dụng khác tra cứu ảnh dựa nội dung với thời gi n đối sánh nhanh (gần thời gian thực) Hình trình b y [ ] sơ sồ hệ thống đối sánh nhận dạng mẫu http://www.cs.ubc.ca/research/flann 36 Luồng xử lý Offline Lưu trữ Luồng xử lý Online CSDL ảnh Dị tìm điểm khóa Mơ tả điểm khóa Lập mục mô tả Dữ liệu đ lập mục Đối sánh Ảnh đầu vào Các ứng dụng (nhận dạng, tra cứu ảnh, v.v.) Hình 3.6 Kiến trúc hệ thống Cụ thể, ảnh đầu vào áp dụng dò tìm điểm khóa (keypoint nhận mẫu detection) s u l mơ tả điểm khóa (keypoint description), thực lập mục để lưu v o CSDL v cuối l đối sánh (matching) Với mục đích minh họa cho hệ lập mục PSVQ đ áp dụng dị tìm điểm khóa mơ tả điểm khó l SURF [ 5] Đây l thuật tốn dị tìm điểm đặc trưng nhanh nhờ ứng dụng khái niệm tích phân ảnh, thích hợp với hệ thống cần đối sánh thời gian thực Để đối sánh mô tả, sử dụng thuật toán lập mục PSVQ áp dụng h m đo khoảng DC đ trình b y Kết trình đối sánh cho tập ánh xạ giữ điểm khó tương ứng ảnh truy vấn ảnh CSDL (m tches) Thông thường, ánh xạ cần qu bước hậu xử lý để loại bỏ đối sánh sai, giữ lại đối sánh quán với đặc điểm hình dạng/hình học củ đối tượng Để giải toán này, thuật toán RANSAC (Random sample consensus) [11] thường sử dụng để loại bỏ đối sánh sai Ý tưởng thuật toán R NS C để loại bỏ đối sánh s i s u: - Bước 1: Chọn tham số model ánh xạ, giả sử trường hợp củ đối sánh ảnh model RANSAC phép biến đổi affine Do vậy, ta có tham số model cần ước lượng - Bước 2: Chọn ngẫu nhiên đối sánh n o S u tính tốn r tham số model Tính sai số model cách đếm xem có 37 đối sánh không phù hợp với tham số vừ ước lượng Cập nhật tham số model vào biến trung gi n để lưu model tốt tìm - Bước 3: Lặp lại bước khoảng N lần v đư r th m số tốt đ tìm Model tối ưu dùng để loại bỏ đối sánh sai cách giữ lại đối sánh có sai số nhỏ với model vừ tìm Hình 3.7 minh họa ảnh truy vấn ảnh CSDL Hình 3.8 minh họ đặc trưng SURF tìm cho hai ảnh Ảnh truy vấn Ảnh CSDL Hình 3.7 Minh họa ảnh truy vấn ảnh CSDL Ảnh truy vấn Ảnh CSDL Hình 3.8 Các đặc trưng SURF tìm hai ảnh (các vịng trịn nhỏ) 38 Hình 3.9 Hình 3.10 minh họ đối sánh trước sau áp dụng RANSAC Hình 3.9 Các đối sánh trước áp dụng RANSAC Hình 3.10 Các đối sánh trước áp dụng RANSAC Như chúng t qu n sát được, RANSAC làm việc hiệu Rất nhiều đối sánh s i đ bị loại bỏ xác, giữ lại đối sánh phù hợp với đặc điểm hình học hai ảnh Các hình sau minh họa kết đối sánh khác phần logo cố tình bị di chuyển đến vị trí khác ảnh Mặc dù vậy, thuật tốn làm việc xác v ln tìm r đối sánh hai hình 39 *) Đánh giá thời gian xử lý: Bảng sau trình bày thời gian xử lý tác vụ khác Task Ảnh truy vấn Ảnh CSDL Dò tìm điểm khóa 30 ms 130 ms (offline) Mơ tả điểm khóa 8.8 ms 207 ms (offline) Đối sánh Tổng thời gian xử lý online 95 ms 30 + 8.8 + 95 = 133.8 ms Chú ý rằng, tác vụ dị tìm điểm khóa mơ tả điểm khó ảnh CSDL thực offline, thời gian xử lý toàn trình liên qu n đến tác vụ thực online (133.8 ms), tương đương với tốc độ xử lý khoảng 7.4 FPS *) Một số kết đối sánh khác (thay đổi vị trí logo): 40 41 42 KẾT LUẬN VÀ KIẾN NGHỊ Kết luận Luận văn n y đ trình b y vấn đề học thuật đề t i lập mục v ứng dụng b i toán đối sánh mẫu Các nội dung v kết củ đề t i tập tóm tắt s u: - Trình b y tổng qu n vấn đề nghiên cứu liên qu n đến b i toán lập mục Các phương pháp liên qu n tập trung v phân loại th nh nhóm sau: dự h m băm (h shing-based ppro ch) dự phân cụm (clustering-b sed ppro ch) dự phân hoạch không gi n (sp ce-based approach), số kỹ thuật lập mục gián tiếp khác - Phân tích yêu cầu củ hệ thống lập mục gồm: tính hiệu mặt nhớ, tính hiệu mặt thời gi n v độ xác củ lược đồ lập mục Tử xác định yêu cầu cần thiết lựa chọn thuật toán lập mục phù hợp cho toán ứng dụng cụ thể - Nghiên cứu tìm hiểu lược đồ lập mục có tên PSVQ (Product Sub-Vector Quantization) ưu điểm bật củ độ xác lập mục cao, hiệu mặt nhớ tốc độ đối sánh nhanh (có thể dễ dàng kết hợp với tìm kiếm phân cụm để tối ưu hó q trình đối sánh) - C i đặt lược đồ PSVQ phân tích đánh giá hiệu PSVQ so sánh với thuật toán khác - Ứng dụng PSVQ để xây dựng ứng dụng demo đối sánh ảnh thời gian thực sử dụng đặc trưng tiên tiến SURF R NS C Kiến nghị Với kết đ đạt việc kết hợp v ứng dụng lược đồ lập mục PSVQ v o b i tốn có CSDL lớn l cần thiết v hiệu Chẳng hạn hệ thống quản lý bệnh viện có đặc thù số lượng ghi lớn kỹ thuật lập mục hữu ích để giúp hệ thống thực truy vấn thời gi n thực khơng có độ trễ 43 Mặc dù nghiên cứu lập mục đ đạt nhiều kết tiến tồn số vấn đề cần tiếp tục nghiên cứu v giải Chẳng hạn việc ứng dụng thuật toán học sâu (Deep Le rning) để th y thuật toán lượng tử hó (product qu ntiz tion) l hướng nghiên cứu nhiều tiềm hẹn tạo r kết bật lĩnh vực lập mục 44 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Phạm Thế nh Nguyễn Mạnh n Đỗ Năng To n (2017), Giáo trình Xử lý ảnh, Nh xuất Giáo dục [2] Ho ng Văn Dũng (2018), Giáo trình Nhận dạng Xử lý ảnh, Nh xuất Kho học v Kỹ thuật Tiếng Anh [3] Silpa-Anan, C and Hartley, R (2008), “Optimised kd-trees for fast image descriptor matching” IEEE Conference on Computer Vision and Pattern Recognition (CVPR’08), pp 1–8 [4] A Andoni, P Indyk (2006), “Near-optimal hashing algorithms for approximate nearest neighbor in high dimensions”, 47th Annual IEEE Symposium on Foundations of Computer Science (FOCS’06), pp 459-468 [5] A Andoni, P Indyk, H L Nguyen, I Razenshteyn (2014), “Beyond localitysensitive hashing”, Proceedings of the Twenty-Fifth Annual ACMSIAM Symposium on Discrete Algorithms, SODA’ pp 8–1028 [6] Beis, J S and Lowe, D G (1997), “Shape indexing using approximate nearest-neighbour search in high-dimensional spaces” Proceedings of the 1997 Conference on Computer Vision and Pattern Recognition, CVPR’97 pp.1000–1006 [7] S Belongie, J Malik, and J Puzicha (2002), "Shape Matching and Object Recognition Using Shape Contexts", IEEE Transactions on Pattern Analysis and Machine Intelligence 24, (24), pp 509–521 [8] Böhm, C., Berchtold, S., and Keim, D A (2001), “Searching in highdimensional spaces: Index structures for improving the performance of multimedia databases” ACM Comput Surv, 33(3), pp.322–373 [9] M Calonder and V Lepetit and M Ozuysal and T Trzcinski and C Strecha and P Fua (2002), {BRIEF}: “Computing a Local Binary Descriptor Very Fast” IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), 34(7), pp 1281-1298 45 [10] Cheng DY, Gersho A, Ramamurthi B, Shoham Y (1984), “Fast search algorithms for vector quantization and pattern matching” IEEE international conference on acoustics, speech, and signal processing, IC SSP’8 [11] M pp.372–375 Fischler nd R C Bolles ( 98 ) “R ndom s mple consensus: paradigm for model fitting with applications to image analysis and automated cartogr phy” Communications of the ACM, 24(6), pp.381– 395 [12] Friedm n J H Bentley J L nd Finkel R ( 977) “ n lgorithm for finding best m tches in log rithmic expected time” ACM Trans Math Softw., 3(3), pp.209–226 [13] T Ge, K He, Q Ke, J Sun ( ) “Optimized product qu ntiz tion” IEEE Trans Pattern Anal Mach Intell, 36 (4), pp.744–755 [14] H Jegou, M Douze, C Schmid, P Perez (2010), “Aggregating local descriptors into a compact image representation”, Computer Vision and Pattern Recognition (CVPR), IEEE Conference on, pp 3304–3311 [15] Jégou, H., Douze, M., and Schmid, C (2011), “Product Quantization for Nearest Neighbor Search” IEEE Trans Pattern Anal Mach Intell., 33(1), pp.117–128 [16] Lv, Q., Josephson, W., Wang, Z., Charikar, M., and Li, K (2007), “Multiprobe LSH: efficient indexing for high-dimensional similarity se rch” Proceedings of the 33rd International Conference on Very large Databases, VLDB’ pp 95 –961 [17] Y Kalantidis, Y Avrithis (2014), “Locally optimized product quantization for approximate nearest neighbor search”, Proceedings of International Conference on Computer Vision and Pattern Recognition (CVPR 2014), Columbus, Ohio [18] Kulis, B and Grauman, K (2009), “Kernelized localitysensitive hashing for scalable image search” IEEE International Conference on Computer Vision (ICCV), pp 1–8 46 [19] M rtin Fischler nd Robert C Bolles ( 98 ) “R ndom s mple consensus: a paradigm for model fitting with applications to image n lysis nd utom ted c rtogr phy” Communication ACM, 24(6), pp.381–395 [20] Hien Phuong Lai, Muriel Visani, Alain Boucher, Jean-Marc Ogier (2014), “A new interactive semi-supervised clustering model for large image database indexing” Pattern Recognition Letters, 37, pp 94-106 [21] Viet Phuong Le, Muriel Visani, De Cao Tran, Jean-Marc Ogier (2013), “Improving Logo Spotting and Matching for Document Categorization by a Post-Filter Based on Homography” ICDAR, pp 270-274 [22] Leibe, B., Mikolajczyk, K., and Schiele, B (2006), “Efficient clustering and matching for object class recognition” Proceedings of British Machine Vision Conference, pp 789–798 [23] Liu, T., Moore, A W., Gray, A., and Yang, K (2004), “An investigation of practical approximate nearest neighbor algorithms” Proceedings of Neural Information Processing Systems (NIPS 2004), pp.825–832, MIT Press [24] D G Lowe (2004) “Distinctive im ge fe tures from sc le-invariant keypoints”, International Journal of Computer Vision, 60(2), pp 91–110 [25] McNames, J., (2001), “A fast nearest-neighbor algorithm based on a principal axis search tree” IEEE Trans Pattern Anal Mach Intell, 23, pp 964–976 [26] Pierre Moreels and Pietro Perona (2007) “Evaluation of Features Detectors and Descriptors based on 3D Object” International Journal of Computer Vision, 73(3), pp 263-284 [27] Mori, G., Belongie, S., and Malik, J Shape (2001), “Contexts enable efficient retrieval of similar shapes” Proceedings of the IEEE Computer Society Computer Vision and Pattern Recognition (CVPR’01), 1, pp 723–730 47 [28] Muja, M and Lowe, D G (2009), “Fast approximate nearest neighbors with automatic algorithm configuration” In VISAPP International Conference on Computer Vision Theory and Applications, pp.331–340 [29] Muja, M and Lowe, D G (2012), “Fast matching of binary features” Proceedings of the Ninth Conference on Computer and Robot Vision (CRV), pp 404–410 [30] Nister, D and Stewenius, H (2006) “Scalable recognition with a vocabulary tree”, Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06), 2, pp.2161–2168 [31] M Norouzi, D J Fleet (2013), “Cartesian k-means”, Proceedings of the 2013 IEEE Conference on Computer Vision and Pattern Recognition, CVPR’ pp 7–3024 [32] A Oliva and A Torralba (2001) “Modeling the sh pe of the scene: A holistic represent tion of the sp ti l envelope”, Int J Comput Vision, 42(3), pp 145–175 [33] The Anh Pham, Mathieu Delalandre, Sabine Barrat and Jean-Yves Ramel (2013), "Accurate junction detection and characterization in linedrawing images ", Pattern Recognition, 47(1), pp.282–295 [34] T.-A Pham, S Barrat, M Delalandre, J.-Y Ramel (2013), “An efficient indexing scheme based on linked-node m-ary tree structure”, 17th International Conference on Image Analysis and Processing (ICIAP), Vol 8156 of LNCS, pp 752–762 [35] T.-A Pham (2017) “P ir-wisely optimized clustering tree for feature indexing”, Computer Vision and Image Understanding, 154(1), pp 35–47 [36] The-Anh Pham, Dinh-Nghiep Le, Lan-Phuong Nguyen (2019), “Product sub-vector quantization for feature indexing” Science and Cybernetics, V.35, N.1, pp.1-35 48 Journal of Computer [37] Roy, P P., Rayar, F., and Ramel, J.-Y (2012), “An efficient coarse-tofine indexing technique for fast text retrieval in historical documents” Proceedings of the 10th IAPR International Workshop on Document Analysis Systems, pp.150–154 [38] K Simonyan, A Zisserman (2014), Very deep convolutional networks for largescale image recognition, arXiv:1409.1556 [cs.CV], CoRR abs/1409.1556 [39] S Tabbone, L Wendling, and K Tombre (2003), “Matching of graphical symbols in line-drawing images using angular signature information”, International Journal on Document Analysis and Recognition (IJDAR), 6, 115–125 [40] Teh, C.-H and Chin, R.-T (1989), “On the detection of dominant points on digital curves” IEEE Trans Pattern Anal Mach Intell., 11(8), pp.859–872 [41] J Wang, N Wang, Y Jia, J Li, G Zeng, H Zha, X Hua (2014), “Trinaryprojection trees for approximate nearest neighbor search”, IEEE Trans Pattern Anal Mach Intell, 36 (2), pp.388–403 [42] S Yang (2005), “Symbol recognition via statistical integration of pixellevel constraint histograms: A new descriptor” Pattern Analysis and Machine Intelligence (PAMI), 27(2), pp.278– 281 Internet [43] Bay H., Tuytelaars T., Van Gool L (2006), “SURF: Speeded Up Robust Features” Leonardis A., Bischof H., Pinz A (eds) Computer Vision – ECCV 2006, ECCV 2006, Lecture Notes in Computer Science, vol 3951 Springer, Berlin, Heidelberg, https://doi.org/10.1007/11744023_32 [44] T.-A Pham and N.-T Do (2018) “Embedding hier rchic l clustering in product qu ntiz tion for fe ture indexing”, Multimedia Tools and Applications, https://doi.org/10.1007/s11042-018-6626-9 49 [45] T.-A Pham (2019), “Improved embedding product qu ntiz tion”, Machine Vision and Applications, https://doi.org/10.1007/s00138-01800999-2 [46] J Wang, H T Shen, J Song, J Ji (2014), “Hashing for similarity search: A survey”, CoRR abs/1408.2927, URL, http://arxiv.org/abs/1408.2927 [47] https://htigroup.vn/thi-giac-may-tinh-va-nhung-ung-dung-khong-ngotrong-xu-the-cong-nghe-hien-nay/ 50

Định dạng
Số trang	57
Dung lượng	2,97 MB