Xây dựng công cụ hỗ trợ đọc xuất bản phẩm lưu chiểu dựa trên phương pháp đối sánh ảnh tài liệu

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	13
Dung lượng	2,04 MB

Nội dung

Nghiên cứu được thực hiện qua nhiều công đoạn như rút trích đặc trưng cục bộ cho ảnh, sau đó thực hiện phân vùng ảnh với thuật toán DBSCAN (Density-Based Spatial Clustering of Application with Noise), gom cụm các đặc trưng cục bộ và đối sánh từng vùng ảnh tài liệu với giải thuật đối sánh các đặc trưng cục bộ SIFT, SURF.

AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 XÂY DỰNG CÔNG CỤ HỖ TRỢ ĐỌC XUẤT BẢN PHẨM LƯU CHIỂU DỰA TRÊN PHƯƠNG PHÁP ĐỐI SÁNH ẢNH TÀI LIỆU Phạm Thị Minh Thư1, Lê Việt Phương1 Trường Cao đẳng nghề An Giang Sở Thông Tin Truyền Thông Tỉnh An Giang Thông tin chung: Ngày nhận bài: 01/10/2018 Ngày nhận kết bình duyệt: 14/11/2018 Ngày chấp nhận đăng: 08/2019 Title: A supportive tool for reading depository publications based on document image matching Keywords: Document images matching, local feature, DBSCAN, SIFT, SURF Từ khóa: Đối sánh ảnh tài liệu, gom cụm DBSCAN, đặc trưng SIFT, SURF ABSTRACT The research was carried out in many stages such as local features extraction image, then segmenting the image by DBSCAN algorithm (Density-Based Spatial Clustering of Application with Noise), clustering local features and comparing each document image area to matching local features algorithms (SIFT, SURF) Finally, determining the mismatched areas, wrong positions of licensing printing and has been printed document images The propose method is capable to decay document images into each separated block (title, image, paragraph, table), not use machine learning and not need to know the detail layout of document images previously; the matching performance is more accurately because of only using each decayed image region to matching and detect the differences instead of using all document images The experimental result on 223 document images were collected at “Read Depositary” part, presented the accuracy of the propose method is 91%, also found the difference image regions between two document images and found the wrong position about layout on two document images TÓM TẮT Nghiên cứu thực qua nhiều công đoạn rút trích đặc trưng cục cho ảnh, sau thực phân vùng ảnh với thuật toán DBSCAN (Density-Based Spatial Clustering of Application with Noise), gom cụm đặc trưng cục đối sánh vùng ảnh tài liệu với giải thuật đối sánh đặc trưng cục SIFT, SURF Cuối xác định vùng bị sai khác, sai vị trí ảnh tài liệu xin cấp phép in ảnh tài liệu in Phương pháp nghiên cứu đưa có khả phân rã ảnh tài liệu thành khối riêng biệt (tiêu đề, hình ảnh, đoạn văn bản, bảng biểu), không sử dụng máy học không cần biết trước bố cục cụ thể ảnh tài liệu; hiệu đối sánh ảnh xác sử dụng vùng ảnh phân rã để đối sánh phát sai khác, thay sử dụng toàn ảnh để đối sánh Kết thực nghiệm 223 ảnh tài liệu thu tập phận đọc lưu chiểu, cho thấy độ xác đạt phương pháp đề xuất 91%, tìm vùng ảnh khác hai ảnh tài liệu, tìm vùng bị sai vị trí bố cục hai ảnh tài liệu 96 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 1) thực việc nhận dạng logo ảnh tài liệu Tác giả sử dụng nhiều loại đặc trưng cục khác mô tả logo, định vị nhận dạng logo ảnh tài liệu kết nghiên cứu thể đặc trưng cục SIFT mang lại kết tối ưu Tác giả I Amerini cộng sử dụng đặc trưng cục SIFT nghiên cứu “A SIFTbased forensic method for copy-move attack detection and transformation recovery” (Amerini, Ballan, Caldelli, Del Bimbo, & Serra, 2011, tr 1) với mục tiêu phát vùng ảnh bị chép Tác giả Olivier Augereau a cs với nghiên cứu “Semi-structured document image matching and recognition” (Augereau, Journet, & Domenger, 2013, tr 1) đối sánh nhận dạng ảnh tài liệu trình bày việc sử dụng đặc trưng cục SIFT đối sánh nhận dạng ảnh tài liệu Trong nghiên cứu “Image Matching Using SIFT, SURF, BRIEF and ORB: Performance Comparison for Distorted Images” (Karami, Prasad, & Shehata, 2015, tr 1) thực nghiên cứu đối sánh ảnh sử dụng đặc trưng cục SIFT, SURF, BRIEF ORB trường hợp ảnh bị biến dạng Kết trình bày nhiều trường hợp kỹ thuật ORB mang lại hiệu suất nhanh mặt thời gian, nhiên tỉ lệ xác kỹ thuật SIFT mang lại hiệu cao GIỚI THIỆU Từ nhu cầu thực tế phận “đọc lưu chiểu” Sở Thông tin Truyền thông tỉnh An Giang việc nghiên cứu toán đối sánh ảnh tài liệu, thực đề tài nghiên cứu xây dựng công cụ thực việc đối sánh hai ảnh tài liệu với nhằm phát khác hai trang tài liệu, so sánh mặt nội dung bố cục văn Trong hai hướng tiếp cận toán đối sánh ảnh đặc trưng toàn cục (Global feature (Kyrki, 2002; Lim & Galoogahi, 2010; Raoui, Houssine BOUYAKHF, Devy, & Regragui, 2011)) đặc trưng cục (Local feature (Kyrki 2002; Lê Việt Phương, 2015; Raoui et al 2011)) Chúng sâu nghiên cứu hướng tiếp cận đối sánh ảnh tài liệu dựa đặc trưng cục SIFT (Lowe, 1999; Lê Việt Phương, Nayef, Visani, Ogier, & Trần Cao Đệ, 2014) SIFT nhiều nghiên cứu nhà khoa học dùng rộng rãi để trích xuất mơ tả điểm đặc trưng có đặc điểm như: Bất biến với độ co, phép quay, phần phép biến đổi affine mạnh với thay đổi độ sáng, che khuất nhiễu Bên cạnh giải thuật gom cụm DBSCAN (Atrayee Dhua, Sarma, Singh, & Roy, 2015; Ester, Xu, Kriegel, & Sander, 1996), thực gom cụm đặc trưng cục nghiên cứu cho việc phân vùng ảnh tài liệu, thành cụm theo bố cục cụ thể đối tượng trang ảnh tài liệu, kết chia ảnh tài liệu thành nhiều vùng cụ thể theo đối tượng ảnh tài liệu Với toán từ nhu cầu thực tiễn cơng trình nghiên cứu trước đối sánh ảnh sử dụng đặc trưng cục Chúng thực nghiên cứu đối sánh ảnh tài liệu với phương pháp sử dụng đặc trưng cục bộ, thực việc đối sánh với hai mục tiêu Thứ xác định xem hai ảnh tài liệu có vùng bị khác khơng Thứ hai có vùng ảnh tài liệu bị sai vị trí khơng Trong cơng trình nghiên cứu đối sánh ảnh với đặc trưng cục tác giả Lê Việt Phương với nghiên cứu “Logo detection, recognition and spotting in context by matching local visual features” (Lê Việt Phương, 2015, tr 97 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Mô hình đề xuất Hình Mơ hình đề xuất đối sánh ảnh tài liệu 2.2 Trích chọn đặc trưng cục SIFT chọn dựa việc đo lường tính ổn định chúng • Xác định hướng cho điểm hấp dẫn (Orientation assignment): Một nhiều hướng gán cho vị trí điểm hấp dẫn dựa hướng gradient cục ảnh • Mơ tả điểm hấp dẫn (Key-point descriptor): Các gradient ảnh cục xác định tỷ lệ chọn vùng bao quanh điểm hấp dẫn Các gradient biểu diễn sang dạng mà cho phép bất biến với thay đổi hình dạng điều kiện chiếu sáng Hình mơ biên độ gradient hướng mẫu ảnh vùng lân cận với điểm hấp dẫn Mỗi điểm hấp dẫn sau xác định hướng mô tả dạng vec-tor đặc trưng có x x 8=128 chiều SIFT (Scale invariant Feature Trasnorm) (Rusiđol & Lladós 2009; Lê Việt Phương, 2015) đặc trưng cục bất biến phép biến đổi tỉ lệ, tịnh tiến, phép quay không đổi phần thay đổi góc nhìn; đồng thời mạnh với thay đổi độ sáng, che khuất, nhiễu Phương pháp rút trích đặc trưng SIFT tóm tắt sau: • Phát điểm cực trị Scale-Space (Scale-Space extrema detection): Sử dụng hàm sai khác Gausian (Different-ofGaussian) để xác định tất điểm hấp dẫn tiềm mà bất biến với quy mô hướng ảnh • Định vị điểm hấp dẫn (key-point localization): Ứng với vị trí tiềm năng, hàm kiểm tra đưa để định xem điểm hấp dẫn tiềm có lựa 98 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 Hình Ví dụ mơ tả SIFT vùng kích thước x x 2.3 Phân cụm đặc trưng với giải thuật DBSCAN DBSCAN (Ester & cs., 1996; Yaikhom, 1996) xác định số lượng cụm cách tự động cụm có hình dạng bất kỳ, điều phù hợp với đối tượng ảnh tài liệu tiến hành phân rã ảnh tài liệu Việc phân cụm đặc trưng cục giúp tìm khối cho đối tượng ảnh tài liệu như: đoạn văn bản, ảnh, bảng biểu… Density-Based Spatial Clustering of Application with Noise (DBSCAN) giải thuật phân cụm dựa mật độ đề xuất Ester, Kriegel Sander vào năm 1996 DBSCAN sử dụng hai tham số: Khoảng cách (eps) số điểm cần có để thành cụm MinPts Khơng giống giải thuật phân cụm dựa khoảng cách khác, Hình Kết phân cụm giải thuật DBSCAN (mỗi cụm màu) chi tiết đối tượng cụ thể ảnh, đoạn văn bản, bảng biểu, logo Như hình 4(a) cho thấy có vùng ảnh phân vùng chưa xác vùng đánh dấu số 1, bao màu xanh Khi để việc phân đoạn ảnh mang lại độ xác cao, phân vùng đối tượng ảnh, đoạn văn xử lý thêm cho vùng tô màu xanh cách kiểm tra phân đoạn ảnh có kích thước lớn 1/5 ảnh tài liệu cần gom nhóm đặc trưng cục với DBSCAN lần với ngưỡng eps nhỏ eps=eps*85% Kết hình 10(b) cho thấy kết tối ưu Thuật tốn DBSCAN tìm cụm với hình thù bất kỳ, thời điểm bị ảnh hưởng thứ tự đối tượng liệu nhập vào Khi có đối tượng chèn vào tác động đến láng giềng xác định Eps MinPts hai tham số toàn cục xác định thủ công theo kinh nghiệm Tham số Eps đưa vào nhỏ so với kích thước khơng gian liệu, độ phức tạp tính tốn trung bình truy vấn O(nlogn) Trong thực nghiệm giá trị 𝑒𝑝𝑠 = max(𝑤, ℎ) /100 chọn, w, h độ cao độ rộng ảnh tài liệu Tuy nhiên với ngưỡng eps không phân vùng 99 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 (a) (b) Hình Kết gom cụm đặc trưng cục DBSCAN lần với vùng ảnh 1,2 hình (a) lớn 1/5 kích thước ảnh tài liệu Những vùng đánh số 1.1, 1.2 gom cụm lại từ vùng kết hình (b) 2.4 Phương pháp đối sánh điểm đặc trưng key-point với chiều dài tùy thuộc vào mơ tả đặc trưng cục (ví dụ, vector 128chiều mơ tả SIFT vector 256-chiều mô tả BRIEF(Calonder, Lepetit, Strecha, & Fua, 2010)) Một key-point q thứ i phân vùng 𝑞 ảnh ký hiệu 𝐿𝑖 Một phân đoạn ảnh cho trước 𝐿𝑖 biểu diễn 𝑛𝑖 điểm đặc trưng (key-point) Mỗi điểm đặc trưng k mô tả vector đặc trưng Dk Có thể biểu diễn sau: 𝐿𝑖 = {(𝑥𝑘 , 𝑦𝑘 , 𝐷𝑘 )} 𝑤𝑖𝑡ℎ 𝑘 ∈ {1, … , 𝑛𝑖 } Tương tự vậy, ảnh tài liệu 𝑇𝑖 biểu diễn tập hợp key-point đặc trưng cục phát ảnh tài liệu thứ i: (1) 𝑥𝑘 , 𝑦𝑘 vị trí x y điểm phát đặc trưng cục thứ k 𝐷𝑘 vector mô tả 𝑇𝑖 = {(𝑥𝑘 , 𝑦𝑘 , 𝐷𝑘 )} 𝑤𝑖𝑡ℎ 𝑘 ∈ {1, … , 𝑚𝑖 } phần tử mô tả tương tự (2) hợp điểm key-point ảnh đối sánh Trong phương thức này, láng giềng gần định nghĩa key-point với khoảng cách gần không gian mô tả Hai vector đặc trưng định nghĩa gần chúng có khoảng cách gần Khoảng cách hai điểm xét theo nhiều cách độ đo Cosine, khoảng cách góc, khoảng cách Euclid, khoảng cách city-block Việc đối sánh điểm đặc trưng thực điểm đặc trưng ảnh tài liệu cần đối sánh Mỗi điểm đặc trưng q ảnh cần đối sánh tìm hai điểm đặc trưng t1 t2 ảnh tài liệu truy vấn sau cho hai điểm gần theo khoảng cách Euclidean không gian vector đặc trưng (ví dụ khơng gian 128 chiều vector đặc trưng SIFT) Đối sánh điểm đặc trưng cục việc so sánh tập key-points phát ảnh đối sánh tập key-point phát ảnh đối sánh Để xác định key-point gọi khớp (giống nhau) cách xác định điểm láng giềng gần tập 100 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 𝑑1 = 𝑚𝑖𝑛𝑘 (||𝑆𝑞 − 𝑆𝑘 ||) Và 𝑘 ∗ = 𝑎𝑟𝑔𝑚𝑖𝑛𝑘 (||𝑆𝑞 − 𝑆𝑘 ||) (3) 𝑑2 = 𝑚𝑖𝑛𝑘#𝑘 ∗ (||𝑆𝑞 − 𝑆𝑘 ||) mờ không rõ ràng chọn điểm đối sánh t1 t2 điểm đối sánh tiềm Trong trường hợp ngược lại, 𝑟 ≤ 𝜑 có phân biệt định t1 t2’, cặp đối sánh (q, t1) chấp nhận Trong thực nghiệm, chọn 𝜑 = 0.75 dựa thực nghiệm Với ||𝑆𝑞 − 𝑆𝑘 || khoảng cách Euclidean hai vector mô tả 𝑆𝑞 𝑣à 𝑆𝑘 hai điểm đặc trưng tương ứng q k 𝑑1 Tỉ số 𝑟 = 𝑑2 dùng để định cặp đối sánh (q,t1) có thích hợp hay khơng dựa ngưỡng 𝜑 cho trước Nếu 𝑟 > 𝜑 có nghĩa cặp đối sánh khơng đáng tin cậy, có mập 2.5 Gom nhóm đặc trưng đối sánh Sau đặc trưng cục đối sánh để tìm cặp đặc trưng tương đồng thỏa điều kiện ngưỡng 𝜑 = 0.75 Tuy nhiên cụm key-point khơng xác đối sánh hai ảnh tài liệu có nhiều đối tượng hình ảnh, bảng biểu, biểu đồ văn bản; đặc biệt văn tìm nhiều cặp key-point tương đồng khối văn khác ảnh tài liệu hình Chính sau tìm số cặp key-point tương đồng chúng tơi tiến hành gom nhóm key-point tương đồng ảnh tài liệu thứ hai với thuật toán gom cụm DBSCAN thực nghiệm xác định tham số eps=max(w,h)/2 với w, h độ rộng độ cao khối ảnh đối sánh MinPts=4 hai tham số tối ưu thực nghiệm cho việc tìm nhóm có số key-point cao Hình (trái) Ảnh mô tả cặp key-point đối sánh trước gom nhóm (phải) sau gom nhóm 2.6 Lọc key-point Homography định vị đối sánh hay sai chưa tốt Chúng tiến hành lọc keypoint khơng thực xác xác định vùng ảnh ảnh tài liệu đối sánh ảnh đối sánh dựa Homography dùng RANSAC(Lê Việt Phương, Nayef, Visani, Ogier, & Trần Cao Đệ, 2014; Lê Việt Phương, Visani, Trần Cao Đệ, & Ogier, 2013; Krishnan & Jawahar 2016; Lê Việt Phương, 2015; Lê Việt Phương, Đặng Quốc Bảo, & Trần Cao Đệ, 2015) với Sau thực gom nhóm đặc trưng cục đối sánh kết đạt hình 5, nhiên, kết biểu diễn đường nối cặp keypoint đối sánh, số keypoint chưa xác (các đường màu vàng); từ dẫn đến việc định vị vùng ảnh đối sánh khơng xác, tỉ lệ % xác định vùng ảnh 101 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 (a) (b) (c) (d) Hình Ảnh mô tả cặp key-point đối sánh sau RANSAC loại bỏ điểm đặc trưng không thực giống Trong thực nghiệm đối sánh ảnh tài liệu phát vùng ảnh không giống hai ảnh tài liệu với số trường hợp cụ thể, tỉ lệ phần % key-point nhỏ ngưỡng 𝜔 = 7% Nếu chọn ngưỡng cao dẫn đến việc bỏ qua vùng có tỉ lệ thấp bố cục ảnh phức tạp nhiều ảnh, văn hay biểu đồ… có nhiều key-point tương đồng Ngược lại, chọn ngưỡng q thấp có nhiều vùng khơng giống bị nhận lầm giống dẫn đến kết đối sánh khơng cao; bị phát nhầm vùng ảnh có bố cục phức tạp, ảnh scan bị mờ Từ cho thấy việc chọn ngưỡng cao hạn chế lỗi phát nhầm 102 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 loại bỏ vùng có tỉ lệ thấp hình 6(a) Để khắc phục nhược điểm này, đề xuất giải pháp cải tiến nâng cao tỉ lệ cách cố gắng tìm kiếm thêm cặp key-point Để tìm kiếm thêm cặp key-point đúng, tiến hành thực nghiệm đối sánh ảnh tài liệu lần với key-point nằm vùng xác định ảnh đối sánh (Lê Việt Phương & Trần Cao Đệ, 2015; Lê Việt Phương, Visani, Trần Cao Đệ, & Ogier, 2013) Việc làm tăng tỉ lệ key-point lên cao hai vùng ảnh thật giống không tăng tỉ lệ keypoint (hoặc tăng không đáng kể) hai vùng ảnh thật khác Thuật toán đề xuất cho việc lọc keypoint khơng xác định vị vị trí phân đoạn ảnh ảnh tài liệu đối sánh so với ảnh đối sánh sau: Đối với ứng viên vùng phân đoạn ảnh tài liệu: sánh lần vùng cần đối sánh với tất key-point trích xuất Khi 𝑠𝑖 (𝑥𝑖1 , 𝑥𝑖2 ) tọa độ điểm key-point đối sánh phân đoạn ảnh ảnh tài liệu đối sánh cần đối sánh, 𝑡𝑖 (𝑦𝑖1 , 𝑦𝑖2 ) tọa độ điểm key-point đối sánh hình ảnh đối sánh Ước lượng lại phép biến đổi H cách sử dụng tất cặp key-point đối sánh (𝑠𝑖 , 𝑡𝑖 ) bước Lọc điểm key-point khơng thật xác: 𝑖𝑓 ‖𝑡𝑖 − 𝐻(𝑠𝑖 )‖ ≥ 𝜃 loại số key-point đối sánh khơng thực xác Xác định lại vị trí phân đoạn ảnh tài liệu ước tính dựa bốn góc phép biến đổi H Cuối cùng, xác định tỉ lệ % số key-point đối sánh số key-point phân đoạn ảnh ảnh tài liệu đối sánh để xác định phân đoạn ảnh có giống hay khác ảnh đối sánh với ngưỡng tỉ lệ cho trước Trong kết trình bày hình sau thực tính số key-point vùng đối sánh thực đối sánh lần kết tỉ lệ % lớn ngưỡng 7% Do đó, thay bị kết luận sai trường hợp hình 7(a), sau thực đối sánh theo thuật giải cải tiến kết ghi nhận hình 7(b) Và so với kết quan sát thực tế vùng ảnh Tìm phép biến đổi H cặp keypoint đối sánh vùng ứng viên phân đoạn ảnh tài liệu Xác định vùng giới hạn chứa phân đoạn ảnh ảnh đối sánh, nhờ vào phép biến đổi H bốn góc vùng phân đoạn ảnh tài liệu Trích xuất tất keypoint vùng giới hạn Tiến hành đối (a) (b) Hình Kết đối sánh vùng ảnh với tỉ lệ 6.8% (a) kết đối sánh sau cải tiến 14.43% 2.7 Xác định vùng ảnh tài liệu bị sai vị trí phải kiểm tra vị trí xuất đối tượng có vị trí tương đối so với ảnh đối sánh hay khơng Vì mà cơng việc nghiên cứu xác định vùng cho có bị sai vị trí mặt bố cục khơng Kết thúc q trình đối sánh, xác định đối tượng tồn (hoặc khơng tồn tại) vị trí ảnh đối sánh Tuy nhiên, theo nhu cầu thực tế toán đặt cần 103 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 Để thực hiện, tiến hành so sánh vị trí tương đối tâm hai vùng ảnh so với biên hai ảnh chuẩn hoá Hai vùng ảnh cho khơng vị trí tọa độ vùng ảnh bị lệch ngưỡng cho trước (trong thực nghiệm dùng α=0.05) Sau phân rã ảnh với DBSCAN, tiến hành bước thứ hai thực việc tìm khối ảnh ảnh thứ ảnh thứ hai với việc đối sánh cặp đặc trưng cục mô tả vector mô tả SIFT Trong trình đối sánh cặp đặc trưng cục để xác định khối ảnh có ảnh thứ hai khơng, chúng tơi thực tính tỉ lệ số key-point tìm ảnh thứ hai số key-point ảnh thứ với giá trị ngưỡng 𝜔 = 0.07 Nghĩa số lượng keypoint tìm thấy ảnh thứ hai đạt tỉ lệ 7% trở lên so với số key-point trích đặc trưng từ khối ảnh thứ Thì xác định khối ảnh có ảnh thứ hai ngược lại đánh dấu khối ảnh khơng có vị trí ảnh số hai KẾT QUẢ VÀ THẢO LUẬN Trong phần thực nghiệm, chúng tiến hành cài đặt ngôn ngữ Python sử dụng thư viện mã nguồn mở OpenCV Intel (Bradski & Kaehler, 2012; Laganière, 2011) thực việc trích đặc trưng SIFT (Đặng Quốc Bảo & cs, 2015; Lê Việt Phương & Trần Cao Đệ, 2015), SURF(Bay, Tuytelaars, & Van Gool, 2006; Đặng Quốc Bảo & cs, 2015; Mandle & Pahadiya, 2016) đối sánh đặc trưng cục Sử dụng DBSCAN thư viện sklearn.cluster cho trình gom cụm đặc trưng cục Chúng sử dụng tập liệu thực tế từ phận “đọc lưu chiểu” Sở Thông tin Truyền thông tỉnh An Giang với số ảnh tài liệu chạy thực nghiệm 223 ảnh Như hình 8.a thể tỉ lệ đối sánh khối ảnh ảnh đối sánh ảnh đối sánh thỏa điều kiện đạt tỉ lệ key-point ngưỡng ω = 0.07 Và với hình 8.b thể tỉ lệ số key-point không thỏa ngưỡng ω = 0.07 Và cuối hình 8.c thể kết đối sánh hai ảnh tài liệu với (a) (b) 104 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 (c) Hình Kết đối sánh ảnh tài liệu, xác định có vùng khơng giống vẽ khung màu đỏ vùng sai vị trí vẽ khung màu vàng Trong bảng trình bày kết đánh giá độ xác công cụ đối sánh ảnh tài liệu với hai kỹ thuật SIFT, SURF Bảng Kết đánh giá độ xác cơng cụ “Đọc lưu chiểu dựa phương pháp đối sánh ảnh tài liệu” Từ kết độ xác cơng cụ đối sánh ảnh tài liệu, cho thấy hai giá trị precision recall cao, từ kết đối sánh ảnh tài liệu với phương pháp đối sánh điểm đặc trưng cục SIFT, SURF mang lại kết cao phạm vi tập liệu thực nghiệm Tuy nhiên bên cạnh cơng cụ chưa thể hỗ trợ xác tuyệt đối cho việc tìm hết vùng khác nhau, vùng sai vị trí Cũng cơng cụ phát nhầm vùng bị sai, phần chất lượng ảnh tài liệu scan vào khơng tốt hình thể số trường hợp công cụ bị phát nhầm sau: 105 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 (a:Nguyên nhân in xin cấp phép scan bị mờ) (b: Nguyên nhân ảnh tài liệu scan bị thông tin thực tế so với in ) (c: Số lượng keypoint phát không đủ % ngưỡng xác định đúng) Hình Ảnh bị phát vùng ảnh bị sai không thực thực tế quan sát 106 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 KẾT LUẬN VÀ KHUYẾN NGHỊ Augereau, O., Journet, N., & Domenger, J.-P (2013) Semi-structured document image matching and recognition, 8658, 865804 https://doi.org/10.1117/12.2003911 Bài báo trình bày giải pháp đối sánh ảnh tài liệu với mục tiêu tìm vùng khơng giống nhau, sai vị trí hai ảnh tài liệu Với mơ hình đề xuất đối sánh ảnh tài liệu qua năm giai đoạn: (1) Trích đặc trưng cục ảnh tài liệu với đặc trưng cục SIFT, SURF; (2) Gom cụm đặc trưng cục với DBSCAN gom cụm lại vùng ảnh gom lớn 1/5 kích thước ảnh tài liệu; (3) Đối sánh đặc trưng cục bộ; (4) Định vị xác định vị trí vùng đối sánh (Homography dùng RANSAC); (5) Xác định vùng ảnh sai vị trí với đề xuất xác định tỉ lệ khoảng cách từ tâm vùng ảnh đến biên ảnh Kết thực nghiệm cho thấy phương pháp đề xuất đạt độ xác cao hỗ trợ cho công tác đọc lưu chiểu Calonder, M., Lepetit, V., Strecha, C., & Fua, P (2010) BRIEF: Binary robust independent elementary features Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 6314 LNCS(PART 4), 778–792 https://doi.org/10.1007/978-3-642-15561-1_56 Đặng Quốc Bảo., Lê Việt Phương., Luqman, M M., Coustaty, M., Trần Cao Đệ., & Ogier, J.M (2015) Camera-based document image retrieval system using local features comparing SRIF with LLAH, SIFT, SURF and ORB In 2015 13th International Conference on Document Analysis and Recognition (ICDAR) (pp 1211–1215) IEEE https://doi.org/10.1109/ICDAR.2015.7333956 Trong tương lai ứng dụng kết nghiên cứu hệ thống văn phòng điện tử đáp ứng nhu cầu thực tế như: Xây dựng hệ thống đối chiếu văn phát hành quan đơn vị, chấm thi tin học văn phòng tự động qua ảnh kết thi Bên cạnh đó, tiếp tục nghiên cứu giải thuật phân vùng đối sánh ảnh tài liệu việc kết hợp thêm đặc trưng khác màu sắc, hình dạng, kết cấu với mục tiêu nâng cao khả đối sánh ảnh tài liệu Edla, D R., & Jana, P K (2012) A PrototypeBased Modified DBSCAN for Gene Clustering Procedia Technology, 6, 485–492 https://doi.org/10.1016/j.protcy.2012.10.058 Ester, M., Xu, X., Kriegel, H., & Sander, J (1996) Density-based algorithm for discovering clusters in large spatial databases with noise Proc Acm Sigkdd Int Conf Knowl Discov Data Min., pages, 226–231 Retrieved from TÀI LIỆU THAM KHẢO Amerini, I., Ballan, L., Caldelli, R., Del Bimbo, A., & Serra, G (2011) A SIFT-based forensic method for copy-move attack detection and transformation recovery IEEE Transactions on Information Forensics and Security, 6(3 PART 2), 1099–1110 http://dl.acm.org/citation.cfm?id=3001460.300 1507 Holzinger, W E., Löcker, H., & Löcker, B (2008) Fulgoromorpha of Seychelles: A preliminary checklist Bulletin of Insectology, 61(1), 121–122 https://doi.org/10.1109/TIFS.2011.2129512 Atrayee Dhua, Sarma, D N., Singh, S., & Roy, B (2015) Segmentation of Images using Density-Based Algorithms International Journal of Advanced Research in Computer and Communication Engineering, (5), 273– 278 https://doi.org/10.17148/IJARCCE.2015.4561 https://doi.org/10.1007/11744023_32 Karami, E., Prasad, S., & Shehata, M (2015) Image Matching Using SIFT , SURF , BRIEF and ORB : Performance Comparison for Distorted Images Image Matching Using SIFT, 107 AGU International Journal of Sciences – 2019, Vol 23 (2), 96 - 108 SURF, BRIEF and ORB: Performance Comparison for Distorted Images, (February 2016) https://doi.org/10.13140/RG.2.1.1558.3762 Innovation, and Vision for Future (RIVF) (pp 89–93) IEEE https://doi.org/10.1109/RIVF.2015.7049880 Le Viet Phuong, Visani, M., Tran, C De, & Ogier, J.-M (2013) Improving Logo Spotting and Matching for Document Categorization by a Post-Filter Based on Homography In 2013 12th International Conference on Document Analysis and Recognition (pp 270–274) IEEE https://doi.org/10.1109/ICDAR.2013.61 Krishnan, P., & Jawahar, C V (2016) Matching handwritten document images Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 9905 LNCS, 766–782 https://doi.org/10.1007/978-3-319-46448-0_46 Le Lim, K.-L., & Galoogahi, H K (2010) Shape Classification Using Local and Global Features 2010 Fourth Pacific-Rim Symposium on Image and Video Technology, 115–120 https://doi.org/10.1109/PSIVT.2010.26 Viet Phuong (2015) Logo Detection, Recognition and Spotting in Context by Matching Local Visual Features, (October) Retrieved from https://tel.archives-ouvertes.fr/tel-01373417 Lowe, D G (1999) Object recognition from local scale-invariant features In Proceedings of the Seventh IEEE International Conference on Computer Vision (pp.1150–1157, vol.2) https://doi.org/10.1109/ICCV.1999.790410 Le Viet Phuong., Dang Quoc Bao., & Trần Cao Đệ., (2015) Logo Spotting on Document Images using Local Features In Proceedings of the Sixth International Symposium on Information and Communication Technology SoICT 2015 (pp 1–8) New York, New York, USA: ACM Press Mandle, P., & Pahadiya, B (2016) An Advanced Technique of Image Matching Using SIFT and SURF, 5(5), 462–466 https://doi.org/10.1145/2833258.2833292 https://doi.org/10.17148/IJARCCE.2016.5510 Le Viet Phuong, Nayef, N., Visani, M., Ogier, J M., & Trần Cao Đệ., (2014) Document retrieval based on logo spotting using keypoint matching In Proceedings - International Conference on Pattern Recognition (pp 3056– 3061) IEEE Raoui, Y., Houssine BOUYAKHF, E., Devy, M., & Regragui, F (2011) Global and Local Image Descriptors for Content Based Image Retrieval and Object Recognition Applied Mathematical Sciences, 5(42), 2109–2136 https://doi.org/10.1109/ICPR.2014.527 Rusiñol, M., & Lladós, J (2009) Logo spotting by a bag-of-words approach for document categorization Proceedings of the International Conference on Document Analysis and Recognition, ICDAR, 111–115 https://doi.org/10.1109/ICDAR.2009.103 Le Viet Phuong, & Tran Cao De.,(2015) Keypoint matching with post-filter using SIFT and BRIEF in logo spotting In The 2015 IEEE RIVF International Conference on Computing & Communication Technologies - Research, 108 ... vàng Trong bảng trình bày kết đánh giá độ xác cơng cụ đối sánh ảnh tài liệu với hai kỹ thuật SIFT, SURF Bảng Kết đánh giá độ xác công cụ Đọc lưu chiểu dựa phương pháp đối sánh ảnh tài liệu Từ... cụm đặc trưng cục nghiên cứu cho việc phân vùng ảnh tài liệu, thành cụm theo bố cục cụ thể đối tượng trang ảnh tài liệu, kết chia ảnh tài liệu thành nhiều vùng cụ thể theo đối tượng ảnh tài liệu. .. giải pháp đối sánh ảnh tài liệu với mục tiêu tìm vùng khơng giống nhau, sai vị trí hai ảnh tài liệu Với mơ hình đề xuất đối sánh ảnh tài liệu qua năm giai đoạn: (1) Trích đặc trưng cục ảnh tài liệu

Ngày đăng: 10/01/2020, 20:12