Giao diện kết quả tìm kiếm ảnh tương tự

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng hệ thống truy vấn ảnh tương tự theo nội dung dựa trên cấu trúc cây r tree (Trang 41 - 49)

3.5.3. Phân tích kết quả thực nghiệm

Trong đề tài này, chúng tơi đề xuất một cải tiến thuật tốn tạo cây KNN_R-Tree nhằm phân cụm dữ liệu và tăng trưởng số cụm theo bộ dữ liệu. Để thực hiện được điều này, chúng tôi sử dụng các giá trị ngưỡng đo độ tương tự giữa các đối tượng dữ liệu cụ thể như sau:

Bảng 1. Các giá trị ngưỡng áp dụng cho chương trình thực nghiệm

Ngưỡng Tên gọi Giá trị

𝜉 Slack 0.25

𝜃 Theta 0.35

𝜇 Nuy 0.005

𝜀 Epsilon 0.15

𝛼 Alpha 0.15

Để đánh giá hiệu quả của phương pháp tìm kiếm ảnh, phần thực nghiệm được đánh giá các giá trị gồm: độ chính xác (precision), độ phủ (recall) và độ đo dung hòa F- measure. Kết quả thực nghiệm được thể hiện như trong Hình 17.

Hình 17. Giá trị trung bình của Precision, Recall, F-measure của tập dữ liệu ImageCLEF

Hiệu suất truy vấn của thuật toán đề xuất được biểu diễn trong Bảng 1, Bảng 2. Để đánh giá hiệu suất của hệ tìm kiếm ảnh tương tự đề xuất, chúng tôi so sánh với kết quả của các cơng trình liên quan trước đó trên cùng tập dữ liệu được mô tả trong Bảng

3.

Bảng 2. Hiệu suất truy vấn ảnh của phương pháp đề xuất trên tập ảnh ImageCLEF

Tập ảnh Độ phủ Độ chính xác Độ trung hồ Thời gian Truy vấn (ms) 00 0.7085 0.8858 0.7873 192 01 0.6948 0.8686 0.7720 228 02 0.6181 0.7720 0.6864 163 03 0.6196 0.7746 0.6885 164 04 0.6731 0.8415 0.7480 203 05 0.6022 0.7529 0.6691 178 06 0.6115 0.7646 0.6794 86 07 0.6527 0.8161 0.7253 202 08 0.6582 0.8229 0.7314 194 09 0.6590 0.8235 0.7320 218 10 0.6109 0.7623 0.6779 90 Trung bình 0.6462 0.8077 0.7179 174 11 0.6408 0.8007 0.7118 199 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95 00 02 04 06 08 10 12 14 16 18 20 22 24 26 30 32 34 36 38 40

Hiệu suất thực thi của mơ hình tìm kiếm ảnh trên bộ dữ liệu ImageCLEF

Tập ảnh Độ phủ Độ chính xác Độ trung hồ Thời gian Truy vấn (ms) 12 0.6688 0.8362 0.7432 210 13 0.6068 0.7587 0.6742 85 14 0.6034 0.7545 0.6705 82 15 0.6544 0.8182 0.7272 182 16 0.6380 0.7968 0.7084 151 17 0.6208 0.7762 0.6899 100 18 0.6657 0.8317 0.7394 181 19 0.6699 0.8375 0.7444 201 20 0.6247 0.7811 0.6941 80 Trung bình 0.6393 0.7992 0.7103 147 21 0.6109 0.7639 0.6789 86 22 0.6388 0.7972 0.7091 160 23 0.6552 0.8192 0.7280 202 24 0.6062 0.7580 0.6736 90 25 0.6086 0.7610 0.6762 88 26 0.6720 0.8401 0.7467 176 29 0.6420 0.8025 0.7133 195 30 0.5822 0.7266 0.6462 83 Trung bình 0.6270 0.7835 0.6965 135 31 0.6246 0.7805 0.6939 69 32 0.5885 0.7359 0.6540 73 33 0.5875 0.7347 0.6529 88 34 0.5665 0.7084 0.6295 171 35 0.6126 0.7659 0.6807 128 36 0.6040 0.7553 0.6711 68 37 0.6311 0.7891 0.7013 114 38 0.5827 0.7285 0.6474 85 39 0.5637 0.7048 0.6263 66 40 0.5952 0.7442 0.6613 70 Trung bình 0.5956 0.7447 0.6618 93

Bảng 3. Hiệu suất truy vấn ảnh trung bình trên tập ảnh ImageCLEF

Tập ảnh Độ phủ Độ chính xác Độ trung hoà Thời gian Truy vấn (ms)

00-10 0.6462 0.8077 0.7179 174 11-20 0.6393 0.7992 0.7103 147 21-30 0.6270 0.7835 0.6965 135 31-40 0.5956 0.7447 0.6618 93

Average 0.6271 0.7838 0.6966 137

Bảng 4. So sánh độ chính xác giữa các phương pháp trên bộ dữ liệu ImageCLEF

Phương pháp Mean Average Precision (MAP)

Hakan Cevikalp, 2017 [28] 0.4678

C.A. Hernández-Gracidas, 2013 [29] 0.5826

Nguyễn Minh Hải, 2019 [30] 0.6753

Lê Thị Vĩnh Thanh, 2020 [27] 0.7110

CHƯƠNG IV. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN TRIỂN

4.1. Những mặt đã làm được

Nghiên cứu về mơ hình, phương pháp tìm kiếm ảnh tương tự theo nội dung dựa trên cây phân cụm dữ liệu KNN_R-Tree được thực hiện trong thời gian dài và được thực nghiệm trên ứng dụng tra cứu ảnh tương tự với số liệu thống kê cho kết quả là khả thi.

Những nội dung đã làm được:

- Tìm hiểu các kỹ thuật trích xuất đặc trưng hình ảnh

- Tìm hiểu các kỹ thuật học máy K-Means, KNN áp dụng vào bài toán truy vấn ảnh.

- Phát triển cấu trúc dữ liệu cây R-Tree nhằm phân cụm dữ liệu dựa trên kỹ thuật học bán giám sát.

- Xây dựng thuật toán tra cứu ảnh trên cơ sở cấu trúc cây R-Tree - Thiết kế hệ tra cứu ảnh dựa trên cây R-Tree

- Viết chương trình trên một ngơn ngữ lập trình C#.Net tạo ra hệ truy vấn ảnh theo nội dung

4.2. Những mặt tồn tại

Bên cạnh việc tối ưu bài tốn tìm kiếm, chúng tơi nhận thấy vẫn cịn tồn tại hạn chế chưa khắc phục được trong nghiên cứu, ví dụ: thời gian tìm kiếm, ảnh truy vấn phụ

thuộc vào tập ImageCLEF, rút trích đặc trưng hình ảnh, phân lớp hình ảnh, ngữ nghĩa

hình ảnh. Do đó đề tài cịn một số hạn chế sau: - Thời gian truy vấn còn chậm

- Chưa trích xuất được phân lớp hình ảnh

- Chưa trích xuất được ngữ nghĩa cấp cao của hình ảnh

4.3. Hướng phát triển

Chính vì vậy, hướng phát triển tiếp theo của chúng tôi sẽ tập trung vào: • Cải thiện thuật tốn truy vấn để tăng tốc độ tìm kiếm

• Tăng trưởng số lượng hình ảnh từ nhiều bộ dữ liệu mẫu khác nhau để tạo cây cho cấu trúc cây KNN_R-Tree

• Tiếp tục nghiên cứu, cải thiện các thuật tốn học máy và phân tích ngữ nghĩa hình ảnh áp dụng vào bài tốn truy vấn ảnh

• Nghiên cứu các thuật tốn trích xuất đặc trưng vec-tơ hình ảnh và phân lớp của ảnh đầu vào nhằm nâng cao độ chính xác cho bài tốn truy vấn ảnh

• Nghiên cứu cơng nghệ ngữ nghĩa Ontology để áp dụng cho các bài tốn tìm kiếm ảnh theo tiếp cận ngữ nghĩa

4.4. Kết luận

Với kết quả mang lại từ mơ hình, phương pháp đã đề xuất của đề tài, chúng tôi đã xây dựng được phần mềm tìm kiếm ảnh tương tự theo nội dung dựa trên cây phân cụm dữ liệu KNN_R-Tree. Như vậy, nghiên cứu đã đóng góp một phần với mơ hình và phương pháp tìm kiếm mới vào bài tốn tìm kiếm ảnh tương tự theo nội dung đã mang lại hiệu quả thiết thực và có thể được áp dụng cho các hệ truy vấn ảnh hiện nay.

TÀI LIỆU THAM KHẢO

[1] C. Bobed, R. Yus, F. Bobillo, S. Ilarri, J. Bernad, E. Mena, R. Trillo-Lado, Á.L. Garrido, "Emerging Semantic-Based Applications", Semantic Web, Cham, pp.39- 83, 2016.

[2] BusinessInsider, "www.businessinsider.com ", 2018

[3] Y. Cao, M. Long, J. Wang, Q. Yang, P.S. Yu, "Deep Visual-Semantic Hashing for Cross-Modal Retrieval", Proceedings of the 22nd ACM SIGKDD International Conf. on Knowledge Discovery and Data Mining, San Francisco, California, USA, pp.1445-1454, 2016.

[4] Y. Chou, D.J. Lee, D. Zhang, "Semantic-Based Brain MRI Image Segmentation Using Convolutional Neural Network", ISVC: Advances in Visual Computing, Cham, pp.628-638, 2016.

[5] L. Deligiannidis, H.R. Arabnia, "Emerging Trends in Image Processing, Computer Vision, and Pattern Recognition", ed S. Elliot, Elsevier, USA: Morgan Kaufmann, Waltham, MA 02451, 2015.

[6] Deloitte, "Photo sharing: trillions and rising", Deloitte Touche Tohmatsu Limited, Deloitte Global, 2016.

[7] Deloitte, "https://www2.deloitte.com", 2018

[8] J. Gantz, D. Reinsel, "THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digi tal Shadows, and Biggest Growth in the Far East", IDC iView, EMC Corporation, 2012 and 2014.

[9] C. Kurtz, A. Depeursinge, C.F. Beaulieu, "A semantic framework for the retrieval of similar radiological images based on medical annotations", IEEE International Conference on Image Processing (ICIP), Paris, France, 2014.

[10] P. Muneesawang, N. Zhang, L. Guan, "Multimedia Database Retrieval: Technology and Applications", Springer, New York Dordrecht London, 2014. [11] A.B. Spanier, D. Cohen, L. Joskowicz, "A new method for the automatic retrieval

of medical cases based on the RadLex ontology", International Journal of Computer Assisted Radiology and Surgery, vol. 12, no. 3, pp.471–484, 2017.

[12] V. Vijayarajan, M. Dinakaran, P. Tejaswin, M. Lohani, "A generic framework for ontology‑based information retrieval and image retrieval in web data", Human-

[13] X. Xie, X. Cai, J. Zhou, N. Cao, Y. Wu, "A Semantic-based Method for Visualizing Large Image Collections", IEEE Transactions on Visualization and Computer Graphics, IEEE Computer Society, vol. xx, no. xx, pp.xx-xx, 2018.

[14] [14] B.B.Z. Yao, X. Yang, L. Lin, M.W. Lee, S.-C. Zhu, "I2T: Image Parsing to Text Description", Proceedings of the IEEE, pp.1485-1508, 2010.

[15] Li, Wen, et al. "Text-based image retrieval using progressive multi-instance learning." 2011 International Conference on Computer Vision. IEEE, 2011

[16] Tollari, Sabrina, et al. "Exploiting visual concepts to improve text-based image retrieval." European Conference on Information Retrieval. Springer, Berlin, Heidelberg, 2009.

[17] Karthikeyan, T., P. Manikandaprabhu, and S. Nithya. "A survey on text and content-based image retrieval system for image mining." International Journal of Engineering 3 (2014).

[18] Al-Mohamade, Abeer, Ouiem Bchir, and Mohamed Maher Ben Ismail. "Multiple Query Content-Based Image Retrieval Using Relevance Feature Weight Learning." Journal of Imaging 6.1 (2020): 2.

[19] Douik, Ali, Mehrez Abdellaoui, and Leila Kabbai. "Content based image retrieval using local and global features descriptor." 2016 2nd International Conference on Advanced Technologies for Signal and Image Processing (ATSIP). IEEE, 2016. [20] Manolopoulos, Yannis, et al. R-trees: Theory and Applications. Springer Science

& Business Media, 2010.

[21] Chandresh Pratap Singh, "R-Tree implementation of image databases ". Signal & Image Processing: An International Journal (SIPIJ) Vol.2, No.4, December 2011. [22] Shifeng Wu1, Huazhu Song, Gui Cheng1, Xian Zhong, “Civil engineering

supervision video retrieval method optimization based on spectral clustering and R- tree”. The Natural Computing Applications Forum, 2018.

[23] Xia Tiantian, Lin Hong, Li Yuqiang, “Spatio-temporal Trajectory Gatherings Pattern Mining Method Based on R* tree Index”. 3rd International Conference for Convergence in Technology (I2CT), 2018.

[24] Xinlu Wang, Weiming Meng, Mingchuan Zhang, “A novel information retrieval method based on R-tree index for smart hospital information system”. International Journal of Advanced Computer Research, Vol 9(42), 2019.

[25] Yang Yang, Pengwei Bai, Ningling Ge, “LAZY R-tree: The R-tree with lazy splitting algorithm”. Journal of Information Science, pp. 1–15, 2019.

[26] Yuan Qiu, Xinhong Hei, Tadashi Ohmori, Hideyuki Fujita, “An Object-Pair Driven Approach for Top-k mCK Query Problem by Using Hilbert R-tree”. 18th IEEE International Conference On-Trust, Security And Privacy In Computing And Communications/13th IEEE International Conference On Big Data Science And Engineering, 2019.

[27] L.T.V. Thanh và cộng sự, “Một phương pháp cải tiến cho bài tốn tìm kiếm ảnh dựa trên cây R-Tree”, Tạp chí Khoa học và Cơng nghệ, Trường Đại học khoa học - Đại học Huế, T. 129, S. 2A, 2020.

[28] H. Cevikalp, M. Elmas, S. Ozkan (2017), "Large-scale image retrieval using transductive support vector machines", Computer Vision and Image Understanding, vol. no. pp.1-11.

[29] C.A. Hernández-Gracidas, Sucar, L.E. & Montes-y-Gómez (2013), "Improving image retrieval by using spatial relations", Multimed Tools Application, vol. 62, no. 2, pp. 479–505.

[30] Nguyễn Minh Hải, Lê Thị Vĩnh Thanh, Văn Thế Thành, Trần Văn Lăng, “Tra cứu ảnh theo ngữ nghĩa dựa trên cây phân cụm phân cấp”, Kỷ yếu Hội thảo Quốc gia về Nghiên cứu cơ bản và ứng dụng CNTT (FAIR), ĐH Huế, Nhà xuất bản Khoa học Tự nhiên và Công nghệ, ISBN: 978-604-913-915-4, tr.502-511, 2019.

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng hệ thống truy vấn ảnh tương tự theo nội dung dựa trên cấu trúc cây r tree (Trang 41 - 49)

Tải bản đầy đủ (PDF)

(49 trang)