Hướng đề xuất nghiên cứu

Một phần của tài liệu Tìm kiếm hình ảnh bằng phương pháp học sâu (Trang 40 - 42)

2.3. Tìm kiếm hình ảnh bằng phương pháp học sâu

2.3.3. Hướng đề xuất nghiên cứu

Thành phần chính của CBIR là kỹ thuật tra cứu ảnh được sử dụng để lấy ra các ảnh tương tự nhất đối với ảnh truy vấn mà người dùng đưa vào. Một hệ thống tra cứu dựa vào nội dung tiêu biểu được chia thành hai pha: trích xuất đặc trưng ngoại tuyến và tìm kiếm ảnh trực tuyến. Trong pha ngoại tuyến, hệ thống trích xuất tự động các thuộc tính trực quan ở mức thấp (màu, kết cấu và hình dạng) hoặc ở mức cao. Trong pha tìm kiếm ảnh trực tuyến, người dùng có thể cung cấp một ảnh mẫu cho hệ thống tìm kiếm để tra cứu các ảnh mong muốn. Hệ thống tìm kiếm ảnh biểu diễn ảnh mẫu này bởi véc-tơ đặc trưng và khoảng cách (hoặc độ tương tự) giữa các véc-tơ đặc trưng của ảnh mẫu và của ảnh trong cơ sở dữ liệu đặc trưng được tính tốn. Cuối cùng hệ

41

thống phân hạng các ảnh theo thứ tự tăng dần của khoảng cách hay giảm dần của độ tương tự và trả về tập ảnh kết quả cho người dùng.

Trong nghiên cứu của chúng tôi, chúng tôi giới thiệu một phương pháp để xây dựng một hệ thống tìm kiếm ảnh theo nội dung dựa trên mơ hình học sâu là mạng nơ- ron tích chập (Convolution Neural Networks - CNN) nhằm tận dụng tối đa sức mạnh tính tốn của máy tính trong việc tìm kiếm hình ảnh theo nội dung. Trong đó, người dùng có thể cung cấp một hình ảnh bất kỳ và hệ thống sẽ trả về danh sách các hình ảnh với các mức độ tương đồng (tương tự) được sắp xếp từ cao xuống thấp. Việc trích xuất đặc trưng của hình ảnh người dùng cung cấp được thực hiện dựa trên một mạng nơ ron tích chập và việc tính tốn độ tương tự của hình ảnh được thực hiện dựa trên kỹ thuật tìm “láng giềng gần nhất” (Nearest-Neighbors) để trả về danh sách các hình ảnh có độ tương tự cao nhất với hình ảnh đầu vào.

42

CHƯƠNG 3 MƠ HÌNH ĐỀ XUẤT

Chương này chúng tơi đưa ra mơ hình đề xuất là sự kết hợp của mạng nơ-ron học sâu chuyển giao dùng để huấn luyện dữ liệu trích xuất đặc trưng và phương pháp tìm kiếm k láng giềng gần nhất dựa trên độ đo tương đồng về khoảng cách giữa các véc-tơ đặc trưng ảnh.

Một phần của tài liệu Tìm kiếm hình ảnh bằng phương pháp học sâu (Trang 40 - 42)

Tải bản đầy đủ (PDF)

(108 trang)