Sơ bộ về tính hạng ảnh 18

Một phần của tài liệu ĐỀ TÀI " MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM " pot (Trang 28 - 30)

Cùng với sự bùng nổ thông tin trên Web và sự phát triển của công nghệ kỹ thuật số, lượng ảnh lưu trữ trên Web cũng tăng một cách nhanh chóng. Mỗi ngày, có hàng triệu bức ảnh được đăng tải trên các trang ảnh trực tuyến như: Flickr1, Photobucket2, Facebook3…. Theo thống kê, có 10 tỉ ảnh trên Facebook (tính đến tháng 10/2008), 3 tỉ ảnh trên Flickr (tính đến tháng 11/2008), 6.2 tỉ ảnh trên Photobucket (tính đến tháng 10/2008) [19]

Bên cạnh nhu cầu tìm kiếm thông tin thì tìm kiếm ảnh cũng là một nhu cầu đang nhận được sự quan tâm lớn của người sử dụng. Tuy nhiên, với một lượng ảnh trên

1 Flickr: http://www.flickr.com

2 Photobucket: http://www.photobucket.com

19

Internet quá lớn công việc tìm kiếm sẽ trở nên vô cùng khó khăn. Để giải quyết vấn đề này, đã có các hệ thống tìm kiếm ảnh ra đời như: Yahoo, MSN, Google Image Search, Bing…. Cũng như đối với các hệ thống tìm kiếm thông thường và các hệ thống tìm kiếm thực thể khác, mô đun xếp hạng là một phần quan trọng cốt lõi trong máy tìm kiếm ảnh. Hiện nay, bài toán xếp hạng ảnh đã trở thành một trong những bài toán điển hình của lĩnh vực khai phá dữ liệu nói chung và lĩnh vực xếp hạng thực thể nói riêng.

Để tìm kiếm và xếp hạng ảnh trên Web, các máy tìm kiếm thường dựa vào các thuộc tính sẵn có của ảnh. Các ảnh trên Web được nhận biết qua các thuộc tính được nhóm thành hai loại: văn bản và nội dung hiển thị. Các thuộc tính văn bản có thể là: tên ảnh, thẻ ảnh (tags1), vùng văn bản xung quanh ảnh, tên trang Web chứa ảnh, …. Nội dung hiển thị của ảnh có thể là: màu sắc, hình dạng, kết cấu, các thuộc tính cục bộ (local features), … hay bất cứ thông tin nào bắt nguồn từ chính nội dung của bức ảnh. Dựa vào hai loại đặc trưng này của các ảnh trên Web, các thuật toán xếp hạng ảnh cũng phân thành hai hướng là: xếp hạng ảnh dựa theo nội dung hiển thị và xếp hạng ảnh dựa theo văn bản. Các máy tìm kiếm ảnh thông dụng hiện nay như: Google Image Search, Yahoo! Image Search, MSN, AltaVista, … xếp hạng các ảnh trả về dựa trên vùng văn bản đi kèm với ảnh. Các hệ thống này cho phép người sử dụng nhập các chuỗi truy vấn về chủ đề ảnh mà họ cần tìm kiếm, thông qua việc phân tích các vùng văn bản đi kèm với các bức ảnh, hệ thống gửi trả lại các ảnh có nhãn tương ứng với chủ đề ảnh mà người sử dụng yêu cầu. Phương pháp này cho kết quả khả quan cũng như đáp ứng nhanh nhu cầu của người sử dụng. Tuy nhiên, đối với các câu truy vấn mang ý nghĩa nhập nhằng có thể sẽ có các kết quả trả về không đúng với yêu cầu đặt ra bởi vì vùng văn bản đi kèm ảnh không thể diễn tả được hết nội dung ảnh. Một hướng nghiên cứu khác là phân tích các đặc trưng hiển thị của ảnh và tiến hành xếp hạng theo các đặc trưng này. Một số công cụ tìm kiếm ảnh dựa trên nội dung điển hình như: Google Image Swirl, Tiltomo, Byo Image Search …. Các công cụ này nhận đầu vào là một chuỗi truy vấn dưới dạng văn bản hoặc một bức ảnh và cho phép người dùng tùy chỉnh lựa chọn tìm ảnh theo một số đặc trưng nào đó. Tuy nhiên, các máy tìm kiếm này thường chỉ tập trung khai thác vào một phần nội dung của ảnh và thường tốn khá nhiều thời gian do phải phân tích nội dung các bức ảnh.

1Tags: là là các từđểđánh dấu một vùng trong ảnh mà khi di chuột qua vùng đó thì các từđó sẽ hiển thị lên để

20

Một trong các hướng nghiên cứu nhằm giải quyết và khắc phục vấn đề trên là kết hợp cả việc phân tích các đặc trưng của ảnh với các đặc trưng của chuỗi truy vấn vào quá trình tìm kiếm ảnh. Đây là một hướng nghiên cứu mới được sự quan tâm của nhiều hội nghị quốc tế như: International Journal of Computer Vision, IEEE conference…

Một phần của tài liệu ĐỀ TÀI " MỘT SỐ THUẬT TOÁN PHÂN HẠNG ẢNH PHỔ BIẾN VÀ ÁP DỤNG TRONG HỆ THỐNG TÌM KIẾM ẢNH LỚP TRÊN THỬ NGHIỆM " pot (Trang 28 - 30)