Tìm kiếm Web

Một phần của tài liệu “Tổng quan về xử lý ảnh” (Trang 30 - 32)

XÁC ĐỊNH VÙNG CHỨA CHỮ TRONG ẢNH THÔNG THƯỜNG VÀ ẢNH VIDEO

3.3.2Tìm kiếm Web

Từ năm 1993, nhiều máy chủ Web đã tăng gấp đôi trong vòng gần 3 tháng và đã đạt tổng số trên 476 000 [12]. Text là một trong những thành phần quan trọng trong trang Web. Text trong trang Web có thể là text mã hoá hoặc text ảnh. Thông qua quốc lộ thông tin, người dùng có thể truy cập bất kỳ trang được phép truy cập nào để thu thập thông tin quan tâm. Điều này tạo ra vấn đề là tìm kiếm tự động và có hiệu quả những trang hữu ích trên Web. Để có được thông tin mong muốn từ nguồn vô cùng lớn này, thì nhứng công cụ tìm kiếm dựa trên text mã hoá (coded text) (như, Yahoo, Infoseek, Lycos, và AltaVista) được sử dụng rộng rãi. Ví dụ, công cụ tìm kiếm AltaVista xử lý trên 29 triệu yêu cầu một ngay [12].

Do số lượng tăng ồ ạt trong độ rộng dải tần mạng và dung lượng đĩa, ngày càng nhiều trang Web hiện nay chứa ảnh để xuất hiện bắt mắt hơn và nội dung giàu thông tin hơn. Những ảnh đó đặc biệt là text ảnh trong đó cung cấp các công cụ tìm kiếm với các gợi ý thêm để tìm được chính xác thông tin mong muốn. Hình 3.4 (c) thể hiện một ví dụ như vậy. Do đó, đối với quốc lộ thông tin, người ta mong muốn một công cụ tìm kiếm đa phương tiện có thể sử dụng thông tin từ text mã hoá và text ảnh, hình ảnh, video và audio.

Phần lớn ảnh Web được tạo ra bằng máy tính và gọi là ảnh tổng hợp. Text trong ảnh trang Web thay đổi phông, màu sắc, cỡ và kiểu dáng thậm chí trong cùng một trang. Hơn nữa, màu và kết cấu của text và nền của nó cũng thay đổi. Vì những lý do này nên rất khó để định vị tự động text trong hình ảnh Web mà không sử dụng khả năng nhận dạng ký tự. Chỉ một số hướng tiếp cận đơn giản được công bố để xác định vùng chứa chữ trong ảnh Web [13].

Hình 3.4: Phương pháp xác định vùng chứa chữ sử dụng cách thức phân tích hình khối. (a) ảnh đen trắng trên một trang báo (b) Ảnh bìa một tạp chí sau khi scan (c) Ảnh trên trang

web. (d) Ảnh trên video frame.

Hình 3.5: Phân tích ảnh Web của hình 3.4 (c): (a) – (f) ảnh tiền cảnh thực (real foreground image);

(g) ảnh tiền cảnh bổ sung nền (background complementary foreground image)

Một phần của tài liệu “Tổng quan về xử lý ảnh” (Trang 30 - 32)