Đầu vào: Một truy vấn có dạng là một chuỗi các từ khóa.
Đầu ra: Một danh sách các ảnh đã được sắp xếp theo thứ tự giảm dần về độ phù hợp
48 Mô hình đề xuất
Hình 14. Mô hình đề xuất
Các thành phần trong mô hình
‐ Giao diện hiển thị
o Là thành phần giao tiếp với người dùng, thực hiện hai chức năng chính: Nhận chuỗi từ khóa truy vấn từ phía người dùng để gửi cho bộ điều
49
Nhận danh sách các ảnh đã được sắp xếp từ mô đun xếp hạng hoặc từ CSDL và hiển thị chúng cho người sử dụng.
‐ Bộ điều vận
o Kiểm tra xem câu truy vấn là tiếng Anh hay tiếng Việt. Nếu là một câu truy vấn tiếng Việt thì sử dụng từ điển để dịch nó sang tiếng Anh.
o Tiền xử lý câu truy vấn: đưa về chữ thường, loại bỏ từ dừng và các ký tự đặc biệt, đưa về từ gốc.
o Lấy các truy vấn đã có trong CSDL (đường dữ liệu (1)) để kiểm tra xem câu truy vấn nhận được là một câu truy vấn mới hay là một truy vấn cũ.
Nếu là một truy vấn mới:
• Chọn các máy tìm kiếm nguồn sẽ gửi yêu cầu đến. Sửa đổi câu truy vấn về dạng phù hợp với dạng truy vấn của từng máy tìm kiếm nguồn đã được chọn rồi gửi yêu cầu tới các máy tìm kiếm này.
Nếu là một truy vấn cũ: Gửi thông báo và id của truy vấn đến giao diện hiển thị (đường dữ liệu (2)).
o Sau một khoảng thời gian nhất định, bộ điều vận sẽ lấy các truy vấn có sẵn từ CSDL và gửi yêu cầu đến các máy tìm kiếm nguồn để cập nhật CSDL (đường dữ liệu (3)).
‐ Bộ xử lý kết quả
o Nhận kết quả trả về từ các máy tìm kiếm nguồn, tổng hợp các kết quả này lại thành một danh sách duy nhất và xử lý các kết quả trùng lặp.
o Trích xuất các ảnh và các thông tin cần thiết liên quan đến các ảnh để gửi cho mô đun xếp hạng.
‐ Mô đun xếp hạng
o Nếu truy vấn của người dùng là một truy vấn mới:
Nhận các thông tin cần thiết về các ảnh từ bộ phận xử lý kết quả, thực hiện tính hạng cho ảnh dựa theo nội dung văn bản rồi trả lại kết quả cho thành phần hiển thị.
Sau đó đánh chỉ mục lại cho các ảnh, kết hợp giữa các đặc trưng về nội dung hiển thị và đặc trưng văn bản của ảnh để tính hạng lại cho ảnh. Lưu kết quả tính hạng vào CSDL để sử dụng cho lần truy vấn sau ‐ Cơ sở dữ liệu
o Lưu trữ các ảnh và các thông tin về ảnh. Các ảnh trong CSDL được phân cụm theo tập câu hỏi người dùng.
50
o Lưu trữ tập các câu hỏi mà người dùng đã truy vấn đến máy tìm kiếm lớp trên và kết quả xếp hạng của các câu hỏi này.