Lớp giao diện tìm kiếm

Một phần của tài liệu hệ thống tìm kiếm thông tin trên kho tài liệu tiếng Việt (Trang 103 - 108)

2. Chi tiết các lớp đối tượng

2.3.3 Lớp giao diện tìm kiếm

Hình 6-39 Lớp giao diện tìm kiếm 8.3.1. Ý nghĩa của các biến thành phần :

 Term : mảng chuỗi chứa các từ khóa của câu hỏi.

 DocID : mảng chuỗi chứa DocID liên quan đến câu hỏi.

 Sim : mảng số thực chứa các độ tương quan của câu hỏi với các tài liệu (DocID tương ứng).

 Words : mảng số nguyên chứa số từ của câu hỏi có trong tài liệu (DocID tương ứng).

 n : tổng số tài liệu liên quan đến câu hỏi.

 tk : đối tượng của lớp xử lý tìm kiếm.

Hình 6-40 Màn hình tìm kiếm

- Sau khi tìm kiếm xong người sử dụng có thể xem từ khóa của câu hỏi. Ví dụ với câu hỏi : an toàn giao thông tại Tp. HCM bạn sẽ có được từ khóa như sau :

- Xem từ khóa của tài liệu : nghĩa là khi người sử dụng chọn một tài liệu nào đó và chọn chức năng xem từ khóa tài liệu thì họ sẽ thấy từ khóa đó xuất hiện với tần số bao nhiêu và trọng số tương ứng của nó.

Hình 6-42 Xem từ khóa tài liệu 8.3.2. Các hàm chính của lớp :

- Hàm TimKiem_Click( ) : hàm này sẽ dùng đối tượng của lớp xử lý tìm kiếm để tách từ câu hỏi rồi tính độ tương quan của các tài liệu với câu hỏi

* Thuật toán :

void TimKiem_Click() {

CtimKiem tk = new CtimKiem; tk.TachTuCauHoi(câu hỏi) tk.LoaiBoSLCauHoi(câu hỏi); tk.TinhDoTuongQuan();

// Sau khi gọi 3 hàm này ta sẽ tạo ra được tập tin TuongQuan.xml Đọc tập tin TuongQuan.xml ta đưa vào mảng các DocID, Sim, Words SapXepUuTien();

HienThiTaiLieu(); }

- Hàm sắp xếp ưu tiên : dùng giải thuật InterchangeSort để sắp xếp tài liệu nào liên quan đến câu hỏi nhiều nhất.

* Thuật toán :

void SapXepUuTien () {

// Ưu tiên theo Words (số từ của câu hỏi trong tài liệu) // Ưu tiên theo Sim (độ tương quan của tài liệu với câu hỏi) }

Một phần của tài liệu hệ thống tìm kiếm thông tin trên kho tài liệu tiếng Việt (Trang 103 - 108)

Tải bản đầy đủ (DOC)

(116 trang)
w