Phƣơng pháp tìm kiếm theo ngữ nghĩa dựa trên ontology công văn

Một phần của tài liệu (LUẬN văn THẠC sĩ) thiết kế hệ hỗ trợ tìm kiếm công văn theo ngữ nghĩa trong một cơ quan nhà nƣớc (Trang 53 - 56)

Gần giống với phƣơng pháp kích hoạt lan truyền, việc tìm kiếm theo ngữ nghĩa sử dụng các điểm xung lan truyền N cấp sẽ tạo nên các vùng lan truyền trên mạng lƣới keyphrase. Những keyphrase thuộc phần giao nhau giữa các vùng lan truyền sẽ là kết quả cuối cùng của đầu ra. Để làm đƣợc điều đó thì các keyphrase phải đƣợc liên kết với nhau tạo thành mạng lƣới keyphrase rộng. Cuối cùng, quá trình kiểm tra lớp của keyphrase sẽ xác định chính xác những keyphrase nào là công văn và sử dụng nó nhƣ một kết quả trả về cho ngƣời dùng. Đối với trƣờng hợp không tồn tại keyphrase nào thuộc lớp công văn thì mỗi keyphrase trả về đó sẽ trở thành một điểm nguồn xung lan truyền một cấp mới để xác định các công văn có

45

Các bƣớc thực hiện :

1. Xác định các điểm xung lan truyền :

Các điểm xung lan truyền đƣợc xác định nhờ vào từ khóa mà ngƣời dùng cung cấp để tìm kiếm. Có 2 loại từ khóa và mỗi loại sẽ ứng với một cách xác định xung lan truyền tƣơng ứng.

a. Từ khóa đề nghị.

Là những từ khóa đƣợc lấy từ chính những keyphrase mà bộ từ vựng có. Ví dụ: đƣợc ban hành bởi, đƣợc ký bởi, Nguyễn Văn Lâm, Chánh Văn Phòng,… và cũng chính mỗi từ khóa sẽ là môt điểm tạo xung lan truyền cho toàn bộ quá trình.

b. Từ khóa tự do

Ngƣợc lại với từ khóa đề nghị, nhóm từ khóa tự do không thuộc vào bất cứ keyphrase nào trong bộ tự vựng. Vậy nên ta phải tiến hành quét toàn bộ các keyphrase cũng nhƣ các dữ liệu khác thuộc bộ từ vựng nhƣ trích yếu, mô tả,… để kiểm tra xem từ khóa có chứa hoặc gần tƣơng đồng hay không. Từ đó sẽ xác định đƣợc các keyphrase gần tƣơng đồng hoặc có liên quan đến từ khóa tự do đó.

2. Tạo xung lan truyền

Quá trình tạo xung lan truyền thực chất là quá trình truy vấn đệ quy. Với một keyphrase đã xác định, ta tiến hành truy vấn sâu vào các keyphrase có liên kết với nó và mỗi keyphrase liên kết đó lại tiếp tục gọi đệ quy tới lúc đạt giới hạn cấp độ đệ quy đƣợc đặt ra ban đầu. Quá trình này khi kết thúc sẽ tạo thành danh sách các keyphrase mà nó đã truy vấn qua.

3. Xác định vùng giao thoa.

Từ những danh sách của quá trình tạo xung lan truyền, tiến hành quét chọn những keyphrase chung.

4. Xác định kết quả đầu ra

Từ danh sách các keyphrase giao thoa, loại bỏ những keyphrase không thuộc lớp công văn. Nếu sau quá trình này mà toàn bộ các keyphrase đều bị loại bỏ thì

46

tiến hành tạo xung lan truyền một cấp mới với các điểm nguồn là các keyphrase giao thoa trên. Tiếp tục loại bỏ những keyphrase không thuộc lớp công văn ta đƣợc kết quả cuối cùng trả về cho ngƣời dùng. Tùy theo yêu cầu của quá trình tìm kiếm và kết quả cuối cùng còn thông qua nhiều bộ lọc khác nhƣ: duyệt kết quả theo khoảng thời gian tùy chọn,…

47

CHƢƠNG 4 - CÀI ĐẶT VÀ THỬ NGHIỆM

Một phần của tài liệu (LUẬN văn THẠC sĩ) thiết kế hệ hỗ trợ tìm kiếm công văn theo ngữ nghĩa trong một cơ quan nhà nƣớc (Trang 53 - 56)

Tải bản đầy đủ (PDF)

(83 trang)