Bắt đầu từ đƣờng dẫn :
http://apps.dongthap.gov.vn/vanban/result.jsp?&cboCoQuanBH=-1&cboLoaiVb=- 1&cboLinhVuc=11&txtNguoiKy=&txtNgayKy1=&txtNgayKy2=&txtNoiDung=&i dDonVi=dt&page=2
Ở đây là đƣờng dẫn hỗ trợ từ công cụ tìm kiếm mặc định nhằm mục đích giới hạn số lƣợng công văn quét qua phải nằm trong cùng một lĩnh vực Khoa Học Kỹ Thuật. Có tất cả 277 Công Văn thuộc lĩnh vực trên.
Hệ thống sử dụng để chạy thực nghiệm :
Laptop: HP Pavilion, core i5, Ram 4G.
Internet : VNPT 5 MB download. Kết quả thực nghiệm :
Sau khi quá trình thu thập đƣợc khởi động, hệ thống mất 3 phút 43 giây để quét hết danh sách tất cả các đƣờng dẫn đến chi tiết công văn.
Mất 17 phút 12 giây để quét hết nội dung tất cả công văn để tạo thành các keypharse.
61
Kết quả sau khi chạy chƣơng trình :
Số lƣợng Công văn : 263 công văn.
Số lƣợng Ngƣời ký : 16 ngƣời
Số lƣợng Cơ Quan : 2 cơ quan.
Số lƣợng Lĩnh Vực : 1 lĩnh vực.
Các thông tin mô tả liên quan khác : tƣơng ứng 263 trích yếu, 154 ngày ký, 263 số kí hiệu.
Từ đây ta tiến hành bổ sung thông tin các keyphrase liên quan đến ngƣời ký nhƣ có chức vụ nhƣ thế nào? Thuộc cơ quan nào? Và một số thông tin cá nhân liên quan đến ngƣời đó nhƣ [email], [số điện thoại], [quê quán],... Ngoài ra, đọc lƣớt qua từng nội dụng của các công văn ta xây dựng bộ keyphrase có liên kết là [Gửi đến cơ quan], [liên quan đến], bổ sung nhóm [Vấn Đề], [Thuật Ngữ], [Hạ Tầng Kỹ Thuật],… Việc bổ sung này phải diễn ra bằng tay để đảm thông tin an toàn và chính xác.
Quy Trình Thời gian Kết quả Quét danh sách đƣờng dẫn đến chi tiết
công văn
3 phút 43 giây 277 đƣờng dẫn
Quét nội dung từng đƣờng dẫn chi tiết và tạo các keypharse và quan hệ trên ontology.
17 phút 12 giây
263 công văn