kiếm thực thể người
Tập tên người
Module thu thập văn bản và phân biệt nhập nhằng tên
người trên tập văn bản
Tập trang Web ứng với từng
người
Trích xuất các đặc trưng cho mỗi
người
CSDL về người
34 Hệ thống gồm 2 bước chính:
Bước 1: Tập tên người sẽ được cho qua “Module thu thập văn bản và phân biệt nhập nhằng tên người trên tập văn bản” để thu được một tập trang Web tương ứng với từng người riêng biệt. Bước này đã được trình bày chi tiết ở hệ thống phân biệt nhập nhằng tên người trên tập văn bản ở phần trước.
Bước 2: Trích xuất đặc trưng cho mỗi người.
Trong bước 1, với mỗi tên người và tập các trang Web tương ứng với người đó khóa luận đã trích xuất đặc trưng là tập các thực thể người có liên quan đến người đó và các cụm từ chung đại diện cho người. Các đặc trưng này sẽ được lưu vào trong cơ sở dữ liệu để phục vụ cho quá trình tìm kiếm sau này.
Tóm tắt chương ba
Trong chương ba, khoá luận đã giới thiệu các đặc trưng của miền dữ liệu báo điện tử để từđó đề xuất ra mô hình giải quyết bài toán nhập nhằng tên người trên tập văn bản và ứng dụng bài toán đó trong việc đề xuất mô hình hệ thống tìm kiếm thực thể người. Trong chương tiếp theo, khóa luận tiến hành thực nghiệm trên mô hình đã xây dựng và đánh giá những kết quảđạt được của mô hình đề xuất.
35
Chương 4. Thực nghiệm và đánh giá
Dựa vào cơ sở lý thuyết và mô hình đề xuất ở chương 3, khóa luận tiến thành thực nghiệm việc phân biệt nhập nhằng tên người trên miền dữ liệu báo điện tử.