Áp dụng bài toán phân biệt nhập nhằng tên người trong hệ thống tìm kiếm thực

Một phần của tài liệu PHÂN BIỆT NHẬP NHẰNG TÊN NGƯỜI TRONG HỆ THỐNG TÌM KIẾM THỰC THỂ (Trang 40 - 42)

kiếm thc th người

Tập tên người

Module thu thập văn bản và phân biệt nhập nhằng tên

người trên tập văn bản

Tập trang Web ứng với từng

người

Trích xuất các đặc trưng cho mỗi

người

CSDL về người

34 Hệ thống gồm 2 bước chính:

Bước 1: Tập tên người sẽ được cho qua “Module thu thập văn bản và phân biệt nhập nhằng tên người trên tập văn bản” để thu được một tập trang Web tương ứng với từng người riêng biệt. Bước này đã được trình bày chi tiết ở hệ thống phân biệt nhập nhằng tên người trên tập văn bản ở phần trước.

Bước 2: Trích xuất đặc trưng cho mỗi người.

Trong bước 1, với mỗi tên người và tập các trang Web tương ứng với người đó khóa luận đã trích xuất đặc trưng là tập các thực thể người có liên quan đến người đó và các cụm từ chung đại diện cho người. Các đặc trưng này sẽ được lưu vào trong cơ sở dữ liệu để phục vụ cho quá trình tìm kiếm sau này.

Tóm tt chương ba

Trong chương ba, khoá luận đã giới thiệu các đặc trưng của miền dữ liệu báo điện tử để từđó đề xuất ra mô hình giải quyết bài toán nhập nhằng tên người trên tập văn bản và ứng dụng bài toán đó trong việc đề xuất mô hình hệ thống tìm kiếm thực thể người. Trong chương tiếp theo, khóa luận tiến hành thực nghiệm trên mô hình đã xây dựng và đánh giá những kết quảđạt được của mô hình đề xuất.

35

Chương 4. Thc nghim và đánh giá

Dựa vào cơ sở lý thuyết và mô hình đề xuất ở chương 3, khóa luận tiến thành thực nghiệm việc phân biệt nhập nhằng tên người trên miền dữ liệu báo điện tử.

Một phần của tài liệu PHÂN BIỆT NHẬP NHẰNG TÊN NGƯỜI TRONG HỆ THỐNG TÌM KIẾM THỰC THỂ (Trang 40 - 42)