Trong chương này chúng tôi giới thiệu phương pháp phân giải nhập nhằng dựa trên ontol- ogy, được đặt tên là OntoNEON (Ontology-based Named Entity DisambiguatiON). Ý tưởng chủđạo của phương pháp này là khai thác các thực thể đã được xác định trong văn bản để phân giải nhập nhằng cho các thực thể khác, bằng một quá trình lặp cải thiện dần. Nội dung của chương dựa trên Nguyen và Cao (2007a, 2007b) và Nguyễn Thanh Hiên và Cao Hoàng Trụ (2008). Đóng góp chính của chương này là ý tưởng phân giải nhập nhằng lặp cải thiện dần và mô hình phân hạng các ứng viên dựa trên mối quan hệ ngữ nghĩa của các ứng viên với các thực thểđã được xác định trong văn bản.
Giả thuyết mà phương pháp OntoNEON dựa trên đó để thực hiện phân giải nhập nhằng là trong một văn bản luôn tồn tại một số thực thể có thể dễ dàng được xác định, tức là tên của chúng không nhập nhằng. Tập các thực thể đó được xem là tập các hạt giống, khởi đầu từđó, bằng một quá trình lặp cải thiện dần, các thực thể khác được đề cập đến trong văn bản sẽđược xác định. Trong quá trình phân giải nhập nhằng, tập các hạt giống sẽ
thay đổi, thể hiện ở chỗ một khi có một thực thể mới được xác định, ngay lập tức nó được bổ sung vào tập các hạt giống, và cứ thế quá trình đó diễn tiến cho đến khi nào tất cả các thực thể được đề cập đến trong văn bản được xác định hoặc giữa hai lần lặp không xác
Phần còn lại của chương này được tổ chức như sau. Phần 3.2 trình bày phương pháp phân hạng các ứng viên. Phần 3.3 trình bày các độ đo để đánh giá hiệu quả các phương pháp phân giải nhập nhằng thực thể có tên nói chung. Các độđo này áp dụng được cho các trường hợp khi mà các tên trong văn bản được nhận ra bán phần, và thực thể được đề cập trong một văn bản không tồn tại trong cơ sở tri thức được sử dụng. Phần 3.4 trình bày các tập dữ liệu thí nghiệm và các kết quảđánh giá phương pháp được đề xuất. Phần cuối cùng là tổng kết chương.