Thông qua việc nghiên cứu và xem xét sự tương quan giữa đồ thị quan hệ thực thể do tác giả đề xuất và hai mạng ngữ nghĩa Wordnet và Wikipedia cùng một số độ đo tương đồng ứng dụng trên hai mạng ngữ nghĩa đã được đề xuất ở mục 3.3.3, chúng tôi đã đề xuất một độ tương đồng ngữ nghĩa dựa vào đồ thị thực thể.
Sự tương quan giữa đồ thị quan hệ thực thể và mạng ngữ nghĩa Wordnet, Wikipedia
1 Lingpipe Api. http://alias-i.com/lingpipe
33
Wordnet Wikipedia Đồ thị thực thể Đồ thị quan hệ
giữa các khái niệm
Có Có Có
Cây phân cấp chủ đề
Có Có Không
Nội dung thông tin tại các khái niệm
Có Có Không
Loại quan hệ giữa các khái niệm Bao gồm hầu hết các quan hệ giữa hai từ/thực thể/khái niệm Quan hệ thượng hạ vị, quan hệ bộ phẩn tổng thể, quan hệ tương đồng Quan hệ tương đồng
Ngôn ngữ Tiếng Anh 265 ngôn ngữ Tiếng Anh, Tiếng Việt
Bảng 4.1: Sự tương quan giữa đồ thị quan hệ thực thể, Wordnet và Wikipedia
Độ tương đồng ngữ nghĩa dựa vào đồ thị quan hệ thực thể
Dựa vào sự xem xét tương quan được nêu ở bảng 4.1, chúng tôi nhận thấy việc xây dựng độ tương đồng ngữ nghĩa dựa vào đồ thị quan hệ thực thể chỉ có thể áp dụng nhóm các độ đo tương đồng dựa vào khoảng cách giữa các khái niệm (Path length measures). Độ đo tương đồng thực thể được chúng tôi đề xuất dựa trên độ đo LC (Leacock & Chodorow) nhưđã được trình bày ở chương 3:
trong đó:
- n1, n2: là hai thực thể cần tính toán trên đồ thị
- depth: là độ dài lớn nhất trên đồ thịđược tính từ các thực thể mồi lúc khởi tạo hệ thống đến thực thể (nút) có khoảng cách xa nhất so với các nút này.
34
- l(n1,n2): khoảng cách ngắn nhất giữa hai thực thể.
Áp dụng công thức tính độ tương đồng câu tại mục 3.3.3 của Li và các cộng sự trong năm 2006 [LLB06] để xây dựng độ tương đồng câu cho đồ thị quan hệ thực thể.
Nhận xét:
Mặc dù, đồ thị quan hệ thực thể không có nhiều thông tin trong mỗi nút thực thể cũng như việc phân loại chủđề cho các thực thể trong đồ thị. Mặc dù vậy, đây là một phương pháp tựđộng giảm thiểu được chi phí xây dựng kho ngữ liệu cũng như có thể tạo ra được một đồ thị có số lượng nút thực lớn và mở rộng nhanh.
Độ đo tương đồng ngữ nghĩa cậu dựa vào đồ thị quan hệ thực thể chỉ hạn chế trong việc áp dụng các độđo khoảng cách tuy nhiên nó có thể dễ dàng kết hợp với các độđo tương đồng ngữ nghĩa khác thông qua các hàm trộn giữa các độđo.