CẢI TIẾN MÔ HÌNH ONTOLOGY TRONG GIẢI PHÁP TỔNG THỂ

Một phần của tài liệu Nghiên cứu cải tiến giải pháp thiết kế hệ hỗ trợ tìm kiếm theo ngữ nghĩa trên kho tài liệu khoa học máy tính (Trang 42)

- SBD_R: Liên hệ ràng buộc giữa các thành phần kể trên.

CẢI TIẾN MÔ HÌNH ONTOLOGY TRONG GIẢI PHÁP TỔNG THỂ

PHÁP TỔNG THỂ

Trong chương này, chúng tôi đề xuất một mô hình ontology cải tiến mô tả tri thức về một lĩnh vực đặc biệt trong đó sử dụng keyphrase và lớp là thành phần chính để hình thành các khái niệm của ontology, trình bày sự đóng góp cải tiến từ mô hình ontology và quy trình xây dựng ontology cho lĩnh vực KHMT. Ứng dụng mô hình ontology cải tiến trong việc mở rộng xử lý câu truy vấn và phương pháp suy diễn để tìm mối quan hệ ngữ nghĩa giữa các keyphrase trong việc đo lường mức độ tương quan về ngữ nghĩa giữa hai đồ thị keyphrase.

3.1. MÔ HÌNH ONTOLOGY CẢI TIẾN

Mô hình CK-ONTO cải tiến là một hệ thống gồm 5 thành phần:

(K, C, R, Rules,label)

mô hình CK_ONTO được định nghĩa thông qua quá trình sau:

3.1.1. Định nghĩa thành phần K tập các keyphrase:

Theo [3], keyphrase là thành phần chính để hình thành các khái niệm của ontology, ngoài ra keyphrase cũng có nghĩa là một đơn vị ngôn ngữ học cấu trúc như một từ, một từ kép, một ngữ. Nói cách khác, keyphrase được xem là những từ vựng hay thuật ngữ chuyên ngành biểu thị khái niệm khoa học, chủ yếu dùng trong các văn bản khoa học công nghệ.

Keyphrase là thành phần cơ bản và nền tảng của ontology. Về mặt cấu trúc thì có hai loại keyphrase là keyphrase đơn và keyphrase tổ hợp. Keyphrase đơn là những keyphrase chỉ biểu thị cho một khái niệm, được hiểu là những keyphrase cấu tạo bằng một đơn vị từ vựng đơn là từ hay một đơn vị tương đương từ như cụm từ cố định (đơn vị do một số từ hợp lại, tồn tại với tư cách một đơn vị có sẵn như từ, có thành tố cấu tạo và ngữ nghĩa cũng ổn định như từ). Ví dụ: computer, network, database, data structure, wireless, communication, algorithm. Keyphrase tổ hợp gồm nhiều đơn vị từ vựng đơn kết hợp thành, được xây dựng theo phương thức ghép các keyphrase đơn (hay keyphrase tổ hợp khác) lại, mà giữa các keyphrase

(thành tố cấu tạo) đó có quan hệ về nghĩa với nhau. Dựa vào tính chất của mối quan hệ về nghĩa giữa các thành tố cấu tạo, có thể phân loại keyphrase tổ hợp như sau:

- Đẳng lập: Đây là những keyphrase mà các thành tố cấu tạo có quan hệ bình đẳng với nhau về nghĩa, thường có cú pháp đơn giản là dùng liên từ “and”, “with”, “by”, …. Ví dụ: computer networking and communication, computer graphic and image processing.

- Chính phụ: Những keyphrase mà có thành tố cấu tạo này phụ thuộc vào thành tố cấu tạo kia, thành tố phụ có vai trò phân loại, chuyên biệt hoá và sắc thái hoá cho thành tố chính, biểu hiện thuộc tính, tính chất, đặc điểm. Ví dụ: database programming, network programming, document retrieval, wireless communication. Như vậy, gọi K = {k| k là keyphrase thuộc về lĩnh vực đang xét}, K = K1 ∪ K2, trong đó K1 là tập các keyphrase đơn và K2 là tập các keyphrase tổ hợp. Hiện nay, tập keyphrase về lĩnh vực KHMT mà chúng tôi thu thập được bao gồm khoảng 6000 keyphrase.

3.1.2. Định nghĩa thành phần C tập các lớp

Mô hình một lớp trong C là một hệ thống gồm ba thành phần:

(Kb, Attr, Inst)

trong đó các thành phần được mô tả như sau:

Một phần của tài liệu Nghiên cứu cải tiến giải pháp thiết kế hệ hỗ trợ tìm kiếm theo ngữ nghĩa trên kho tài liệu khoa học máy tính (Trang 42)

Tải bản đầy đủ (DOCX)

(111 trang)
w