Chuyển đổi thành phầ nC trong mô hình CK-ONTO

Một phần của tài liệu Nghiên cứu cải tiến giải pháp thiết kế hệ hỗ trợ tìm kiếm theo ngữ nghĩa trên kho tài liệu khoa học máy tính (Trang 60)

- SBD_R: Liên hệ ràng buộc giữa các thành phần kể trên.

3) Một tập hợp Inst các thực thể:

3.1.6. Chuyển đổi thành phầ nC trong mô hình CK-ONTO

Theo mô hình CK-ONTO, khi mỗi lớp keyphrase c ∈ C là một tập hợp các keyphrase có liên quan với nhau theo một tính chất hay ngữ nghĩa nào đó. Chúng có

thể chứa các keyphrase, các lớp khác, hay là sự phối hợp của cả hai. Như vậy, một lớp có thể bao gồm nhiều lớp hoặc được gộp vào lớp khác hình thành mối quan hệ phân cấp giữa lớp cha và lớp con. Theo đó các lớp được cho phép có một số lượng lớp cha bất kỳ. Một keyphrase có thể thuộc nhiều lớp khác nhau. Sự phân lớp trong K được phân thành nhiều cấp theo mức độ cụ thể của khái niệm tăng dần.

Với định nghĩa của C như trên, ta thấy thật sự thành phần C của mô hình CK-ONTO khá đơn giản, mỗi lớp chỉ chứa các keyphrase, mà các keyphrase có quan hệ với lớp theo một mức độ ngữ nghĩa nào đó, được gọi chung là quan hệ thuộc về. Vậy, quan hệ ngữ nghĩa phát sinh theo định nghĩa của lớp trong mô hình CK-ONTO chỉ bao gồm quan hệ thuộc về giữa keyphrase và lớp và quan hệ phân cấp giữa lớp cha và lớp con.

Trong ontology, lớp thường được định nghĩa như là một nguyên mẫu, một mô hình khái niệm về một thực thể mà từ đó các đối tượng cụ thể được tạo ra. Mỗi lớp định nghĩa các thuộc tính, các đặc tính chung cho tất cả các đối tượng của cùng một loại nào đó. Một đối tượng là một thể hiện cụ thể của một lớp.

Như vậy, mỗi c ∈ C không thật sự thể hiện ý nghĩa của một khái niệm trong miền tri thức. Mỗi lớp ở đây được định nghĩa giống như việc phân loại một chủ đề thuộc lĩnh vực; mà ở đó, mỗi chủ đề được xác định từ tập các keyphrase có liên quan tới chủ đề và các chủ đề con thuộc về chủ đề đó.

Đề xuất:

Xây dựng một phép chuyển đổi từ thành phần C trong mô hình CK-ONTO cũ sang mô hình CK-ONTO cải tiến bằng phép gán nhãn chủ đề cho các keyphrase cùng tên với chủ đề gọi là keyphrase chủ đề; chuyển quan hệ thuộc về giữa keyphrase và lớp thành quan hệ thuộc về giữa keyphrase chủ đề và keyphrase thuộc về chủ đề; và cuối cùng, chuyển quan hệ phân cấp cha con giữa các lớp thành quan hệ phân cấp cha con giữa các keyphrase chủ đề.

Ví dụ: chuyển đổi lớp DATA STRUCTURE bằng việc gán nhãn keyphrase ‘data structure’ là keyphrase chủ đề, tạo các quan hệ thuộc về giữa keyphrase ‘data structure’ và các keyphrase thuộc về chủ đề DATA STRUCTURE và quan hệ cha con giữa keyphrase chủ đề ‘data structure’ và các keyphrase chủ đề con của nó.

Lớp DATA STRUCTURE chứa các keyphrase liên quan cấu trúc dữ liệu như sau: DATA STRUCTURE = {stack, queue, contiguous list, linked list, hash table, graph, tree, sorting, multiway tree, root, strictly binary tree, complete binary tree, AVL tree, Red Black tree, Bubble sort, Merge sort,…}, trong đó bao gồm các lớp con khác như GRAPH, TREE, SORTING, …

=> Đầu tiên, dùng hàm gán nhãn chủ đề để gán nhãn cho keyphrase ‘data structure’ như là một keyphrase chủ đề. Sau đó, tạo các quan hệ thuộc về giữa các keyphrase{stack, queue, contiguous list, linked list,…} với keyphrase ‘data structure’. Cuối cùng, tạo các quan hệ part_of giữa các keyphrase chủ đề con {graph, tree, sorting, …} với keyphrase chủ đề cha ‘data structure’.

Đóng góp cải tiến:

- Như đã phân tích ở trên, thành phần C – tập các lớp chủ đề trong mô hình CK- ONTO không thật sự thể hiện ý nghĩa của lớp trong miền tri thức. Do đó, chúng tôi chuyển đổi thành phần C thành mối quan hệ giữa keyphrase chủ đề và keyphrase thuộc về chủ đề, và mối quan hệ giữa keyphrase chủ đề cha và keyphrase chủ đề con. Việc chuyển đổi này vẫn giữ nguyên ý nghĩa của thành phần C cũ; bên cạnh đó, tạo tiền đề cho việc định nghĩa thành phần lớp mới trong mô hình ontology, giúp ontology biểu diễn miền tri thức của lĩnh vực một cách đầy đủ và chính xác hơn.

- Thành phần label trong mô hình CK-ONTO cũ được định nghĩa nhưng chưa được sử dụng. Việc thay chuyển đổi phần C từ mô hình cũ sang mô hình mới bằng cách tạo các quan hệ và gán nhãn keyphrase đã khai thác và sử dụng được thành phần

label trong mô hình ontology, góp phần vào việc xây dựng ontology một cách rõ ràng và xúc tích hơn.

Một phần của tài liệu Nghiên cứu cải tiến giải pháp thiết kế hệ hỗ trợ tìm kiếm theo ngữ nghĩa trên kho tài liệu khoa học máy tính (Trang 60)

Tải bản đầy đủ (DOCX)

(111 trang)
w