Mô hình biểu diễn

Một phần của tài liệu trình bày lý thuyết về web có ngữ nghĩa, ontology và các thế hệ phát triển của world wide web (Trang 85 - 88)

Ontology được áp dụng cho BKEduPortal nhằm mục đích mô hình hóa các khái niệm và các mối quan hệ về các miền tri thức lĩnh vực, tài nguyên chia sẻ và cộng đồng người sử dụng. Một đặc điểm rất quan trọng là BKEduPortal được xây dựng hướng về cộng đồng, và được phát triển bởi cộng đồng. Mô hình biểu diễn ontology cho cổng thông tin BKEduPortal thể hiện một cơ sở tri thức đầy đủ trong Cổng thông tin gồm các lớp và thể hiện lớp (hình 4.1).

Như trên hình vẽ ta thấy lược đồ Ontology được chia thành 3 khối riêng biệt về chủ đề, con người và tài nguyên. Ba khối trong mô hình có ý nghĩa như sau:

 Khối các khái niệm mô tả tri thức về lĩnh vực dưới dạng các chủ đề và phân nhóm, phân cấp của chúng. Ví dụ các chủ đề về Windows XP, Linux thuộc về nhóm chủ đề Hệ điều hành, Oracle, MySQL thuộc về Cơ sơ dữ liệu. Trong đó Hệ điều hành và Cơ sở dữ liệu là các nhóm con của Công nghệ thông tin. Các chủ đề được coi là một lớp các đối tượng tri thức trong chủ đề đó. Với mỗi nhóm chủ đề, có thể có các thuộc tính mô tả kèm theo, ví dụ đối với Hệ điều hành có sử dụng các thuộc tính mô tả về tính chất đơn nhiệm hay đa nhiệm của nó.

 Khối các lớp mô tả nhóm các loại tài nguyên được chia sẻ trong hệ thống. Ví dụ đối với các loại tài liệu học tập, có thể có các lớp con là Sách, Bài báo, Sách điện tử, Bài giảng,… Với mỗi nhóm tài nguyên, các thuộc tính siêu dữ liệu (meta-data) được lựa chọn sử dụng để mô tả. Dublin Core là các thuộc tính cơ bản thường dùng để mô tả một tài nguyên với các thông tin như tên tài liệu, tác giả, ngày tạo tài liệu, ngày xuất bản,… Để hỗ trợ khả năng tìm kiếm ngữ nghĩa các tài nguyên học tập, một thuộc tính chủ đề được sử dụng để gắn tài nguyên với một hoặc nhiều chủ đề cụ thể mô tả trong khối tri thức lĩnh vực.

 Khối các nhóm đối tượng người sử dụng của hệ thống. Cũng giống như tài nguyên, các thuộc tính cũng được gắn với từng nhóm người sử dụng để mô tả các cá nhân và các thông tin liên quan khác. Mối quan hệ giữa người sử dụng với các khối còn lại trong ontology thông qua các thể hiện như tác giả, người cung cấp chia sẻ một tài nguyên, một người có sở thích hoặc là chuyên gia trong một lĩnh vực.

Tuy 3 khối Con người, Lĩnh vực và Tài nguyên được xây dựng tách biệt nhưng giữa chúng có các mối liên hệ và hình thành mối quan hệ vòng tròn qua lại, tạo thành một không gian mô tả ngữ nghĩa trong một cộng đồng chía sẻ tri thức và tài nguyên thuộc về một lĩnh vực.

Các khối được liên hệ với nhau thông qua một số thuộc tính như dc:subject liên kết khối Tài nguyên và Chủ đề, phát biểu rằng tài nguyên giáo dục có nội dung thuộc về chủ đề lĩnh vực nào đã được mô hình hóa trong khối lĩnh vực. Quan hệ giữa khối Con người và Tài nguyên thể hiện ở phát biểu thành viên nào đóng góp tài nguyên học tập. Có một chút đặc biệt đối với các thuộc tính quan hệ dc:contributor và expertIn và trỏ tới siêu lớp TopicCls để khai thác tính chất của OWL Full.

Các khối trên chứa khái niệm chung đóng vai trò nền tảng để xây dựng các ontology lĩnh vực và ontology ứng dụng cho từng phân hệ ứng dụng của BKEduPortal. Số lượng và phạm vi các ontology thành phần được sử dụng tùy thuộc vào từng ứng dụng cụ thể.

Mô hình biểu diễn ontology được xây dựng dựa trên ngôn ngữ OWL Full với 3 mức gồm: mức Siêu lược đồ (meta-schema), mức Lược đồ (schema) và mức Thể hiện (instance).

Mức siêu lược đồ (meta-schema): gồm các lớp TopicCls, MaterialCls và

PersonCls ứng với các siêu lớp dùng để tạo ra các lớp mô tả trong các khối tri thức lĩnh vực, tài nguyên và cộng đồng người sử dụng. TopicCls, DocumentationCls và PersonCls là các lớp con của owl:Class. Các siêu lớp trên đóng vai trò phân chia ontology tổng quát BKOnto thành 3 miền riêng biệt ứng với 3 khối Lĩnh vực, Tài nguyên và Con người. Các siêu lớp còn có vai trò định nghĩa các lớp ở mức bên dưới.

Mức lược đồ (schema): gồm các lớp được tạo từ các lớp ở mức siêu lược

đồ. Trong đó Topic, Documentation và Person là các lớp có kiểu tương ứng là TopicCls, DocumentationCls và PersonCls. Hay nói cách khác, 3 lớp Topic, Documentation và Person là các thể hiện của 3 lớp tương ứng là TopicCls, DocumentationCls và PersonCls. Tùy thuộc vào mỗi loại hình ứng dụng khác nhau và các miền lĩnh vực cần được mô hình hóa mà các lớp này có thể được mở rộng với các lớp con khác nhau. Chú ý Topic, Documentation, Person luôn là lớp gốc cho các chủ đề, tài nguyên và con người. Các lớp thuộc các ontology lĩnh vực và ứng dụng là lớp con của các lớp gốc trên.

Mức thể hiện (instance): bao gồm các đối tượng được tạo với các lớp định

nghĩa trong mức lược đồ. Các đối tượng thể hiện chính là nguồn thông tin tri thức được chia sẻ và do cộng đồng người sử dụng cập nhật trong quá trình sử dụng. Số lượng các thể hiện trong ontology thường là rất lớn và không có sự hạn chế. Bởi cộng đồng người sử dụng chính là nguồn cung cấp các thể hiện nên tính phong phú của hệ thống như thế này là rất lớn.

Một đặc điểm của lược đồ Ontology trên 3 mức là các thành phần ở mức bên dưới là thể hiện của các thành phần ở mức trên. Ví dụ các lớp ở mức lược đồ như Topic, Person, Documentation là thể hiện của các lớp TopicCls, PersonCls và DocumentationCls, và các thành phần MySQL và Oracle, Person_id1, Book_id1 là thể hiện của các lớp Databage_Management, Person, Book ở mức lược đồ.

Ngôn ngữ OWL Full được chọn để biểu diễn ontology với một lý do đặc biệt. OWL Full coi thể hiện như là một kiểu lớp đặc biệt, và do đó có thể khai thác, xử lý các thể hiện của một lớp biểu diễn chủ đề lĩnh vực như các chủ đề con thuộc chủ đề lĩnh vực đó.

Ontology tổng quát gồm ba siêu lớp thuộc mức siêu lược đồ và ba lớp gốc cho ba khối ở mức lược đồ. Các ontology lĩnh vực và ontology ứng dụng được xây dựng từ ba lớp gốc thuộc mức lược đồ. Như vậy, các ontology thành phần được xây dựng và mở rộng tùy theo từng phân hệ ứng dụng.

Một phần của tài liệu trình bày lý thuyết về web có ngữ nghĩa, ontology và các thế hệ phát triển của world wide web (Trang 85 - 88)