CHƯƠNG 2 : CÁC HỆ THỐNG THÔNG TIN GIÁO DỤC
2.8. Áp dụng các kỹ thuật xử lý ontology từ các hệ thống trên
2.8.2. Kỹ thuật tạo siêu dữ liệu của TANGRAM
TANGRAM kết hợp nhiều ontology để tạo siêu dữ liệu cho bài giảng [21] (hình 2.16). Cấu trúc file RDF diễn giải tài liệu được xây dựng dựa trên các ontology Domain, Edu-Context và Content Structure. Vì tác giả biên soạn bài giảng thường chỉ cần một số phần trong tài liệu đã có như 1 bức ảnh hoặc 1 bảng, ... nên TANGRAM tập trung vào việc diễn giải theo cấu trúc của tài liệu để có thể trích rút và sử dụng lại từng thành phần trong tài liệu đó.
Sau khi tác giả upload LO thì LO được diễn giải bán tự động, nhưng việc diễn giải các thành phần của LO thì hồn tồn tự động. TANGRAM sử dụng file LOM RDF Binding để diễn giải nội dung và tạo siêu dữ liệu tự động cho các thành phần của LO. File LOM RDF được xây dựng dựa trên chuẩn IEEE LOM [29], nhưng không sử dụng tất cả các thành phần trong chuẩn này (hình 2.17).
Hình 2.17: Lược đồ siêu dữ liệu RDF Binding
Tất cả các thành phần siêu dữ liệu được biểu diễn trong hình trên hồn tồn tương thích với đặc tả LOM RDF Binding, ngoại trừ 2 thành phần: learning resource type và classification.
Learning Resource Type. TANGRAM sử dụng thuộc tính alocom-meta:type để
xác định các kiểu tài nguyên học của đơn vị nội dung và tham chiếu đến các khái niệm phân loại kiểu tài nguyên đã định nghĩa trong ALOCoM CT Ontology.
Classification. Thuộc tính dc:subject trỏ vào khái niệm trong domain ontology để
phân loại đơn vị nội dung theo lĩnh vực chủ đề.
Quá trình phân rã và diễn giải các thành phần của LO dựa trên siêu dữ liệu đã được tạo trong file LOM RDF Binding. Tiến trình diễn giải tự động theo hướng top- down, nghĩa là siêu dữ liệu mô tả các thành phần con được dẫn xuất từ siêu dữ liệu ứng với thành phần cha. Một số giá trị siêu dữ liệu được sao chép từ LO tới siêu dữ liệu của thành phần con ứng với các thuộc tính dc:creator, dcterms:created và dc:language. Một số thành phần trong LOM RDF Binding chỉ có ý nghĩa đối với LO như lom- edu:difficulty, lom-cls:accessibilityResstriction, do đó khơng được gán vào các thành phần phân rã từ LO. Siêu dữ liệu của thành phần con ứng với các thuộc tính dc:title, dc:subject, alocom-meta:type, dc:description và dc:identifier, TANGRAM sử dụng các thuật toán khai phá dữ liệu để tạo giá trị từ siêu dữ liệu của thành phần cha. Trong hình
2.18, LO là slide được diễn giải, trong đó thành phần siêu dữ liệu dc:subject tham chiếu tới thể hiện iis:semweb của ontology lĩnh vực.
Hình 2.18: file RDF diễn giải 1 trang slide
2.9. Kết chương
Chương 2 đã phân loại các hệ thống hỗ trợ giáo dục có áp dụng ontology và các cơng nghệ Web có ngữ nghĩa và khảo sát một số hệ thống điển hình được lựa chọn trong đó. Mục đích của chương là làm nổi bật vai trị của Web có ngữ nghĩa và đặc biệt là ontology trong các hệ thống giáo dục hiện nay. Các hệ thống được luận văn phân thành 3 loại gồm: (1) Các hệ thống chia sẻ tài nguyên giáo dục trực tuyến; (2) Các mạng chia sẻ ngang hàng về tài nguyên giáo dục; (3) Các hệ thống Elearning dựa trên ontology. Trong đó, các hệ thống POOL và Edutella sử dụng từ vựng Dublin Core còn Connexions sử dụng từ vựng CanCore để diễn giải tài nguyên. Tuy đã được ứng dụng phổ biến nhưng cấu trúc hai từ vựng trên khá đơn giản. Tuy nhiên hệ thống Connexion có đặc điểm rất quan trọng là hướng vào cộng đồng người sử dụng. Các hệ thống còn lại là GEM, PIP và TANGRAM đã xây dựng và xử lý ontology có cấu trúc phức tạp. Ontology của GEM biểu diễn nhiều lĩnh vực như nghệ thuật, tốn học, vật lý, ... nhưng khơng mơ tả chi tiết từng lĩnh vực. GEM cũng phát triển từ vựng Dublin Core để mô tả tài nguyên. Các ontology trong PIP được kết hợp mô tả các khái niệm trong việc giảng dạy, học tập ngôn ngữ tiếng Anh và sử dụng các nhóm tri thức để kết nối “Con người -> Tri thức lĩnh vực chủ đề -> Phương pháp giảng dạy -> Ngữ cảnh -> Nội dung” thành một khối thống nhất. Cấu trúc ontology của TANGRAM gồm một số ontology biểu diễn nội dung, cấu trúc, kiểu tài liệu và tập trung diễn giải tài liệu học tập theo từng thành phần chi tiết trong tài liệu. Qua quá trình khảo sát, luận văn cũng áp dụng một số kỹ thuật đã được các hệ thống trên sử dụng như kỹ thuật tích hợp và truy vấn trên nhiều ontology, kỹ thuật tạo file RDF Binding, ...
CHƯƠNG 3
KIẾN TRÚC ONTOLOGY TỔNG QUÁT CHO CÁC HỆ THỐNG HỖ TRỢ GIÁO DỤC CỘNG ĐỒNG
3.1. Giới thiệu
Mục tiêu của luận văn là xây dựng một kiến trúc ontology tổng quát có thể áp dụng cho các hệ thống hỗ trợ giáo dục cộng đồng. Trong đó, cộng đồng người sử dụng gồm nhiều đối tượng có các vai trị khác nhau trong xã hội và là nhân tố quyết định để duy trì và phát triển các hệ thống hỗ trợ giáo dục.
Mạng xã hội và web có ngữ nghĩa hỗ trợ cho nhau: web có ngữ nghĩa định nghĩa thông tin xã hội theo cách rõ ràng và hình thức thơng qua việc sử dụng ontology. Mơ hình mạng xã hội cho phép truy cập và thu nhận tri thức thông qua việc sử dụng chức năng mạng xã hội.
Luận văn hướng tới một cách tiếp cận kết hợp các công nghệ của Web xã hội và Web có ngữ nghĩa, đặc biệt là ontology để áp dụng cho các hệ thống hỗ trợ giáo dục cộng đồng nhằm tăng khả năng suy diễn ngữ nghĩa và tính mở rộng. Trong đó ontology là hạt nhân của hệ thống, dùng để chia sẻ tri thức trong mỗi lĩnh vực.
Một ví dụ điển hình của các hệ thống hỗ trợ giáo dục cộng đồng là một cổng thơng tin có tên BKEduPortal [22]. Trong q trình xây dựng BKEduPortal, luận văn đã hướng tới việc thiết kế một kiến trúc ontology áp dụng cho Cổng thơng tin này, và qua đó đưa ra kiến trúc chung cho các Cổng thông tin giáo dục cộng đồng. Mục đích ứng dụng ontology trong hệ thống là giúp mơ hình hóa dễ dàng các tri thức chung trong từng lĩnh vực (ví dụ các chủ đề học tập, danh mục ngành nghề, chuyên môn học tập, …), các nguồn tài nguyên (ví dụ tài liệu học tập, các câu hỏi thường gặp,…) được chia sẻ trong cộng đồng người sử dụng. Ngồi ra ontology cịn được sử dụng để mơ hình hóa các loại đối tượng sử dụng khác nhau trong cộng đồng người sử dụng để tạo thành một mạng xã hội, qua đó chúng ta có thể xác định được các chuyên gia và mối quan hệ của họ trong một lĩnh vực.