WEB CÓ NG NGHĨA VÀ ONTOLOGY Ữ
Web có ng ữ nghĩa (Semantic Web)
Semantic Web bao gồm các công nghệ, công cụ và tiêu chuẩn, tạo thành một cơ sở hạ tầng cho việc xây dựng Web kết hợp ngữ nghĩa Kiến trúc của Semantic Web được hình thành từ một chuỗi các tiêu chuẩn nhóm lại vào một cấu trúc và biểu diễn mối quan hệ giữa các chuẩn này Tiến trình phát triển Semantic Web được thực hiện theo từng bước, với mỗi bước thuộc về một tầng trong kiến trúc và được xây dựng dựa trên tầng kế liền bên dưới.
Hình 1.7: Kiến trúc phân t ng cầ ủa Semantic Web (Berners_Lee – 2006)
Thành phần Unicode đảm bảo việc sử dụng tập ký tự quốc tế, trong khi thành phần URI (Uniform Resource Identifier) cung cấp phương tiện để định danh các đối tượng trong Semantic Web URI là một dạng định danh Web, thường bắt đầu bằng “http” hoặc “ftp” Ví dụ, một quyển sách có tiêu đề “Oracle Database Management” sẽ có URI riêng để nhận diện.
“http://www.cs.bris.ac.uk/home/book/title#Oracle_Database_Management”
Một dạng thức của URI là URL (Uniform Resource Locator) Một URL là địa chỉ cho phép thăm một trang Web, như: http://www.w3.org/owl/
1.2.1.2 T ng XML, ầ XML Schema và Namespace
XML là ngôn ngữ cho phép tạo ra tài liệu Web có cấu trúc với từ vựng được định nghĩa rõ ràng, phù hợp cho việc gửi tài liệu và chuyển đổi dữ liệu giữa các ứng dụng Cấu trúc XML được tổ chức theo dạng cây với các thẻ mở và đóng, cùng giá trị đi kèm Ưu điểm của XML là tính đơn giản và linh hoạt, dễ dàng tạo ra tài liệu với cấu trúc tùy ý, nhưng điều này cũng khiến việc xử lý bằng máy tính trở nên khó khăn do thiếu nghĩa rõ ràng cho các thẻ XML Schema là ngôn ngữ mô tả cấu trúc của tài liệu XML, với cú pháp dựa trên XML, giúp tăng khả năng đọc và cho phép tái sử dụng công nghệ, cải tiến lược đồ cấu trúc XML đã có.
Một trong những ưu điểm nổi bật của XML là khả năng truy cập thông tin từ nhiều nguồn khác nhau Đặc biệt, một tài liệu XML có thể sử dụng nhiều cấu trúc dữ liệu khác nhau để tổ chức và lưu trữ thông tin hiệu quả.
Nhưng vì mỗ ấi c u c a tài liủ ệu được phát triển độ ập, do đó xảy ra xung độc l t v tên ề
Khi lược đồ A và B định nghĩa phần tử có tên là e theo cách khác nhau, bộ phân tích sẽ không xác định được phần tử e thuộc về lược đồ nào Để tránh sự nhập nhằng này, giải pháp đơn giản là sử dụng hai namespace khác nhau cho mỗi lược đồ, được khai báo theo hình thức: xmlns:prefix = “location”.
RDF là mô hình dữ liệu cơ bản, tương tự như mô hình quan hệ, dùng để biểu diễn các phát biểu về tài nguyên Web Mặc dù RDF không phụ thuộc vào XML, nó sử dụng cú pháp dựa trên XML Tuy nhiên, RDF chỉ mô tả các phát biểu mà không định nghĩa ngữ nghĩa của các thành phần trong đó Để khắc phục điều này, RDF Schema được phát triển như một ngôn ngữ lược định nghĩa thuật ngữ trong mô hình dữ liệu RDF.
RDF Schema là mô hình cơ bản cho việc tổ chức và phân cấp các đối tượng Web Các thành phần chính của RDF Schema bao gồm lớp, thuộc tính, lớp con, thuộc tính con, cùng với các giới hạn về lĩnh vực (domain) và giá trị (range) Ngôn ngữ RDF Schema cho phép xây dựng các mô hình đa dạng cho các lớp và thuộc tính của tài nguyên RDF, sử dụng cú pháp của RDF.
RDF Schema gặp một số hạn chế trong việc biểu diễn các khái niệm, chẳng hạn như không thể biểu diễn hai lớp tách rời (disjoint) và không hỗ trợ các phép toán như hợp, giao hay lấy phần bù Do đó, cần sử dụng các ngôn ngữ ontology mạnh hơn để mở rộng khả năng của RDF Schema, cho phép biểu diễn các mối quan hệ phức tạp hơn giữa các đối tượng trên Web Ontology có thể đáp ứng những hạn chế này của RDF Schema.
Ontology là một tập hợp các khái niệm và quan hệ giữa các khái niệm, được định nghĩa cho một lĩnh vực cụ thể nhằm mục đích biểu diễn và trao đổi thông tin Nó thường bao gồm cấu trúc phân cấp giữa các lớp, trong đó nếu lớp C là lớp con của lớp C’, thì mọi đối tượng trong C cũng thuộc về C’ Ngoài phân cấp lớp, ontology còn chứa thông tin về thuộc tính của lớp, các phép toán logic trên các lớp, và quan hệ giữa các lớp Trong ứng dụng Semantic Web, ontology hỗ trợ việc chia sẻ và tái sử dụng tri thức trong một miền lĩnh vực.
Tầng Logic được sử dụng để nâng cao ngôn ngữ ontology thông qua việc khai báo các nguyên tắc logic, cho phép máy tính suy diễn dựa trên những nguyên tắc này Ví dụ, một công ty có thể quy định rằng nhân viên bán được hơn 100 sản phẩm sẽ trở thành thành viên của Super Salesman Club Chương trình máy tính thông minh có khả năng hiểu luật logic này và tự động kết luận rằng "John đã bán 102 sản phẩm, do đó John là thành viên của Super Salesman Club".
Tầng Proof gồm tiến trình suy luận cũng như biểu diễn kiểm chứng trong các ngôn ng ữWeb (từcác tầng thấp hơn) và xác nhận việc kiểm chứng đó
Tầng Trust được sử dụng để xác nhận chữ ký điện tử và các loại tri thức khác trong dịch vụ Semantic Web, dựa trên việc tư vấn hoặc đánh giá độ tin cậy của các agent.
Siêu dữ liệu được định nghĩa là "dữ liệu mô tả dữ liệu" và có mục đích kết hợp với các nguồn dữ liệu để hỗ trợ tìm kiếm thông tin liên quan Một số loại siêu dữ liệu được kết hợp để biểu diễn nhiều mặt của dữ liệu, bao gồm cú pháp, cấu trúc và ngữ nghĩa theo ngữ cảnh Trong Semantic Web, tài liệu được đánh dấu bằng siêu dữ liệu ngữ nghĩa, giúp máy tính hiểu nội dung tài liệu.
Siêu dữ liệu cú pháp là hình thức đơn giản nhất của siêu dữ liệu, mô tả thông tin không ngữ nghĩa về nội dung Nó cung cấp các thông tin chung như kích thước, ngày tạo và nơi chứa tài liệu Siêu dữ liệu cú pháp thường gắn liền với các nhãn để xác định rõ ràng hơn thông tin liên quan.
1.2.2.2 Siêu d u cữliệ ấu trúc (structure metadata)
Siêu dữ liệu là thông tin mô tả cấu trúc và nội dung của dữ liệu Số lượng kiểu siêu dữ liệu này biến đổi rất lớn, phụ thuộc vào kiểu tài liệu Siêu dữ liệu cấu trúc giúp nhóm và đặc trưng hóa dữ liệu theo cách sắp xếp có hệ thống với dữ liệu khác Ví dụ dưới đây, cấu trúc DTD mô tả một tài liệu XML.
1.2.2.3 Siêu dữ u ng liệ ữ nghĩa(semantic metadata)
Siêu dữ liệu ngữ nghĩa bổ sung các quan hệ, luật và ràng buộc vào siêu dữ liệu cú pháp và cấu trúc, mô tả thông tin liên quan ngữ cảnh hoặc về lĩnh vực cụ thể của nội dung dựa trên một mô hình siêu dữ liệu Trong Semantic Web, mô hình siêu dữ liệu chính là ontology.
Ontology
Ontology, từ tiếng Hy Lạp với nghĩa "đang tồn tại" và "từ", là lĩnh vực nghiên cứu về phân loại các sự vật và hiện tượng trong một lĩnh vực cụ thể Trong ngữ cảnh Web có ngữ nghĩa, ontology được định nghĩa theo nhiều cách, nhưng cộng đồng nghiên cứu thống nhất về vai trò của nó trong việc cung cấp sự hiểu biết chung về một lĩnh vực nào đó.
Một số định nghĩa đầy đủ nhất củ ontology như saua :
Theo Uschold và Jasper (1999), ontology không chỉ bao gồm các hình thức mà còn chứa từ vựng và các đặc tả về ngữ nghĩa Nó cung cấp các định nghĩa và quan hệ giữa các khái niệm, tạo thành một cấu trúc lĩnh vực và làm rõ ngữ nghĩa của thuật ngữ trong tài liệu.
Ontology được định nghĩa bởi Neches et al (1991) không chỉ là tập hợp các thuật ngữ và mối quan hệ trong một lĩnh vực mà còn bao gồm các quy tắc kết hợp các thuật ngữ và mối quan hệ này để tạo ra một cấu trúc rõ ràng và có thể áp dụng trong các ngữ cảnh khác nhau.
Ontology được định nghĩa bởi Gruber (1993) như một đặc trưng tường minh của "khái niệm hóa" "Khái niệm hóa" thể hiện ý niệm về thế giới của một cá nhân hoặc nhóm, trong khi "tường minh" chỉ ra kiểu và giới hạn của các khái niệm được định nghĩa một cách rõ ràng.
Ontology được định nghĩa bởi Weiss (1999) là một đặc tả bao gồm các khái niệm và mối quan hệ trong một lĩnh vực cụ thể Nó không chỉ đơn thuần là một phân cấp các lớp mà còn thể hiện rõ ràng các mối quan hệ giữa chúng.
Ontology được định nghĩa bởi Noy và McHuinness (2001) là một mô hình thể hiện rõ ràng các khái niệm trong một lĩnh vực cụ thể Trong đó, thuộc tính của mỗi khái niệm mô tả một số tính chất của nó và các ràng buộc liên quan.
Ontology là một tập hợp các thuật ngữ tri thức, bao gồm từ ngữ, các quan hệ ngữ nghĩa và một số luật suy diễn logic trong lĩnh vực cụ thể Hai thành phần quan trọng trong định nghĩa này là quan hệ ngữ nghĩa, thể hiện mối liên hệ giữa các khái niệm, và suy diễn logic, giúp xác định cách thức tư duy và rút ra kết luận từ các thông tin có sẵn.
Ngoài ra, cộng đồng nghiên c u phân bi t các ontology dứ ệ ựa trên độ phức tạp c a ủ mô hình bi u di n ontology ể ễ
Lightweight ontology: chứa các khái ni m, phân c p khái ni m, m i quan h ệ ấ ệ ố ệ giữa các khái niệm và các thuộc tính mô t khái niả ệm.
Heavyweight ontology: b sung vào lighweight ontology các tiổ ền đề (axioms) và ràng buộc (constraint).
Trong phạm vi luận văn, ontology là sự đặ c tả rõ ràng, hình thức của các khái niệm được chia sẻ trong lĩnh vực quan tâm
1.3.2 Vai trò c ủa ontology đố i v ớ i Web có ng ữ nghĩa
Mục đích của Semantic Web là phát triển WWW thông qua việc sử dụng ngữ nghĩa, cụ thể là thông qua việc đề xuất cách diễn giải ngữ nghĩa để mô tả các thành phần thông tin trên Web và các dịch vụ Web Các chuẩn hỗ trợ diễn giải ngữ nghĩa bao gồm RDF, RDF Schema và OWL Bên cạnh đó, các siêu dữ liệu diễn giải cũng góp phần nâng cao tính chính xác trong các ứng dụng tìm kiếm trên Web, cho phép các công cụ tìm kiếm tìm kiếm trang Web dựa trên các khái niệm chính xác từ một ontology đã được đánh dấu, thay vì chỉ thu thập tất cả các trang chứa sự nhập nhằng về từ khóa.
Ontology được xem là “trục xương sống” c a Semantic Web Danh m c ủ ụ dưới đây s phân tích vai trò c a ontology trong ng c nh ng d ng Web có ng ẽ ủ ữ ả ứ ụ ữ nghĩa.
Ontology là một công cụ quan trọng giúp chia sẻ kiến thức giữa các ứng dụng và con người, bằng cách cung cấp các khái niệm chung và đặc tả cụ thể cho từng khái niệm và từ vựng Nó hỗ trợ các hệ thống thông minh trong việc trung gian tổ chức thông tin, tạo điều kiện thuận lợi cho việc truy cập toàn cầu vào các dịch vụ Web Khả năng này đóng vai trò tiên quyết trong việc nâng cao hiệu quả của các ứng dụng trực tuyến.
Cho phép sử ụ d ng l i tri th c Ví d , n u m t nhóm nghiên cạ ứ ụ ế ộ ứu đã phát triển các ontology, nhóm khác có th s d ng l i cho ng d ng cể ử ụ ạ ứ ụ ủa họ
Đưa ra các giả thi t rõ ràng v mi n: c t ế ề ề Đặ ảrõ ràng mi n tri th c s giúp về ề ứ ẽ cho người m i d tìm hi u ng ớ ễ ể ữ nghĩa của miền lĩnh vực
Phân tích tri thức lĩnh vực Phân tích hình th c c a các khái ni m, c n thi t ứ ủ ệ ầ ế cho việc tái sử ụ d ng và m r ng ontology ở ộ
Có nhiều kỹ thuật để lập mô hình và biểu diễn ontology, như frames, logic bậc nhất, logic mô tả và các công nghệ phần mềm khác Mặc dù những kỹ thuật này có thể biểu diễn một cơ sở tri thức với các mức độ hình thức và chi tiết khác nhau, nhưng các ontology được xây dựng đều có những thành phần cơ bản chung.
Các lớp trong lập trình là các khái niệm cơ bản, thường được tổ chức theo cấu trúc phân cấp, thể hiện mối quan hệ giữa các lớp thông qua cây cấu trúc Một lớp có thể có nhiều lớp cha, cho phép tính đa thừa kế Các lớp có thể được phân loại thành lớp cụ thể, có thể được khởi tạo và sử dụng trực tiếp, và lớp trừu tượng, không thể khởi tạo mà chỉ định nghĩa các phương thức cho các lớp con.
Thuộc tính là những đặc điểm mô tả tính chất của một khái niệm, và nó khác biệt với quan hệ Trong khi quan hệ thể hiện mối liên hệ giữa các khái niệm, thuộc tính lại được xác định trên giá trị, có thể là chuỗi ký tự, số, hay kiểu dữ liệu boolean.
Quan hệ (relation) là biểu diễn các kiểu quan hệ giữa các khái niệm Các quan hệ này được sử dụng để thể hiện thuộc tính Tuy nhiên, giá trị của quan hệ khác với giá trị của thuộc tính ở chỗ giá trị của quan hệ là một khái niệm.
Thể hiện (instance) là biểu diễn các thành phần cụ thể, là các thể hiện của một tập hợp Các thể hiện mới có thể được tạo ra và gán giá trị cho thuộc tính và quan hệ Trong các công cụ đồ họa xây dựng ontology, có giao diện nhập liệu khi tạo instance.
Hàm (function): biểu di n các quan h c bi t, ễ ệ đặ ệ trong đó, ầ ử ứph n t th n là duy nhất đố ới v i n-1 ph n t còn l ầ ử ại.
Tiền đề (Axioms): u di n các phát bibiể ễ ểu luôn đúng Axioms được s d ng ử ụ để ể ki m ch ng s nh t quán c a ontology hoứ ự ấ ủ ặc cơ sở tri th c ứ
K ết chương
Chương 1 trình bày tổng quan về sự phát triển của các thế hệ Web, từ Web tĩnh đến Web 3.0 trong tương lai, nhấn mạnh sự kết hợp giữa Web 2.0 và Web có ngữ nghĩa Luận văn cũng đề cập đến các công nghệ Web có ngữ nghĩa, bao gồm kiến trúc phân tầng, các kiểu siêu dữ liệu, và Semantic Web Portal Tất cả các vấn đề liên quan đến công nghệ ontology sẽ được thảo luận, như định nghĩa, vai trò đối với Web có ngữ nghĩa, cấu trúc, phân loại, các ngôn ngữ, công cụ xây dựng, tiến trình thiết kế ontology, và một số ontology phổ biến như Dublin Core, FOAF Chương này sẽ cung cấp cơ sở lý thuyết cho các chương tiếp theo trong luận văn.
CHƯƠNG 2 : CÁC H Ệ TH Ố NG THÔNG TIN GIÁO D Ụ C Ứ NG D NG ONTOLOGY Ụ
Công nghệ Web ngữ nghĩa giáo dục đã ảnh hưởng đến thiết kế các hệ thống giáo dục Henze et al đã đề xuất một framework cho học tập cá nhân, sử dụng các khuôn dạng mô tả tài nguyên Web ngữ nghĩa để tạo ra các cấu trúc hypermedia Các ontology học tập được sử dụng để phát triển các hệ thống thông tin học tập thông minh, chứa tri thức gồm các đặc tả rõ ràng, hình thức về các khái niệm, đối tượng học tập và mối quan hệ giữa chúng.
Trong các hệ thống giáo dục, ontology được sử dụng chủ yếu cho ba mục đích: (i) xây dựng cấu trúc, diễn giải ngữ nghĩa, đánh chỉ mục và tìm kiếm tài nguyên học tập; (ii) biểu diễn và lưu trữ tri thức về các lĩnh vực cũng như các đối tượng cần thiết trong ứng dụng; và (iii) xây dựng các phương pháp giảng dạy, các hoạt động học tập phù hợp với mục tiêu, sở thích và năng lực của từng cá nhân Hiện nay, đã có nhiều hệ thống giáo dục được phát triển theo cách tiếp cận sử dụng ontology.
Luận văn đưa ra phân tích đánh giá một số ệ ố h th ng hi n t i d a trên m t phân ệ ạ ự ộ nhóm sau đây:
Các hệ th ng chia s tài nguyên giáo d c tr c tuy n: ố ẻ ụ ự ế GEM [15, 16], Connexions [16, 17, 26]
Các mạng chia s ngang hàng v tài nguyên giáo d c: POOL [ẻ ề ụ 16, 18 , ] Edutella [16, 19]
Các hệ thống Elearning hiện nay, như PIP và TANGRAM, đã ứng dụng ontology và các chuẩn Semantic Web, đóng vai trò quan trọng trong việc biểu diễn đối tượng học tập và kho chứa.
Dự án GEM (Gateway to Educational Materials), được thực hiện từ năm 1996 tại NLE (National Library of Education), nhằm hỗ trợ giáo viên tìm kiếm tài nguyên giáo dục trực tuyến như kế hoạch giảng dạy, chương trình học, bài giảng và sách GEM phát hiện, tập hợp và phân loại tài nguyên giáo dục từ nhiều nguồn khác nhau, bao gồm thư viện chính phủ, trường đại học và các trang web thương mại Hiện tại, GEM sử dụng từ vựng điều khiển dựa trên RDFS với các thuộc tính như title và description để mô tả tài nguyên giáo dục Đối tượng sử dụng GEM được chia thành hai loại: GEM Member, bao gồm giáo viên, nhà nghiên cứu và học tập, và GEM Consortium, là các tổ chức muốn đóng góp tài nguyên giáo dục cho dự án Các tổ chức và cá nhân tham gia miễn phí và được khuyến khích chia sẻ tài nguyên.
Dự án đã phát triển phần mềm Gem Cat, cho phép người dùng tạo các bản ghi siêu dữ liệu mô tả tài nguyên giáo dục Những bản ghi này được tập hợp vào kho chứa tài nguyên trung tâm mang tên The Gateway, nơi lưu trữ đa dạng các loại tài nguyên giáo dục từ giáo án, kế hoạch giảng dạy đến các dự án thẩm định trực tuyến Để đảm bảo chất lượng tài nguyên, các tổ chức và cá nhân cần có bản ghi về tài nguyên của họ trong Gateway, tuân thủ chuẩn mô tả của dự án và tham gia vào The Gateway Consortium.
GEM sử dụng cơ chế truy lục Seamark từ Siderean Software để tìm kiếm tài nguyên hiệu quả Cơ chế này được phát triển dựa trên các kỹ thuật tìm kiếm hiện đại.
Tìm kiếm phân cấp, hay "faceted searching", kết hợp các quy trình tìm kiếm theo từ khóa tương tự như Yahoo và Google, với mô tả tài nguyên dựa trên các "facet" Kết quả là một giao diện mới và mạnh mẽ, hỗ trợ hiệu quả trong việc khai thác và phát hiện tài nguyên.
GEM đã xây dựng một lược đồ mô tả tài nguyên giáo dục dựa trên tiêu chuẩn Dublin Core Hiện tại, lược đồ này được xây dựng trên RDFS và bản ghi siêu dữ liệu mô tả tài nguyên là dữ liệu RDF Bản ghi siêu dữ liệu mô tả tài nguyên bao gồm các thuộc tính được liệt kê trong bảng 2.1.
Source subject standards title type
Ontology trong GEM bao gồm nhiều khối từ vựng điều khiển, tạo thành một lược đồ thống nhất nhằm hỗ trợ việc tạo siêu dữ liệu mô tả tài liệu Ontology EduOnto, được xây dựng trên Protégé và dựa trên lược đồ RDFS của GEM, có thể được tìm thấy tại địa chỉ http://web.syr.edu/~jqin/eduonto/eduonto.html.
Hình 2.1: Lược đồ ontology GEM Các từ ự v ng quan tr ng ọ trong lược đồ ontology là:
Kỹ năng thế kỷ 21 bao gồm các yếu tố quan trọng như khả năng đọc, kỹ năng toán học, tư duy phản biện và giải quyết vấn đề Những kỹ năng này không chỉ giúp sinh viên phát triển kiến thức mà còn nâng cao khả năng đánh giá và áp dụng học tập trong thực tế.
Level Element GEM Controlled Vocabulary: mô tả các c p giáo dấ ục như trung học cơ sở, phổ thông trung học, đại học, … và các thang điểm.
GEM Controlled Vocabulary là một công cụ quan trọng giúp mô tả các phương tiện giao tiếp giữa người và máy Nó đóng vai trò trung gian, giúp chuyển giao thông tin một cách hiệu quả và chính xác Bằng cách sử dụng từ vựng được kiểm soát, GEM giúp đảm bảo rằng tài nguyên được nhận diện và sử dụng một cách nhất quán, từ đó nâng cao giá trị và khả năng truy cập của các tài nguyên đó.
Ressource Type GEM Controlled Vocabulary: mô tả th lo i c a tài nguyên ể ạ ủHình 2.2 liệt kê các lớp trong t v ng n ừ ự ày
Hình 2.2 Phân c p l p trong t v ng Resource Type : ấ ớ ừ ự
Subject Element GEM Controlled Vocabulary: mô tả chủ đề ủ c a tài nguyên
Chủ đề trong GEM Level 1 mô tả các miền lĩnh vực, trong khi GEM Level 2 cung cấp các thành phần chi tiết cho mỗi miền lĩnh vực Hình 2.3 liệt kê các thành phần của Level 1.
Hình 2.3 ác thành ph n trong Level 1 :C ầ
Bảng 2.2 dưới đây minh họa phân cấp chi tiết Level 1 và 2 của lĩnh vực giáo dục công nghệ
Educational Technology Audio-visual equipment
Informal education Instructional issues Integrating technology into the classroom Language laboratories
Staff inservice Technology Technology planning
Teaching Method GEM Element Controlled Vocabulary: mô tả các cách th ể hi n cệ ủa tài liệu giảng dạy hoặc điều khiển các hoạt động gi ng d ả ạy.
Tuy chưa được xem là m t tiêu chuộ ẩn, nhưng lược đồ ontology c a GEM ủ đã được ứng d ng r ng rãi trong các ng d ng Web có ng ụ ộ ứ ụ ữ nghĩa và ontology.
Dự án Connexions, được triển khai tại Đại học Rice vào năm 1999, nhằm xây dựng kho tài liệu học tập và công cụ hỗ trợ giảng dạy, nghiên cứu và chia sẻ tri thức Hệ thống Connexions trên web cung cấp tài liệu khóa học điện tử, cho phép tùy biến theo phong cách học tập và khuyến khích cộng đồng gồm tác giả, giáo viên và sinh viên kết nối giữa các khái niệm, khóa học và môn học, đồng thời tham gia đóng góp tri thức để phát triển và chia sẻ tài liệu học tập.
D Connexions ựán cóhai đặc điểm nổi bật ]: [26
Biểu di n tri thễ ức tự nhiên và liên kết nội dung giữa các khóa học và chương trình h ọc.
Kiến trúc Connexions và các công cụ ph n mầ ềm đã được thi t k h tr phát ế ế để ỗ ợ triển, qu n lý và khai thác tài nguyên giáo d c (hình 2.4) ả ụ
Hình 2.4: Kiến trúc Connexions Hình 2.5: Hoạt động như “nhà máy tri thức”
CÁC HỆ TH NG THÔNG TIN GIÁO D Ố Ụ C NG D Ứ Ụ NG
Gi ớ i thi ệ u
Công nghệ Web ngữ nghĩa giáo dục đã có tác động đáng kể đến các hệ thống giáo dục hiện nay Henze et al đã đề xuất một framework cho việc học tập cá nhân, sử dụng các khuôn dạng mô tả tài nguyên Web ngữ nghĩa để tối ưu hóa các cấu trúc hypermedia Các ontology học tập được áp dụng để phát triển các hệ thống thông tin học tập thông minh, với mỗi ontology chứa tri thức rõ ràng về các khái niệm, đối tượng học tập và mối quan hệ giữa chúng.
Trong các hệ thống thông tin giáo dục, ontology được sử dụng chủ yếu cho ba mục đích: (i) xây dựng cấu trúc, diễn giải ngữ nghĩa, đánh chỉ mục và tìm kiếm tài nguyên học tập; (ii) biểu diễn và lưu trữ tri thức về các lĩnh vực cũng như các đối tượng cần thiết trong ứng dụng; và (iii) xây dựng các phương pháp giảng dạy và các hoạt động học tập tương ứng với mục tiêu, sở thích và năng lực của từng cá nhân Hiện nay, đã có nhiều hệ thống giáo dục được xây dựng theo cách tiếp cận sử dụng ontology.
Luận văn đưa ra phân tích đánh giá một số ệ ố h th ng hi n t i d a trên m t phân ệ ạ ự ộ nhóm sau đây:
Các hệ th ng chia s tài nguyên giáo d c tr c tuy n: ố ẻ ụ ự ế GEM [15, 16], Connexions [16, 17, 26]
Các mạng chia s ngang hàng v tài nguyên giáo d c: POOL [ẻ ề ụ 16, 18 , ] Edutella [16, 19]
Các hệ thống Elearning hiện nay, như PIP và TANGRAM, đã áp dụng ontology và các tiêu chuẩn Semantic Web, đóng vai trò quan trọng trong việc biểu diễn đối tượng học tập và quản lý kho dữ liệu.
GEM
Dự án GEM (Gateway to Educational Materials), được thực hiện từ năm 1996 tại NLE (National Library of Education), nhằm hỗ trợ các nhà giáo dục tìm kiếm tài nguyên giáo dục trên Internet như kế hoạch giảng dạy, chương trình học, bài giảng và sách GEM thu thập và phân loại tài nguyên giáo dục từ nhiều nguồn khác nhau, bao gồm các thư viện chính phủ, trường đại học và các trang web thương mại Hiện tại, GEM sử dụng từ vựng điều khiển được xây dựng trên RDFS với các thuộc tính như title và description để mô tả tài nguyên giáo dục Đối tượng sử dụng GEM được chia thành hai loại: (1) GEM Member, bao gồm các nhà giáo dục, nghiên cứu và học tập; (2) GEM Consortium, gồm các tổ chức muốn đóng góp tài nguyên giáo dục cho dự án Các tổ chức và cá nhân tham gia miễn phí vào dự án và được khuyến khích chia sẻ tài nguyên.
Here is the rewritten paragraph:GEM sử dụng một cơ chế truy lục mới tên là Seamark từ Siderean Software để tìm kiếm tài nguyên Cơ chế này được xây dựng trên cơ sở một kỹ thuật tìm kiếm tiên tiến, cho phép tìm kiếm và phát hiện tài nguyên một cách hiệu quả và chính xác.
“Faceted searching” kết hợp các quy trình tìm kiếm theo từ khóa giống như Yahoo và Google, với mô tả tài nguyên dựa trên các “facets” Kết quả là một giao diện mới và mạnh mẽ, hỗ trợ người dùng trong việc khai thác và phát hiện tài nguyên hiệu quả hơn.
GEM đã phát triển một lược đồ mô tả tài nguyên giáo dục dựa trên tiêu chuẩn Dublin Core Hiện tại, lược đồ này được xây dựng trên nền tảng RDFS, với các bản ghi siêu dữ liệu mô tả tài nguyên dưới dạng dữ liệu RDF Bản ghi siêu dữ liệu này bao gồm các thuộc tính được liệt kê trong bảng 2.1.
Source subject standards title type
Ontology trong GEM được phân chia thành nhiều khối, mỗi khối là một từ vựng điều khiển, tạo thành một lược đồ thống nhất nhằm hỗ trợ việc tạo siêu dữ liệu mô tả tài liệu Ontology EduOnto, được phát triển trên nền tảng Protégé, dựa trên lược đồ RDFS của GEM, có thể tham khảo tại địa chỉ http://web.syr.edu/~jqin/eduonto/eduonto.html.
Hình 2.1: Lược đồ ontology GEM Các từ ự v ng quan tr ng ọ trong lược đồ ontology là:
Kỹ năng thế kỷ 21 bao gồm các kỹ năng quan trọng như đọc, toán học, tư duy phản biện và giải quyết vấn đề, cùng với các phương pháp đánh giá học tập của sinh viên Những kỹ năng này không chỉ giúp học sinh phát triển khả năng tư duy mà còn chuẩn bị cho họ những thách thức trong cuộc sống và công việc tương lai.
Level Element GEM Controlled Vocabulary: mô tả các c p giáo dấ ục như trung học cơ sở, phổ thông trung học, đại học, … và các thang điểm.
Mediators trong hệ thống GEM là các yếu tố quan trọng giúp quản lý và điều phối thông tin giữa người dùng và tài nguyên, đảm bảo việc chuyển giao dữ liệu một cách hiệu quả và chính xác Chúng đóng vai trò trung gian, kết nối người nhận với các tài nguyên cần thiết, từ đó tối ưu hóa quá trình truy cập và sử dụng thông tin.
Ressource Type GEM Controlled Vocabulary: mô tả th lo i c a tài nguyên ể ạ ủHình 2.2 liệt kê các lớp trong t v ng n ừ ự ày
Hình 2.2 Phân c p l p trong t v ng Resource Type : ấ ớ ừ ự
Subject Element GEM Controlled Vocabulary: mô tả chủ đề ủ c a tài nguyên
Chủ đề trong GEM được chia thành hai cấp độ: GEM Level 1 mô tả các miền lĩnh vực chủ đề, trong khi GEM Level 2 cung cấp các thành phần chi tiết cho mỗi miền lĩnh vực Hình 2.3 liệt kê các thành phần của Level 1.
Hình 2.3 ác thành ph n trong Level 1 :C ầ
Bảng 2.2 dưới đây minh họa phân cấp chi tiết Level 1 và 2 của lĩnh vực giáo dục công nghệ
Educational Technology Audio-visual equipment
Informal education Instructional issues Integrating technology into the classroom Language laboratories
Staff inservice Technology Technology planning
Teaching Method GEM Element Controlled Vocabulary: mô tả các cách th ể hi n cệ ủa tài liệu giảng dạy hoặc điều khiển các hoạt động gi ng d ả ạy.
Tuy chưa được xem là m t tiêu chuộ ẩn, nhưng lược đồ ontology c a GEM ủ đã được ứng d ng r ng rãi trong các ng d ng Web có ng ụ ộ ứ ụ ữ nghĩa và ontology.
Dự án Connexions, được triển khai tại Đại học Rice vào năm 1999, nhằm tạo ra một kho tài liệu học tập phong phú và các công cụ hỗ trợ giảng dạy Hệ thống Connexions cung cấp tài liệu khóa học điện tử tùy biến theo phong cách học tập, khuyến khích sự tham gia của cộng đồng gồm tác giả, giáo viên và sinh viên Qua đó, dự án thúc đẩy việc kết nối giữa các khái niệm, khóa học và môn học, đồng thời khuyến khích việc chia sẻ và phát triển tri thức trong giáo dục.
D Connexions ựán cóhai đặc điểm nổi bật ]: [26
Biểu di n tri thễ ức tự nhiên và liên kết nội dung giữa các khóa học và chương trình h ọc.
Hướng tới cộng đồng: chuyển từ quá trình học tập, xuất bản, tạo và lưu trữ tài liệu học thuật tự nhiên sang việc kết nối con người vào các cộng đồng giáo
Kiến trúc Connexions và các công cụ ph n mầ ềm đã được thi t k h tr phát ế ế để ỗ ợ triển, qu n lý và khai thác tài nguyên giáo d c (hình 2.4) ả ụ
Hình 2.4: Kiến trúc Connexions Hình 2.5: Hoạt động như “nhà máy tri thức”
Kiến trúc và công cụ Connexions bao gồm ba phần chính: đầu tiên là tòa module nội dung với các công cụ Module Authoring; thứ hai là lưu trữ tập trung các module trong kho chứa trung tâm gọi là Content Commons; và cuối cùng là tùy biến, ghép hợp các module từ kho chứa để tạo ra tài liệu hoặc bài giảng mới thông qua công cụ Course Composer.
Connexions có thể được hình dung như một "nhà máy sản xuất tri thức", nơi một cộng đồng tác giả liên tục chuyển đổi "tri thức thô" thành các module thông tin nhỏ, độc lập Các module này được lưu trữ trong Content Commons, cho phép người dùng sử dụng, tái sử dụng, cập nhật và điều chỉnh Giảng viên sử dụng phần mềm Course Composer để kết hợp các module thành bài giảng và đăng tải lên web Học viên có thể truy cập vào khóa học trên web hoặc Content Commons thông qua các công cụ hỗ trợ điều hướng và trực quan hóa.
Connexions sử dụng ngôn ngữ XML để tạo siêu dữ liệu mô tả các module theo ngữ nghĩa, giúp khai thác liên kết giữa các module và tìm kiếm tài liệu học tập chính xác Để giải thích nội dung khóa học, Connexions áp dụng một ngôn ngữ đánh dấu dựa trên XML mang tên CnXML Các module mã hóa bằng CnXML có thể hiển thị dưới dạng trang web và chuyển đổi sang các định dạng khác như PDF, Postscript Việc gắn thẻ có ngữ nghĩa cho nội dung module đã nâng cao khả năng chia sẻ, tìm kiếm, tái sử dụng và ghép các module thành đơn vị lớn hơn Các thành phần trong siêu dữ liệu mô tả module bao gồm tiêu đề, tác giả, từ khóa và liên kết với các module khác, trong đó Connexions dựa trên chuẩn Dublin Core để định nghĩa các thành phần này.
POOL
POOL (Portal for Online Objects in Learning) là dự án của tập đoàn TeleLearning NCE, Canada, nhằm xây dựng cơ sở hạ tầng theo mô hình peer-to-peer, kết nối nhiều kho chứa không đồng nhất thành một mạng lưới POOL tập trung phát triển hai công nghệ chính: (1) “POOL, POND và SPLASH” là kiến trúc phân tán cho mạng peer-to-peer các kho chứa tài liệu học, và (2) CanCore, giao thức siêu dữ liệu mô tả tài liệu học Các chức năng của POOL bao gồm quản lý hồ sơ cá nhân, tạo, lưu trữ và phân tán nội dung, truy cập và tìm kiếm, cũng như định nghĩa các kiểu đối tượng đa phương tiện.
SPLASH là kho chứa tài liệu học miễn phí cho cá nhân, cho phép người dùng tải xuống và quản lý tài nguyên Nó kết hợp cơ sở dữ liệu với cơ chế tìm kiếm peer-to-peer và giao thức siêu dữ liệu CanCore, giúp trao đổi tài nguyên giữa các thành viên trong mạng Trong khi đó, POND là kho chứa lớn hơn, phục vụ cho cộng đồng hoặc tổ chức như bộ giáo dục và trường học POOL kết nối POND và SPLASH, cải thiện tốc độ truy vấn và tìm kiếm tài liệu thông qua kết nối băng thông cao Sự quan trọng của POOL, POND và SPLASH nằm ở khả năng kết nối các kho chứa, đảm bảo dòng chảy thông tin giữa người tạo và người sử dụng tài nguyên, đồng thời cho phép thành viên tự định nghĩa tài liệu học.
POOL và CanCore đang được ứng dụng bởi TeleCampus, với kho chứa trực tuyến hơn 55.000 chương trình, khóa học, module và bài giảng Một điểm nổi bật của POOL là có hai mức siêu dữ liệu: một mức chung tạo bởi CanCore và mức còn lại được xây dựng dựa trên các thành viên để đáp ứng nhu cầu của cộng đồng Cấu trúc của giao thức CanCore cũng đóng vai trò quan trọng trong việc tổ chức và quản lý nội dung học tập.
CanCore (Canadian Core Learning Resource Metadata Protocol) là một chuẩn siêu dữ liệu nhằm mô tả tài nguyên học tập, hỗ trợ tìm kiếm, chia sẻ và quản lý tài nguyên giáo dục trực tuyến Giới thiệu CanCore bao gồm các thành phần mô tả tài liệu được lựa chọn từ các tiêu chuẩn Dublin Core, IMS và hoàn toàn tương thích với chuẩn IEEE LOM 1484 Lược đồ CanCore được chia thành 8 loại từ 9 loại của chuẩn LOM, bao gồm 15 phần tử mô tả cho các loại con và 36 phần tử tổng quát.
“động” được sử ụ d ng để nhập d ữliệu trong ti n trình t o b n ghi siêu d li u ế ạ ả ữ ệ (bảng 3 2 )
1 general 3 metametadata 4.6.otherplatform- requirement 7.2 resource 1.1 identifier 3.1 identifier 4.7 duration 7.2.1 identifier 1.2 title 3.2 catalogentry 5 educational 7.2.3 catalogentry 1.3 catalogentry 3.2.1 catalog 5.2 learning- resourcetype 7.2.3.1 catalog
1.3.1 catalog 3.2.2 entry 5.5 intendedenduser- role 7.2.3.2 entry
1.3.2 entry 3.3 contribute 5.6 context 9 classification 1.4 language 3.3.1 role 5.7 typicalagerange 9.1 purpose
2 lyfecycle 3.4 metadatascheme 6.1 c ost 9.2.2 taxon 2.1 version 3.5 language 6.2 copyrightand otherrestriction
B ng 2.3ả : Các thành ph n c a CanCoreầ ủ (www.cancore.ca/schema.html).
Các phần tử trong bảng được sử dụng để mô tả đối tượng học tập (learning object) Khuôn dạng siêu dữ liệu được áp dụng theo giao thức CanCore và được lưu trữ trong các kho của POOL dưới định dạng XML Hình 2.7 minh họa quy trình tạo và lưu trữ siêu dữ liệu của POOL.
Hình 2.7 T: ạo và lưu trữsiêu dữ u d a trên CanCore liệ ự
Edutella
Edutella (http://www.edutella.org/edutella.shtml) là một mạng Peer to Peer kết nối các kho chứa tài nguyên giáo dục không đồng nhất về hiệu năng, kích thước và kiểu lưu trữ Mạng này cho phép người dùng truy cập và chia sẻ nhiều loại kho chứa tài nguyên, ngôn ngữ truy vấn và kiểu dữ liệu khác nhau, nhằm mục đích trao đổi thông tin và tài nguyên học tập, không phải nội dung.
Edutella cung cấp các dịch vụ quản lý nhiều nguồn dữ liệu và siêu dữ liệu khác nhau Các dịch vụ của Edutella bao gồm việc truy vấn siêu dữ liệu RDF được lưu trữ trong các kho chứa phân tán, sử dụng các ngôn ngữ truy vấn như RQL và TRIPPLE.
Dịch vụ nhân bản giúp đảm bảo tính sẵn dùng và cân bằng dữ liệu, đồng thời duy trì tính nhất quán và toàn vẹn Dịch vụ ánh xạ cho phép kết hợp các nguồn dữ liệu khác nhau, tạo điều kiện cho sự hợp tác giữa nhiều bên Dịch vụ Mediation xác định các khung nhìn kết hợp dữ liệu từ nhiều nguồn, giúp điều hòa xung đột và giảm thiểu chồng chéo thông tin.
Edutella áp dụng hai công nghệ then chốt: (1) Công nghệ peer-to-peer JXTA, là giao thức P2P chung, thiết kế cho nhiều ứng dụng P2P với khả năng kết hợp và độc lập về nền tảng; (2) RDF, cơ cấu biểu diễn thông tin trên Web, được sử dụng để tạo siêu dữ liệu mô tả tài nguyên Edutella sẽ xử lý và kết hợp siêu dữ liệu, sử dụng từ vựng từ các nguồn khác nhau Kiến trúc tích hợp nội dung từ nhiều kho chứa của Edutella được minh họa trong hình 2.8.
Hình 2.8: Kiến trúc tích hợp n i dung Edutella ộ
Các từ vựng thường được sử dụng trong kho chứa của Edutella bao gồm Dublin Core, Dublin Core Qualifiers, Vcard, IEEE LOM và IMS Content Packaging Edutella đã phát triển một cơ sở dữ liệu chung gọi là ECDM (Edutella Common Data Model) để xử lý và chuyển đổi các kiểu siêu dữ liệu RDF thành khung nhìn siêu dữ liệu chung cho các đối tượng học tập Ngữ nghĩa được nắm bắt thông qua việc kết hợp các công nghệ RDFS, DAML + OIL và các luật Datalog.
PIP
PIP (Personalized Instruction Planner) (http://peonto.cityu.edu.hk/index.jsp) [2]:
PIP là hệ thống hỗ trợ giảng dạy ngôn ngữ tiếng Anh trong các trường trung học ở Hồng Kông Hệ thống này cung cấp các công cụ giảng dạy cá nhân hóa để thực hiện nhiều tác vụ khác nhau như tạo tài liệu, chiến lược giảng dạy và đánh giá Để tối ưu hóa quá trình giảng dạy cá nhân, PIP tích hợp 5 chế độ chức năng chính.
Hệ thống quản lý giáo dục tích hợp các chức năng quan trọng như thay đổi linh hoạt cấu trúc ontology, thiết kế chương trình học dựa trên PEOnto và tạo kế hoạch giảng dạy từ các thông tin đã định nghĩa Để hỗ trợ giáo viên, hệ thống cung cấp một khuôn mẫu cho việc tạo kế hoạch giảng dạy, giúp giáo viên chỉ cần điền thông tin cần thiết Thiết kế giảng dạy cá nhân hóa dựa trên chương trình học, mục tiêu, sở thích và năng lực cá nhân Hệ thống cũng quản lý hồ sơ người sử dụng và cho phép tìm kiếm tài nguyên học tập từ Internet (Global Search) hoặc từ PIP (Local Search) Cơ chế tìm kiếm theo từ khóa giúp giáo viên dễ dàng lựa chọn và gán tài nguyên vào kế hoạch giảng dạy của mình.
Các Agent trong PIP thực hiện các chức năng quan trọng như xác định và trích rút tài nguyên Web, phân loại và tổ chức tài nguyên cho việc lập kế hoạch giảng dạy cá nhân, diễn giải và mô tả tài nguyên học tập cho ứng dụng, tìm kiếm thông tin, cũng như tạo và quản lý hồ sơ học viên.
Hình 2.9 Các Agent trong PIP : 2.6.2 C u trúc Ontology trong PIP ấ
PIP sử ụ d ng ontology framework PEOnto, gồm 5 ontology kết hợp v i nhau (hình ớ
Ontology con người biểu diễn các cá nhân tham gia hệ thống; Ontology lĩnh vực (Ngôn ngữ) thể hiện tri thức trong lĩnh vực; Ontology chương trình giảng dạy mô tả kế hoạch giảng dạy bao gồm đường học, mục tiêu và các hoạt động học tập; Ontology phương pháp giáo dục phản ánh chiến lược và phương thức tổ chức tài nguyên giáo dục.
PEOnto mô tả vai trò và chức năng của các Agent, cho phép tái sử dụng, chia sẻ và mở rộng các ontology trong PEOnto Các lớp và thuộc tính của PEOnto tuân theo các chuẩn thông dụng như IEEE LOM trong Pedagogy và IMS LIS trong People Ontology Mục tiêu thiết kế của PEOnto là chia sẻ và định nghĩa các thực thể giáo dục theo một khuôn dạng chuẩn, giúp liên kết tài nguyên giáo dục siêu phương tiện với các thực thể giáo dục khác như chương trình học và ngữ cảnh sư phạm.
PEOnto tập trung vào việc tổ chức tài nguyên giáo dục một cách hệ thống, giúp giáo viên và học viên dễ dàng tìm kiếm, đánh giá, thu nhận và sử dụng hiệu quả hơn Các ontology được xây dựng bằng ngôn ngữ OWL Full thông qua công cụ biên tập Protege và bộ phân tích ontology Jena.
Phương thức thiết kế và xây dựng PEOnto bao gồm 5 bước chính: (1) Sử dụng lại ontology đã có; (2) Trích rút các thành phần chính và mở rộng các lớp, thuộc tính; (3) Điều chỉnh ontology theo mục tiêu thiết kế; (4) Cải tiến và hoàn chỉnh ontology; (5) Áp dụng ontology vào hệ thống ngữ dụng.
PEOnto xây dựng các ontology nhằm mô tả các khái niệm liên quan đến việc giảng dạy và học tập ngôn ngữ tiếng Anh Các nhóm tri thức được sử dụng để kết nối giữa "Con người" và các yếu tố trong quá trình học tập, tạo ra một hệ thống hỗ trợ hiệu quả cho việc giáo dục ngôn ngữ.
> Tri thức lĩnh vực chủ đề > Phương pháp g ả - i ng d y -ạ > Ngữ ả c nh -> N i dung” thành ộ m t khộ ối thống nh ất.
TANGRAM là ứng dụng học tập Semantic Web hỗ trợ giáo viên và sinh viên trong lĩnh vực Hệ thống Thông tin Thông minh (IIS) Ứng dụng này tập trung vào việc tự động xây dựng tài liệu học từ các thành phần có sẵn và chia sẻ tài nguyên Chức năng của TANGRAM được chia thành hai nhóm: một cho tác giả tạo nội dung giảng dạy và một cho học viên Tác giả có thể tải tài liệu lên kho chứa, sau đó tài liệu sẽ được phân tách thành các phần nhỏ hơn để sử dụng lại TANGRAM tạo siêu dữ liệu cho từng thành phần của tài liệu dựa trên các ontology, giúp tác giả tìm kiếm tài liệu đã có và xây dựng tài liệu mới từ các thành phần đã truy xuất Học viên có hai chức năng chính: điều chỉnh nội dung học tập theo mức tri thức, phong cách học và sở thích cá nhân; và kết hợp tìm kiếm tài liệu theo chủ đề, loại, cấu trúc Kiến trúc TANGRAM bao gồm bốn module chính, bao gồm các ontology và kho chứa.
Module quản lý nội dung (Content Management Module) đóng vai trò quan trọng trong việc xử lý, chỉnh sửa tài liệu và quản lý kho chứa Nó bao gồm các chức năng chính như: (a) Phân rã tài nguyên học tập (LO) thành các đơn vị nội dung chi tiết dựa trên cấu trúc ontology; (b) Diễn giải ngữ nghĩa các đơn vị nội dung này với các thành phần siêu dữ liệu dựa trên các ontology như lĩnh vực và phương pháp giảng dạy, nhằm hỗ trợ mô tả ngữ nghĩa của tài liệu; (c) Lưu trữ LO theo các khuôn dạng phù hợp với cấu trúc ontology; (d) Tìm kiếm LO trong kho chứa theo ngữ nghĩa và kiểu Module này được minh họa trong hình 3.14.
Module quản lý mô hình người sử dụng (User Model Management Module) có nhiệm vụ xử lý truy cập và cập nhật kho chứa hồ sơ người sử dụng.
Here is the rewritten paragraph:Module lắp ráp động là một công cụ hiệu quả trong việc cung cấp nội dung học tập cá nhân hóa Bằng cách kết hợp các đơn vị học tập sẵn có trong kho chứa, module này xây dựng nội dung học tập mới phù hợp với nhu cầu và hồ sơ của từng học viên.
Module giao diện ngườ ử ụi s d ng (User Interface Module): x lý tử ương tác giữa hệthống và người dùng
Hình 2.12: Các module trong TANGRAM
Trong TANGRAM, có hai kho chứa quan trọng: (i) kho chứa tài nguyên học tập (LOR), được lưu trữ theo định dạng tương thích với mô tả trong Ontology Cấu trúc Nội dung và siêu dữ liệu dựa trên chuẩn IEEE LOM; và (ii) kho chứa hồ sơ người sử dụng, được biểu diễn theo Ontology Mô hình Người dùng.
TANGRAM là một framework nguồn mở được xây dựng trên Tapestry, sử dụng ngôn ngữ lập trình Java, cho phép phát triển các ứng dụng web động và phong phú Jena được sử dụng để lưu trữ, cập nhật và tìm kiếm các kho chứa dữ liệu, đồng thời hỗ trợ suy diễn trên các ontology TANGRAM tập trung vào việc biểu diễn cấu trúc tài liệu, cho phép tái sử dụng từng thành phần của tài liệu để xây dựng tài liệu mới.
The ontologies utilized in the system include ALOCoM CS (ALOCoM Content Structure Ontology), which defines concepts applicable to the presentation structure of slides, encompassing elements such as slides, slide bodies, titles, and tables, along with relationships like ordering and part-of ALOCoM CT (Content Type) represents the linguistic characteristics of educational materials, such as Tutorials, Lessons, and Examples Additionally, Domain Ontology illustrates concepts within the IIS field, along with other ontologies like User Model Ontology and Learning Path Ontology.
Các ontology của TANGRAM được xây dựng trên ngô ngữ OWL, và sẵn có tại địa ch : http://iis.fon.bg.ac.yu/TANGRAM/ontologies ỉ
K ết chương
Chương này phân loại các hệ thống hỗ trợ giáo dục áp dụng ontology và công nghệ Web ngữ nghĩa, đồng thời khảo sát một số hệ thống điển hình Mục đích là làm nổi bật vai trò của Web ngữ nghĩa và ontology trong các hệ thống giáo dục hiện nay Các hệ thống được chia thành ba loại: (1) Hệ thống chia sẻ tài nguyên giáo dục trực tuyến; (2) Mạng chia sẻ ngang hàng về tài nguyên giáo dục; (3) Hệ thống Elearning dựa trên ontology Hệ thống POOL và Edutella sử dụng từ điển Dublin Core, trong khi Connexions sử dụng từ điển CanCore để mô tả tài nguyên Mặc dù đã được ứng dụng phổ biến, cấu trúc của hai từ điển này khá đơn giản Tuy nhiên, Connexions có đặc điểm quan trọng là hướng vào cộng đồng người dùng Các hệ thống khác như GEM, PIP và TANGRAM đã xây dựng và xử lý ontology với cấu trúc phức tạp Ontology của GEM biểu diễn nhiều lĩnh vực như nghệ thuật, toán học, vật lý nhưng không mô tả chi tiết từng lĩnh vực GEM cũng phát triển từ điển Dublin Core để mô tả tài nguyên Các ontology trong PIP kết hợp các khái niệm trong việc giảng dạy và học tập ngôn ngữ tiếng Anh, sử dụng các nhóm tri thức để kết nối con người.
TANGRAM sử dụng cấu trúc ontology để tổ chức nội dung, cấu trúc và kiểu tài liệu, nhằm diễn giải tài liệu học tập theo từng thành phần chi tiết Qua quá trình khảo sát, luận văn áp dụng các kỹ thuật tích hợp và truy vấn từ nhiều hệ thống khác nhau, tạo nên một khối thống nhất cho việc quản lý tri thức trong lĩnh vực này.
KIẾ N TRÚC ONTOLOGY T Ổ NG QUÁT CHO CÁC H Ệ TH NG H Ố Ỗ
Gi ớ i thi ệ u
Mục tiêu của luận văn là phát triển một kiến trúc ontology tổng quát, có khả năng áp dụng cho các hệ thống hỗ trợ giáo dục cộng đồng Kiến trúc này sẽ phục vụ cho nhiều đối tượng trong cộng đồng, mỗi đối tượng đảm nhận những vai trò khác nhau trong xã hội, từ đó góp phần quan trọng vào việc duy trì và phát triển các hệ thống giáo dục hiệu quả.
Mạng xã hội và web có ngữ nghĩa hỗ trợ lẫn nhau, với web có ngữ nghĩa định nghĩa thông tin xã hội một cách rõ ràng thông qua việc sử dụng ontology Mô hình mạng xã hội cho phép người dùng truy cập và thu thập tri thức hiệu quả nhờ vào các chức năng của mạng xã hội.
Luận văn này tập trung vào việc kết hợp công nghệ Web xã hội và Web có ngữ nghĩa, đặc biệt là ontology, để áp dụng cho các hệ thống hỗ trợ giáo dục cộng đồng Mục tiêu là tăng cường khả năng suy diễn ngữ nghĩa và tính mở rộng Trong đó, ontology đóng vai trò hạt nhân của hệ thống, giúp chia sẻ tri thức trong từng lĩnh vực.
BKEduPortal là một ví dụ điển hình về hệ thống hỗ trợ giáo dục cộng đồng, nơi mà việc xây dựng cổng thông tin này đã áp dụng kiến trúc ontology nhằm mô hình hóa tri thức chung trong các lĩnh vực giáo dục Ontology giúp tổ chức các chủ đề học tập, danh mục ngành nghề và tài nguyên chia sẻ như tài liệu học tập và câu hỏi thường gặp Hơn nữa, nó còn hỗ trợ việc mô hình hóa các đối tượng sử dụng khác nhau trong cộng đồng, tạo thành một mạng xã hội để xác định các chuyên gia và mối quan hệ trong từng lĩnh vực.
3.2 Cổng thông tin giáo dục cộng đồng BKEduPortal
Trong khuôn khổ đề tài khoa h c & công nghọ ệ ấp nhà nướ c c mã số KC01.05/06-
Hệ thống thông tin giáo dục cộng đồng 10 cần được nghiên cứu và phát triển, với cổng thông tin giáo dục BKEduPortal là hạt nhân chính.
Cổng thông tin giáo dục BKEduPortal là nền tảng truy cập duy nhất, tích hợp nhiều kênh thông tin và dịch vụ giáo dục Nó cung cấp cho người dùng một phương thức truy cập thuận tiện trên nền tảng web, cho phép quản lý thông tin cá nhân và tài khoản Hệ thống xác thực người dùng đảm bảo an toàn khi đăng nhập, từ đó tạo ra giao diện web dễ sử dụng, giúp người dùng nhanh chóng khai thác thông tin và dịch vụ, cũng như thực hiện các công việc một cách linh hoạt và hiệu quả.
BKEduPortal nổi bật với đặc điểm hướng về cộng đồng, khác biệt so với các cổng thông tin khác Người dùng không chỉ tiếp nhận thông tin mà còn đóng vai trò là nguồn lực chính, cung cấp và chia sẻ thông tin trong cộng đồng.
Cổng thông tin cộng đ ng đưồ ợc duy trì và phát triển bởi cộng đ ng ngưồ ờ ửi s dụng
3.2.1 Ki ế n trúc c ng thông tin BKEduPortal ổ
Một kiến trúc hệthống được đề xuất nhưtrong hình 3.1 bao gồm các thành phần:
Các phân hệ ứng dụng bao gồm hệ thống quản lý nội dung, cổng tài liệu học tập và tri thức, kênh thông tin về giáo dục và đào tạo, hệ tư vấn giáo dục, cùng với mạng cộng đồng giáo dục.
Cộng đồng người sử dụng cuối bao gồm nhiều đối tượng với vai trò xã hội khác nhau như cá nhân và chuyên gia, tham gia vào việc sử dụng các dịch vụ của cổng thông tin Tùy thuộc vào từng ứng dụng cụ thể, người dùng có thể đóng góp và chia sẻ tri thức cho hệ thống Cộng đồng này là nguồn lực chính cung cấp tài nguyên Ngoài ra, cổng thông tin còn thu thập tài nguyên từ các hệ thống khác trên WWW như bài giảng, hệ thống E-learning và các website giáo dục Ontology được sử dụng để xây dựng cơ sở tri thức và hỗ trợ trong việc diễn giải nội dung trong hệ thống, được cấu trúc dựa trên ba khối: Tri thức lĩnh vực, Tài nguyên và Cộng đồng người sử dụng Mô hình phân tích ontology Jena API Model được áp dụng để kết nối giữa các phân hệ ứng dụng.
Cổng thông tin và ontology là hai yếu tố quan trọng trong việc phân tích và kiểm tra tính nhất quán của cơ sở tri thức Nhóm chuyên gia, hay còn gọi là kỹ sư tri thức, có trách nhiệm xây dựng và cải tiến nội dung trong ontology Cơ sở tri thức dựa trên ontology của hệ thống có thể được cập nhật qua hai phương thức chính: người sử dụng đăng nhập và sử dụng trực tiếp các chức năng của cổng thông tin giáo dục để chia sẻ tri thức.
Nguồn tri thức có thể được thu thập tự động từ các hệ thống hỗ trợ mô tả ngữ nghĩa tài nguyên học tập dựa trên ontology, chẳng hạn như hệ thống hỗ trợ xuất bản tài liệu học và thông tin khóa học Các mục tiếp theo sẽ cung cấp thông tin chi tiết hơn về các phân hệ trong kiến trúc này.
Tài nguyên chia sẻ Cộng đồng người sử dụng
Hệ quản trị nội dung
Chia sẻ tài liệu học tập, tri thức
Nhà cung cấp tài liệu học tập
Các hệ thống E-Learning Các website giáo dục
Thông tin giáo dục và đào tạo
Mạng cộng đồng về giáo dục
Hình 3.1: Kiến trúc c ng thông tin BKEduPortal ổ
Phân hệ CMS cung cấp môi trường tích hợp để phát triển và quản lý nội dung, cho phép nội dung được biểu diễn theo nhiều khuôn dạng khác nhau mà không phụ thuộc vào giao diện web Mục tiêu chính của CMS là tự động thu nhận và tổ chức nội dung từ nhiều nguồn phân tán không đồng nhất, nhằm đáp ứng các câu hỏi thông minh từ người sử dụng cũng như từ các hệ thống ngang hàng khác Ngoài ra, phân hệ ứng dụng CMS còn cung cấp các chức năng nền tảng cho các phân hệ ứng dụng khác.
Các tiến trình quan tr ng c a phân h ọ ủ ệCMS là:
Tạo và thu thập nội dung: tạo mới hoặc thu nhận các mục nội dung và chuyển đổ ềi v các khuôn d ng chu n n u c n ạ ẩ ế ầ
Quản tr : ị lưu trữ và quản lý nội dung và siêu d ữliệu c a nủ ội dung trong kho chứa
Xuấ ảt b n: rút trích nội dung để đưa ra thông tin hữu d ng Phân b thông tin ụ ố này tới các ứng d ng hoụ ặc người dùng
Một số thành ph n n n t ng c n ầ ề ả ầ được xây dựng trong phân h ệCMS gồm:
Xây dựng một framework để kết nối và x ửlý nhiều nguồn dữliệu không đồng nhất: ví dụcác CSDL quan hệ ộ, n i dung web, các n i dung tài liộ ệu hợp lệ,
Công cụ phân tích, phân lo i và tích h p (ghép h p ho c ánh x ) n i dung ạ ợ ợ ặ ạ ộ theo c u trúc ng ấ ữ nghĩa liên quan đến miền lĩnh vực nào đó
Xây dựng ontology để hình th c hóa ng ứ ữ nghĩa của n i dung theo cây phân ộ c p khái ni m ấ ệ trong lĩnh vực
Các giao diện thông minh h tr truy c p cho c ỗ ợ ậ ả con người và ph n m m máy ầ ề tính (agent) để tìm ki m theo ng ế ữ nghĩa dựa trên ontology
Mục tiêu của luận văn là áp dụng công nghệ web có ngữ nghĩa và ontology để mô tả cấu trúc nội dung theo ngữ nghĩa Hướng tiếp cận này giúp khắc phục những hạn chế của các hệ thống CMS hiện nay.
3.2.3 Chia s ẻ tài li ệ u h ọ c t ậ p và tri th ứ c
Trong phần này, cộng đồng người sử dụng đóng vai trò quan trọng trong việc chia sẻ và đóng góp tài liệu học tập, tạo nên một thư viện tài liệu phong phú với nhiều lĩnh vực và chủ đề khác nhau Cộng đồng này chính là nguồn lực chính để phát triển và củng cố kho tài liệu học tập chung.
3.2.3.1 Thư viện tài liệu học tập
Thư viện là nơi lưu trữ và tập trung tất cả các tài liệu học tập của hệ thống, được xem là tài sản chung với quyền truy cập và sử dụng cho mọi thành viên Tài liệu học tập được sắp xếp và phân loại theo nội dung, dựa trên các chủ đề thuộc các lĩnh vực khác nhau Mỗi lĩnh vực được biểu diễn thành các nhóm chủ đề phân cấp, tạo thành một cấu trúc phân cấp rõ ràng cho các tài liệu học tập.
Nhóm lĩnh vực K thu t Công ngh ỹ ậ ệ
Công ngh thông tin ệ Điện - Điệ ửn t - Viễn thông
Cơ - Nhiệt - Luy n - ng l c ệ Độ ự Xây dựng - Ki n trúc – Công trình thế ủy lợi
K thuỹ ật ứng d ng khác ụ Nhóm lĩnh vực Kinh t - Qu n lý ế ả Quản lý Nhà nước
Chuyên đề Lu t ậ Khoa h c Quọ ản tr ị Tài chính chứng khoán Nhóm lĩnh vực Nông-Lâm-Ngư Nông nghi p ệ
Nhóm lĩnh vực Khoa h c t nhiên ọ ự Địa lý
Vật lý Nhóm lĩnh vực Khoa h c xã h i ọ ộ Ngoại ngữ
Lịch sử Văn - hóa Chính tr - ị tư tưởng Nhóm lĩnh vực Y t -s c kh e ế ứ ỏ Y h c cọ ổ truy n ề
Mô hình bi u di ể ễ n ontology
4.1 Mô hình biểu diễn ontology
Dựa trên yêu cầu xây dựng hệ thống thông tin giáo dục và kiến trúc ontology, ontology tổng quát của Cổng thông tin BKEduPortal được thiết kế với ba khái niệm chính: Lĩnh vực, Tài nguyên và Con người Mô hình biểu diễn này giúp tổ chức và quản lý thông tin một cách hiệu quả, phục vụ cho nhu cầu giáo dục.
Ontology được áp dụng cho BKEduPortal nhằm mục đích mô hình hóa các khái niệm và mối quan hệ trong các miền tri thức, tài nguyên chia sẻ và cộng đồng người sử dụng Một điểm đặc biệt quan trọng là BKEduPortal được xây dựng hướng về cộng đồng và phát triển bởi chính cộng đồng Mô hình biểu diễn ontology cho cổng thông tin BKEduPortal thể hiện một cơ sở tri thức đầy đủ, bao gồm các lớp và thể hiện lớp như owl:Class, bkonto:TopicCls, và bkonto:PersonCls.
Schema Level bkonto:Topic bkonto:Person bkdmict:ICT
Oracle MySQL dc:contributor bkonto:
Book_id1 dc:contributor dc:subject rdf:subClassOf dc:subject
O’Relly dc:publisher dc:format pdf
Oracle Database Management is a specialized field that focuses on the efficient handling and organization of data within Oracle databases As an expert in this area, one must understand various aspects such as database architecture, performance tuning, and security measures Mastery of Oracle Database Management not only enhances data accessibility but also ensures optimal performance and reliability for businesses.
Hình 4.1: Bi u di n 3 mể ễ ức và 3 khối của ontology
Mô hình Ontology được chia thành ba khối riêng biệt, bao gồm chủ đề, con người và tài nguyên Mỗi khối trong mô hình này mang ý nghĩa quan trọng, giúp phân loại và tổ chức thông tin một cách hiệu quả.
Khối các khái niệm mô tả thực tế về lĩnh vực dữ liệu được phân nhóm theo các chủ đề và phân cấp cụ thể Ví dụ, các chủ đề như Windows XP và Linux thuộc về nhóm hệ điều hành, trong khi Oracle và MySQL thuộc về cơ sở dữ liệu Hệ điều hành và cơ sở dữ liệu là hai nhóm con của công nghệ thông tin Các chủ đề này được coi là một lớp các đối tượng tri thức trong lĩnh vực đó Đối với mỗi nhóm chủ đề, có thể có các thuộc tính mô tả kèm theo, chẳng hạn như tính chất đơn nhiệm hay đa nhiệm của hệ điều hành.
Khối các lớp mô tả nhóm các loại tài nguyên được chia sẻ trong hệ thống, ví dụ như tài liệu học tập với các lớp con như Sách, Bài báo, Sách điện tử, và Bài giảng Mỗi nhóm tài nguyên sẽ có các thuộc tính siêu dữ liệu (meta-data) được lựa chọn để mô tả Dublin Core là các thuộc tính cơ bản thường dùng để mô tả tài nguyên, bao gồm thông tin như tên tài liệu, tác giả, ngày tạo tài liệu, và ngày xuất bản Để hỗ trợ khả năng tìm kiếm ngữ nghĩa cho các tài nguyên học tập, một thuộc tính chủ đề được sử dụng để gán tài nguyên với một hoặc nhiều chủ đề cụ thể trong khối tri thức lĩnh vực.
Khối các nhóm đối tượng người sử dụng của hệ thống thủ tục ống được thiết lập với các thuộc tính riêng biệt, nhằm mô tả các cá nhân và thông tin liên quan Mối quan hệ giữa người sử dụng và các khối khác trong ontology được thể hiện qua các vai trò như tác giả, người cung cấp thông tin, hoặc chuyên gia trong một lĩnh vực cụ thể.
Tuy 3 khối Con người, Lĩnh vực và Tài nguyên được xây dựng tách biệt nhưng giữa chúng có các mối liên hệvà hình thành mối quan hệ vòng tròn qua lại, tạo thành một không gian mô tả ng ữ nghĩa trong một cộng đồng chía sẻ tri thức và tài nguyên thuộc về ột lĩnh vự m c
Các khối được liên kết với nhau thông qua một số thuộc tính như dc:subject, cho phép kết nối tài nguyên giáo dục với chủ đề lĩnh vực cụ thể Mối quan hệ giữa khối Con người và Tài nguyên thể hiện qua các thành viên đóng góp tài nguyên học tập Đặc biệt, các thuộc tính quan hệ như dc:contributor và expertIn chỉ đến siêu lớp TopicCls, nhằm khai thác tính chất của OWL Full.
Các khối trên chứa khái niệm chung là nền tảng quan trọng để xây dựng ontology cho lĩnh vực và ontology dành cho từng phân hạng của BKEduPortal.
S ố lượng và phạm vi các ontology thành phần được sử ụ d ng tùy thuộc vào từng ng ứ d ng c ụ ụthể
Mô hình biểu diễn ontology sử dụng ngôn ngữ OWL Full và được phân chia thành ba mức: mức Siêu lược đồ (meta-schema), mức Lược đồ (schema) và mức Thể hiện (instance).
Mức siêu lược đồ (meta schema) bao gồm các lớp TopicCls, MaterialCls và PersonCls, tương ứng với các siêu lớp dùng để tạo ra các lớp mô tả trong các khối tri thức lĩnh vực, tài nguyên và cộng đồng người sử dụng TopicCls, DocumentationCls và PersonCls là các lớp con của owl:Class Các siêu lớp này đóng vai trò phân chia ontology tổng quát BKOnto thành ba miền riêng biệt, tương ứng với ba khối Lĩnh vực, Tài nguyên và Con người, đồng thời định nghĩa các lớp mới ở mức bên dưới.
Mức lực đời ồ (schema) bao gồm các lớp được tạo ra từ các lớp siêu lược đồ, trong đó Topic, Documentation và Person tương ứng với các lớp TopicCls, DocumentationCls và PersonCls Ba lớp này thể hiện các khía cạnh chính của thông tin, với Topic, Documentation và Person là các lớp gốc cho các chủ đề, tài nguyên và con người Tùy thuộc vào từng loại hình người dùng và các lĩnh vực cần mô hình hóa, các lớp này có thể được mở rộng với các lớp con khác nhau Các lớp thuộc ontology lĩnh vực và người dùng là các lớp con của các lớp gốc này.
Mức thể hiện trong ontology bao gồm các đối tượng được tạo ra từ các lớp định nghĩa, với các đối tượng này là nguồn thông tin tri thức được chia sẻ và cập nhật bởi cộng đồng người dùng Số lượng thể hiện thường rất lớn và không bị giới hạn, cho thấy tính phong phú của hệ thống nhờ vào sự đóng góp từ cộng đồng người sử dụng.
A key feature of the Ontology data model is its hierarchical structure, which consists of components at three levels For instance, elements such as Topic, Person, and Documentation represent the TopicCls, PersonCls, and DocumentationCls classes Additionally, MySQL and Oracle components, along with identifiers like Person_id1 and Book_id1, exemplify the DataManagement, Person, and Book classes within the data model.
K ết chương
Chương 4 của luận văn trình bày quá trình xây dựng ontology cho BKEduPortal, sử dụng ngôn ngữ OWL Full Mô hình ontology được thiết kế dựa trên ba khối lĩnh vực: con người và tài nguyên, được phân thành ba tầng: siêu lược đồ, lược đồ và thực hiện Quá trình xây dựng ontology được cải tiến từ phương pháp của Noy và McGuiness để phù hợp với kiến trúc phân tầng Luận văn cũng đề cập đến các kỹ thuật xây dựng ontology bằng công cụ Protégé, bao gồm tạo siêu lớp, tích hợp ontology và tạo siêu dữ liệu Cuối cùng, luận văn xây dựng các ontology cho ứng dụng chia sẻ tài liệu học tập và đưa ra kịch bản tìm kiếm tài liệu theo nội dung và chủ đề.
GIAO DIỆ N L Ậ P TRÌNH (API) D Ự A TRÊN JENA
M ụ c tiêu
Mục tiêu của chương 5 là phát triển các lớp và phương thức trong Jena API framework nhằm dễ dàng xử lý và truy vấn ontology theo kiến trúc và mô hình ontology tổng quát đã được đề xuất cho các cổng thông tin giáo dục, đặc biệt là BKEduPortal Mặc dù Jena đã hỗ trợ đầy đủ các lớp và phương thức cho ngôn ngữ truy vấn ontology, nhưng để đáp ứng yêu cầu của kiến trúc và mô hình tổng quát BKOnto, cần mở rộng các API có sẵn trong framework nhằm tăng cường khả năng sẵn có và tính linh hoạt của ontology cho người dùng trong bối cảnh Semantic Web.
Jena API Framework
Jena là một framework Java hỗ trợ xây dựng ứng dụng Semantic Web, cung cấp môi trường lập trình cho RDF, RDFS và OWL Nó bao gồm một mô tơ suy diễn dựa trên luật Các API trong Jena được phân chia thành 5 tập hàm xử lý ontology.
X ửlý các RDF data model theo cấu trúc đồ thịmô tả phát biểu RDF.
X lý ontology gử ồm lớp, thu c tính và th hi n ộ ể ệ
Suy diễn trên các OWL và RDFS model.
G n kắ ết ontology vào cơ sở ữ d u liệ
5.2.1 Mô hình phân c p Je ấ na API
Jena API bao gồm các package ch a các interface và các lứ ớp cài đặt trong đó Các package và lớp x lý ontology g m: ử ồ
com.hp.hpl.jena.ontology: Resource, OntResource, OntModel, OntClass, OntProperty, Individual
com.hp.hpl.jena.db: IDBConnection, DBConnection
com.hp.hpl.jena.rdf.model: ModelFactory, Model
com.hp.hpl.jena.rdql
com.hp.hpl.jena.reasoner
Trong đó package com.hp.hpl.jena.ontology là quan trọng nh t S phân c p các ấ ự ấ lớp interface trong Jena API như sau (hình 5.1)
Hình 5.1: Mô hình phân c p com.hp.hpl.jena.ontology ấ
Các lớp OntClass, OntProperty và Individual bi u diể ễn và x lý các lử ớp, thu c ộ tính và th hi n có trong ontology ể ệ
Mô hình Ontology đại diện cho một mô hình ontology được lưu trữ trong bộ nhớ Lớp Java chính để biểu diễn mô hình ontology trong bộ nhớ là OntModel Trong Jena, mô hình ontology được tạo ra thông qua lớp ModelFactory và phương thức createOntologyModel(OntModelSpec o), trong đó tham số OntModelSpec mô tả tính chất của ontology Jena API có khả năng tạo ra hơn 20 loại mô hình ontology khác nhau.
Hình 5.2: Ontology model Đoạn mã sau tạo một ontology model, lưu trong bộ nh và không h ớ ỗtrợsuy diễn Import com.hp.hpl.jena.ontology.OntModel;
Import com.hp.hpl.jena.ontology.OntModelSpec;
Import com.hp.hpl.jena.rdf.model.ModelFactory; public class CreateModel { public static void main(String[] args) {
OntModel model ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);
Sau khi xây dựng mô hình ontology, bước tiếp theo là nạp tài liệu ontology vào mô hình Jena sử dụng phương thức read để đọc một ontology từ địa chỉ URL hoặc từ tệp tin lưu trữ trên thư mục cục bộ Ví dụ, đoạn mã dưới đây cho phép đọc ontology BKOnto từ URL http://www.hut.edu.vn/BKOnt.
OntModel model ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);
Model.read(“http://www.hut.edu.vn/BKOnt ”);
Các lớp OWL ontology được mô tả thông qua lớp Java OntClass Để truy xuất một lớp từ ontology, bạn có thể sử dụng phương thức getOntClass(URI) từ OntModel hoặc sử dụng phương thức listClasses() để lấy ra tất cả các lớp Lớp OntClass cho phép lấy ra tất cả các lớp con thông qua phương thức listSubClasses() Phương thức createClass() được sử dụng để tạo một lớp mới Ví dụ, lớp mới #Researcher là lớp con của lớp #Person.
OntClass r = model.createClass(baseURI + “Reseacher”); r.addSuperClass(p);
L p ớ OntClass có một số phương thức kiểm tra tính chất của 1 lớp như isIntersectionClass(), isComplementClass(), isRestriction(), hasSuperClass() T t cấ ả các phương thức này đều tr v tham s Boolean ả ề ố
Lớp OntProperty đại diện cho các thuộc tính trong mô hình ngữ nghĩa Bạn có thể tạo ra các thuộc tính mới bằng cách sử dụng lớp OntModel, với các phương thức như createObjectProperty() và createDatatypeProperty() Dưới đây là một ví dụ về đoạn mã để tạo thuộc tính mới.
The #Documentation and Object property #DocumentationOwner are defined by setting the domain and range using the setDomain and setRange methods of ObjectProperty This establishes the new property attributes for #Documentation and #Person.
OntClass p = model.createClass(baseURI + “#Documentation”);
ObjectProperty po = model.createObjectProperty(baseURI +
“#DocumentationOwner”); po.setRange(model.getResource(baseURI + “#Person”)); po.setDomain(p);
The OntProperty class offers several methods to verify property characteristics, including isTransitiveProperty(), isSymmetricProperty(), isDatatypeProperty(), and isObjectProperty() Additionally, the listDeclaredProperties() method can be utilized within the OntClass to enumerate the properties associated with a specific class.
Lớp Instance được sử dụng để biểu diễn thể hiện, và bạn có thể sử dụng phương thức listInstances() thuộc lớp OntClass để liệt kê tất cả các thể hiện trong lớp Tương tự, trong lớp OntModel, phương thức listIndividuals() cũng có thể được sử dụng Đoạn mã dưới đây sẽ trả về tất cả các thể hiện của lớp #Person.
OntClass Student = model.getOntClass(baseURI + “Person”);
For (ExtendedIterator i = Student.listInstances(); i.hasNext();)
System.out.println((Individual) i.next()).toString());
The createIndividual() method of the OntModel class allows for the creation of individuals with specific attributes For instance, the example demonstrates how to create an instance named #Jorge of the #Person class, assigning the values "Jorge Cardoso" for the name attribute and "jcardoso@uma.pt" for the email attribute of #Jorge.
Resource tClass = model.getResource(baseURI + “#Person”);
Individual teacher = model.createIndividual(baseURI + “#Jorge”, tClass);
DatatypeProperty name = model.getDatatypeProperty(baseURI + “#Name”); teacher.addProperty(name, “Jorge Cardoso”);
DatatypeProperty name = model.getDatatypeProperty(baseURI + “#Name”); teacher.addProperty(name, “Jorge Cardoso”);
DatatypeProperty email = model.getDatatypeProperty(baseURI + “#Email”); Teacher.addProperty(email, “jcardoso@uma.pt”);
Jena sử ụ d ng ngôn ng ữ RDQL để truy v n d li u trong ontology Cú pháp c a ấ ữ ệ ủ RDQL tương tự như cú pháp SQL.
RDQL cho phép người dùng thực hiện tìm kiếm các đối tượng con trong cấu trúc dữ liệu RDF dựa trên các điều kiện tìm kiếm cụ thể Chẳng hạn, đoạn mã dưới đây có khả năng truy xuất tất cả các lớp con thuộc về lớp lớn hơn là Person.
SELECT ?x WHERE (?x )
USING rdfs FOR http://www.w3.org/2000/01/rdf-schema#
Univ FOR http:// www.hut.edu.vn/BKOnt#>
Gói com.hp.hpl.jena.rdql bao gồm tất cả các lớp và giao diện cần thiết để sử dụng RDQL trong ngôn ngữ lập trình Java Câu lệnh RDQL được biểu diễn thông qua một đối tượng cụ thể.
Phương thức setResource của đối tượng Query xác định mô hình ontology nào là nguồn truy vấn Sau khi tạo Query, cần tạo QueryEngine để thực hiện truy vấn thông qua phương thức exec() Kết quả truy vấn sẽ được lưu trong đối tượng QueryResults Đoạn mã sau thực hiện truy vấn để lấy ra các bộ ba RDF trong ontology.
Query query = new Query(sql);
QueryResults result = new QueryEngine(query).exec();
Mô tơ suy diễn Jena cho các ontology OWL được phân loại thành ba loại với các độ phức tạp khác nhau: OWL FULL, OWL Mini và OWL Micro Jena hỗ trợ một số cấu trúc của OWL DL và OWL Full, chẳng hạn như owl:hasValue Tuy nhiên, một số cấu trúc OWL như owl:complementOf và owl:oneOf không được xử lý trong mô tơ suy diễn của Jena.
B ng 5ả 1 dưới đây liệt kê các cấu trúc OWL được Jena hỗ trợ
B ng 5.1: ả Các cấu trúc được suy diễn trong Jena
Lớp x lý suy diễn, hay còn gọi là Reasoner, được khởi tạo thông qua phương thức getOWLReasoner của lớp ReasonerRegistry Sau khi khởi tạo đối tượng suy diễn, cần liên kết đối tượng này với mô hình ontology bằng phương thức bindSchema Đoạn mã dưới đây minh họa cách khởi tạo một đối tượng suy diễn.
InfModel infmodel = ModelFactory.createInfModel(reasoner, model);
Tác vụ đầ u tiên có th thể ực hiện là ki m tra tính nh t quán cể ấ ủa dữ ệ li u trong ontology, sử ụng phương thứ d c validate()
System.out.println(“Valid OWL”);
System.out.println(“Not a valid OWL!”);
For (Iterator i = vr.getReports(); i.hasNext(); ) {
5.2.8 G ắn ontology vào cơ sở ữ d u li ệ
Jena có khả năng ạp và lưu trữ ontology trong các hệ quản trị cơ sở dữ liệu quan hệ, từ đó hỗ trợ phân tán siêu dữ liệu Hiện tại, Jena chỉ hỗ trợ MySQL, Oracle và PostgreSQL Để tạo một mô hình trong cơ sở dữ liệu, người dùng cần sử dụng đối tượng ModelFactory và gọi phương thức createModelRDBMaker.
5.3.1 Lý do c ầ n m ở ộ r ng Jena API
K ết chương
Chương 5 trình bày vi c thi t k các lệ ế ế ớp và phương thức m r ng t các l p giao ở ộ ừ ớ diện Jena API Do các lớp Jena API chỉ ử x lý các lớp, thuộc tính và thể ệ hi n chung Ví d ụ phương thức listClass() thuộc lớp OntClass trả ề v toàn bộ các lớp trong ontology Tuy nhiên, người dùng gặp khó khăn khi sử ụng Jena API để ử d x lý mô hình phân t ng ầ trên cơ sở 3 kh i Ch ố ủ đề, Con người và Tài nguyên của ontology BKOnto Do đó ầc n thiết kế ở ộ m r ng các lớp và phương thức của Jena API thành các lớp giao diện xử lý lớp và thể ệ hi n của ontology theo kiến trúc của BKOnto Các lớp và thể ệ hi n thuộc mỗi khối trong BKOnto được xử b i lý ở các lớp giao diện Jena API mở ộ r ng là OntTopicCls,OntPersonCls, OntDocumentationCls và IndTopic, IndPerson, dDocumentation In
Các vấn đã giải quyết được
Trong khuôn khổ ủ c a luận văn, tác giả đã nghiên cứu và gi i quyả ết được các vấn đề chính sau:
Tổng hợp các thế ệ h phát triển của World Wide Web Nghiên cứu và ứng d ng ụ các công nghệ Web có ng ữ nghĩa và ontology
Khảo sát và phân tích các hệ thống hỗ trợ giáo dục hiện nay cho thấy việc áp dụng công nghệ Web có ngữ nghĩa và ontology đang trở thành xu hướng phát triển nổi bật Nghiên cứu này phát hiện ra rằng các hệ thống giáo dục đang dần chuyển mình theo hướng cộng đồng, mở ra tiềm năng lớn cho người sử dụng trong lĩnh vực giáo dục.
Bài viết trình bày việc xây dựng một mô hình kiến trúc ontology tổng quát cho các hệ thống hỗ trợ giáo dục cộng đồng Để chứng minh tính khả thi của kiến trúc ontology này, luận văn đã phát triển ontology tổng quát BKOnto cho BKEduPortal dựa trên kiến trúc đã đề xuất Mô hình BKOnto được xây dựng bằng ngôn ngữ OWL Full, với ba khái niệm chính: Chủ đề, Con người và Tài nguyên, cùng với ba mục tiêu: mô hình Siêu lược đồ và các mục tiêu khác.
Luận văn này trình bày các kỹ thuật xây dựng và tích hợp ontology, đồng thời phát triển các ontology cho từng lĩnh vực cụ thể Ngoài ra, bài viết cũng chia sẻ tài liệu học tập và minh họa thông qua một bộ công cụ tìm kiếm tài liệu học tập hiệu quả.
M rở ộng các lớp giao diện trong Jena API để người sử ụ d ng có thể giao tiếp d ễ dàng hơn với kiến trúc ontology BKOnto
Hướng phát tri n cể ủa đề tài
Để giải quyết vấn đề về số lượng lớn và kích thước của các lớp và thể hiện trong mỗi lớp, cải tiến mô hình ontology tổng quát là cần thiết Một giải pháp hiệu quả là lưu trữ các thể hiện tách biệt với lớp, sử dụng các cơ sở dữ liệu quan hệ như MySQL, Oracle, hoặc các hệ thống lưu trữ siêu dữ liệu như Sesame để lưu trữ siêu dữ liệu RDF Lớp giao diện Jena API mở rộng sẽ đóng vai trò là cầu nối giữa hệ thống lưu trữ siêu dữ liệu và ontology, cho phép truy xuất và quản lý dữ liệu hiệu quả.
Tiếp tục xây dựng các ontology cho các ứng dụng và lĩnh vực của Cổng thông tin giáo dục BKEduPortal, bao gồm Thông tin giáo dục, Tư vấn giáo dục, và Mạng xã hội giáo dục, nhằm hoàn thiện BKEduPortal Mục tiêu tương lai của luận văn không chỉ áp dụng mô hình ontology tổng quát cho các hệ thống hỗ trợ giáo dục như BKEduPortal mà còn mở rộng sang các lĩnh vực khác như Y tế.
Trong quá trình nghiên cứu và trình bày, không thể tránh khỏi những thiếu sót trong luận văn Tác giả rất mong nhận được sự đóng góp và giúp đỡ từ các Thầy Cô giáo cũng như bạn bè đồng nghiệp để hoàn thiện luận văn Xin chân thành cảm ơn.
1 T.Berners Lee, Godel and Turing Thinking on the Web Published by John - Willey and Sons, 2006 ISBN: 0-471-76814-6
2 A.W.P.Fok and H.H.S Ip: Education Ontologies Constructions for Personalized Learning on the Web
3 Peter Mika Social Networks and the Semantic Web Published by Springer,
4 Grigoris Antoniou and Frank Van Harmelen A Semantic Web Primer Published by MIT Press Cambridge, 2004 ISBN: 0-262-01210-3
5 Jorge Cardoso and Amit P.Sheth Semantic Web Services, Processes and Applications Published by Springer, 2006 ISBN: 987-0-387-34685-4
6 Arthur Tatnall Web Portal: The New Gateways to Internet Information and Services Published by Idea Group Inc., 2006 ISBN: 1-59140-438- X.
7 Semantic Web Portals State of the Art Survey DERI Semantic Web Portal – – Project http://sw-portal.deri.at/
8 Asuncion Gomez Perez, Mariano Fernandez and Oscar Corcho Ontology - Engineering Published by Springer, 2004 ISBN: 1-85233-551-3
9 Dublin Core Metadata Element Set http://dublincore.org/documents/dces/
10.Phạm Minh Quân Hiểu và sử ụ d ng Dublin Core Phòng Tài nguyên thông tin, thư viện Đạ ọi h c Khoa h c t nhiên TP H Chí Minh, 3/2003 ọ ự ồ
11.FOAF Vocabulary Specification 0.9 http://xmlns.com/foaf/0.1/
12.FOAF Project http://www.foaf-project.org
13.Vladan Devedzic Semantic Web and Education Published by Springer, 2006 ISBN: 0-387-35416-6
14.Vladan Devedzic Education and the Semantic Web International Journal of Artificial Intelligence in Education 14 (2004) 39-65 IOS Press
16.Dimitris Kanellopoulos, Sotiris Kotsiantis and Panayiotis Pintelas Ontology- based Learning Applications: A Development Methodology Proceedings of the
24 th IASTED International Multi Conference SOFTWARE ENGINEERING, -February 14-16, 2006, Innsbruck, Austria
17.Connexions: Building Communities and Sharing Knowledge Richard Baraniuk Rice University http://cnx.rice.edu
18.Griff Richards, Rory McGreal, Marek Hatala and Norm Friensen The Evolution of Learning Object Repository Technologies: Portals for On-line Objects for Learning Journal of Distance Education Vol.17, No3, 2002
19.Wolfgang Nejdl and Steffen Staab Edutella: Searching and Annotating Resources within an RDF-based P2P Network Semantic Web Workshop 2002 Honolulu, Hawaii, May 7, 2002
20.Apple W P Fok and Horace HS Ip Personalized Search of Educational Content Based on Multiple Ontologies IEEE International Conference on Volume, Issue, 9-12 July 2006, pages: 2085 – 2088
21.Jelena Jovanovic, Dragan Gasevie, Vladan Devedzie Ontology-Based Automatic Annotation of Learning Content Int’l Journal on Semantic Web & Information Systems, April-June 2006, Pages 91-119
22 T ạ Tuấn Anh, Phạm Huy Giang, Đặng Văn Chuyết Thiết kế Ontology cho một
Cổng thông tin giáo dục cộng đồng Báo cáo tại Hội thảo Quốc gia vềCNTT và Truy n thông lề ần thứ 11, 6/2008, Hu ế
23 T ạ Tuấn Anh, Trần Trung Hùng, Đặng Văn Chuy t Mế ột Hệ thống tư vấn giáo dục dựa trên Ontology và lập luận theo tình huống Báo cáo tại Hội thảo Quốc gia ICT rda về CNTT và Truyền thông do B Khoa h c và Công ngh t ch c, ộ ọ ệ ổ ứ 8/2008, Hà Nội
Tạ Tuấn Anh, Phạm Huy Giang và Đặng Văn Chuyết đã trình bày một Ontology tổng quát nhằm phát triển các cổng thông tin cộng đồng Báo cáo này được trình bày tại Hội thảo Quốc gia về CNTT và Truyền thông do Bộ Khoa học và Công nghệ tổ chức vào tháng 8 năm 2008 tại Hà Nội.
25.The ACM Computing Classification System 1998 Version, valid in 2002, – http://www.acm.org/class/1998/
26.Geneva Henry, Richard Baraniuk, Christopher Kelty The Connexions Projects: Promoting Open Sharing of Knowledge for Education Connexions Projects – http://cnx.rice.edu
27.Anna V.Zhdanova People’s Community Semantic Web Portal and Metaportal DERI - Semantic Web Portal Project April 2004
28 John Holland Lý thuyết chọn ngành ngh ề http://www.careerkey.org/
29.http://www.ischool.washington.edu/sasutton/IEEE1484.html
30.http://www.w3.org/2004/02/skos/core/
Phụ ụ l c 1 Mã nguồn OWL mã hóa ontology BKOnto
The requested URL was not found on this server Please check the link or try again later.
People Class of upper ontology
Con_nguoi
Material Class of upper ontology
Tai_lieu
Linh_vuc dfs:comment rdf:datatype="http://www.w3.org/2001/XMLSchema#string">