Copyright © Wondershare Software Copyright © Wondershare Software NGHIÊN CỨU CÁC GIẢI PHÁP THIẾT KẾ VÀ XÂY DỰNG PHÂN HỆ QUẢN LÝ TÀI NGUYÊN HỌC TẬP CHO HỆ THỐNG E-LEARNING BÁO CÁO NGHIỆM THU ĐỀ TÀI NGHIÊN CỨU KHOA HỌC NỘI DUNG Mô hình Các vấn đề 1 2 3 Mục êu -Mô hình ontology mô tả tri thức của lĩnh vực - Mô hình biểu diễn tài liệu - Mô hình Semantic Document Base - Tổ chức lưu trữ các thành phần của SDB - So khớp đồ thị keyphrase, đo lường mức độ liên quan giữa tài liệu và câu truy vấn. - Xây dựng đồ thị keyphrase biểu diễn tài liệu - Xử lý câu truy vấn - Bài toán tìm kiếm theo ngữ nghĩa Kết luận 4 5 Ứng dụng - Kết quả đạt được - Hạn chế -Hướng phát triển - Thiết kế hệ thống: Mô tả yêu cầu, chức năng; Cấu trúc hệ thống - Cài đặt và thử nghiệm - Chương trình demo - Mục tiêu của đề tài Copyright © Wondershare Software Copyright © Wondershare Software 1. MỤC TIÊU ĐỀ TÀI Mục tiêu Ứng dụng xây dựng hệ thống quản lý tài nguyên học tập lĩnh vực CNTT trong phạm vi của một trường đại học với 2 nhóm chức năng chính: tổ chức quản lý lưu trữ và tìm kiếm (kho tài liệu tiếng Anh) Nghiên cứu xây dựng một giải pháp bao gồm các mô hình, vấn đề, thuật giải, kỹ thuật và qui trình để tổ chức một kho tài nguyên học tập lĩnh vực CNTT theo ngữ nghĩa • cố gắng quản lý được các thông tin ngữ nghĩa liên quan đến nội dung của tài liệu • hỗ trợ biểu diễn và xử lý ngữ nghĩa trong tìm kiếm • cố gắng quản lý được các thông tin ngữ nghĩa liên quan đến nội dung của tài liệu • hỗ trợ biểu diễn và xử lý ngữ nghĩa trong tìm kiếm Copyright © Wondershare Software Copyright © Wondershare Software 2. MÔ HÌNH VÀ GIẢI PHÁP 2 Mô hình biểu diễn tài liệu 31 Mô hình ontology mô tả tri thức lĩnh vực 4 Tổ chức lưu trữ các thành phần của SDB 33 Mô hình cơ sở tài liệu có ngữ nghĩa SDB Copyright © Wondershare Software Copyright © Wondershare Software 5 trong đó, các thành phần được mô tả như sau: K : tập hợp các keyphrase C : tập hợp các lớp keyphrase R KC : tập hợp các quan hệ giữa keyphrase và lớp R CC : tập hợp các quan hệ giữa các lớp R KK : tập hợp các quan hệ giữa các keyphrase label : hàm gán nhãn phân loại keyphrase (K, C, R KC , R CC , R KK , label) Mô hình “Ontology cho các keyphrase được phân lớp” (CK_ONTO) 2.1. MÔ HÌNH ONTOLOGY Copyright © Wondershare Software Copyright © Wondershare Software Keyphrase: Thành phần chính để hình thành các khái niệm của ontology. Một đơn vị ngôn ngữ học cấu trúc như một từ, một từ kép, một ngữ. Sử dụng các keyphrase làm yếu tố đơn vị để mô tả tri thức trong lĩnh vực hay nội dung tài liệu. 6 Cấu trúc: Keyphrase đơn: cấu tạo bằng một đơn vị từ vựng đơn (từ, cụm từ cố định). Ví dụ : “computer”, “network”, “database”, “data structure” Keyphrase tổ hợp: nhiều đơn vị từ vựng đơn kết hợp thành (đẳng lập, chính phụ) Ví dụ: “image processing”, “database programming” Tập hợp K các keyphrase K = {k| k là keyphrase thuộc về lĩnh vực đang xét} K = {k| k là keyphrase thuộc về lĩnh vực đang xét} K = K K = K 1 1 ∪ ∪ K K 2 2 K K 1 1 : tập keyphrasre đơn, K : tập keyphrasre đơn, K 2 2 : tập keyphrase tổ hợp : tập keyphrase tổ hợp K = {k| k là keyphrase thuộc về lĩnh vực đang xét} K = {k| k là keyphrase thuộc về lĩnh vực đang xét} K = K K = K 1 1 ∪ ∪ K K 2 2 K K 1 1 : tập keyphrasre đơn, K : tập keyphrasre đơn, K 2 2 : tập keyphrase tổ hợp : tập keyphrase tổ hợp 2.1. MÔ HÌNH ONTOLOGY (K, C, R KC , R CC , R KK , label) Copyright © Wondershare Software Copyright © Wondershare Software 7 Tập hợp C các lớp keyphrase Mỗi lớp là một tập hợp các keyphrase có liên quan với nhau theo một tính chất hay ngữ nghĩa nào đó. Ví dụ: Lớp DATA STRUCTURE = {stack, queue, contiguous list, linked list, hash table, graph, tree, sorting,…} Một keyphrase có thể thuộc nhiều lớp khác nhau Sự phân lớp trong K được được phân thành nhiều cấp theo mức độ cụ thể của khái niệm tăng dần Tập hợp R KC quan hệ giữa keyphrase và lớp Trong phạm vi đề tài, chỉ xét R KC gồm 1 quan hệ “thuộc về” (r BL ) { | } KC R r r K C= ⊆ × 2.1. MÔ HÌNH ONTOLOGY (tt) (K, C, R KC , R CC , R KK , label) Copyright © Wondershare Software Copyright © Wondershare Software 8 Quan hệ phân cấp trên lớp r HYP Quan hệ có liên quan r RE Tập hợp R CC quan hệ giữa các lớp Trong phạm vi đề tài, xét R CC gồm 2 quan hệ { , } CC HYP RE R r r= 2.1. MÔ HÌNH ONTOLOGY (tt) (K, C, R KC , R CC , R KK , label) { | } CC R r r C C= ⊆ × Copyright © Wondershare Software Copyright © Wondershare Software 9 Nhóm quan hệ tương đương Nhóm quan hệ phân cấp Tập hợp R KK quan hệ trên keyphrase Trong ontology lĩnh vực CNTT, { | } KK R r r K K= ⊆ × { } 25 1 KK i i R r = = 2.1. MÔ HÌNH ONTOLOGY (tt) (K, C, R KC , R CC , R KK , label) Copyright © Wondershare Software Copyright © Wondershare Software 10 Nhóm quan hệ không phân cấp 2.1. MÔ HÌNH ONTOLOGY (tt) (K, C, R KC , R CC , R KK , label) [...]... Wondershare Software 4.2 CẤU TRÚC HỆ THỐNG User Interface: quản lý giao diện người dùng Query Analysis: xử lý thông tin truy vấn Ontology Manager: quản lý ontology Search Engine: xử lý tìm kiếm tài liệu Semantic Collector: lập chỉ mục cho kho tài liệu Semantic Doc Base Manager: bộ quản lý Semantic Document Base Copyright © Wondershare Software ... (GK,GR ,E ) GK ⊂ K : tập các đỉnh keyphrase GR ⊂ RKK : tập các đỉnh quan hệ, biểu diễn cho các mối quan hệ ngữ nghĩa giữa các keyphrase E : tập các cung của đồ thị Mỗi cung chỉ có thể đi từ 1 đỉnh trong G K đến 1 đỉnh trong GR hoặc ngược lại Mỗi đỉnh quan hệ trong GR được xây dựng từ một cạnh trong E và nhãn của cạnh đó Copyright © Wondershare Software 2.2 MÔ HÌNH BIỂU DIỄN TÀI LIỆU (tt) Đồ thị keyphrase... © Wondershare Software 2.2 MÔ HÌNH BIỂU DIỄN TÀI LIỆU Đồ thị keyphrase (KG) định nghĩa trên CK_ONTO là một bộ (GK, E, l) GK ⊂ K : tập khác rỗng các keyphrase, tập các đỉnh của đồ thị E ⊂ GK × GK : tập các cung của đồ thị Mỗi cung biểu thị cho 1 quan hệ ngữ nghĩa giữa 2 đỉnh kề với nó l :E RKK : hàm gán nhãn cho các cung Đồ thị keyphrase mở rộng (Ge) phát sinh từ đồ thị keyphrase G = (GK, E, l)... theo nếu có, thực hiện việc rút trích các keyphrase đặc trưng của tài liệu và biểu diễn (nội dung) tài liệu thành đồ thị keyphrase tương ứng Copyright © Wondershare Software 3 CÁC VẤN ĐỀ (tt) Vấn đề 3: Xử lý câu truy vấn Tương tự như quá trình xử lý tài liệu bao gồm thao tác rút trích tự động keyphrase và thiết lập đồ thị keyphrase cho câu truy vấn Vấn đề 4: Bài toán tìm kiếm theo ngữ nghĩa các tài. .. Đồ thị keyphrase biểu diễn cho tài liệu bên phải 14 Copyright © Wondershare Software 2.3 MÔ HÌNH SEMANTIC DOCUMENT BASE Mô hình cơ sở tài liệu có ngữ nghĩa Mô hình cơ sở tài liệu có ngữ nghĩa (Semantic Document Base - SDB) (Semantic Document Base - SDB) D FS DB CK_ONTO Trong đó: D : Tập hợp các tài liệu, mỗi tài liệu tương ứng một tập tin FS : Mô hình lưu trữ kho tài liệu theo hệ thống thư mục có... TÀI LIỆU Paper: title, keywords, abstract Ebook:title, table of content, preface Dò tìm và so khớp (gần đúng) từng keyphrase có trong ontology 31 Copyright © Wondershare Software VẤN ĐỀ 3: XỬ LÝ CÂU TRUY VẤN Cú pháp của câu truy vấn có dạng: Ví dụ: 32 Copyright © Wondershare Software VẤN ĐỀ 3: XỬ LÝ CÂU TRUY VẤN (tt) 33 Copyright © Wondershare Software VẤN ĐỀ 4: BÀI TOÁN TÌM KIẾM THEO NGỮ NGHĨA... kho tài liệu CK_ONTO : Mô hình ontology mô tả tri thức của lĩnh vực SDB_R : Các hàm liên kết các thành phần SDB_R 15 Copyright © Wondershare Software KHO TÀI LIỆU Thu thập tài liệu: từ các giảng viên, nhà nghiên cứu khoa học, các trung tâm thông tin, thư viện, trường học và từ Internet Kích thước kho: ~ 100 GB, gồm hơn 50.000 tập tin tài liệu (chủ yếu là ebook và paper) Copyright © Wondershare... diễn tài liệu X: tập các tên thư mục f: quan hệ phân cấp thư mục (cha - con) 20 Copyright © Wondershare Software LƯU TRỮ ĐỒ THỊ KEYPHRASE Các đồ thị keyphrase biểu diễn tài liệu được lưu lại theo từng tài liệu trong định dạng plaintext có cấu trúc dựa trên một số từ khóa và qui ước về cú pháp đơn giản 21 Copyright © Wondershare Software 3 CÁC VẤN ĐỀ Vấn đề 1: So khớp đồ thị keyphrase, trên cơ sở đó... NGHĨA 34 Copyright © Wondershare Software 4 ỨNG DỤNG 3 1 Mô tả yêu cầu hệ thống 2 Cấu trúc của hệ thống 3 Vấn đề tìm kiếm theo ngữ nghĩa 4 Vấn đề tổ chức quản lý 3 5 Cài đặt và thử nghiệm Copyright © Wondershare Software 4.1 YÊU CẦU VÀ CHỨC NĂNG Cung cấp kho tài nguyên trung tâm, hỗ trợ chia sẻ bảo quản Tổ chức, phân loại, chú dẫn, tổng hợp tài nguyên theo chuẩn Dublin Core, thư mục qui chuẩn Ontology... giá cho phép chiếu bộ phận chỉ phụ thuộc vào tập đỉnh của H’ và được định nghĩa như phép chiếu Độ tương quan ngữ nghĩa giữa hai đồ thị keyphrase biểu diễn cho câu truy vấn (H) và cho tài liệu (G) được biểu diễn bởi công thức (7): 29 Copyright © Wondershare Software VẤN ĐỀ 1: ĐO LƯỜNG TƯƠNG QUAN NGỮ NGHĨA (tt) Ví dụ: 30 Copyright © Wondershare Software VẤN ĐỀ 2: XÂY DỰNG ĐỒ THỊ KEYPHRASE BIỂU DIỄN TÀI . Software NGHIÊN CỨU CÁC GIẢI PHÁP THIẾT KẾ VÀ XÂY DỰNG PHÂN HỆ QUẢN LÝ TÀI NGUYÊN HỌC TẬP CHO HỆ THỐNG E-LEARNING BÁO CÁO NGHIỆM THU ĐỀ TÀI NGHIÊN CỨU KHOA HỌC NỘI DUNG Mô hình Các vấn đề 1 2 3 Mục. hệ thống quản lý tài nguyên học tập lĩnh vực CNTT trong phạm vi của một trường đại học với 2 nhóm chức năng chính: tổ chức quản lý lưu trữ và tìm kiếm (kho tài liệu tiếng Anh) Nghiên cứu. cứu xây dựng một giải pháp bao gồm các mô hình, vấn đề, thuật giải, kỹ thuật và qui trình để tổ chức một kho tài nguyên học tập lĩnh vực CNTT theo ngữ nghĩa • cố gắng quản lý được các