MỤC TIÊU VÀ KIẾN TRÚC CỦA HỆ THỐNG

Một phần của tài liệu Nghiên cứu cải tiến giải pháp thiết kế hệ hỗ trợ tìm kiếm theo ngữ nghĩa trên kho tài liệu khoa học máy tính (Trang 85)

- Phần thứ hai là tìm kiếm nâng cao theo các khóa dữ liệu mô tả thuộc tính của tài liệu Để hỗ trợ cho việc tìm kiếm nhanh chóng và chính xác hơn, hệ thống đưa ra

CÀI ĐẶT – THỬ NGHIỆM

4.1. MỤC TIÊU VÀ KIẾN TRÚC CỦA HỆ THỐNG

4.1.1. Mục tiêu ứng dụng

Mục tiêu của ứng dụng là xây dựng một hệ thống quản lý kho tài nguyên học tập lĩnh vực KHMT trong phạm vi một trường đại học. Hệ thống được xây dựng trên cơ sở tương tác giữa người sử dụng với hệ thống để phục vụ chính người sử dụng. Ứng dụng được cài đặt trên web cho phép người sử dụng tìm kiếm và chọn lựa các tài nguyên được số hoá. “Chương trình quản lý kho tài nguyên học tập” thuộc vào loại chương trình hỗ trợ giáo dục, trong đó cung cấp những công cụ mới cho người quản lý, cán bộ giảng dạy, các nhà nghiên cứu khoa học, sinh viên, học viên và các chuyên gia CNTT nhằm tạo nên một môi trường giảng dạy, học tập, nghiên cứu cũng như chia sẻ và khai thác tri thức hiệu quả. Hệ thống được xây dựng với các mục tiêu chính sau:

• Cung cấp kho tài nguyên trung tâm cho các tài nguyên được số hoá, hỗ trợ việc chia sẻ các nguồn tài nguyên và làm nơi bảo tồn, duy trì các công trình số hoá này.

• Cung cấp hệ thống thông tin số có khả năng tổ chức, phân loại, chú dẫn và tổng hợp các tài nguyên theo chuẩn Dublin Core.

• Tạo nên giao diện duy nhất và thống nhất cho người sử dụng cùng truy cập, tra cứu, tìm kiếm các tài nguyên để hỗ trợ nguồn thông tin cho các bài giảng, công việc học tập, tham khảo của sinh viên và công tác nghiên

cứu khoa học. Đây cũng là mục tiêu hàng đầu của chương trình là làm thế nào để cung cấp kiến thức cho người sử dụng một cách nhanh chóng và tiện lợi nhất, thoả mãn tốt nhất nhu cầu khai thác thông tin trong giảng dạy, học tập và nghiên cứu.

• Đảm bảo việc thống nhất các quy trình bổ sung thông tin, CSDL, bộ sưu tập điện tử cũng như việc lưu trữ và quản lý tập trung các nguồn tài nguyên này.

4.1.2. Kiến trúc của hệ thống

Kiến trúc của hệ thống đã được thiết kế để hỗ trợ phát triển, quản lý và khai thác tài nguyên giáo dục, gồm có các thành phần chính sau:

User Interface: dùng để giao tiếp giữa người sử dụng và hệ thống. Giao diện phải đẹp, tiện dụng, phù hợp với người dùng. Nhu cầu thông tin của người sử dụng được đưa vào hệ thống dưới dạng một câu truy vấn bằng ngôn ngữ tự nhiên hay một dạng thức qui ước nào đó. User Interface sẽ thực hiện vai trò tiếp nhận câu truy vấn, hiển thị câu truy vấn sau khi đã được chuẩn hóa và yêu cầu chọn lựa các chức năng tìm kiếm, hiển thị kết quả truy vấn trả về của hệ thống cùng với những đề xuất tinh chỉnh câu truy vấn nếu có.

Query Analysis: phân tích dữ liệu được nhập vào, phân tích yêu cầu truy vấn, thực hiện việc chuẩn hóa và yêu cầu sự tinh chỉnh câu truy vấn nếu có, phân tích ngữ nghĩa và biểu diễn câu truy vấn người dùng bởi một cấu trúc đơn giản như một danh sách các từ khóa hay một đồ thị keyphrase giàu ngữ nghĩa hơn tùy thuộc vào chức năng tìm kiếm được lựa chọn. Kết quả của giai đoạn này là một cấu trúc đặc tả cho câu truy vấn của người dùng được dùng làm input cho bộ Semantic Search Engine của hệ thống.

File system: Kho lưu trữ các tài liệu học tập được tổ chức theo hệ thống thư mục có quy chuẩn.

Database: CSDL cho kho tài liệu, lưu trữ các thông tin mô tả tài liệu cơ bản như nhan đề, tác giả, loại hình tài liệu , …

Hình 4.1. Mô hình kiến trúc hệ thống quản lý kho tài nguyên theo ngữ nghĩa  File Semantics: Các đồ thị biểu diễn ngữ nghĩa của tài liệu.

Ontology: Ontology cho miền tri thức về lĩnh vực CNTT.

Ontology Manager: Bộ quản lý Ontology cho phép tổ chức lưu trữ, cập nhật và tìm kiếm trên Ontology.

Semantic Search Engine: Xử lý tìm kiếm tài liệu theo yêu cầu của người dùng, truy vấn các siêu dữ liệu từ Semantic Doc Base để trả về cho User Interface các tài liệu thỏa yêu cầu tìm kiếm. Câu truy vấn và tập dữ liệu sẽ được phân tích và biểu diễn thành một dạng biểu diễn bên trong. Hệ thống sẽ sử dụng một hàm so khớp để so khớp biểu diễn của câu truy vấn với tập chỉ mục đã lập của các tài liệu để đánh giá độ liên quan của các tài liệu với câu truy vấn và trả về các tài liệu liên

quan, được xếp hạng theo thứ tự về mức độ liên quan của các tài liệu với câu truy vấn. Động cơ tìm kiếm có thể tương tác với người dùng thông qua giao diện User Interface, để có thể hiệu chỉnh dần kết quả trả về cho phù hợp với nhu cầu thông tin tìm kiếm của người dùng.

Semantic Collector: Xử lý, rút trích siêu dữ liệu mô tả tài nguyên, mô tả mối quan hệ giữa các tài nguyên với các đối tượng trong Ontology, thực hiện việc lập chỉ mục cho kho tài liệu. Lập chỉ mục là giai đoạn phân tích tài liệu để rút trích các đơn vị thông tin cần thiết mô tả tài liệu, biểu diễn lại tài liệu bởi các đơn vị thông tin đó và tổ chức thành CSDL riêng để có thể tìm kiếm trên đó một cách nhanh chóng, hiệu quả.

Semantic Doc Base Manager - Bộ quản lý Semantic Doc Base: Tổ chức lưu trữ, cập nhật, theo dõi các sự kiện liên quan đến hệ thống tập tin như thêm, xóa một tài liệu, sửa đổi nội dung hay thuộc tính tài liệu, sửa đổi thư mục lưu trữ tài liệu, … Trong trường hợp thêm một tài liệu mới, bộ quản lý này sẽ gọi lại Semantic Collector để rút trích các thông tin ngữ nghĩa và biểu diễn tài liệu dựa trên các thông tin này.

Một phần của tài liệu Nghiên cứu cải tiến giải pháp thiết kế hệ hỗ trợ tìm kiếm theo ngữ nghĩa trên kho tài liệu khoa học máy tính (Trang 85)