Mô hình hoạt động của Phân tích cú pháp dựa vào Ontology

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng mô hình chuyển đổi tri thức cho máy chủ web (Trang 64 - 66)

5. Ý nghĩa khoa học và thực tiễn

2.2.3. Mô hình hoạt động của Phân tích cú pháp dựa vào Ontology

Để xác định đƣợc hệ thống phân tích cú pháp dựa vào Ontology hoạt động nhƣ thế nào. Đầu tiên ta cần xác định hệ thống chuyển đổi tri thức dựa vào Ontology sẽ hoạt động nhƣ thế nào để làm tiền đề xây dựng hệ thống phân tích cú pháp.

Hệ thống chuyển đổi tri thức dựa vào Ontology bao gồm hai phần: Xử lý dữ liệu Ontology (bao gồm máy chủ ontology, nguồn dữ liệu, đơn vị xử lý tài liệu và cơ sở dữ liệu) và Truy xuất dữ liệu ontology (bao gồm máy chủ ontology, chuyển đổi truy vấn, quy trình tùy chỉnh và tác nhân truy xuất).

Xử lý dữ liệu Ontology: Sẽ đảm nhận nhiệm vụ xử lý dữ liệu của tài liệu đƣợc sử dụng, tiến hành phân tích đƣa dữ liệu vào cơ sở dữ liệu và thông qua các truy vấn có thể đƣợc tùy chỉnh để tiến hành kết nối với máy chủ Ontology chuyển đổi các truy vấn thành dữ liệu ngƣời dùng cần. Quá trình này đƣợc thể hiện trong Hình 2.9.

Truy xuất dữ liệu Ontology: Đảm nhận nhiệm vụ xử lý tài liệu đƣợc sử dụng để trích xuất thông tin từ một hệ thống không có cấu trúc nhất định và xác lập quan hệ giữa các thuật ngữ và các khái niệm của tài liệu dựa trên máy chủ Ontology. Quá trình truy xuất này đƣợc thể hiện trong Hình 2.10.

Hình 2.5. Mô hình truy xuất dữ liệu Ontology [21]

Trong quá trình xử lý mỗi tài liệu trong bộ tài liệu sẽ triển khai từ vựng, phân tích từ và lọc số, dấu gạch ngang và dấu câu. Sử dụng danh sách từ dừng loại bỏ các từ chức năng để lại các từ hữu ích nhƣ danh từ và động từ. Việc trích xuất các từ gốc và loại bỏ tiền tố và hậu tố để cải thiện độ chính xác của việc truy xuất. Cuối cùng, việc xác định một số từ ngữ làm thành phần chính để thể hiện nội dung.

Parser Query: Sẽ kiểm tra các truy vấn đầu vào và tạo ra Cây truy

vấn theo quy tắc Heuristic.

Query Analysis: Tiến hành kiểm tra cây truy vấn theo từng Node trên

cây. Đầu ra của thuật toán này có thể là:

- Trọng tâm của truy vấn.

- Yêu cầu ngƣời dùng cung cấp thêm thông tin của yêu cầu để chỉ định truy vấn.

- Trả về kết quả kiểm tra sai khi không tìm thấy các Node và các yêu cầu của ngƣời dùng.

Data field to find: xác định Khái niệm của trƣờng dữ liệu ontology đầu

tiên trong câu hỏi thuộc về lớp hoặc loại thuộc tính kiểu dữ liệu. Điều này là do loại câu trả lời cuối cùng đề cập đến một trong hai loại khái niệm này trong ontology. Do đó, nếu yêu cầu của ngƣời dùng đề cập đến các loại khái niệm bản thể học khác, thì quy trình nhƣ sau:

- Nếu yêu cầu đề cập đến thuộc tính đối tƣợng: thực hiện hợp nhất với các lớp miền hoặc phạm vi của thuộc tính này

- Nếu yêu cầu đề cập đến một cá thể: thực hiện hợp nhất với một lớp của cá thể đó.

Check – Merge: Đối với mỗi truy vấn, mục tiêu là xác định loại câu trả

lời. Hợp nhất là một nỗ lực để đạt đƣợc điều này bằng cách hợp nhất đầu ra của Query Analysis/ Data field to find.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu xây dựng mô hình chuyển đổi tri thức cho máy chủ web (Trang 64 - 66)

Tải bản đầy đủ (PDF)

(105 trang)