Kỹ thuật xây dựng ontology trong tích hợp thông tin

Một phần của tài liệu ứng dụng agent phần mềm trong tích hợp thông tin về phương tiện giao thông (Trang 55 - 59)

2.4.2.1 Xây dựng cấu trúc ontology

Quá trình xây dựng ontology dùng cho tích hợp thông tin sử dụng cách tiếp cận lai bao gồm ba giai đoạn chính: xây dựng bộ từ vựng dùng chung, xây dựng các ontology riêngđịnh nghĩa các ánh xạ. Mỗi giai đoạn cần phải hoàn thành một số tác vụ nhất định [3] như trong hình vẽ 2.6.

Giai đoạn một: Xây dựng bộ từ vựng dùng chung: như trong hình 2.6 cho thấy giai đoạn này gồm ba bước chính: phân tích các nguồn thông tin, tìm các thuật ngữ (hoặc các từ gốc) định nghĩa ontology tổng quát.

Bước đầu tiên cần thực hiện phân tích đầy đủ các nguồn thông tin, ví dụ, nguồn thông tin đó lưu giữ những thông tin gì, lưu như thế nào, ý nghĩa của thông tin được lưu giữ (ngữ nghĩa), v.v… Bước này cần xác định các vấn đề về tính không đồng nhất ngữ nghĩa.

Bước 2, tìm các thuật ngữ (hoặc các từ gốc), lựa chọn danh sách các thuật ngữ hoặc các khái niệm phù hợp với bộ từ vựng dùng chung.

Bước 3 và cũng là bước cuối cùng, định nghĩa ontology tổng quát, sử dụng các thuật ngữ trong bước 2 để tạo nên ontology tổng quát.

Hình 2.6. Các bước xây dựng cấu trúc ontology.

Giai đoạn hai: Xây dựng các ontology riêng: như mô tả trong hình 2.6, giai đoạn này gồm hai bước chính: phân tích nguồn thông tinđịnh nghĩa ontology riêng.

Bước đầu tiên cũng tương tự như trong giai đoạn một ở trên: phân tích đầy đủ các nguồn thông tin. Việc phân tích cần thực hiện một cách độc lập và không cần để ý đến các nguồn thông tin khác. Sau đó ta có thể thực hiện bước hai xây dựng nên ontology riêng cho từng nguồn thông tin từ các phân tích chi tiết và độc lập này.

Giai đoạn 3: Định nghĩa các ánh xạ: trong giai đoạn này chúng ta sẽ định nghĩa các ánh xạ (và các mối quan hệ) giữa các khái niệm đã được định nghĩa trong ontology tổng quát cũng như trong các ontology riêng. Giai đoạn này cần giải quyết hết các vấn đề không đồng nhất về ngữ nghĩa tạo sự liên kết giữa hai giai đoạn.

Theo [37], từ vựng chung dùng để biểu diễn các khái niệm có tính chung chung, mang tính chất kết nối giữa các nguồn thông tin. Các khái niệm có tính chất kết nối này là các khái niệm mang ý nghĩa tương đương (hoặc không tương đương nhưng có liên quan đến nhau) trong các nguồn thông tin nhưng có thể được biểu diễn khác nhau trong các ontology cục bộ. Nhiệm vụ của từ vựng chung là phải biểu diễn các khái niệm này một cách thống nhất để có thể ánh xạ với các khái niệm tương đương trong các ontology địa phương. Như vậy, bộ từ vựng chung chính là trung gian trong quá trình chuyển đổi ngữ nghĩa giữa các nguồn thông tin. Phần tiếp theo của luận văn xin trình bày cách xây dựng bộ từ vựng dùng chung.

2.4.2.2 Xây dựng bộ từ vựng dùng chung

Phương pháp xây dựng bộ từ vựng dùng chung dựa theo mô hình bậc thang bao gồm năm bước thực hiện tuần tự như trong hình 2.7. Mỗi bước thực hiện đều góp phần thêm các đặc tả vào ontology dùng chung. Bước cuối cùng là đánh giá các bước trước đó để mở rộng và tinh chỉnh ontology [16].

Bước 1: Tìm các khái niệm cầu nối. Cần tìm ra tất cả các khái niệm có liên quan đến nhau và các khái niệm có tính chất cầu nối. Để tìm được các khái niệm này, ta phải trả lời câu hỏi “cần chuyển đổi thông tin gì?”. Các khái niệm này thường biểu diễn các tri thức chung có thể chuyển đổi giữa các nguồn thông tin, xuất hiện trong tất cả các nguồn thông tin. Để phân loại chính xác chúng ta nên chọn các khái niệm cầu nối càng cụ thể càng tốt.

Hình 2.7. Các bước xây dựng dùng chung.

Bước 2: Định nghĩa các thuộc tính. Bước này định nghĩa các thuộc tính của các khái niệm cầu nối. Cần xác định cụ thể khái niệm nào là lớp và khái niệm nào chỉ là thuộc tính thông qua mức độ chi tiết của khái niệm đó. Ví dụ, một chiếc xe ô tô có thể có các thuộc tính như: màu sắc, nhãn hiệu, giá cả, v.v…

Bước 3: Tìm các giá trị của thuộc tính. Bước này định nghĩa cụ thể kiểu dữ liệu và giá trị của các thuộc tính trong từ vựng chung để có thể ánh xạ với các thuộc tính

trong các ontology riêng. Kiểu dữ liệu này có thể là một trong các kiểu dữ liệu chuẩn hoặc một kiểu đã được định nghĩa

Bước 4: Điều chỉnh bộ từ vựng. Có thể sau khi thực hiện các bước đầu tiên sẽ xuất hiện một số vấn đề, ontology dùng chung chưa định nghĩa đầy đủ hết tất cả các thuật ngữ cần thiết. Do vậy cần phải điều chỉnh ontology để duyệt lại vấn đề, định nghĩa lại các thuật ngữ sao cho rõ ràng và đầy đủ.

Bước 5: Đánh giá và tinh chỉnh các định nghĩa. Bước này tiếp tục sửa đổi hoặc thêm bớt các định nghĩa, ví dụ: tinh chỉnh khái niệm cầu nối hoặc bổ sung thêm các nguyên tắc phân loại vào trong dùng chung.

Kết hợp quá trình xây dựng cấu trúc ontology và các bước xây dựng từ vựng dùng chung, ta có kỹ thuật xây dựng hệ ontology cho tích hợp thông tin tổng quát như sau:

Xác định mục đích và phạm vi của ontology.

Liệt kê các thuật ngữ quan trọng của ontology.

Xây dựng bộ từ vựng dùng chung gồm các bước: tìm các khái niệm cầu nối; định nghĩa các thuộc tính; tìm các giá trị thuộc tính; điều chỉnh từ vựng; đánh giá và tinh chỉnh các định nghĩa.

Xây dựng các ontology cục bộ gồm hai bước: phân tích nguồn thông tin cục bộ và định nghĩa ontology cục bộ.

Định nghĩa các ánh xạ.

Chương tiếp theo của luận văn trình bày về bài toán tích hợp thông tin giao thông sử dụng phương pháp tích hợp dựa trên ontology.

Chương 3 Hệ thống tích hợp thông tin giao thông

Một phần của tài liệu ứng dụng agent phần mềm trong tích hợp thông tin về phương tiện giao thông (Trang 55 - 59)