Thuận lợi của cách tiếp cận lai là có thể dễ dàng thêm các nguồn thông tin mới vào hệ thống mà không cần sửa đổi các ánh xạ hoặc bộ từ vựng chung, hỗ trợ sự phát triển và tiến hóa của các ontology, do đó phù hợp với các ứng dụng có các nguồn thông tin hay thay đổi. Việc sử dụng bộ từ vựng chung giúp chúng ta có thể đối chiếu giữa các ontology nguồn và tránh được nhược điểm của cách tiếp cận đa ontology. Tuy nhiên, phương pháp này cũng có điểm hạn chế đó là rất khó tái sử dụng các ontology có sẵn từ trước mà phải quy hoạch lại từ nhiều nguồn hỗn tạp bởi tất cả các ontology nguồn đều phải tham chiếu đến bộ từ vựng dùng chung.
Trong ba hướng tiếp cận trên, tiếp cận đơn ontology và tiếp cận lai phù hợp trong xây dựng hệ thống tích hợp dữ liệu trung tâm. Tuy nhiên cách tiếp cận đơn ontology có hạn chế là các nguồn thơng tin phải có các mức dữ liệu gần tương đương nhau, hơn nữa rất khó duy trì khi cần thêm các nguồn thông tin mới vào hệ thống. Trong khi đó kiến trúc lai linh động hơn, cho phép chúng ta dễ dàng thêm các nguồn thông tin mới vào hệ thống. Cách tiếp cận đa ontology thích hợp nhất khi xây dựng các hệ thống tích hợp dữ liệu ngang hàng, khơng có nguồn thơng tin mức cao.
46
Với cách tiếp cận lai, q trình tích hợp thơng tin sẽ diễn ra một cách tự động thông qua các khái niệm được định nghĩa trong từ vựng chung và các ánh xạ giữa những khái niệm này và các khái niệm tương ứng trong các ontology cục bộ [16]. Mặt khác, với việc sử dụng bộ từ vựng chung đã giải quyết được vấn đề không đồng nhất về ngữ nghĩa do: bộ vựng chung dùng một từ thống nhất để thay cho tất cả các từ đồng nghĩa nên các từ đồng nghĩa này sẽ được ánh xạ tương đương; vấn đề từ đồng âm khác nghĩa khơng xảy ra do chỉ khái niệm nào có ngữ nghĩa tương tương thì mới được định nghĩa ánh xạ, các khái niệm không tương đương sẽ khơng có ánh xạ tương ứng; với các từ có ngữ nghĩa liên quan, các ánh xạ sẽ định nghĩa cụ thể mối quan hệ này. Do vậy mà nhiều nghiên cứu đã khẳng định cách tiếp cận lai là cách tiếp cận phù hợp nhất để xây dựng ontology cho mục đích tích hợp thơng tin [3], [16], [20], [29].
2.4.2 Kỹ thuật xây dựng ontology trong tích hợp thơng tin
2.4.2.1 Xây dựng cấu trúc ontology
Quá trình xây dựng ontology dùng cho tích hợp thơng tin sử dụng cách tiếp cận lai bao gồm ba giai đoạn chính: xây dựng bộ từ vựng dùng chung, xây dựng các ontology riêng và định nghĩa các ánh xạ. Mỗi giai đoạn cần phải hoàn thành một số
tác vụ nhất định [3] như trong hình vẽ 2.6.
Giai đoạn một: Xây dựng bộ từ vựng dùng chung: như trong hình 2.6 cho
thấy giai đoạn này gồm ba bước chính: phân tích các nguồn thơng tin, tìm các thuật ngữ (hoặc các từ gốc) và định nghĩa ontology tổng quát.
Bước đầu tiên cần thực hiện phân tích đầy đủ các nguồn thơng tin, ví dụ, nguồn thơng tin đó lưu giữ những thơng tin gì, lưu như thế nào, ý nghĩa của thông tin được lưu giữ (ngữ nghĩa), v.v… Bước này cần xác định các vấn đề về tính khơng đồng nhất ngữ nghĩa.
Bước 2, tìm các thuật ngữ (hoặc các từ gốc), lựa chọn danh sách các thuật ngữ hoặc các khái niệm phù hợp với bộ từ vựng dùng chung.
Bước 3 và cũng là bước cuối cùng, định nghĩa ontology tổng quát, sử dụng các thuật ngữ trong bước 2 để tạo nên ontology tổng quát.
47