Vai trò của Ontology trong tích hợp thông tin

Một phần của tài liệu ứng dụng agent phần mềm trong tích hợp thông tin về phương tiện giao thông (Trang 51 - 55)

Như trong đã trình bày ở trên, ontology được định nghĩa là “một đặc tả rõ ràng và chính xác của một khái niệm phức tạp” [50]. Do vậy có thể sử dụng ontology trong tích hợp để mô tả ngữ nghĩa của các nguồn thông tin cũng như xác định và kết hợp các khái niệm tương đương về mặt ngữ nghĩa [20].

Sử dụng ontology trong tích hợp dữ liệu có rất nhiều thuận lợi như sau [3]: ontology cung cấp một bộ từ vựng đầy đủ được định nghĩa từ trước và độc lập với các lược đồ CSDL; những tri thức được biểu diễn bởi ontology mang tính toàn diện và hỗ trợ tốt cho việc chuyển đổi giữa tất cả các nguồn thông tin có liên quan; ontology cũng hỗ trợ việc quản lý nhất quán và nhận dạng các dữ liệu không nhất quán; v.v…

Theo H. Wache và H. Stuckenschmidt [19], [20], trong hầu hết các phương pháp tích hợp dựa trên ontology đều sử dụng các ontology để diễn tả ngữ nghĩa của nguồn thông tin. Có rất nhiều cách khác nhau để thực thi ontology trong đó có ba hướng tiếp cận chính là đơn ontology, đa ontology và cách tiếp cận lai.

2.4.1.1 Cách tiếp cận đơn ontology

Cách tiếp cận đơn ontology sử dụng một ontology tổng quát cung cấp bộ từ vựng dùng chung để xác định ngữ nghĩa, tất cả các nguồn thông tin đều liên quan trực tiếp đến một ontology tổng quát này (hình 2.3).

Có thể áp dụng cách tiếp cận đơn ontology cho bài toán tích hợp trong trường hợp tất cả các nguồn thông tin cần tích hợp có các mức thể hiện dữ liệu khá giống nhau trong cùng một lĩnh vực (mức độ chi tiết giống nhau). Nếu một nguồn thông tin biểu diễn dữ liệu hơi khác so với các nguồn thông tin khác trong một lĩnh vực, ví dụ, khác mức độ chi tiết, khi đó sẽ rất khó tìm ra giao kết ontology tối thiểu. Ví dụ, nếu hai nguồn thông tin đều cung cấp các đặc tả chi tiết về sản phẩm nhưng lại tham khảo từ hai danh mục sản phẩm khác nhau hoàn toàn, khi đó sẽ rất khó để phát triển lên một ontology tổng quát từ hai danh mục sản phẩm khác nhau. Tích hợp các nguồn thông tin tham chiếu tới các danh mục sản phẩm tương tự nhau dễ dàng hơn nhiều. Hơn nữa, cách tiếp cận đơn ontology cũng dễ dàng bị ảnh hưởng khi các nguồn thông tin thay đổi do nó ảnh hưởng đến quá trình khái niệm hóa các lĩnh vực được biểu diễn trong ontology. Khi một nguồn thông tin thay đổi có thể dẫn đến việc thay đổi ontology tổng quát và ánh xạ đến các nguồn thông tin khác.

2.4.1.2 Cách tiếp cận đa ontology

Trong cách tiếp cận đa ontology, mỗi nguồn thông tin được miêu tả bởi ontology của riêng nó (hình 2.4). Có thể thấy ngay thuận lợi của cách tiếp cận này là không cần đến giao kết chung và tối thiểu cho một ontology tổng quát. Có thể phát triển riêng mỗi ontology nguồn mà không cần quan tâm đến các nguồn khác cũng như các ontology của chúng - không cần phải có ontology chung cho tất cả các nguồn.

Hình 2.4. Cách tiếp cận đa ontology.

Có thể dễ dàng thay đổi kiến trúc ontology trong cách tiếp cận đa ontology, ví dụ, sửa đổi trong một nguồn thông tin, thêm hoặc bớt thông tin trong các nguồn. Tuy nhiên trên thực tế sẽ cực kỳ khó để đối chiếu giữa các ontolog nguồn khác nhau nếu thiếu một bộ từ vựng chung. Để giải quyết vấn đề này cần có cách biểu diễn sự ánh xạ giữa các ontology. Ánh xạ này xác định các thuật ngữ tương đương về mặt ngữ nghĩa giữa các ontology nguồn khác nhau, và xem xét các mức độ dữ liệu khác nhau trong cùng một lĩnh vực ví dụ như xem xét các khái niệm ontology ở các mức chi tiết và mức kết hợp khác nhau. Nhưng trong thực tiễn rất khó để định nghĩa rõ ánh xạ giữa các ontology bởi vì có quá nhiều vấn đề về sự không đồng nhất ngữ nghĩa.

2.4.1.3 Cách tiếp cận lai

Cách tiếp cận lai là sự kết hợp của hai cách tiếp cận đơn ontology và đa ontology nhằm khắc phục những hạn chế của chúng (hình 2.5). Tương tự như cách tiếp cận đa ontology, mỗi nguồn thông tin có ontology riêng, các ontology này không được ánh xạ tới các ontology cùng cấp mà ánh xạ tới một ontology dùng chung tổng quát để có thể so sánh được các ontology nguồn với nhau. Bộ từ vựng dùng chung chứa các thuật ngữ cơ bản (thuật ngữ gốc) của một lĩnh vực.

Để xây dựng các thuật ngữ phức tạp của một ontology nguồn, người ta kết hợp các từ gốc bằng một số toán tử. Các toán tử kết hợp này cũng tương tự như các toán tử trong biểu diễn logic, nhưng được mở rộng cho các yêu cầu đặc biệt trong tích hợp các nguồn thông tin. Mỗi thuật ngữ của ontology nguồn được xây dựng dựa trên từ gốc do vậy có thể dễ dàng đối chiếu các thuật ngữ hơn so với cách tiếp cận đa ontology. Đôi khi bộ từ vựng dùng chung cũng là một ontology.

Hình 2.5. Cách tiếp cận lai.

Thuận lợi của cách tiếp cận lai là có thể dễ dàng thêm các nguồn thông tin mới vào hệ thống mà không cần sửa đổi các ánh xạ hoặc bộ từ vựng chung, hỗ trợ sự phát triển và tiến hóa của các ontology, do đó phù hợp với các ứng dụng có các nguồn thông tin hay thay đổi. Việc sử dụng bộ từ vựng chung giúp chúng ta có thể đối chiếu giữa các ontology nguồn và tránh được nhược điểm của cách tiếp cận đa ontology. Tuy nhiên, phương pháp này cũng có điểm hạn chế đó là rất khó tái sử dụng các ontology có sẵn từ trước mà phải quy hoạch lại từ nhiều nguồn hỗn tạp bởi tất cả các ontology nguồn đều phải tham chiếu đến bộ từ vựng dùng chung.

Trong ba hướng tiếp cận trên, tiếp cận đơn ontology và tiếp cận lai phù hợp trong xây dựng hệ thống tích hợp dữ liệu trung tâm. Tuy nhiên cách tiếp cận đơn ontology có hạn chế là các nguồn thông tin phải có các mức dữ liệu gần tương đương nhau, hơn nữa rất khó duy trì khi cần thêm các nguồn thông tin mới vào hệ thống. Trong khi đó kiến trúc lai linh động hơn, cho phép chúng ta dễ dàng thêm các nguồn

thông tin mới vào hệ thống. Cách tiếp cận đa ontology thích hợp nhất khi xây dựng các hệ thống tích hợp dữ liệu ngang hàng, không có nguồn thông tin mức cao.

Với cách tiếp cận lai, quá trình tích hợp thông tin sẽ diễn ra một cách tự động thông qua các khái niệm được định nghĩa trong từ vựng chung và các ánh xạ giữa những khái niệm này và các khái niệm tương ứng trong các ontology cục bộ [16]. Mặt khác, với việc sử dụng bộ từ vựng chung đã giải quyết được vấn đề không đồng nhất về ngữ nghĩa do: bộ vựng chung dùng một từ thống nhất để thay cho tất cả các từ đồng nghĩa nên các từ đồng nghĩa này sẽ được ánh xạ tương đương; vấn đề từ đồng âm khác nghĩa không xảy ra do chỉ khái niệm nào có ngữ nghĩa tương tương thì mới được định nghĩa ánh xạ, các khái niệm không tương đương sẽ không có ánh xạ tương ứng; với các từ có ngữ nghĩa liên quan, các ánh xạ sẽ định nghĩa cụ thể mối quan hệ này. Do vậy mà nhiều nghiên cứu đã khẳng định cách tiếp cận lai là cách tiếp cận phù hợp nhất để xây dựng ontology cho mục đích tích hợp thông tin [3], [16], [20], [29].

Một phần của tài liệu ứng dụng agent phần mềm trong tích hợp thông tin về phương tiện giao thông (Trang 51 - 55)