Ontology trong tích hợp thông tin không thuần nhất về ngữ nghĩa

Một phần của tài liệu TÍCH HỢP THÔNG TIN KHÔNG THUẦN NHẤT VỀ NGỮ NGHĨA TRONG MÔI TRƯỜNG PHÂN TÁN (Trang 28)

thông tin thống kê.

2.1 Ontology trong tích hợp thông tin không thuần nhất về ngữ nghĩa về ngữ nghĩa

Một trong những vấn đề khó khăn mà các nhà phát triển cần phải vượt qua trong quá trình xây dựng các hệ thống tích hợp thông tin là sự phân tán và không thuần nhất về ngữ nghĩa của các nguồn dữ liệu ([7],[10],[45]). Ở mức ngữ nghĩa, sự không thuần nhất của các nguồn dữ liệu xuất hiện khi có sự khác nhau trong biểu diễn thông tin trong những ngữ cảnh khác nhau. Theo Goh ([25]), có ba nguyên nhân chính tạo nên sự không thuần nhất về ngữ nghĩa:

 Mâu thuẫn về nghĩa (confounding conflicts): xuất hiện khi các đối tượng thông tin dường như có cùng một nghĩa nhưng thực ra lại khác nhau trong thực tế.

 Mâu thuẫn về tỉ lệ (scaling conflicts): xuất hiện khi những hệ thống tham chiếu khác nhau được dùng để đo giá trị của một đối tượng. Ví dụ như hệ thống tiền tệ của thế giới.

 Mâu thuẫn về tên (naming conflicts): xuất hiện khi việc đặt tên cho cùng một đối tượng trong các hoàn cảnh khác nhau là thực sự khác nhau. Một hiện tượng quen thuộc cho xung đột này chính là việc sử dụng các từ đồng nghĩa.

Sử dụng ontology để giải thích các khái niệm và các mối quan hệ là một cách tiếp cận khả thi trong việc giải quyết các vấn đề không thuần nhất về ngữ nghĩa. Ontology [16] được áp dụng trong việc thống nhất các thuật ngữ trong chức năng và cấu trúc sinh học của con người nhằm tạo nên các ứng dụng trong việc huấn luyện giải phẫu dựa trên mô phỏng. Trong đó, ontology phản ánh những đối tượng và quan hệ của các đối tượng trong hệ thống. Ngoài ra, trong khoa học về con người, việc xây dựng một ontology còn tạo nên ý thức về việc thống nhất hệ thống từ vựng nhằm cung cấp các định nghĩa chuẩn cho các đối tượng của hệ thống.

OntoMedia [31] là một ontology biểu diễn của dữ liệu đa phương tiện (hình ảnh, âm thanh, video) không thuần nhất, nó cho phép người sử dụng có thể truy vấn thông tin dựa trên ngữ nghĩa và xây dựng khả năng tương tác giữa các nguồn dữ liệu đa phương tiện. OntoMedia được thiết kế dựa theo thực thể và sự kiện. Hai lớp này biểu diễn những thành phần và các tình huống xuất hiện của các thành phần. Dựa trên OntoMedia, các nhà phát triển web ngữ nghĩa [15] có được nền tảng phát triển trong việc tích hợp các thông tin đa phương tiện.

Như vậy, đối với các nhà nghiên cứu, ontology cung cấp các định nghĩa chung cho các đối tượng trong cùng một miền thông tin, nó bao gồm định nghĩa của các khái niệm cơ bản mà máy tính có thể hiểu được và mối quan hệ giữa các khái niệm cơ bản đó [44]. Phần tiếp theo chúng ta sẽ tìm hiểu định nghĩa hình thức của ontology và các lí do sử dụng ontology trong việc thuần nhất ngữ nghĩa.

Một phần của tài liệu TÍCH HỢP THÔNG TIN KHÔNG THUẦN NHẤT VỀ NGỮ NGHĨA TRONG MÔI TRƯỜNG PHÂN TÁN (Trang 28)