Tổng quan về logi mô tả và ứng dụng

đặc ựiểm tiêu biểu của Logic mô tả là khả năng biểu diễn các loại quan hệ khác nhau giữa các khác niệm trong một miền ứng dụng mà trong ựó các biểu thức ựược xây dựng từ các khái niệm ng

TỔNG QUAN VỀ LOGIC MÔ TẢ

Giới thiệu

Biểu diễn tri thức là một nhánh của trí tuệ nhân tạo (AI), chuyên thiết kế các hình thức mô tả tri thức trong một miền ứng dụng thông qua việc xác định các lớp đối tượng và mối quan hệ giữa chúng Tổ chức thông tin thành các lớp giúp mô tả miền ứng dụng một cách hiệu quả, đồng thời cải thiện khả năng suy diễn và thực thi công việc.

Nghiên cứu logic mô tả bao gồm cơ sở lý thuyết, thực thi các hệ thống mô tả tri thức và ứng dụng của chúng trong nhiều lĩnh vực.

Vào năm 1970, lĩnh vực biểu diễn tri thức bắt đầu được tiếp cận thông qua mạng ngữ nghĩa và các hệ thống khung Tuy nhiên, những hệ thống này thiếu định nghĩa rõ ràng và các công cụ suy diễn chủ yếu dựa vào chiến lược thực hiện Sự ra đời của hệ thống KL-ONE đã cung cấp cơ sở logic cho việc phiên dịch các lớp đối tượng và mối quan hệ, đánh dấu sự hình thành của một hướng tiếp cận mô tả tri thức mới.

Ban ủầu, logic mụ tả (DL) được biết đến với tên gọi “các hệ thống thuật ngữ” (terminological systems) hoặc “ngôn ngữ khái niệm” (concept languages) Sau này, khi sự chú ý chuyển hướng vào các tính chất của hệ thống logic, cái tên này đã được điều chỉnh để phản ánh sự phát triển trong lĩnh vực nghiên cứu.

“logic mô tả” (description logic) mới trở nên phố biến

Từ năm 1989, hội thảo về logic mù tả diễn ra hai năm một lần, nhưng từ năm 1994, sự kiện này được tổ chức hàng năm Đến năm 1997, tất cả các khía cạnh liên quan đến logic mù tả, bao gồm lý thuyết, thực hiện và ứng dụng, đã được đề xuất một cách đầy đủ.

Lĩnh vực biểu diễn tri thức được chia thành hai loại chính: logic hình thức, nơi suy diễn dựa vào phép tính vị từ, và phi logic, dựa trên sự mô tả và phát triển từ các khái niệm liên quan đến nhận thức.

Trong cách tiếp cận thứ nhất, ngôn ngữ mô tả được xem như một biến thể của phép tính vị từ cấp một, với suy diễn chủ yếu là kiểm tra kết quả logic Ngược lại, trong cách tiếp cận phi logic, tri thức được biểu diễn thông qua ngữ nghĩa của cấu trúc dữ liệu đặc biệt, và quá trình suy diễn được hoàn thành bằng các thủ tục cụ thể, thao tác trên cấu trúc dữ liệu đó.

Sự phân loại này giúp chúng ta nhận diện các mạng ngữ nghĩa và hệ thống khung, mặc dù có sự khác nhau giữa hai loại hệ thống này Cả hai đều được xem là các mạng có cấu trúc, biểu diễn một tập các khả thể và mối liên hệ của chúng Do đó, thuật ngữ “mạng cấu trúc” (network-based structures) được sử dụng để chỉ các mạng ngữ nghĩa và hệ thống khung.

Với nhu cầu ngày càng tăng của con người, các mạng cấu trúc đang trở nên hấp dẫn và có ảnh hưởng hơn so với các hệ thống logic Tuy nhiên, chúng vẫn chưa đáp ứng đầy đủ nhu cầu của người dùng do thiếu tính chính xác trong việc mô tả ngữ nghĩa Trong nhiều trường hợp, các thành phần và tên gọi của các mối quan hệ thường bị lẫn lộn Để cung cấp ngữ nghĩa chính xác nhằm mô tả tri thức trong các mạng cấu trúc, cần tiến hành khai thác các khái niệm một cách có hệ thống, bao gồm cả các thuật ngữ không bị ràng buộc mô tả và các thuật ngữ có tầm ảnh hưởng đến khả năng suy diễn.

Để nhận diện một hệ thống mạng ngữ nghĩa, cần chú ý đến các đặc điểm chính của nó, dựa vào logic vị từ cấp một [Hayes, 1979] Các thành phần cơ bản trong mô tả được biểu diễn bao gồm vị từ một ngôi, thể hiện bằng một tập các cá thể, và vị từ hai ngôi, phản ánh các mối quan hệ giữa các cá thể.

1.1.3 Các bước xây dựng một hệ thống logic mô tả

Logic mô tả được phát triển từ mạng kế thừa cấu trúc, nhằm khắc phục tính nhập nhằng của các hệ thống mạng ngữ nghĩa trước đây Hệ thống KL-ONE là một trong những ứng dụng đầu tiên của logic mô tả Để xây dựng một hệ thống logic mô tả, cần thực hiện các bước cụ thể theo quy trình đã được xác định.

Xây dựng bộ cú pháp cơ bản là các khái niệm nguyên tố, các vai trò nguyên tố và các cá thể (các thể hiện)

Xõy dựng cỏc khỏi niệm và vai trũ phức tạp dựa vào sức mạnh diễn ủạt của ngôn ngữ mô tả

Sử dụng các thủ tục suy diễn giúp làm rõ tri thức tiềm ẩn liên quan đến các khái niệm và cá thể Điều này đặc biệt quan trọng trong việc hiểu rõ mối quan hệ bao hàm giữa hai khái niệm cũng như mối quan hệ giữa các cá thể và khái niệm.

1.1.4 ðặc ủiểm của logic mụ tả ðặc ủiểm tiờu biểu của Logic mụ tả là khả năng biểu diễn cỏc loại quan hệ khỏc nhau giữa cỏc khỏc niệm trong một miền ứng dụng mà trong ủú cỏc biểu thức ủược xây dựng từ các khái niệm nguyên tố và các vai trò nguyên tố Nó khác với các ngụn ngữ logic khỏc ở chỗ, DL ủược trang bị cơ sở logic dựa trờn ngữ nghĩa Do ủú, các hệ thống biểu diễn tri thức dựa trên DLs cung cấp cho người sử dụng nó các khả năng suy diễn khỏc nhau ủể tỡm ủược tri thức tỡm ẩn từ cỏc tri thức ủược mụ tả 1.1.5 Các miền ứng dụng

Logic mũ ngày càng phát triển và được ứng dụng rộng rãi trong nhiều hệ thống ở nhiều lĩnh vực khác nhau Một số miền ứng dụng tiêu biểu của logic mũ có thể kể đến như: trí tuệ nhân tạo, phân tích dữ liệu, và tự động hóa quy trình.

 Xây dựng phần mềm (Software engineering)

4 ngày là miền ứng dụng ưu tiên của Logic mô tả, với ý tưởng cơ bản là xây dựng dữ liệu để thực hiện hệ thống thông tin phần mềm Hệ thống này hỗ trợ phát triển phần mềm bằng cách tìm kiếm thông tin trong một hệ thống phần mềm rộng lớn.

Kiến trúc tổng quát của một hệ thống mô tả

Hệ thống biểu diễn tri thức dựa trên logic mô tả cho phép thiết lập cơ sở tri thức để suy diễn và thực hiện các tác vụ liên quan.

Hỡnh 1.1 dưới ủõy mụ tả kiến trỳc chung của một hệ logic mụ tả ([1]- trang 46)

Cơ sở tri thức K = bao gồm hai thành phần chính là “Bộ thuật ngữ” TBox T và “Bộ khẳng ủịnh” ABox A

Hệ thống DL bao gồm các khái niệm được biểu thị bằng tập hợp các đối tượng và các vai trò thể hiện mối quan hệ giữa các đối tượng Dựa vào các khái niệm và vai trò nguyên tố, người dùng có thể xây dựng các mô tả phức tạp hơn Ngôn ngữ dùng để xây dựng các mô tả là một đặc điểm quan trọng của mỗi hệ thống DL, và các hệ thống khác nhau được phân biệt dựa trên cơ sở ngôn ngữ mô tả.

Chứa cỏc khẳng ủịnh hay cụ thể hơn là cỏc mụ tả về thế giới

Hệ thống DL không chỉ bao gồm bộ thuật ngữ và bộ khẳng định mà còn có các dịch vụ suy diễn Một ví dụ điển hình là dịch vụ suy diễn cho bộ thuật ngữ TBox, nhằm xác định xem mô tả có thỏa mãn hay không (tức là không có mâu thuẫn), hoặc liệu mô tả này có tổng quát hơn mô tả khác hay không (nghĩa là có bao hàm hay không) Một bài toán quan trọng khác liên quan đến bộ khẳng định ABox là bài toán kiểm tra tính nhất quán, tức là xem nó có mô hình hay không, và liệu các khẳng định trong ABox có thể được thể hiện dưới dạng một khái niệm đã được định nghĩa trước hay không.

Hình 1.1 Kiến trúc của hệ thống mô tả tri thức dựa trên Logic mô tả

(ðịnh nghĩa các thuật ngữ

Chúng ta sẽ quay lại tìm hiểu chi tiết hơn hai thành phần này của cơ sở tri thức trong chương 2

Một số hệ thống logic mô tả đáng chú ý bao gồm hệ thống KL-ONE, được giới thiệu bởi Brachman và Schmolze vào năm 1985 Sau đó, các hệ thống như LOOM (1987), BACK (1988), KRIS (1991) và CLASSIC đã xuất hiện, mở rộng khả năng mô tả và xử lý thông tin trong lĩnh vực này.

Các thủ tục suy diễn

Hệ cơ sở tri thức bao gồm bộ thuật ngữ TBox và bộ khẳng định ABox, có ngữ nghĩa tương ứng với tập các tiên đề trong logic vị từ cấp một.

Do ủú và nú chứa tri thức tiềm ẩn, qua các thủ tục suy diễn, chúng ta có thể làm cho tri thức ủú trở nên rõ ràng và có ngữ nghĩa Các thủ tục suy diễn liên quan đến các bài toán sẽ được giới thiệu ngay sau đây.

Bài toán suy diễn cơ bản trong hệ tri thức logic liên quan đến việc kiểm tra quan hệ bao hàm giữa hai khái niệm, cụ thể là xác định xem khái niệm C có phải là tập con của khái niệm D hay không Điều này đồng nghĩa với việc xem xét liệu D có bao hàm C hay không, từ đó giúp hiểu rõ hơn về mối quan hệ giữa các khái niệm trong hệ tri thức.

Một bài toán suy diễn quan trọng là kiểm tra tính thỏa mãn của khái niệm, nhằm xác định xem một biểu thức có phải là tập rỗng hay không.

Việc thiết kế thủ tục suy diễn trong hệ logic mô tả cho mạng ngữ nghĩa là một quá trình phức tạp và tốn thời gian Trong các hệ thống mạng ngữ nghĩa, các khái niệm được thể hiện dưới dạng các nút (node), trong khi vai trò của chúng được thể hiện qua các liên kết (link).

Bài toán bao hàm là một trong những bài toán suy diễn quan trọng, với ý tưởng cơ bản là ánh xạ hai khái niệm vào trong các đồ thị có gắn nhãn Mục tiêu là kiểm tra xem một khái niệm có được gắn vào đồ thị khác hay không Nếu có, thì đồ thị đó tương ứng với khái niệm bao hàm (D) [Lipkis, 1982] Thuật toán này được gọi là thuật toán so sánh cấu trúc.

Nhiều cuộc phân tích cho thấy thuật toán này chỉ đảm bảo tính đúng đắn mà không đáp ứng được tính đầy đủ Để thuật toán có tính đầy đủ, các hệ thống mô tả tri thức cần phải không thất bại khi kiểm tra quan hệ bao hàm Điều này dẫn đến sự phát sinh của các giải thuật mới để tính toán lại quan hệ bao hàm mà không còn dựa vào mạng mô tả nữa, và các giải thuật này đã được chứng minh là có tính đầy đủ.

Khi đánh giá một thuật toán, người ta thường xem xét độ phức tạp tính toán của nó, đặc biệt là trong trường hợp xấu nhất (worst-case complexity) để xác định mức độ ảnh hưởng của các thủ tục suy diễn trong logic mô tả và trong các ngôn ngữ hình thức biểu diễn tri thức Để hiểu rõ hơn về các thủ tục suy diễn, chúng ta sẽ mô tả quy trình suy diễn gắn liền với một hệ thống tri thức trong một ngôn ngữ cụ thể, bao gồm suy diễn cho khái niệm, cho TBox và cho ABox Các suy diễn này sẽ được trình bày chi tiết trong chương 2.

Khi đề cập đến các thủ tục suy diễn, người ta thường quan tâm đến các thuật toán suy diễn để giải quyết các bài toán liên quan Trong ngôn ngữ logic mô tả, thuật toán được chú ý nhiều nhất là thuật toán tableau, dùng để giải quyết bài toán thỏa mãn cho ngôn ngữ ALC Thuật toán này sẽ được trình bày chi tiết trong chương 3.

Tổng kết chương

Chương một của bài viết giới thiệu tổng quan về logic mô tả, bao gồm lịch sử phát triển, mối quan hệ với mạng ngữ nghĩa và hệ thống khung Bài viết cũng trình bày các bước xây dựng hệ thống logic mô tả, kiến trúc tổng quát của hệ mô tả cùng cơ sở tri thức (TBox, ABox), và cuối cùng là các thủ tục suy diễn liên quan cùng các miền ứng dụng đặc trưng của logic mô tả.

BIỂU DIỄN TRI THỨC BẰNG NGÔN NGỮ MÔ TẢ

Cơ sở tri thức của ngôn ngữ mô tả

Hệ mô tả trong hình 1.1 được giới thiệu trong chương trước bao gồm cơ sở tri thức K = , với TBox T là bộ thuật ngữ và ABox A là bộ khẳng định.

Trong hệ thống mô tả của một cơ sở tri thức, TBox T là tập hợp các "mô hình" tiên đề, mô tả các quan hệ giữa các khái niệm hoặc lớp Đồng thời, ABox A là tập hợp các dữ liệu cụ thể, phản ánh trạng thái của các khái niệm và vai trò trong một miền ứng dụng, tức là các thể hiện của TBox.

Cho cơ sở tri thức bao gồm:

HappyParent ≡ Person⊓∀hasChild.(Doctor hasChild.Doctor} ⊔∃

- Abox A: { HappyParent (JOHN), hasChild (JOHN, MARRY)}

Như đã đề cập trước đó, chúng ta có thể xây dựng các mô tả cho những khái niệm phức tạp để biểu diễn các lớp đối tượng Để thực hiện điều này, cần thiết phải có các tiên đề thuật ngữ và các định nghĩa khái niệm rõ ràng.

Biểu thức là cách tổng quát để thể hiện mối liên hệ giữa các khái niệm hoặc vai trò, được trình bày dưới dạng công thức.

Trong ủú C, D là cỏc khỏi niệm và R, S là cỏc vai trũ

Tiờn ủề cú dạng C ⊐ D ủược gọi là bao hàm khỏi niệm, và tiờn ủề dạng C D ≡ ủược gọi là tương ủương khỏi niệm

- Ngữ nghĩa của cỏc tiền ủề qua phộp dịch I ([1] trang 51)

Phép dịch I thoả bao hàm khái niệm C ⊐ D nếu C I ⊆ D I (hay I là mô hình của C ⊐ D, kí hiệu I |= C ⊐ D)

 Phộp dịch I thoả một tương ủương khỏi niệm C ≡ D nếu C I = D I

Nếu T là một tập các tiên đề, thì một mô hình I thỏa mãn T (ký hiệu là I |= T) khi và chỉ khi I thỏa mãn tất cả các tiên đề trong T Khi đó, I được gọi là mô hình của TBox T.

Hai tiờn ủề thuật ngữ hoặc hai tập tiờn ủề thuật ngữ ủược gọi là tương ủương với nhau nếu nó có cùng mô hình

Một tương ương khỏi niệm cú vế trỏi, hay còn gọi là thành phần bờn trỏi, là các khỏi niệm nguyên tố Định nghĩa khỏi niệm này sử dụng các ký hiệu tên (symbolic names) để mô tả các khỏi niệm phức tạp.

Nếu không có khái niệm nào được định nghĩa hơn một lần (nghĩa là mọi khái niệm nguyên tố A mà có nhiều hơn một tên gọi trong bộ thuật ngữ TBox T thì thành phần bên trái của nó sẽ là A), thì ta gọi đó là một định nghĩa khái niệm.

Bộ thuật ngữ TBox T với cỏc ủịnh nghĩa khỏi niệm mụ tả mối quan hệ trong một gia ủỡnh ủược mụ tả như sau:

Hỡnh 2.2 Bộ thuậtt ngữ TBox với cỏc khỏi niệm về quan hệ gia ủỡnh

Một bộ thuật ngữ T bao gồm các khái niệm nguyên tố, mỗi khái niệm được cấu thành từ hai phần: ký hiệu tên NT ở bên trái và ký hiệu nguyên tố.

BT, hay còn gọi là vế phải, là thành phần quan trọng trong cấu trúc Ký hiệu tên được gọi là định nghĩa khỏi niệm, trong khi ký hiệu nguyên tố được gọi là các khỏi niệm nguyên tố.

Về mặt ngữ nghĩa, phép thông dịch nguyên thủy T chỉ thông dịch các ký hiệu nguyên tố, trong khi phép J là một phép thông dịch mở rộng cho phép thông dịch các ký hiệu nguyên tố nếu có I và J cùng miền với nhau, tức là J ∆ I = ∆ J Chúng ta nói rằng T là một định nghĩa khái niệm nếu mỗi phép thông dịch nguyên thủy có ứng một mô hình mở rộng là mô hình của T Nếu ký hiệu nguyên tố được biểu diễn dưới dạng nguyên thủy và T được xác định, thì ngữ nghĩa của nó hoàn chỉnh.

18 toàn ủược xỏc ủịnh Rừ ràng, khi một thuật ngữ ủược ủịnh nghĩa thỡ mọi thuật ngữ tương ủương với nú cũng ủược ủịnh nghĩa

Thuật ngữ trong TBox T có thể chứa chu trình, và T chứa chu trình khi tồn tại một khái niệm nguyên tố trong T được sử dụng để quy Tuy nhiên, nếu A không bao gồm B và B không bao gồm A, thì đó không phải là một chu trình thuật ngữ mà là một tương ứng khái niệm.

Một vấn ủề ủặt ra là thuật ngữ trong T cú ủược ủịnh nghĩa hay khụng dự cú hay không có một chu trình?

Nếu T chứa chu trỡnh thỡ khụng tồn tại duy nhất một ủịnh nghĩa

Cho T chứa chu trình như sau: Human’ Animal ≡ ⊓ ∀ hasParent.Human’

Trong ngữ cảnh của Human, ký hiệu tờn là Animal và hasParent là ký hiệu nguyên tố Qua phân tích, hasParent liên quan đến loại động vật có tổ tiên Do đó, có rất nhiều định nghĩa được đưa ra để giải thích mối quan hệ này.

Nếu T không chứa chu trình, thì T được định nghĩa Để việc suy diễn một cơ sở tri thức trở nên dễ dàng hơn, người ta thực hiện việc chuẩn hóa TBox T.

Một TBox được chuẩn hóa khi tất cả các tiên đề trong TBox đều ở dạng định nghĩa khái niệm Để chuẩn hóa TBox, cần thay thế các bao hàm khái niệm bằng các định nghĩa khái niệm Cụ thể, nếu có bao hàm khái niệm C ⊐ D, ta sẽ thay thế bằng một định nghĩa khái niệm C ≡ C D, với D là một khái niệm nguyên tố mới được thêm vào.

Thay bao hàm khỏi niệm Woman ⊐ Person bằng ủịnh nghĩa khỏi niệm:

Khái niệm "Woman" là một yếu tố mới được thêm vào tính chất phân biệt giới tính Trong đó, "Woman" có thể được định nghĩa lại là "Female" Cụ thể, ta có thể biểu diễn mối quan hệ giữa Woman, Female và Person như sau: Woman Female Person ≡ ⊓ đối với một TBox không chứa chu trình Quá trình chuẩn hóa sẽ dừng lại sau một số hữu hạn các bước, và quá trình này được gọi là mở rộng bộ thuật ngữ Việc mở rộng bộ thuật ngữ là hợp lệ nếu bộ thuật ngữ mới tương ứng với bộ thuật ngữ ban đầu.

Gọi T là một bộ thuật ngữ không chứa chu trình và T' là bộ thuật ngữ mở rộng của nú, khi ủú ([1] trang 53):

- T và T' có cùng các ký hiệu tên và các ký hiệu nguyên tố

Cơ sở lý thuyết ủể ủảm bảo tớnh ủỳng ủắn về ngữ nghĩa cho quỏ trỡnh chuẩn hoỏ là ([1] trang 59):

-Mọi mô hình của T cũng là mô hình của T

- Với mỗi mô hình I của T có một mô hình I của T mà có cùng miền với I và chấp nhận I về các khái niệm và các luật trong T

Trong ủú là bộ thuật ngữ khụng cú chu trỡnh và T T là bộ thuật ngữ chuẩn hoỏ của nó

Các thuật toán suy diễn

Cuối chương một, chúng ta đã giới thiệu về các thủ tục suy diễn Trong phần này của chương hai, chúng ta sẽ trình bày chi tiết hơn về các thủ tục này thông qua các thuật toán suy diễn trên một hệ thống cơ sở tri thức của một ngôn ngữ cụ thể.

Hệ thống mô tả tri thức dựa trên logic mô tả có khả năng thực hiện các loại suy diễn đặc biệt Các loại suy diễn khác nhau trong hệ thống DL được định nghĩa tương tự như các loại suy diễn logic đã biết Bài viết này sẽ tìm hiểu về các loại suy diễn, bắt đầu với suy diễn cho các khái niệm, sau đó là TBox T và ABox A.

2.3.1 Suy diễn cho các khái niệm

Khi mô hình hóa một miền, việc xây dựng bộ thuật ngữ TBox là rất quan trọng Bên cạnh việc định nghĩa các khái niệm đã biết, chúng ta cũng cần tạo ra những khái niệm mới Trong quá trình này, cần phát hiện xem có những định nghĩa khái niệm nào gần gũi có khả năng tạo ngữ nghĩa hay không, và liệu có mâu thuẫn nào xuất hiện hay không Từ quan điểm logic, một khái niệm có khả năng như vậy nếu nó thỏa mãn các tiên đề của T (hay mô hình của T), và nó được ký hiệu bằng một tập hợp I rỗng Một khái niệm có tính chất này được gọi là thỏa mãn với T, trong khi đó, nếu không thỏa mãn, nó sẽ được gọi là không thỏa mãn với T.

Kiểm tra tính thỏa khái niệm là một bài toán suy diễn cơ bản, liên quan đến việc xác định xem một khái niệm có được chuẩn hóa trong bối cảnh toán học hay không Để kiểm tra tính chính xác của một miền hình, hoặc tối ưu hóa cấu trúc truy vấn cho một biểu thức khái niệm, cần xác định khái niệm này có tổng quát hơn khái niệm kia hay không Một khái niệm C được coi là bị bao hàm bởi khái niệm D nếu mọi mô hình của T, C là một tập con của D Bên cạnh đó, còn có hai bài toán quan trọng khác liên quan đến mối quan hệ giữa các khái niệm, bao gồm bài toán tương đương và bài toán khái niệm không giao nhau.

Cho TBox T Chỳng ta ủịnh nghĩa ([1] trang 62):

 Bài toán thỏa khái niệm

Một khỏi niệm C là thoả ủối với T nếu tồn tại một mụ hỡnh của T sao cho CI I ≠

∅ Khi ủú, ta núi rằng là mụ hỡnh của C I

 Bài toán bao hàm khái niệm

Khỏi niệm C bị bao bởi khỏi niệm D ủối với T nếu với mọi mụ hỡnh của T, ta I cú C I D⊆ I Khi ủú ta kớ hiệu là C ⊐ T D hoặc T |= C D ⊐

 Bài toỏn tương ủương khỏi niệm

Hai khỏi niệm C và D là tương ủương ủối với T nếu với mọi mụ hỡnh của T ta I cú C I = D I Khi ủú ta viết C ≡T D hoặc T | = C D ≡

 Bài toán khái niệm không giao nhau

Hai khỏi niệm C và D ủược gọi là khụng giao nhau (hay tỏch rời nhau) ủối với

T nếu C I ∩ D I = với mọi mô hình của T ∅ I

Nếu TBox T ủó cú ngữ cảnh rừ ràng, ủể ủơn giản chỳng ta sẽ bỏ ủi cụm từ “ủối với T” trong các tính chất trên

Chúng ta sẽ bỏ qua cụm từ “trong trường hợp đặc biệt” khi TBox T là tập hợp rỗng Để đơn giản, ta viết |= C ⊐ D nếu C bị bao hàm bởi D và |= C ≡ D nếu C, D tương đương nhau.

Bài viết đề cập đến các thuật ngữ thể hiện mối quan hệ trong gia đình, với khái niệm "Person" bao hàm cả "Woman" và "Man" Tương tự, khái niệm "Parent" bao gồm "Father" và "Mother" Đặc biệt, "Woman" và "Man" là hai khái niệm tách rời, không giao nhau.

Cơ chế suy diễn cơ bản trong các hệ thống logic mô tả là quy trình kiểm tra tính bao hàm của các khái niệm Thực tế cho thấy, điều này là cần thiết để thực hiện các suy diễn dựa trên các phép biến đổi đã được xác định.

 Biến ủối về bài toỏn bao hàm khỏi niệm

Với C, D là 2 khái niệm, ta có :

- C là không thoả ⇔ C bị bao hàm bởi ⊥

- C tương ủương với D ⇔ C bị bao hàm bởi D và D bị bao hàm bởi C

- C và D không giao nhau ⇔ C ⊓ D bị bao hàm bởi ⊥

Mệnh này cũng ủỳng trong trường hợp suy diễn cho TBox

Tất cả các ngôn ngữ mô tả trong các hệ thống DL hiện nay đều cung cấp phép toán giao nhau (⊓) và hầu hết đều chứa khái niệm không thỏa Do đó, nhiều hệ thống DL cung cấp thủ tục kiểm tra bao hàm khái niệm, từ đó có thể thực hiện bốn loại suy diễn đã được định nghĩa trước đó.

Nếu một hệ thống cho phép thiết lập toán tử phủ định vào các mục tả, chúng ta có thể biến đổi bài toán bao hàm khái niệm, tương ứng khái niệm và bài toán khái niệm không giao nhau về bài toán thỏa khái niệm.

 Biến ủổi về bài toỏn khụng thoả

Với C, D là hai khái niệm, ta có:

- C bị bao hàm bởi D ⇔ C ⊓ơD là khụng thoả

- C và D là tương ủương ⇔ cả C ⊓ơD và D⊓ ơC là khụng thoả

- C và D không giao nhau ⇔ C ⊓ D là không thoả

Mệnh này cũng ủỳng trong trường hợp suy diễn cho TBox

Để xây dựng một thủ tục quyết định có thể suy diễn cho bất kỳ loại nào, cần phát triển bài toán quyết định kiểm tra thỏa mãn Hướng tiếp cận này là cơ sở để phát triển các thuật toán suy diễn trong logic mô tả.

Trong các ngôn ngữ lập trình, không có phép toán phủ định đầy đủ, vì vậy khái niệm bao hàm và khái niệm tương đương không thể đơn giản biến đổi thành bài toán không thỏa mãn như các biểu thức đã nêu.

Trong trường hợp xấu nhất, nếu nhãn dưới góc độ phức tạp, bài toán này liên quan đến khái niệm suy diễn tổng quát trong các ngôn ngữ thuộc họ.

AL Bài toỏn khụng thỏa chỉ là một trường hợp ủặc biệt của một bài toỏn khỏc Cho một khỏi niệm C Cỏc phỏt biểu sau ủõy là tương ủương:

Mệnh này cũng áp dụng cho việc suy diễn trong TBox Để có được cận trên và cận dưới cho các suy diễn trong ngữ cảnh AL, cần đánh giá cận dưới cho bài toán không thỏa và cận trên cho bài toán bao hàm Đối với mỗi ngữ cảnh, cận trên của bài toán phức tạp AL bao hàm cũng là cận trên của bài toán không thỏa, bài toán tương ứng và bài toán khỏi niệm không giao nhau Hơn nữa, cận dưới của bài toán phức tạp không thỏa cũng là cận dưới của bài toán bao hàm, tương ứng và bài toán khỏi niệm không giao nhau.

2.3.2 Suy diễn cho TBox (loại bỏ TBox)

Ngoài các phát biểu cụ thể áp dụng cho suy diễn TBox đã được trình bày trước đó, phần này sẽ xem xét thêm các trường hợp suy diễn khác liên quan đến TBox.

Trong nhiều ứng dụng, các khái niệm thường được sử dụng trong ngữ cảnh của TBox T, nhưng do sự phức tạp của nó, chúng ta thường giả thiết rằng TBox T là rỗng (tức là T =φ) để đơn giản hóa quá trình.

Nếu T là một TBox khụng cú chu trỡnh, chỳng ta cú thể biến ủối bài toỏn suy diễn ủối với T về bài toỏn ủối với TBox rỗng

Chương này tập trung vào ngôn ngữ mô tả AL, bao gồm cú pháp và ngữ nghĩa, cùng với các ngôn ngữ mở rộng của nó Nó khám phá bộ thuật ngữ TBox và bộ khẳng định ABox trong cơ sở tri thức K = Bên cạnh đó, chương cũng định nghĩa các bài toán quyết định trong logic mô tả và các phép biến đổi tương ứng, đồng thời đưa ra một số phương pháp khác nhau để giải quyết các bài toán này Cuối cùng, chương sẽ trình bày chi tiết giải thuật tableau để kiểm tra tính thỏa mãn của ALC trong chương 3.

THUẬT TOÁN SUY DIỄN TABLEAU

Giới thiệu

Các hệ thống biểu diễn tri thức dựa trên DL (hệ thống DL) cung cấp khả năng suy diễn đa dạng để khai thác tri thức tiềm ẩn từ tri thức ban đầu Thuật toán bao hàm khái niệm cho phép xác định quan hệ bao hàm giữa các tập hợp, cụ thể là C bị bao hàm trong D nếu tất cả các thể hiện của C cũng là thể hiện của D, tức là C được xem như một tập con của D Để đảm bảo tính hợp lý và khả năng tương tác với hệ thống DL, bài toán bao hàm khái niệm cần có tính quyết định và ưu tiên có độ phức tạp thấp.

Trong lĩnh vực học sâu (DL), khả năng diễn đạt các câu truy vấn cần được giới hạn để đảm bảo tính phù hợp Tuy nhiên, việc lạm dụng có thể làm mờ đi các khái niệm quan trọng trong miền ứng dụng Khám phá và kiểm tra sự cân bằng giữa khả năng biểu diễn và độ phức tạp của các bài toán suy diễn đã dẫn đến nhiều phát minh quan trọng trong nghiên cứu DL.

Cỏc kết quả thử nghiệm ban ủầu về lĩnh vực ứng dụng cơ sở dữ liệu [Horrocks,

Năm 1999, nghiên cứu của Patel và Schneider đã chỉ ra rằng logic mệnh đề động (PDL) có thể áp dụng hiệu quả cho các thuật toán kiểm tra bài toán thỏa mãn Để giải quyết vấn đề này, các nhà nghiên cứu trong lĩnh vực logic động đã bắt đầu thiết kế các thuật toán tableau cho các ngôn ngữ DL với khả năng diễn đạt cao.

3.2 Thuật toỏn tableau ủối với bài toàn thoả khỏi niệm cho ALC

Thuật toán tableau, như đã đề cập trong chương 2 (mục 2.3.4), nhằm thay thế việc kiểm tra trực tiếp mối quan hệ bao hàm khái niệm Phương pháp này sử dụng phép toán phủ định để biến đổi bài toán bao hàm, loại bỏ khái niệm về tính thỏa/không thỏa Mục tiêu của thuật toán là chứng minh tính thỏa của một khái niệm trong cơ sở tri thức K = thông qua việc xây dựng các cấu trúc logic phù hợp.

Thuật toỏn tableau ủối với bài toỏn thỏa khỏi niệm cho ALC

Để xây dựng một mô hình hoặc cấu trúc thể hiện sự tồn tại của một mô hình, cần sử dụng hệ thống các ràng buộc và luật lan truyền Bước đầu tiên là chuẩn hóa TBox T bằng cách định nghĩa tất cả các thuật ngữ của T dưới dạng định nghĩa khái niệm Tiếp theo, cần chuyển đổi tất cả các mô tả khái niệm trong TBox sang dạng chuẩn phủ định (NNF), tức là đưa dấu phủ định vào trước các khái niệm nguyên tố theo quy tắc đã định.

Khái niệm phức Dạng chuẩn NNF ơ ⊥

⊥ ơ ơ(C D) ⊓ ơC ⊔ơD ơ(C D) ⊔ ơC ⊓ơD ơơC C ơ∀R.C ∃ ơR C ơ∃R.C ∀ ơR C

Hỡnh 3.1 Luật chuyển về dạng chuẩn phủ ủịnh

Sau khi chuyển đổi, ta loại bỏ các định nghĩa khỏi niệm trong TBox và đưa chúng vào ABox dưới dạng chuẩn phủ định, dẫn đến TBox trở thành rỗng Khi đó, quá trình lập luận chỉ dựa vào ABox, được phát triển thành các khẳng định chỉ chứa các mô tả của các khỏi niệm nguyên tố, cùng với các mô tả khỏi niệm ở dạng chuẩn phủ định.

 Ví dụ 3.1 ðặt A, B là các mô tả khái niệm và R là tên vai trò

Xét (∃R.A) ⊓ ( ∃ R.B) có bị bao hàm bởi ∃R.(A ⊓ B) hay không ? Nghĩa là chỳng ta phải kiểm tra tớnh khụng thỏa của mụ tả khỏi niệm sau ủõy:

Đầu tiên, chúng ta chuyển mệnh đề C về dạng chuẩn phủ định bằng cách đưa dấu phủ định vào trong mệnh đề, áp dụng luật De Morgan, ta thu được mệnh đề sau

C0 = ( ∃ R.A) (⊓ ∃R.B) R.( A B) ⊓∀ ơ ⊔ơ Sau ủú, chỳng ta cố gắng xõy dựng một phộp thụng dịch sao cho I C I 0 ≠ ỉ Nghĩa là trong ∆ I phải tồn tại một cá thể là một phần tử của C I 0

Gọi cá thể này là b, ta có b ∈ C I 0

Vỡ C0 là giao của 3 mụ tả khỏi niệm ( ∃ R.A), ( ∃ R.B) và R.( A B) , nờn b ∀ ơ ⊔ ơ phải thỏa cả 3 ràng buộc là: b ∈ ( ∃ R.A) I , b ∈ ( ∃ R.B) I , b ∈ ( R.( A ∀ ơ ⊔ ơB)) I

Từ b ∈ ( ∃ R.A) I suy ra phải tồn tại một cá thể c sao cho (b,c) ∈ R I và c ∈ A I

Tương tự, từ b ∈ ( ∃ R.B) I suy ra phải tồn tại một cá thể d mà (b,d) ∈ R I và d ∈

B I Trong trường hợp này không cần phải giả sử c = d Như vậy ([1] trang 79):

Đối với lượng từ tồn tại, nó có thể áp dụng vào một thể thừa tự, hay còn gọi là thể kế vị, tức là thể có quan hệ R với thể được cho Thể thừa tự này cần phải thỏa mãn các ràng buộc được mô tả bởi lượng từ tồn tại.

Vỡ b cũng phải thỏa món lượng từ với mọi R.( A B), và c, d ủược ủưa vào ∀ ơ ⊔ơ ủể thừa tự vai trũ R của b, chỳng ta cú thờm ràng buộc: c ∈ ( A B)ơ ⊔ơ I và d ∈ ( A ơ

Thuật toán sử dụng lượng từ với phép giao trong các quan hệ vai trò sẽ áp đặt các ràng buộc mới lên các khả năng.

Khi c ∈ (A ơ ⊔ ơB) I, có nghĩa là c phải thuộc vào (A)ơ I hoặc (B)ơ I, và chúng ta cần chọn một trong hai khả năng này Nếu chọn c ∈ (A)ơ I, sẽ xảy ra mâu thuẫn với ràng buộc c ∈ A I, do đó phải chọn c ∈ (B)ơ I Tương tự, để thỏa mãn ràng buộc d ∈ (A ơ ⊔ ơB) I mà không vi phạm điều kiện d ∈ B I, chúng ta phải chọn d ∈ (A)ơ I.

ðối với các luật hợp, thuật toán cố gắng thử cả hai khả năng liên tiếp nhau

Và phải quay lại nếu gặp mâu thuẫn Tức là, cùng một cá thế mà thoả mãn nhiều ràng buộc là mâu thuẫn hiển nhiên

Hiện tại, mọi ràng buộc đã được thỏa mãn mà không gặp mâu thuẫn nào, cho thấy rằng Co là thỏa Điều này chứng tỏ rằng (∃ R.A) (⊓ ∃R.B) không bị bao hàm bởi ∃ R.(A B) Thuật toán đã sinh ra một phép thông dịch để chứng minh điều này: I ∆ I {b,c,d}; R I = {(b, c), (b, d)}; A I = {c} và B I = {d} Với phép thông dịch này, b thuộc C I 0, nghĩa là b thuộc (( ∃ R.A) (⊓ ∃R.B)) I nhưng không thuộc ( ∃ R.(A B))⊓ I.

Có thể khẳng định rằng trong khái niệm (≤ ∃R.A) ⊓ (∃R.B), 1 R đảm bảo khả năng thừa tự giữa A và B Điều này cho thấy rằng sự thừa tự trong A có thể tương ứng với sự thừa tự trong B, và do đó, có thể rút ra rằng thừa tự trong (A B) cũng được đảm bảo.

Giải thuật tableau cho bài toán thỏa mãn điều kiện thực hiện tương tự như ví dụ đầu tiên, nhưng có thêm ràng buộc b (1 R)∈ ≤ I Để thỏa mãn ràng buộc này, hai cột thừa tự c và d của b cần phải được đồng nhất cựng nhau.

ðối với cỏc khỏi niệm cú giới hạn số lượng thỡ thuật toỏn sẽ ủống nhất cỏc cá thể thừa tự có vai trò khác nhau

Trong vớ dụ này, cỏ thể c = d phải cựng thuộc A I và B I Do ủú c = d ( A ∈ ơ ⊔ ơB) luụn luụn dẫn ủến sự mõu thuẫn

 Ví dụ 3.2 (Mở rộng ví dụ 3.1 bằng cách thêm giới hạn số lượng: ≤ n R )

Kiểm tra (∃R.A) (⊓ ∃R.B) 1 R có bị bao hàm bởi ⊓ ≤ ∃R.(A B) hay ⊓ không ?

3.2.2 Thuật toán Tableau cho ALC

Chó Co là một khái niệm trong ALC, liên quan đến thuật toán tableau Thuật toán này được áp dụng để giải bài toán thỏa mãn khái niệm cố gắng xây dựng một phép thông dịch thỏa mãn CI, tức là chứa phần tử xo sao cho xo thuộc Co I.

Trước khi trình bày về thuật toán tableau, cần xác định cấu trúc dữ liệu thích hợp để biểu diễn các ràng buộc cú pháp như “a thuộc C” và “b có thể thừa tự của a” (hay còn gọi là R-filler).

Bài viết của Schmidt-SchauB và Smolka (1991) cùng nhiều nghiên cứu khác về giải thuật tableau đã giới thiệu các khái niệm mới, tuy nhiên, các ràng buộc này thực chất được mô tả bởi bộ khẳng định ABox Trong ví dụ 3.2, các khái niệm chứa giới hạn số lượng sẽ đồng nhất các khả thể khác nhau, do đó không cần giả định rằng tên các khả thể là duy nhất trong bộ ABox được xét trong thuật toán Thay vào đó, chúng ta cho phép các bộ khẳng định khác nhau; với hai khả thể x và y, ta có thể viết x ≠ y với ngữ nghĩa rằng có một phép thông dịch thỏa mãn I x ≠ y nếu và chỉ nếu x I ≠ y I Các bộ khẳng định này được giả sử có tính đối xứng, tức là nếu x ≠ y thuộc ABox A thì cũng có y ≠ x thuộc A Ngoài ra, giả định rằng tất cả các mô tả khái niệm ở dạng chuẩn phủ định (NFF) sẽ giúp đơn giản hóa vấn đề.

Túm lại, cấu trỳc dữ liệu thớch hợp ủể biểu diễn thuật toỏn tableau như sau:

Để kiểm tra tính thỏa của khái niệm C₀ dưới dạng NNF, ta cần ràng buộc rằng x ≠ y Thuật toán bắt đầu với ABox A₀ = { C₀(x₀) } và áp dụng các luật lan truyền cho đến khi không còn áp dụng được nữa Kết quả của quá trình này là ABox ban đầu sẽ được chia thành nhiều ABox mới Chúng ta nói rằng ABox ban đầu là nhất quán khi và chỉ khi

Khi một trong các ABox mới nhất quần, chúng ta sẽ có tập hữu hạn S gồm các ABox Ai (S={A1, ,Ak}) thay vì chỉ có một ABox A ban đầu Tập S này được coi là nhất quán khi tồn tại ít nhất một Ai trong S thỏa mãn tính nhất quán Luật lan truyền áp dụng cho tập S cho phép thay thế một phần tử A của S bằng một ABox A’ hoặc bằng 2 ABox A’ và A’’ hoặc bằng nhiều ABox Ai,j Các luật lan truyền được áp dụng theo thứ tự tùy ý cho đến khi không còn luật nào có thể áp dụng Khái niệm C0 được gọi là thỏa mãn khi tập S thu được chứa một ABox mở và không thỏa mãn trong trường hợp ngược lại.

Luật →⊓⊓⊓⊓ ðiều kiện: A chứa (C1 C⊓ 2 )(x), nhưng khụng chứa cả hai khẳng ủịnh C1(x) và

Luật →⊔⊔⊔⊔ ðiều kiện: A chứa (C1⊔C2)(x), nhưng khụng chứa hoặc khẳng ủịnh C1(x) hoặc khẳng ủịnh C2(x)

Luật →∃∃∃∃ ðiều kiện: S chứa ( R.C)(x) và không chứa cá thể z nào mà có chứa hai ∃ khẳng ủịnh C(z) và R(x,z) trong S

Hành ủộng: S = S ∪ {C(y),R(x,y)} với y là cỏ thể mới

Luật → ∀∀∀∀ ðiều kiện: S chứa ( R.C)(x) và R(x,y) nhưng không chứa C(y) ∀

Hình 3.2 Các luật lan truyền của bài toán thỏa cho ALC

3.2.2.1 Nguyờn tắc hoạt ủộng của thuật toỏn tableau

Bắt đầu từ một tập ABox {{Co(xo)}}, áp dụng các luật lan truyền trong hình 3.2 cho đến khi không còn áp dụng được nữa Bài toán sẽ được coi là thỏa mãn nếu tập S chứa một ABox A mở và không thỏa mãn nếu ngược lại.

Mở rộng thuật toán tableau

Bài toán thỏa mãn niệm (cho ALC) là một phần cơ bản trong hệ thống mô tả cơ sở tri thức Để giải quyết các bài toán suy diễn, chúng ta có thể áp dụng nhiều thủ tục và giải thuật khác nhau Thay vì thiết kế các giải thuật mới, chúng ta có thể mở rộng bài toán này tới các ngôn ngữ khác và liên kết với một số bài toán có liên quan trong hệ thống.

Hình vẽ 3.4 trên ủy mụ mô tả cách mở rộng thuật toán tableau cho bài toán thỏa mãn niệm ALC, áp dụng cho các bài toán suy diễn cơ bản khác và ngôn ngữ ALCN Việc mở rộng giải thuật này thực tế có thể áp dụng cho nhiều bài toán và ngôn ngữ khác nhau.

3.3.1 Mở rộng tới bài toán khác

Hình 3.4 Mở rộng thuật toán tableau tới các bài toán và ngôn ngữ khác

Thuật toán thỏa khái niệm cho

Nhất quán cho ABox ALC

TBox ðịnh nghĩa khái niệm

Ràng buộc (Bao hàm) ALCN

Thuật toán thỏa mãn niệm cho ALC có thể mở rộng đến bài toán nhất quán cho ABox – ALC Đặt A0 là một ABox – ALC, trong đó mọi khái niệm được mô tả trong A0 ở dạng chuẩn phủ định (NNF) Để kiểm tra tính nhất quán của A0, chúng ta chỉ cần thực hiện một công việc đơn giản là áp dụng các luật trong hình 3.2 lên một tập S chỉ có một phần tử là A0, tức là S = { A0 }.

Chúng ta nhận thấy rằng, ở đây tính chất soundness và completeness vẫn còn đúng Tuy nhiên, tính kết thúc thì cần phải xem xét và đặc biệt khi phải có các chiến lược áp dụng cụ thể thì thuật toán mới dừng Bài toán nhất quán ABox-ALC thuộc lớp các bài toán PSPACE-complete.

Xột TBox T khụng chứa chu trỡnh và cú tiờn ủề bao hàm dạng C ⊐ D, trong ủú

C và D là 2 mô tả khái niệm phức ðặt C ’ = ( Cơ 1 D⊔ 1 ) ( C⊓ ⊓ ơ n D⊔ n )

Thay vỡ xột một số hữa hạn cỏc tiờn ủề bao hàm là: C1 D⊐ 1 , , Cn D⊐ n Để đơn giản hóa, chỉ cần xột một tiờn ủề duy nhất C’, tức là mọi cỏ thể phải thuộc về C’.

Thuật toán tableau cho ALC có thể dễ dàng được điều chỉnh để đảm bảo mọi thể hiện, bao gồm cả các thể hiện ban đầu và những thể hiện mới được sinh ra bởi luật →∃, đều thuộc về C’ Tuy nhiên, sự thay đổi này dẫn đến việc thuật toán không thể kết thúc.

Kiểm tra tính nhất quán của ABox A0 = {A(x0), (R.A)(x∃0)} với tiên đề R.A cho phép áp dụng thuật toán lên A0 để thu được một dãy các ABox A1, A2, cùng các cá thể x1, x2, sao cho Ai+1 = Ai {R(x∪i, xi+1), A(xi+1), (R.A)(x∃i+1)} Do mọi xi nhận các khẳng định khỏi niệm giống nhau như x0, thuật toán sẽ chạy đến cùng.

Để thực hiện thuật toán kết thúc, cần phát hiện vòng lặp và loại bỏ một số quy tắc phát sinh Thay vì tạo ra một cá thể mới, cá thể bị khóa x có thể được sử dụng làm cá thể thừa kế của y.

Trong ví dụ 3.5, thay vì tạo ra một cá thể mới là cá thể thừa tự cho x1, chúng ta xây dựng cá thể x0 Khi đó, ta có thể thiết lập tập hợp I ∆ I = {x0, x1}, A I = ∆ I và R I = {(x0, x1), (x1, x1)} Điều này rõ ràng là một mô hình của AI0 và tiên đề R.A ⊐∃.

Để đảm bảo thuật toán dừng lại, cần xem xét bảng liệt kê các khả thể và xác định khả thể x bị khử bởi y mà xảy ra trước x trong bảng liệt kê đó Dựa trên ý tưởng này cùng với một số giả thiết khác, thuật toán đạt được cả ba tính chất: tính đúng đắn (soundness), tính đầy đủ (completeness) và tính dừng lại (termination) [Buchheit, 1993a; Baader].

Bài toán ALC-ABox năm 1996 là bài toán quan trọng nhất thuộc lớp các bài toán quyết định, thuộc phạm vi EXPTIME-complete, bao hàm các tiên đề phức tạp.

3.3.2 Mở rộng tới các ngôn ngữ khác ðể có thể áp dụng thuật toán tableau cho các ngôn ngữ khác thuộc họ AL về nguyên tắc, chúng ta phải xây dựng thêm các luật lan truyền mới phù hợp với ngôn ngữ ủó cho Thường thỡ cỏc qui luật này ủược xõy dựng nhờ vào nghữ nghĩa của bộ tạo tỏc tử (constructor) của ngụn ngữ ủú

 Ví dụ 3.6 Thuật toán tableau cho ALCN

Ngôn ngữ ALCN là mở rộng của ALC có thêm giới hạn số nên cần bổ sung thêm

2 luật lan truyền sau ủõy:

Tính ủỳng ủắn của giải thuật thường dễ dàng chứng minh, nhưng tính completeness và termination cần được xem xét kỹ lưỡng Để giải thuật đáp ứng cả ba tính chất này, cần có một chiến lược cụ thể áp dụng cho ngôn ngữ đang xét.

Hệ thống suy diễn FaCT++

Cú nhiều hệ thống suy diễn dựa trờn tableau ủó ủược biết ủến nhiều như RACER

[12], PETTLE [10]… Tuy nhiờn ở ủõy chỳng ta sẽ giới thiệu một hệ thống suy diễn khác cũng dựa trên tableau là FaCT++ [5],[6]

FaCT++ là một bộ suy diễn dựa trên tableau, được phát triển từ bộ suy diễn FaCT cho OWL-DL (Fa Cst lassification of erminologies) Nó sử dụng thuật toán FaCT đã được tạo sẵn nhưng có kiến trúc bên trong khác biệt Ngoài ra, FaCT++ còn có nhiều đặc điểm mới và được tối ưu hóa hơn so với phiên bản trước.

FaCT++ là một công cụ mạnh mẽ cho các ngôn ngữ logic, đặc biệt là OWL và OWL2 DL, cho phép diễn đạt và xử lý thông tin hiệu quả Nó có thể được sử dụng như một bộ giải quyết logic để nâng cao khả năng suy diễn trong các ứng dụng trí tuệ nhân tạo.

: A chứa ( nR ) ( ) và không chứa các cá thể z ðiều kiện ≥ x 1, z2,…, zn nào mà

R( , zx i) (1 i n) và z≤ ≤ i ≠ zj (1 i

< !ATTLIST Customer type (business | private) “Private” >

< !ATTLIST Registered service IDREF #REQUIRED >

< !ATTLIST Deparment name CDATA #REQUIRED >

< !ATTLIST Service code ID #REQUIRED >

Hình 4.4 Phần DTD Service tương ứng với tài liệu XML trong hình 4.3

Trong XML, cấu trúc tài liệu được định nghĩa bằng DTD (Document Type Definition) DTD bao gồm một tập hợp các khai báo, thiết lập các quy tắc cú pháp cho các nhãn Nó chỉ ra các phần tử có thể sử dụng trong tài liệu, thứ tự xuất hiện của chúng, và các phần tử nào có thể chứa bên trong các phần tử khác, cùng với các thuộc tính liên quan Từ khóa #PCDATA được sử dụng để cho phép chứa tất cả dữ liệu văn bản thuần túy không thuộc phần định dạng.

Hình 4.5 Cây nhị phân tương ứng với tài liệu XML mô tả khách hàng

Trong bài viết này, chúng ta sẽ không tập trung vào cấu trúc của XML mà sẽ tìm hiểu về phương pháp mô hình hóa XML DTDs thành cơ sở tri thức DL Để đơn giản hóa, chúng ta sẽ không xem xét các thuộc tính của XML, mặc dù chúng có thể được xử lý nếu đưa vào các vai trò phù hợp Sự hiện diện của các biểu thức hợp quy tắc trong XML yêu cầu việc mô hình hóa DTDs thành DLs phải sử dụng DLs có cấu trúc xây dựng để tạo ra các biểu thức thông qua các vai trò Lưu ý rằng, việc mã hóa DTDs thành DLs cần được mô tả dưới dạng cây và phải bảo toàn thứ tự các nút con Ví dụ, trong TDT, nội dung của phần tử Customer bao gồm phần tử Name, phần tử Field và phần tử SSN.

Calvanese [1999] ủề xuất mụ tả tài liệu XML bằng cõy nhị phõn, ủỏp ứng ủược công việc mã hóa DTDs thành DLs

Trong hình 4.6, mô tả thành phần mô hình hóa các tiền đề DTD trong hình 4.4 Hai vai trò f và r được sử dụng để mô hình hóa cây nhị phân, với các vai trò này là các hàm toàn cục (tiền đề 4.1) Cấu trúc well-founded wf (f r) được sử dụng để mô tả sao cho không có chuỗi vụ tận các đối tượng mà mỗi kết nối với đối tượng kế tiếp bằng biểu thức f r Điều kiện này là cần thiết để lưu giữ dữ liệu XML phù hợp với cây được giới hạn Với mỗi phần tử kiểu, các khái niệm nguyên tố Start E E và End lần lượt được mô tả là tag bắt đầu (tiền đề 4.2) và tag kết thúc (tiền đề 4.3) Các tag này là các mức của cây (tiền đề 4.4) và các mức còn lại của cây là E Văn bản thuần túy được mô tả bằng khái niệm nguyên tố PCDATA (tiền đề 4.5) Dựng các vai trò và khái niệm này có thể đưa vào mỗi phần tử có kiểu trong DTD E.

Một khái niệm nguyên tố ED liên quan đến việc xác định cấu trúc của phần tử kiểu thích hợp với vai trò phức tạp, đồng thời khai thác các cấu trúc xây dựng cho các biểu thức hợp lệ thông qua các vai trò, bao gồm cả toán tử id Hình 4.6 minh họa rõ ràng thành phần các kiểu phần tử TDT được thể hiện trong hình 4.4, giúp người đọc dễ dàng hiểu và hình dung về cấu trúc này.

In the provided content, the relationships between elements are defined through a series of logical expressions Each element of type E is associated with a StartE and EndE tag, ensuring proper encapsulation The Tag is defined to encompass all possible combinations of f and r, while PCDATA represents the data content associated with these tags The CustomersS structure is defined to include conditions for identifying customer records, starting with StartCustomers and concluding with EndCustomers, incorporating various attributes such as NameS, FieldS, and RegisteredS to ensure comprehensive data representation.

NameS ≡ ∃f.StartName ⊓∃(r º ( (id ∃f.PCDATA) º r).EndName

Hình 4.6 Phần mã hóa DTD S thành cơ sở tri thức DL

Công việc mã hóa DTDs sang DLs có thể khai thác nhiều thuộc tính khác nhau trên DTDs, bao gồm các thuộc tính quan hệ bao hàm, tương ương và tách rời giữa các tài liệu phù hợp với hai DTDs Suy diễn có thể bắt đầu từ nhiều hình thức khác nhau, và tất cả các suy diễn trên DTDs đều có thể được xác định với thời gian hàm mũ.

Sau khi giới thiệu tổng quan về logic mô tả và các ứng dụng của nó trong chương

Chương 1 trình bày chi tiết về ngôn ngữ AL và các ngôn ngữ mở rộng của nó, cùng với cơ sở tri thức K = trong hệ thống mô tả các bài toán quyết định và thuật toán suy diễn Chương 4 tập trung vào mối liên hệ giữa logic mô tả và các ngôn ngữ khác, đặc biệt là các ngôn ngữ hình thái trong lĩnh vực này.

AI, bao gồm mạng ngữ nghĩa, hệ thống khung, và logic vị từ, cùng với XML, là những ngôn ngữ hỗ trợ Web quan trọng Những yếu tố này tạo nền tảng cho chương 5, trong đó trình bày ứng dụng của logic mô tả nhằm hỗ trợ công cụ tạo Web ngữ nghĩa.

ỨNG DỤNG LOGIC MÔ TẢ HỔ TRỢ CÔNG CỤ TẠO WEB NGỮ NGHĨA

Tóm tắt

Trong những năm gần đây, sự bùng nổ của công nghệ thông tin và các dịch vụ trên Internet đã thu hút sự quan tâm của nhiều nhà nghiên cứu đối với Web ngữ nghĩa Logic mô tả được coi là một công cụ hỗ trợ quan trọng cho Web ngữ nghĩa, giúp bổ sung phần ngữ nghĩa, từ đó cải thiện khả năng chia sẻ, tìm kiếm thông tin và tăng cường liên kết giữa các trang Web.

Trong chương này, chúng ta sẽ khám phá ứng dụng của logic mô tả và các dịch vụ suy diễn trong thiết kế Ontology, đồng thời giới thiệu khái quát về Web ngữ nghĩa Chúng ta sẽ tìm hiểu về ngôn ngữ mô tả SHIQ và DAML+OIL, cũng như công cụ tạo Ontology Protégé 4.0 Cuối cùng, chúng tôi sẽ trình bày một số kết quả thử nghiệm Tuy nhiên, việc xây dựng một ứng dụng Web ngữ nghĩa còn yêu cầu nhiều công cụ hỗ trợ khác, và trong giới hạn của luận văn này, chúng ta sẽ chỉ tập trung vào các công cụ liên quan đến logic mô tả.

Web ngữ nghĩa và Ontology

Đối với nhiều người, World Wide Web (WWW) đã trở thành một nhu cầu thiết yếu trong việc tìm kiếm, chia sẻ và cung cấp thông tin Tuy nhiên, việc tìm kiếm trên Web gặp khó khăn do các máy tìm kiếm thường trả về lượng lớn câu trả lời, trong đó nhiều câu không phù hợp với nhu cầu của người dùng Một trong những nguyên nhân chính dẫn đến vấn đề này là do các nguồn tài nguyên trên Web chủ yếu được viết bằng ngôn ngữ HTML, nhằm mô tả thông tin dưới dạng văn bản để đáp ứng nhu cầu "hiểu" của con người.

Web ngữ nghĩa nhằm mục đích nâng cao khả năng "hiểu" của các nguồn tài nguyên trên Internet, cho phép thông tin được chia sẻ và xử lý một cách hiệu quả thông qua các công cụ tự động.

Web ngữ nghĩa là sự mở rộng của WWW hiện tại, cho phép máy tìm kiếm và các tác nhân con người hiểu và xử lý thông tin một cách hiệu quả hơn thông qua việc thêm vào các mô tả ngữ nghĩa.

Thông tin được chia sẻ trên web yêu cầu có các chú giải để các tác nhân tìm kiếm khác nhau có thể hiểu được Các chú thích này được chuẩn hóa và sử dụng bởi một ngôn ngữ có ý nghĩa (có các toán tử luận lý và lượng hóa) để đảm bảo các thuật ngữ được chính xác Để đạt được điều này, cần có các Ontology để mô tả các thuật ngữ này và thiết lập mối quan hệ giữa chúng.

Ontology là một bản thể mô tả rõ ràng các khái niệm và mối quan hệ trong một miền ứng dụng Nó cung cấp từ vựng chung cho việc trao đổi thông tin giữa các ứng dụng và dịch vụ Web Phần ngữ nghĩa của Web ngữ nghĩa bao gồm Ontology cùng với các giá trị cụ thể của các khái niệm được định nghĩa trong Ontology.

Việc sử dụng Ontology yêu cầu phải có định nghĩa rõ ràng, thiết kế chính xác và ngôn ngữ Ontology tương thích với Web để hỗ trợ công việc suy diễn Một số ngôn ngữ như XML, RDF và RDFS đáp ứng được khả năng mô tả nhưng lại không thể suy diễn hoặc có khả năng suy diễn yếu.

Các thủ tục suy diễn đóng vai trò quan trọng trong việc đảm bảo chất lượng của Ontology Trong quá trình thiết kế Ontology, các thủ tục này được xây dựng để kiểm tra tính hợp chuẩn của các khái niệm và mối quan hệ của chúng Việc bổ sung thông tin vào các khái niệm trong giai đoạn thiết kế cần được kiểm tra để đảm bảo các định nghĩa trong Ontology đạt được kết quả mong đợi Hơn nữa, thông tin này rất hữu ích cho việc tối ưu hóa tìm kiếm trên web Sự tương tác và tích hợp giữa các phần khác nhau của Ontology cũng là yếu tố quan trọng cần được chú ý.

Các thủ tục suy diễn sẽ được áp dụng khi Ontology đã được triển khai hoàn tất, tức là khi trang web đã có các khái niệm được chứng thực Giai đoạn này là rất quan trọng để đảm bảo tính chính xác và hiệu quả của hệ thống.

67 yờu cầu kết quả suy diễn nghiờm ngặt hơn so với giai ủoạn thiết kế và tớch hợp cỏc Ontology lại với nhau

Dựa trên các yêu cầu cho một ngôn ngữ đảm bảo các tính chất đã nêu, chúng ta có thể nhận thấy rằng logic mô tả là một ngôn ngữ hỗ trợ hiệu quả cho việc thiết kế Ontology, và do đó, nó thường được xem là ngôn ngữ Ontology.

Logic mô tả là ngôn ngữ Ontology

Một Ontology chất lượng cao là nền tảng quan trọng cho Web ngữ nghĩa, và việc xây dựng, tích hợp, phát triển nó phụ thuộc vào ngữ nghĩa được thêm vào cùng với khả năng của công cụ suy diễn Logic mô tả đáp ứng được hai khả năng này và được coi là ngôn ngữ Ontology.

Ngôn ngữ DAML+OIL, được phát triển bởi tổ chức W3C, là một phần quan trọng trong lĩnh vực ngôn ngữ Ontology Cú pháp của DAML+OIL là một sự mở rộng của RDF Schema, cho phép định nghĩa ngữ nghĩa một cách chính xác thông qua logic mô tả SHIQ.

Cỏc ủặc ủiểm chớnh của SHIQ là:

 Cú chứa giới hạn số ủầy ủủ (qualified number restrictions)

 Ví dụ 5.1: Khái niệm “a person who has at most one son and at most one daughter” ủược mụ tả như sau:

 Cú thể thành lập cỏc tiền ủề thuật ngữ phức tạp

 Vớ dụ 5.2:Khỏi niệm “humans have human parents” ủược mụ tả như sau:

 Cú cỏc vai trũ ủảo (inverse roles), vai trũ bắc cầu (transitive roles), và vai trũ subrole

Logic mô tả SHIQ

- hasChild cú vai trũ ủảo hasParent

- hasAncestor là vai trò bắc cầu

- hasParent là subrole của hasAncestor

Cỏc ủặc ủiểm này ủúng vai trũ quan trọng khi mụ tả thuộc tớnh của cỏc ủối tượng tập hợp và khi xây dựng các Ontology

5.4.1 Cú pháp và ngữ nghĩa vai trò SHIQ

Định nghĩa 5.1 xác định rằng R là một tập hợp các vai trò, bao gồm R+, là tập hợp các vai trò bắc cầu, và RP, là tập hợp các vai trò còn lại Tất cả các vai trò SHIQ được biểu diễn bởi tập R.

Trong lý thuyết vai trò, vai trò U được gọi là vai trò cha của vai trò r Một tiền đề vai trò bao gồm dạng r⊐ trong hệ thống vai trò s, với s là các vai trò thuộc SHIQ Một tập hợp hữu hạn các tiền đề vai trò được gọi là hệ thống phân cấp các vai trò.

Phép thông dịch I =(∆ I , I ) là một khái niệm quan trọng, bao gồm một miền khác rỗng ∆ I , được gọi là miền của I, và một hàm dịch I Hàm dịch này ánh xạ mỗi vai trò vào tập con của ∆ I × ∆ I , sao cho với mọi và p∈R r∈.

Phép thông dịch thỏa một hệ thống phân cấp khi và chỉ khi I R r I ⊆ s I với mọi r⊐ s∈ R, khi ủú ủược gọi là mụ hỡnh của I R

Việc không giới hạn cách sử dụng các vai trò trong tất cả các tạo tử khái niệm của SHIQ sẽ dẫn đến các bài toán DL không thể quyết định Do đó, trước hết chúng ta cần định nghĩa các tập con tương thích của các vai trò SHIQ.

(1) Quan hệ ủảo hai ngụi thỡ cú tớnh chất ủối xứng Nghĩa là quan hệ ủảo của r - lại là r

Để tránh các cách viết như r - - , r - - - , chúng ta định nghĩa một hàm lnv Hàm này trả về giá trị ủảo như sau: lnv(r) = r nếu r là một tên vai trò, và lnv(r) = s nếu r = s - đối với tên vai trò s.

Bài viết này đề cập đến tính chất bao hàm của tập hợp và mối quan hệ giữa hai vai trò có thể chuyển đổi thành vai trò ảo Để áp dụng các quan hệ bao hàm bổ sung trong một hệ thống cấp vai trò cụ thể, chúng ta định nghĩa R là phản xạ bắc cầu, với R được mở rộng bằng cách thêm các yếu tố lnv ln(r)⊐ (s) r s ⊐ ∈ vào tập hợp.

Kí hiệu r ≡ s là viết tắt của r R s s và R r Trong trường hợp này, mỗi mô hình của thông dịch các vai trò này giống như một quan hệ hai ngôi R

Quan hệ hai ngôi có tính bắc cầu nếu và chỉ nếu ảnh của nó có tính bắc cầu Điều này có nghĩa là nếu r tương đương với R s và lnv có tính bắc cầu, thì mọi mô hình của thông dịch r (r) R s sẽ giống như một quan hệ hai ngôi có tính bắc cầu Để tính toán và áp dụng các vai trò bắc cầu, chúng ta định nghĩa hàm Trans như sau: true nếu r thuộc R+ hoặc lnv(r) thuộc R+ đối với mọi r tương đương R s.

(4) Một vai trũ ủược gọi là ủơn ủối với nếu và chỉ nếu Transr R (s, R) = false ủối với mọi s R r

5.4.2 Cú pháp và ngữ nghĩa khái niệm SHIQ

 ðịnh nghĩa 5.2 ðặt NC là một tập tên các khái niệm Tập các khái niệm SHIQ là tập nhỏ nhất sao cho:

 Mỗi tên khái niệm A N∈ C là một khái SHIQ

 Nếu C và D là các khái niệm SHIQ và là một vai trò r SHIQ thì C D, C D, ⊓ ⊔ ơC, ∀r.C và ∃r.C là cỏc khỏi niệm SHIQ

 Nếu C là một khái niệm SHIQ r, là một vai trò SHIQ nguyên tố và n thì ∈ ( ≤ n r.C) và (≥n r.C) là các khái niệm SHIQ

Hàm thông dịch I của phép thông dịch I =(∆ I , I ) ánh xạ mỗi khái niệm vào tập con của ∆ I sao cho:

Trong tập M, các lực lượng được xác định bởi r I (x,C) ={y |(x,y) ∈ r I ∧ y∈ C I Nếu x thuộc C I, thì x được coi là một thể hiện của C Hơn nữa, nếu (x,y) thuộc r I, thì y được gọi là kế vị vai trò r (r-successor) của x.

Trong SHIQ, các khái niệm được xây dựng để mô tả các khái niệm trong miền ứng dụng Bộ khẳng định TBox cung cấp tên viết tắt để diễn đạt các khái niệm phức tạp trong miền này Đồng thời, TBox trong SHIQ cho phép trạng thái có nhiều ràng buộc phức tạp.

Một bao hàm khái niệm GCI (a general concept inclusion) trong SHIQ có dạng

Trong lý thuyết SHIQ, C ⊐ D thể hiện mối quan hệ giữa các khái niệm, trong đó C và D là các khái niệm trong tập hợp Một tập hợp hữu hạn các GCI được gọi là bộ thuật ngữ TBox T Mô hình của TBox T được xác định khi I thỏa mãn tất cả các GCI trong T, tức là C I ⊆ D I phải đúng với mọi C ⊐ D thuộc T.

Một ủịnh nghĩa khỏi niệm cú dạng A ≡ C, trong ủú A là tờn khỏi niệm, ủược hiểu là viết tắt của hai GCIs A ⊐ C và C ⊐ A

Cỏc bài toỏn suy diễn ủược ủịnh nghĩa ủối với một TBox T và một hệ phõn cấp vai trò như sau:

Khái niệm C được định nghĩa là thỏa mãn với hệ phân cấp và thỏa mãn TBox T nếu và chỉ nếu R tồn tại một mô hình của T mà I R C I ≠ ∅ Một phép thuần dịch như vậy được gọi là mô hình thỏa mãn và thỏa mãn với T.

Khỏi niệm D bao hàm khỏi niệm C ủối với < , T> ủược viết là C R ⊐ D nếu và chỉ nếu C I ⊆D I ủược thỏa với mọi mụ hỡnh của và của T I R

Hai khỏi niệm C, D ủược gọi là tương ủương nhau ủối với ủược viết là R

C≡ < ,T> R D nếu chúng bao hàm qua lại lẫn nhau

Bài toán tương ương trong SHIQ có thể được chuyển đổi thành bài toán bao hàm khái niệm, trong đó bài toán bao hàm khái niệm có thể được biến đổi thành bài toán thỏa mãn khái niệm Cụ thể, điều này được thể hiện qua mối quan hệ C ⊐ D, nếu và chỉ nếu C ⊓ D không thỏa mãn với R và T.

Mô tả Ontology bằng ngôn ngữ SHIQ

Một cỏch tổng quỏt, một Ontology cú thể ủược xem là hỡnh thức húa của TBox

T ðể sử dụng ngụn ngữ SHIQ mụ tả Ontology, trước tiờn chỳng ta ủưa ra cỏc giới hạn hỗ trợ cho việc ghi chỳ nhằm mục ủớch giới hạn lại từ vựng chỳ thớch sao cho hợp lý Tiếp theo chỳng ta xỏc ủịnh cỏc khỏi niệm cú liờn quan với nhau trong miền ứng dụng bằng cỏch ủịnh nghĩa cỏc khỏi niệm với lưu ý là ủịnh nghĩa khỏi niệm cú dạng A ≡ C là hai GCIs A C và C A A ủược gọi là ủịnh nghĩa khỏi niệm nếu ⊐ ⊐ nú ở vế trỏi của ủịnh nghĩa và ngược lại, A ủược gọi là khỏi niệm nguyờn tố nếu nú ở vế phải của ủịnh nghĩa

Chúng ta cần các định nghĩa khái niệm có khả năng tương tác Để thực hiện điều này, một tập các định nghĩa khái niệm bổ sung vào GCIs phải thỏa ba điều kiện sau đây.

 Khụng cú cỏc ủịnh nghĩa phức tạp Tức là mỗi ủịnh nghĩa khỏi niệm cú tờn xuất hiện nhiều nhất một lần bờn vế trỏi của ủịnh nghĩa

 Khụng tồn tại cỏc ủịnh nghĩa cú chu trỡnh

 Tờn ủịnh nghĩa khụng ủược xuất hiện bất cứ ủõu trong GCIs bổ sung

Ngược lại với cỏc ủịnh nghĩa khỏi niệm, cỏc GCIs trong SHIQ cú chu trỡnh phụ thuộc giữa các tên khái niệm

TBox SHIQ là một công cụ mạnh mẽ để mô hình hóa các khái niệm trong miền ứng dụng thông qua các GCIs, khai báo bắc cầu và bao hàm vai trò Các khái niệm phức tạp hơn có thể được xây dựng từ các định nghĩa khái niệm Việc đưa ra một phép thuần dịch các khái niệm và các định nghĩa cơ bản đảm bảo tính duy nhất trong việc diễn dịch các định nghĩa khái niệm.

Nguyên tắc phân loại một TBox được xác định bởi một hệ thống phân cấp của các định nghĩa khái niệm Nó có thể được tính toán bằng thuật toán bao hàm khái niệm SHIQ Để kiểm tra TBox, chúng ta cần xác minh tính thỏa mãn của các định nghĩa khái niệm và xác định xem vị trí của nó có tương thích trong hệ thống phân loại hay không.

Khả năng diễn đạt xuất sắc của SHIQ, cùng với cơ chế suy diễn hiệu quả để kiểm tra TBox, là lý do chính khiến SHIQ trở thành một ngôn ngữ Ontology rất phù hợp.

SHIQ và DAML+OIL

DAML+OIL là ngôn ngữ Ontology được sử dụng để mô tả dữ liệu cho Web ngữ nghĩa, với khả năng định nghĩa thông qua DL có ý nghĩa Việc ánh xạ này cho phép DAML+OIL khai thác sức mạnh của DL và các bộ suy diễn như FaCT++ và RACER, cung cấp dịch vụ suy diễn cho các ứng dụng DAML+OIL.

DAML+OIL is an extension of the RDF (Resource Description Framework) syntax, designed to be compatible with the Semantic Web The fundamental structure of RDF is represented as a labelled directed graph, consisting of nodes that can either be resources or literals (such as strings or numeric data) The relationships within this framework are defined by triples, which follow the format (Subject, Property, Object), where the Subject is a resource, the Property is a labelled edge, and the Object can be either a resource or a literal.

Mọi thứ được mô tả bằng RDF đều là các resource, có thể là một URL hoặc các resource ẩn danh Resource có thể là toàn bộ trang web (được xác định bằng URL) hoặc một phần của trang web, cũng như các đối tượng không thể truy xuất thông qua web Property là thuộc tính hoặc mối liên hệ được sử dụng để mô tả một resource.

Các Constructor Cú pháp DL Ví dụ intersectionOf unionOf complementOf oneOf toClass hasClass hasValue minCardinalityQ maxCardinalityQ inverseOf

Human Male ⊓ Doctor Lawyer ⊔ ơMale {JONH, MARRY}

(≥ 2 hasChild.Lawyer) (≤ 1 hasChild.Male) hasChildOf

Bảng 5.1 Cú pháp tương ứng của DAML+OIL và DL

Một Ontology DAML+OIL cú thể ủược xem là tương ủương với một TBox DL

Cả hai đều mô tả miền ứng dụng thông qua các lớp (tương ứng là các khái niệm) và các thuộc tính (tương ứng là các vai trò) Một Ontology bao gồm một tập các tiên đề.

Trong bài viết này, chúng ta khẳng định các quan hệ bao hàm giữa các lớp hoặc giữa các thuộc tính Việc xác nhận một cá thể là thể hiện của một lớp DAML+OIL ở vế trái của RDF là điều cần thiết để đảm bảo tính chính xác và liên kết trong dữ liệu.

DAML+OIL là một chuẩn trong ngữ nghĩa DLs, cho phép xây dựng các lớp từ các tên hoặc biểu thức dựa trên các lớp đơn giản và thuộc tính Tập hợp các toán tử hỗ trợ cho việc xây dựng DAML+OIL tương ứng với cú pháp DL, như đã trình bày trong bảng 5.1 Ngôn ngữ XML tiếp tục phát huy cú pháp của RDF, tạo ra một nền tảng vững chắc cho việc phát triển ngữ nghĩa.

 Ví dụ 5.4: Với khái niệm Human Male⊓ Ta có

< daml:intersectionOf rdf: parseType= “daml:collection”>

 Ví dụ 5.5: Với khái niệm ≥ 2 hasChild Lawyer Ta có

Chỉ thị daml: dựng ủể chỉ khụng gian tờn (namespaces) XML cho cỏc resource và rdf: parseType= “daml:collection”> là một mở rộng của DAML+OIL tới RDF

Một điểm quan trọng của DAML+OIL là ngoài các lớp "trừu tượng" được định nghĩa trong ontology, nó còn sử dụng các kiểu dữ liệu mô hình XML (XML Schema datatypes) như hasClass, hasValue và cardinality Ví dụ, lớp Adult có thể được khẳng định là tương ứng với Person ⊓ age.over17, trong đó ever17 là một XML Schema datatype số thập phân, nhưng cần có thêm giới hạn giá trị tối thiểu là 18 Sự kết hợp giữa XML Schema và RDF cho phép chúng ta diễn đạt như sau:

Axiom Cú pháp DL Ví dụ subClassOf sameClassOf subPropertyOf disjoinWith sameIndividualAs differentIndividualFrom uniqueProperty unambiguousProperty

Mother ⊐ Woman Man ≡ Person ⊓⊓⊓⊓ Male hasDaughter ⊐ hasChild Male ⊐ ơFemale

{President_Bush}≡{G_Bush} {JONH }⊐ ơ{PETER}

T ⊐ ( ≤ 1 isMotherOf ) Bảng 5.2 Cỏc tiờn ủề DAML+OIL

Một Ontology DAML+OIL bao gồm các tiên đề (Axiom) cần thiết Bảng 5.2 tóm tắt các tiên đề hỗ trợ cho DAML+OIL Những tiên đề này giúp xác định các quan hệ bao hàm hoặc tương đương giữa các lớp, thuộc tính, và các lớp không giao nhau, tương đương hoặc không tương đương.

DAML+OIL hỗ trợ mô tả các thuộc tính của thuộc tính, cho phép xác định thuộc tính duy nhất, thuộc tính mập mờ và tính chất bắc cầu Điều này cho thấy rằng, bên cạnh các cá thể và datatype, các constructor và tiên đề của DAML+OIL đều có thể được chuyển đổi sang SHIQ.

Suy diễn trong SHIQ

Suy diễn trong SHIQ liên quan đến việc xác định bài toán thỏa mãn khái niệm và bao hàm khái niệm SHIQ đối với TBox T và hệ phân cấp vai trò Bài toán này có thể biến đổi về bài toán thỏa mãn khái niệm Nhờ vào SHIQ, các vai trò bắt cầu và các vai trò subrole được hỗ trợ, cho phép chúng ta biến đổi bài toán thỏa mãn khái niệm đối với T và với bài toán thỏa mãn khái niệm đối với TBox T rỗng và với R.

Cuối cựng chỳng ta cần chứng minh C ˆ 0 là thỏa ủối với mở rộng nếu và chỉ nếu R

C0 ban ủầu là thỏa ủối với T và R Để quyết định bài toán thỏa mãn khái niệm SHIQ, cần có một thuật giải cho các R vai trò bắc cầu Có nhiều cách tiếp cận để giải bài toán này, nhưng ở đây chúng ta chỉ đề cập đến thủ tục quyết định dựa trên tableau và mở rộng của nó cho SHIQ, như đã trình bày trong chương 3.

Công cụ tạo Ontology Protégé 4.0

Protégé là nền tảng mã nguồn mở miễn phí, cung cấp công cụ cho việc xây dựng mô hình miền và ứng dụng cơ sở tri thức với Ontology Nó hỗ trợ tạo, hiển thị và thao tác Ontology thông qua các mô tả khác nhau, đồng thời cho phép tùy chỉnh để đáp ứng nhu cầu nhập liệu và tạo mô hình tri thức Ngoài ra, Protégé có thể mở rộng bằng cách thêm plug-in và API trên nền tảng Java, đồng thời xuất dữ liệu ra nhiều định dạng file khác nhau như RDF(S), OWL và XML Schema.

Protộgộ platform hỗ trợ hai mụ hỡnh Ontology sau ủõy:

Protégé – Trình biên tập khung: Cho phép người dùng tạo và quản lý các khung Ontology dựa trên chuẩn OKBC (Giao thức Kết nối Cơ sở Tri thức Mở) Mô hình này bao gồm một tập hợp các lớp được tổ chức thành một hệ thống phân cấp nhằm mô tả các khái niệm chính trong một miền, cùng với các liên kết giữa các lớp để mô tả các thuộc tính và mối quan hệ của chúng, và một tập hợp các thể hiện – các cá thể.

Protégé – OWL editor là công cụ cho phép người dùng xây dựng các Ontology hỗ trợ cho Web ngữ nghĩa, đặc biệt là OWL theo tiêu chuẩn của tổ chức W3C Ontology OWL bao gồm các mô tả về lớp, thuộc tính và các thể hiện của chúng Với Protégé – OWL editor, người dùng có thể dễ dàng tạo và quản lý các ontology này.

- Nạp và lưu Ontology RDF và OWL

- Soạn thảo và hiển thị các lớp và các thuộc tính theo qui luật SWRL (Semantic Web Rule Language)

- Sửa ủổi cỏc cỏ thể OWL cho việc ủỏnh dấu Semantic Web

Phiên bản Protégé 4.0 được phát hành vào ngày 16/6/2009, phát triển song song với các phiên bản 3.x và có nhiều ưu điểm nổi bật Phiên bản này hỗ trợ OWL 2, tích hợp trực tiếp với các bộ suy diễn như FaCT++, Pellet và RACER Nó cho phép soạn thảo nhiều Ontology cùng một lúc và có khả năng tạo, nhập, xuất và quản lý nhiều tab Toàn bộ mã nguồn chương trình Protégé và các plug-ins có thể được tải về tại địa chỉ: http://protege.stanford.edu.

Một Ontology ủược xõy dựng bằng chương trỡnh Protộgộ 4.0 bao gồm cỏc thành phần sau ủõy:

 Individuals (cỏc thể hiện): Mụ tả cỏc ủối tượng trong một miền ứng dụng Individual ủược xem như là thể hiện của một lớp

Lớp (class) là một tập hợp các đối tượng được tổ chức theo cấu trúc phân cấp, bao gồm lớp cha và lớp con, nhằm mục đích phân loại và quản lý các đối tượng một cách hiệu quả.

Properties can be categorized into three basic types: object properties, datatype properties, and annotation properties.

Object properties illustrate the relationships between entities in a Protégé framework Key types of object properties include Functional properties (which have a single value), Inverse Functional properties (which are relational), Transitive properties (which exhibit a chain relationship), Symmetric properties (which are bidirectional), Antisymmetric properties (which show non-reciprocal relationships), Reflexive properties (which relate to themselves), and Irreflexive properties (which do not relate to themselves).

Thuộc tớnh chỳ giải ủược sử dụng ủể thờm cỏc thụng tin (metadata – dữ liệu về dữ liệu) cho cỏc lớp, cỏc cỏ thể và cỏc ủối tượng

 Ví dụ về các loại thuộc tính:

Để xây dựng một Ontology, trước tiên chúng ta cần xác định miền ứng dụng Sau đó, tiến hành xác định các khái niệm và liệt kê chúng, phân cấp các lớp, xác định các thuộc tính và các ràng buộc Cuối cùng, cần kiểm tra và tạo các thể hiện cho các lớp đã xác định.

Tống kết chương

The ABox A21 presents a contradiction with the assertions Person(x) and Person(x)s Similarly, ABox A22 contains conflicting statements with Female(x) and Female(x) In ABox A23, the elements include Person(x), Female(x), and the conjunction of Person and Female, denoted as (Person Female)(x).

- Áp dụng Luật →∃∃∃∃ tới ABox A23

- Áp dụng Luật →∀∀∀∀ tới A 23 Vỡ A 23 chứa hasChild.ơPerson(x) và ủó cú ∀ hasChild(x,y) nên:

Như vậy ABox A23 xảy ra mõu thuẫn vỡ chứa hai khẳng ủịnh là Person(y) và ơPerson(y)

- Quay lui trở về kiểm tra ABox A13 Áp dụng Luật →⊔ ⊔ ⊔ ⊔ tới ABox A13 thu ủược 2 ABox:

Cả hai ABox này ủều chứa mõu thuẫn Thuật toỏn kết thỳc

Do ủú ABox A = C(x) khụng thỏa Suy ra C khụng thỏa

Tiêu đề	Tổng Quan Về Logic Mô Tả Và Ứng Dụng
Tác giả	Đinh Văn Phụng
Người hướng dẫn	PGS.TS Trần Đình Khang
Trường học	Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	luận văn thạc sĩ
Năm xuất bản	2009
Thành phố	Hà Nội

Định dạng
Số trang	103
Dung lượng	2,66 MB