Hệ thống thông tin dựa trên logic mô tả

Chúng ta thấy rằng, hệ thống thông tin truyền thống chỉ đặc tả các đối tượng thông qua các thuộc tính mà không đề cập đến mối quan hệ, liên kết với nhau giữa các đối tượng. Tuy nhiên, trong thực tế tồn tại những hệ thống thông tin mà các đối tượng không những được đặc tả bằng các thuộc tính mà còn được đặc tả thông qua các mối quan hệ giữa các đối tượng đó. Chẳng hạn, trong Ví dụ 3.1, chúng ta có thể nghĩ đến việc một ấn phẩm này có thể trích dẫn (tham khảo) thông tin từ một ấn phẩm khác. Web ngữ nghĩa là một trong những hệ thống thể hiện rất rõ mối quan hệ này và tính ưu việt của nó trong quá trình suy luận tri thức. Khai thác được mối quan hệ giữa các đối tượng trong các hệ thống thông tin có thể mang lại những lợi ích nhất định trong quá trình phân loại đối tượng.

Có nhiều cách để đặc tả một hệ thống thông tin dựa trên logic mô tả. Chẳng hạn, hệ thống thông tin có thể được đặc tả bằng cách xây dựng diễn dịch một cách cụ thể hoặc có thể đặc tả dựa trên logic mô tả thông qua một cơ sở tri thức không vòng. Ở đây, chúng tôi đặc tả hệ thống thông tin dựa trên logic mô tả lấy cơ sở tri thức không vòng làm nền tảng và thông qua cơ sở tri thức đó để thể hiện thuộc tính của các đối tượng bằng các khái niệm, thể hiện mối quan hệ giữa các đối tượng bằng cách sử dụng các vai trò đối tượng.

Định nghĩa 3.2 (Cơ sở tri thức không vòng). Cơ sở tri thức không vòng trong ngôn ngữ LΣ,Φ là một bộ KB=hR,T,Ai, trong đó:

• R là một danh sách hữu hạn(ψ1, ψ2, . . . , ψm), được gọi là bộ tiên đề vai trò của KB. Mỗi ψi là một tiên đề vai trò có dạng r≡R, trong đó R là một vai trò đối tượng của LΣ,Φ và r∈ΣoR là một tên vai trò đối tượng không có mặt trong R, A và ψ1, ψ2, . . . , ψi−1,

• T là một danh sách hữu hạn (ϕ1, ϕ2, . . . , ϕn), được gọi là bộ tiên đề thuật ngữ của KB. Mỗi ϕi là một tiên đề thuật ngữ có dạng A ≡ C, trong đó C là một khái niệm của LΣ,Φ và A ∈ΣC là một tên khái niệm không có mặt trong C, A và ϕ1, ϕ2, . . . , ϕi−1,

• Alà một tập hữu hạn, được gọi là bộ khẳng định cá thể củaKB, chứa các khẳng

định cá thể.

Một cơ sở tri thức định nghĩa như trên tương tự như một chương trình logic phân tầng [1], [44]. Các tên khái niệm (tương ứng, tên vai trò đối tượng) có mặt trong A được gọi là các khái niệm (tương ứng,vai trò đối tượng) nguyên thủy. Các tên vai trò đối tượng ở về trái của “≡” trong các định nghĩa của R được gọi là vai trò đối tượng định nghĩa. Các tên khái niệm ở vế trái của “≡” trong các định nghĩa củaT được gọi là khái niệm định nghĩa.

Ví dụ 3.2. Ví dụ sau đây đề cập đến các ấn phẩm khoa học: Φ = {I,O,N,Q}, ΣI ={P1,P2,P3,P4,P5,P6},

ΣC ={Pub,Book,Article,Awarded,UsefulPub,GoodPub,ExcellentPub,

RecentPub,CitingP5},

ΣdA = ΣC ∪ {Title,Kind}, ΣnA ={Year}, ΣoR ={cites,cited_by}, ΣdR =∅,

A ={Title(P1) =“Introduction to Logic”,Awarded(P1),

Title(P2) =“The Essence of Logic”,Awarded(P4),Awarded(P6),

Kind(P1) =“book”,Kind(P2) = “book”,Kind(P3) =“book”,

Kind(P4) =“article”,Kind(P5) =“article”,Kind(P6) =“conf. paper”,

Year(P1) = 2010,Year(P2) = 2009,Year(P3) = 2008,Year(P4) = 2007,

Year(P5) = 2006,Year(P6) = 2006,cites(P1,P2),cites(P1,P3),

cites(P1,P4),cites(P1,P6),cites(P2,P3),cites(P2,P4),cites(P2,P5),

cites(P3,P4),cites(P3,P5),cites(P3,P6),cites(P4,P5),cites(P4,P6)},

R ={cited_by ≡cites−},

T ={Pub ≡ >, Book ≡(Kind =“book”), Article ≡(Kind =“article”),

ExcellentPub ≡GoodPubuAwarded, RecentPub ≡(Year ≥2008)}.

Lúc đó KB =hR,T,Ailà một cơ sở tri thức không vòng trongLΣ,Φ. Định nghĩa Pub ≡ >nói lên rằng miền của mô hìnhKB chỉ chứa các ấn phẩm khoa học. Cơ sở tri thức này được minh họa như Hình 3.1, trong đó, các nút ký hiệu cho các ấn phẩm và các cạnh ký hiệu cho các trích dẫn (nghĩa là, các khẳng định của vai trò cites). Hình này chỉ thể hiện các thông tin cần quan tâm như Year,Awarded và cites.

P1 : 2010 Awarded / / '' ,, P2 : 2009 // w w P5 : 2006 P3 : 2008 // 2 2 3 3 P4 : 2007 Awarded 7 7 / / P6 : 2006 Awarded

Hình 3.1: Một minh họa cho cơ sở tri thức của Ví dụ 3.2

Cho cơ sở tri thức không vòng KB = hR,T,Ai. Một mô hình I của KB trong LΣ,Φ được gọi là mô hình chuẩn nếu I thỏa mãn các điều kiện sau:

• ∆I = ΣI (nghĩa là, miền của I chứa tất cả các tên cá thể củaΣ),

• Nếu A∈ΣC là một khái niệm nguyên thủy trong KB thì AI ={a|A(a)∈ A}, • Nếu B ∈ ΣA \ΣC thì BI : ∆I → range(B) là một hàm từng phần sao cho

BI(aI) =cnếu (B(a) =c)∈ A,

• Nếur∈ΣoRlà một vai trò đối tượng nguyên thủy trongKBthìrI ={ha, bi |r(a, b)∈ A}, • Nếu σ∈ΣdR thì σI ={ha, di |σ(a, d)∈ A},

• Nếu r≡R là một định nghĩa vai trò đối tượng trong R thì rI =RI, • Nếu A≡C là một định nghĩa khái niệm trongT thì AI =CI, • Nếu A∈ΣC mà A không có mặt trong KB thì AI =∅,

• Nếu r∈ΣoR mà r không xuất hiện trongKB thì rI =∅.

Như vậy, một mô hình chuẩn của KB là một diễn dịch hữu hạn. Các định nghĩa khái niệm và định nghĩa vai trò đối tượng áp dụng cho giả thiết tên duy nhất và giả thiết thế giới đóng.

Ghi chú 3.1. Giả thiết tên duy nhất được sử dụng để đơn giản hóa vấn đề. Giả thiết này cho phép các ABox có thể chứa các khẳng định cá thể dạng a =b, trong đó

a, b ∈ ΣI với ngữ nghĩa là một diễn dịch I thỏa mãn khẳng định cá thể a = b nếu

aI = bI. Lúc đó, một cơ sở tri thức không vòng trong LΣ,Φ có thể được chuyển đổi thành một cơ sở tri thức không vòng tương đương bằng cách gộp các cá thể bằng nhau lại để chúng trở thành một cá thể duy nhất. Giả thiết tên duy nhất và giả thiết thế giới đóng phù hợp cho các hệ thống thông tin được lấy từ diễn dịch của cơ sở tri thức.

Định nghĩa 3.3. Cho cơ sở tri thức không vòng KB=hR,T,Ai. Hệ thống thông tin dựa trên logic mô tả được xác định bởi một cơ sở tri thức không vòng KB trong LΣ,Φ là một mô hình chuẩn của cơ sở tri thức đó trong LΣ,Φ.

Trong chương này, các hệ thống thông tin dựa trên logic mô tả được sử dụng trong quá trình học khái niệm. Do đó, để đơn giản, thuật ngữ hệ thống thông tin dựa trên logic mô tả được gọi tắt làhệ thống thông tin.

Ví dụ 3.3. Xét cơ sở tri thức KB như đã cho trong Ví dụ 3.2. Hệ thống thông tin được xác định bởi KB là một diễn dịch I như sau:

∆I ={P1,P2,P3,P4,P5,P6}, P1I =P1, P2I =P2, . . . , P6I =P6,

PubI = ∆I, BookI ={P1,P2,P3}, ArticleI ={P4,P5}, AwardedI ={P1,P4,P6},

citesI ={hP1,P2i,hP1,P3i,hP1,P4i,hP1,P6i,hP2,P3i,hP2,P4i,hP2,P5i,hP3,P4i,

hP3,P5i,hP3,P6i,hP4,P5i,hP4,P6i},

cited_byI = (citesI)−1,

UsefulPubI ={P2,P3,P4,P5,P6}, GoodPubI ={P3,P4,P5,P6},

ExcellentPubI ={P4,P6}, RecentPubI ={P1,P2,P3}, CitingP5I ={P2,P3,P4},

các hàm từng phần TitleI, YearI và KindI có thể được xác định bằng cách liệt kê

theo từng cá thể.

Hệ thống thông tin dựa trên logic mô tả

Logic mô tả và các tên gọi

Logic mô tả ALC reg