Ngôn ngữ logic mô tả LΣ,Φ

Một bộ ký tự logic mô tả là một tập hữu hạn Σ = ΣI∪ΣdA ∪ΣnA∪ΣoR∪ΣdR, trong đó ΣI là tập các cá thể, ΣdA là tập các thuộc tính rời rạc, ΣnA là tập các thuộc tính số, ΣoR là tập các tên vai trò đối tượng và ΣdR là tập các vai trò dữ liệu. Tất cả các tập ΣI,ΣdA, ΣnA, ΣoR và ΣdR rời nhau từng đôi một.

Đặt ΣA = ΣdA ∪ ΣnA. Khi đó mỗi thuộc tính A ∈ ΣA có một miền giá trị là range(A). Miền range(A)là một tập khác rỗng đếm được nếu A là thuộc tính rời rạc và có thứ tự “≤” nếu A là thuộc tính liên tục.2 (Để đơn giản, chúng ta không ghi ký hiệu “≤” kèm theo thuộc tính A). Một thuộc tính rời rạc được gọi là thuộc tính Bool nếu range(A) ={true,false}. Chúng ta xem các thuộc tính Bool như là các tên khái niệm. Gọi ΣC là tập các tên khái niệm củaΣ, lúc đó ta có ΣC ⊆ΣdA.

Mỗi tên vai trò đối tượng đại diện cho một vị từ hai ngôi giữa các cá thể. Mỗi vai trò dữ liệu σ có miền giá trị làrange(σ)và σ đại diện cho một vị từ hai ngôi giữa các cá thể với các phần tử trong tập range(σ). Ở đây, các ký tự nhưσ,%, . . . dùng để ký hiệu cho các vai trò dữ liệu; và các ký tự c, d, . . . dùng để ký hiệu cho các phần tử của tập range(A)hoặc range(σ).

Xét các đặc trưng của logic mô tả gồm: I (vai trò nghịch đảo),O (định danh),F (tính chất hàm), N (hạn chế số lượng không định tính), Q (hạn chế số lượng có định tính), U (vai trò phổ quát), Self (tính phản xạ cục bộ của vai trò). Tập các đặc trưng 2Có thể giả sử rằng nếu A là một thuộc tính số thì range(A) là tập các số thực và “≤” là một quan hệ thứ tự giữa các số thực.

của logic mô tả Φlà một tập rỗng hoặc tập chứa một số các đặc trưng nêu trên. Chẳng hạn như Φ ={I,O,Q} để chỉ tập các đặc trưng của logic mô tả gồm: vai trò nghịch đảo, định danh và hạn chế số lượng có định tính.

Luận án xây dựng các thuật toán học máy cho các hệ thống thông tin dựa trên logic mô tả. Cách tiếp cận này phù hợp đối với các hệ thống thông tin thường có trong thực tế. Lý do là các hệ thống thông tin truyền thống được định nghĩa như các bảng dữ liệu về các giá trị của các thuộc tính, các đối tượng chỉ được đặc tả thông qua các thuộc tính. Tuy nhiên, trong thực tế tồn tại những hệ thống thông tin mà các đối tượng không những được đặc tả bằng các thuộc tính mà còn được đặc tả thông qua các mối quan hệ giữa các đối tượng đó. Hệ thống thông tin dựa trên logic mô tả giải quyết được nhược điểm vốn có của hệ thống thông tin truyền thống và phù hợp với thực tế hơn.

Dovroodi và Nguyen [13], [14], Nguyen và Sza las [44] nghiên cứu logic mô tảALCreg với tập các đặc trưng gồm I, O, Q, U và Self. Ngoài những đặc trưng đã đề cập ở trên, luận án này mở rộng lớp các logic mô tả bằng cách xem xét thêm các đặc trưng F và N. Đặc biệt, luận án xem xét thêm các thuộc tính như là các thành phần cơ bản của ngôn ngữ, bao gồm thuộc tính rời rạc và thuộc tính số. Do đó, ngôn ngữ logic mô tả được nghiên cứu trong luận án tổng quát hơn so với công trình của Nguyen và Sza las [44]. Các kết quả trình bày trong các định nghĩa, định lý tiếp theo là những mở rộng của các định nghĩa, định lý trong [13], [14], [44] bằng cách phát triển nó trên một lớp các logic mô tả rộng hơn.

Định nghĩa 1.4 (Ngôn ngữ LΣ,Φ). Cho Σ là bộ ký tự logic mô tả, Φ là tập các đặc trưng của logic mô tả và L đại diện choALCreg. Ngôn ngữ logic mô tả LΣ,Φ cho phép các vai trò đối tượngvà các khái niệm được định nghĩa đệ quy như sau:

• Nếu r∈ΣoR thì r là một vai trò đối tượng của LΣ,Φ, • Nếu A∈ΣC thì A là một khái niệm của LΣ,Φ,

• NếuA∈ΣA\ΣC vàd∈range(A)thìA=dvàA6=dlà các khái niệm củaLΣ,Φ, • Nếu A ∈ ΣnA và d ∈ range(A) thì A ≤ d, A < d, A ≥ d và A > d là các khái

niệm của LΣ,Φ,

• NếuR vàS là các vai trò đối tượng củaLΣ,Φ,C và Dlà các khái niệm củaLΣ,Φ,

r ∈ΣoR,σ ∈ΣdR,a ∈ΣI và n là một số tự nhiên thì

– ε, R◦S , RtS, R∗ và C? là các vai trò đối tượng của LΣ,Φ,

– Nếud ∈range(σ)thì ∃σ.{d} là một khái niệm của LΣ,Φ, – NếuI ∈Φ thì R− là một vai trò đối tượng của LΣ,Φ, – NếuO ∈Φ thì {a} là một khái niệm của LΣ,Φ, – NếuF ∈Φ thì ≤1r là một khái niệm của LΣ,Φ, – Nếu{F,I} ⊆Φthì ≤1r− là một khái niệm của LΣ,Φ, – NếuN ∈ Φthì ≥n r và ≤n r là các khái niệm củaLΣ,Φ,

– Nếu{N,I} ⊆Φthì ≥n r− và ≤n r− là các khái niệm củaLΣ,Φ, – NếuQ ∈Φ thì ≥n r.C và ≤n r.C là các khái niệm củaLΣ,Φ,

– Nếu{Q,I} ⊆Φthì ≥n r−.C và ≤n r−.C là các khái niệm củaLΣ,Φ, – NếuU ∈Φ thì U là một vai trò đối tượng của LΣ,Φ,

– NếuSelf ∈Φthì ∃r.Self là một khái niệm của LΣ,Φ.

Định nghĩa 1.5(Ngữ nghĩa củaLΣ,Φ). Mộtdiễn dịchtrongLΣ,Φlà một bộI=∆I,·I

, trong đó∆I là một tập khác rỗng được gọi làmiềncủaI và·I là một ánh xạ được gọi làhàm diễn dịchcủaI cho phép ánh xạ mỗi cá thểa ∈ΣI thành một phần tửaI ∈∆I, mỗi tên khái niệm A ∈ ΣC thành một tập AI ⊆ ∆I, mỗi thuộc tính A ∈ ΣA\ΣC thành một hàm từng phần AI : ∆I → range(A), mỗi tên vai trò đối tượng r ∈ ΣoR

thành một quan hệ hai ngôi rI ⊆∆I ×∆I và mỗi vai trò dữ liệu σ ∈ΣdR thành một quan hệ hai ngôi σI ⊆∆I×range(σ). Hàm diễn dịch·I được mở rộng cho các vai trò đối tượng phức và các khái niệm phức như trong Hình 1.3, trong đó #Γ ký hiệu cho

lực lượng của tập Γ.

Chúng ta nói CI (tương ứng, RI) là diễn dịch của khái niệm C (tương ứng, vai trò R) trong diễn dịchI. Một khái niệm C được gọi là thỏa mãnnếu tồn tại một diễn dịch I sao cho CI 6= ∅. Nếu aI ∈ CI, lúc đó chúng ta nói a là một thể hiện của C

trong diễn dịchI. Để ngắn gọn, ta viếtCI(x)(tương ứng,RI(x, y),σI(x, d)) thay cho

x∈CI (tương ứng, hx, yi ∈RI, hx, di ∈σI). Cho diễn dịch I = ∆I,·I

trong ngôn ngữ LΣ,Φ. Chúng ta nói rằng đối tượng

x ∈ ∆I có độ sâu là k nếu k là số tự nhiên lớn nhất sao cho tồn tại các đối tượng

x0, x1, . . . , xk∈∆I khác nhau từng đôi một thỏa mãn: • xk =x và x0 =aI với a∈ΣI,

• xi 6=bI với mọi1≤i≤k và với mọi b∈ΣI,

• với mỗi 1≤i≤k tồn tại một vai trò đối tượngRi của LΣ,Φ sao choRIi(xi−1, xi) thỏa mãn.

Chúng ta ký hiệu I|k là diễn dịch thu được từ diễn dịch I bằng cách hạn chế miền ∆I của diễn dịchI chỉ bao gồm các đối tượng có độ sâu không lớn hơn k và hàm diễn dịch ·I được hạn chế một cách tương ứng. (R◦S)I = RI◦SI (RtS)I = RI∪SI UI = ∆I×∆I (CuD)I = CI∩DI (R∗)I = (RI)∗ (R−)I = (RI)−1 >I = ∆I ⊥I =∅ (CtD)I = CI∪DI (C?)I = {hx, xi |CI(x)} εI = {hx, xi |x∈∆I} (¬C)I = ∆I \CI {a}I = {aI} (A≤d)I ={x∈∆I |AI(x) xác định và AI(x)≤d} (A≥d)I ={x∈∆I |AI(x) xác định và AI(x)≥d} (A=d)I ={x∈∆I |AI(x) = d} (A 6=d)I = (¬(A=d))I (A < d)I = ((A≤d)u(A6=d))I (A > d)I = ((A ≥d)u(A6=d))I (∀R.C)I ={x∈∆I | ∀y[RI(x, y)⇒CI(y)]} (∃r.Self)I ={x∈∆I |rI(x, x)} (∃R.C)I ={x∈∆I | ∃y[RI(x, y)∧CI(y)]} (∃σ.{d})I ={x∈∆I |σI(x, d)} (≥n R.C)I ={x∈∆I |#{y|RI(x, y)∧CI(y)} ≥n} (≥n R)I = (≥n R.>)I (≤n R.C)I ={x∈∆I |#{y|RI(x, y)∧CI(y)} ≤n} (≤n R)I = (≤n R.>)I

Hình 1.3: Diễn dịch của các vai trò phức và khái niệm phức

Logic mô tả và các tên gọi

Logic mô tả ALC reg