Một trong những mục đích của luận án là sử dụng mô phỏng hai chiều để thực hiện việc phân hoạch miền của một diễn dịch. Để làm được điều này chúng ta cần phải xây dựng được mô phỏng hai chiều trên cùng một diễn dịch, được gọi là tự mô phỏng hai chiều. Từ kết quả của các nghiên cứu [14], [44] chúng tôi phát triển các định nghĩa, định lý sau đây trên lớp ngôn ngữ đã đề cập trong Mục 1.2.2 của Chương 1. Định nghĩa 2.8 (Tự mô phỏng hai chiều). Cho I là một diễn dịch trong LΣ,Φ. Một LΣ†,Φ†-tự mô phỏng hai chiềucủa I là một LΣ†,Φ†-mô phỏng hai chiều giữa I và chính nó. Một LΣ†,Φ†-tự mô phỏng hai chiều Z của I được gọi là lớn nhất nếu với mọi LΣ†,Φ†-tự mô phỏng hai chiều Z0 của I thì Z0 ⊆Z.
ChoI là một diễn dịch trongLΣ,Φ, chúng ta ký hiệu LΣ†,Φ†-tự mô phỏng hai chiều lớn nhất của I là ∼Σ†,Φ†,I, và ký hiệu quan hệ hai ngôi ≡Σ†,Φ†,I trên ∆I là quan hệ thỏa mãn tính chất x≡Σ†,Φ†,I x0 khi và chỉ khi x LΣ†,Φ†-tương đương với x0.
Định lý 2.5 sau đây nói lên rằng tự mô phỏng hai chiều lớn nhất trên một diễn dịch là tồn tại và nó là một quan hệ tương đương. Vì là nó một quan hệ tương đương nên chúng ta có thể sử dụng nó để mô hình hóa tính không phân biệt được của các đối tượng. Do đó, tự mô phỏng hai chiều lớn nhất đóng một vai trò quan trọng trong quá trình phân hoạch miền của một diễn dịch.
Định lý 2.5. Cho Σ và Σ† là các bộ ký tự của logic mô tả sao cho Σ† ⊆Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆Φ, I là một diễn dịch trong LΣ,Φ. Lúc đó:
1. LΣ†,Φ†-tự mô phỏng hai chiều lớn nhất của I tồn tại và nó là một quan hệ tương đương,
2. nếu I là một phân nhánh hữu hạn đối với LΣ†,Φ† thì quan hệ ≡Σ†,Φ†,I là một LΣ†,Φ†-tự mô phỏng hai chiều lớn nhất của I (nghĩa là, quan hệ ≡Σ†,Φ†,I và
∼Σ†,Φ†,I trùng khớp nhau).
Chứng minh.
- Khẳng định thứ nhất được suy ra trực tiếp từ khẳng định thứ nhất của Bổ đề 2.1. - Xét khẳng định thứ hai, nếu U ∈/ Φ† hoặc Σ† 6= ∅ thì theo Định lý 2.4,≡Σ†,Φ†,I
là một LΣ†,Φ†-tự mô phỏng hai chiều của I. Trường hợpU ∈Φ† vàΣ†I =∅ là cần thiết cho Định lý 2.4 để chứng minh điều kiện (2.16) và (2.17). Thật vậy, trong trường hợp U ∈Φ† và Σ†I = ∅, các điều kiện này rõ ràng thỏa mãn khi I0 =I. Như vậy ≡Σ†,Φ†,I
là một LΣ†,Φ†-tự mô phỏng hai chiều của I.
Bây giờ chúng ta chứng minh ≡Σ†,Φ†,I là một LΣ†,Φ†-tự mô phỏng hai chiều lớn nhất của I. Giả sử Z là một LΣ†,Φ†-tự mô phỏng hai chiều bất kỳ của I. Với mọi
x∈∆I và x0 ∈∆I, ta cần chỉ ra nếuZ(x, x0)thỏa mãn thì x≡Σ†,Φ†,I x0. Vì Z là một LΣ†,Φ†-tự mô phỏng hai chiều củaI và Z(x, x0) thỏa mãn nên theo khẳng định (2.19) với mọi khái niệm Ccủa LΣ†,Φ†,CI(x)thỏa mãn khi và chỉ khiCI(x0)thỏa mãn và do đó x ≡Σ†,Φ†,I x0. Do đó, ta có Z ⊆ ≡Σ†,Φ†,I. Vậy ≡Σ†,Φ†,I là một LΣ†,Φ†-tự mô phỏng
hai chiều lớn nhất của I.
Chúng ta nói rằng tập Y bị phân chia bởi tập X nếu Y \X 6= ∅ và Y ∩X 6=∅. Như vậy, tậpY không bị phân chia bởi tậpX nếu hoặcY ⊆X hoặcY ∩X =∅. Phân hoạch Y={Y1, Y2, . . . , Yn} được gọi lànhất quánvới tập X nếu với mọi1≤i≤n, Yi
không bị phân chia bởi X.
Định lý 2.6 sau đây nói lên khả năng phân hoạch miền của diễn dịch dựa trên mô phỏng hai chiều lớn nhất sao cho nó nhất quán với một tập các đối tượng cho trước. Khi một phân hoạch nhất quán với một tập các đối tượng cho trước, chúng ta có thể biểu diễn tập đó thông qua hợp của một số lớp tương đương trong phân hoạch đó. Từ đó cho phép chúng ta xây dựng thuật toán học một khái niệm trong hệ thống thông tin thông qua mô phỏng hai chiều lớn nhất.
Định lý 2.6. Cho ΣvàΣ† là các bộ ký tự của logic mô tả sao choΣ†⊆Σ, Φvà Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆Φ, I là một diễn dịch hữu hạn trong LΣ,Φ và X ⊆∆I. Gọi Y là phân hoạch của ∆I thông qua quan hệ ∼Σ†,Φ†,I. Lúc đó:
1. nếu tồn tại khái niệmC của LΣ†,Φ† sao choCI =X thì phân hoạchY nhất quán với tập X,
2. nếu phân hoạch Y nhất quán với tập X thì tồn tại khái niệm C của LΣ†,Φ† sao
cho CI =X.
Chứng minh. Vì I là một diễn dịch hữu hạn trong LΣ,Φ nên I thỏa mãn điều kiện phân nhánh hữu hạn đối vớiLΣ†,Φ†. Theo khẳng định (2) của Định lý 2.5, ta có∼Σ†,Φ†,I
trùng khớp với ≡Σ†,Φ†,I.
- Xét khẳng định (1) và giả sử CI = X với C là một khái niệm của LΣ†,Φ†. Gọi
Y = {Y1, Y2, . . . , Yn} là một phân hoạch của ∆I được phân hoạch thông qua quan hệ∼Σ†,Φ†,I. Với1≤i≤n, lấy xvàx0 là hai phần tử bất kỳ củaYi, ta có xvàx0 thuộc về một lớp tương đương được phân hoạch bởi ∼Σ†,Φ†,I. Do∼Σ†,Φ†,I trùng với≡Σ†,Φ†,I
nên x LΣ†,Φ†-tương đương với x0 và do đó x ∈ CI khi và chỉ khi x0 ∈ CI. Nghĩa là {x, x0}không bị phân chia bởiCI. Do vậy,CI phải là hợp của một số lớp tương đương được phân hoạch bởi ∼Σ†,Φ†,I. Từ đó suy ra phân hoạch Y nhất quán với X.
- Xét khẳng định (2) và giả sử Y là một phân hoạch của ∆I được phân hoạch thông qua quan hệ ∼Σ†,Φ†,I và Y nhất quán với X. Lúc đó Y = {U1, U2, . . . , Um} ∪ {V1, V2, . . . , Vn}, trong đóUi ⊆X với mọi1≤i≤m,Vj∩X =∅với mọi1≤j ≤n và
X =U1∪U2∪· · ·∪Um. VìUivàVj là các lớp tương đương khác nhau từng đôi một theo quan hệ ≡Σ†,Φ†,I nên với mọi1≤i≤mvà 1≤j ≤n tồn tại khái niệm Cij củaLΣ†,Φ† sao cho Ui ⊆CijI và Vj ∩CijI =∅. Với mỗi 1 ≤i ≤m, đặt Ci ≡ Ci1uCi2u · · · uCin, ta có Ui ⊆CiI, và Vj∩CiI =∅ với mọi1≤j ≤n. ĐặtC ≡C1tC2t · · · tCm, ta có
Ui ⊆CI với mọi 1≤i≤m và Vj∩CI =∅ với mọi 1≤j ≤n. Do đó, CI =X.
Tiểu kết Chương 2
Thông qua ngôn ngữ LΣ,Φ và ngôn ngữ con LΣ†,Φ†, chương này đã trình bày mô phỏng hai chiều và tính bất biến đối với mô phỏng hai chiều trên một lớp các logic mô tả như đã đề cập trong Chương 1. Các khái niệm, định nghĩa và các định lý, bổ đề cũng như các hệ quả được phát triển dựa trên các kết quả của các công trình [13], [14], [44] với lớp các logic mô tả lớn hơn. Chúng tôi cũng trình bày các chứng minh cho những định lý, bổ đề, hệ quả đã nêu ra trong chương này. Những định nghĩa, định lý này là các công cụ tốt cho nghiên cứu và triển khai về học khái niệm trong logic mô tả. Tính bất biến, đặc biệt là tính bất biến của khái niệm là một trong những nền tảng cho phép mô hình hóa tính không phân biệt được của các đối tượng thông qua ngôn ngữ con. Tính không phân biệt của các đối tượng là một trong những đặc trưng cơ bản trong quá trình xây dựng các kỹ thuật phân lớp dữ liệu. Điều này có nghĩa là chúng ta có thể sử dụng ngôn ngữ con cho các bài toán học máy trong logic mô tả bằng cách sử dụng mô phỏng hai chiều.
Chương 3.
HỌC KHÁI NIỆM CHO HỆ THỐNG THÔNG TIN TRONG LOGIC MÔ TẢ
3.1. Hệ thống thông tin