3.2.2.1. LFoC và cấu trúc ngữ nghĩa vốn có của chúng
(xxxvii) Từ khái niệm về khung nhận thức mờ của một biến trong lý thuyết tập mờ, một khái niệm tương tự nhưng dưới dạng ngôn ngữ được gọi là khung nhận thức ngôn ngữ (LFoC) được giới thiệu trong [62]. Chúng ta có thể hình dung cách một người bày tỏ ý kiến của mình về tuổi của người khác như sau. Nếu anh ta cảm thấy rằng người đó không ở độ tuổi trung niên, anh ta có thể dễ dàng quyết định người đó hoặc là ‘young’ hoặc ‘old’. Trường hợp anh ta quyết định là ‘old’ nhưng nếu anh ta cảm thấy rằng ‘old’ vẫn còn quá chung chung thì anh ta cố gắng chọn một trong các từ cụ thể hơn ‘old’. Các từ đó có thể gồm ‘Little old’, ‘Rather old’, ‘More old’, ‘Very old’, và ‘Extremly old” chẳng hạn. Anh ta phải quyết định chọn từ nào trong các từ được sắp theo thứ tự tuyến tính là phù hợp với ngữ cảnh để mô tả tuổi của người đó, v.v. Từ quan sát này, ta đặt ra yêu cầu về ngữ nghĩa của các LFoC phải có tính chất sau.
(xxxviii) Định nghĩa 3.5. Cho cấu trúc SA= (XA, ≤, g) được thiết lập dựa trên ĐSGT của biến A mô hình hóa miền từ XA và một LFoC �� là một tập con hữu hạn của XAthì:
1)�� đóng với mức đặc tả cao hơn nếu ∀x ∈ ��, và ∀h, k ∈ H, hx ∈ �� thì kx ∈ ��; 2)�� đóng theo quan hệ g nếu ∀y ∈ ��, g(x, y) là đúng trong SAthì g(x, y)
đúng trong trong ��. Nó có nghĩa là nếu y ∈ �� và x khái quát hơn y thì x
∈ ��;
3) �� là tập cấu trúc con của SAnếu thỏa mãn điều kiện 1) và 2) ở trên. (xxxix) Nhận xét 3.2:
a) Trong trường hợp miền từ của A được mô hình hóa bởi ĐSGT mở rộng �� = (�� ,
G, C, Hen, ≤), tập các gia tử Hen được bổ sung với một gia tử nhân tạo, h0. Do
� � �
d)
e) các từ có dạng h0x, x ∈ XA, là những từ nhân tạo, chỉ đơn thuần được sử dụng để biểu diễn lõi ngữ nghĩa của từ x, trong khi tập từ của �� được đề cập trong Định nghĩa 3.5, �� không bắt buộc phải chứa bất kỳ từ nhân tạo nào.
f) Định nghĩa tính đóng �� theo quan hệ g trong 2) của Định nghĩa 3.5, tương tự như tính đóng trong đại số tập con với các toán tử của nó.
g) Trong luận án này sử dụng định nghĩa �� ở trên thay vì định nghĩa được đưa ra trong [62] để nhấn mạnh yêu cầu về ngữ nghĩa của �� phải là một cấu trúc con của toàn bộ cấu trúc ngữ nghĩa SAcủa biến A. Ví dụ, về cấu trúc con của SA
được biểu diễn trong Hình 3.1 là tập �� = {0, c−, Vc−, Lc−, VVc−, LVc−, VLc−, LLc−}, có thể dễ dàng kiểm chứng rằng nó thỏa mãn 3) của Định nghĩa 3.5.
3.2.2.2. Khả năng mở rộng ngữ nghĩa của LFoC
a) Để chứng tỏ ngữ nghĩa của các LFoC được xây dựng dựa trên ĐSGT
có khả năng mở rộng. Chúng ta tiến hành nghiên cứu mối quan hệ của các cấu trúc ngữ nghĩa hiện có của các LFoC �� với cấu trúc ngữ nghĩa SAcủa XA. Mối quan hệ này tương tự như mối quan hệ giữa cấu trúc của tập hữu hạn các số nguyên được sử dụng trong máy tính với cấu trúc của toàn bộ tập số nguyên. Nó gợi ý rằng, chúng ta phải nghiên cứu xem �� có cấu trúc ngữ nghĩa như thế nào và quan hệ giữa cấu trúc ngữ nghĩa
b) của LFoC ��, kí hiệu là ��, với �� trên toàn miền ��.
c) � � �
d) Trong thực tế, trong vòng đời của ứng dụng, người sử dụng thường đòi hỏi cần tăng số lượng từ ngôn ngữ của biến A, chẳng hạn �� tăng lên mức ��,
với l > k. Như e) � �
f) vậy, xuất hiện vấn đề quan hệ ngữ nghĩa định tính của các từ trong các tập ��, � và g) ��, hay quan hệ các cấu trúc ngữ nghĩa của ��, ��
và �� . h) � �
i) � �
j) Trong thực tiễn, với một tri thức trong một lĩnh vực nào đó của con người, ngữ nghĩa của các từ, nhìn chung là không thay đổi trong khi tri thức đó vẫn gia tăng cùng với sự tồn tại và phát triển của xã hội. Vì vậy luận án đứng trên quan điểm các từ ngôn
k) ngữ cùng có trong các tập ��, �� và �� có ngữ nghĩa như nhau. Và nếu chúng ta chứng
l) � �
m) minh được rằng quan hệ cấu trúc giữa các từ cùng có trong các cấu trúc ��, �� và ��
n) � �
o) cũng giống nhau, tức �� là cấu trúc con của ��, và �� là cấu trúc con của �� thì chứng
p) � � �
q) tỏ rằng �� có thể mở rộng thành �� và nó đảm bảo ngữ nghĩa của các từ của �� trong
r) � � �
s) �� không bị thay đổi. Để chứng minh điều này, trước tiên chúng ta nghiên cứu khái niệm cấu trúc con trong toán học và từ đó áp dụng để nghiên cứu cấu trúc con của �� .
a. Cấu trúc con trong toán học
t) Trước hết, ta cần nhắc lại một khái niệm toán học về cấu trúc con của
3 � � � � � �
một cấu trúc toán học, được lược giản tính tổng quát, nhưng vẫn phù hợp với nội dung nghiên
w)
x) cứu của luận án và được phát biểu như sau (lưu ý rằng hàm f : X1 × … ×Xn
→ X(n + 1) được phát biểu bằng biểu thức quan hệ như sau: quan hệ r, (n + 1)-ngôi
biểu thị qua hệ hàm f như trên, và gọi là quan hệ hàm n-ngôi, nếu với mọi hai véc tơ, (x1 × … ×xn ×x(n + 1)), (y1 × … ×yn ×y(n + 1)) ∈ X1 × … ×X(n + 1), và thỏa điều kiện
xj = yj, với mọi j = 1, …, n, thì xn + 1 = yn + 1)
y) Định nghĩa 3.6. Cho một cấu trúc C = (D, r1, …,rj), trong đó D là tập các phần tử, còn ri, i = 1, …, j, là các quan hệ tổng quát hay quan hệ hàm (tức là, có một biến X sao cho tất cả các biến khác bằng nhau thì giá trị của biến X phải bằng nhau) có ni- ngôi bất kì, xác định trên miền tích Đề Các ni chiều trên cùng miền D, ��� =
z) � ×. . . ×�. Khi đó, C * = (D*, r1*, …rj*), với D* ⊆D, được gọi là cấu trúc con của
aa) C nếu:
ab)
ac) (∀ri)(∀dl ∈ D*, l = 1, …, ni) [nếu ri(d1, …�� ) là đúng trong cấu trúc con C *, ad) thì ri(d1, …���) cũng đúng
trong C]. Để làm sáng tỏ thêm ý nghĩa định nghĩa này, ta xét một số ví dụ sau:
∘Xét C = (D, ≼, ∨, ∧) là một cấu trúc thứ tự, trong đó ≼ là một quan hệ thứ tự bộ phận và hai phép max (∨) và min (∧). Khi đó, với mọi tập con thực sự D’ của D mà là D’ một đoạn thì cấu trúc C’ = (D’, ≼, ∨, ∧) là một cấu trúc con của C.
∘Xét cấu trúc số nguyên N = (N, +, −). Khi đó, với mọi tập con N’ hữu hạn của ae) N, cấu trúc (N’, +, −) không phải là cấu trúc con của N.
af) Để nghiên cứu cấu trúc ngữ nghĩa của tập ��, ta sẽ sử dụng một kết quả hiển ag) nhiên trong toán học sau:
ah) Định lý 3.2. Cho hai cấu trúc toán C → C’. Nếu ánh xạ f : C → C’ là một ánh xạ đẳng cấu nhúng cấu trúc C vào cấu trúc C’, thì ảnh f(C) nhúng trong C’ là một cấu trúc con của C’.
b. Quan hệ giữa các cấu trúc ngữ nghĩa ��, �� và �� của các LFoCs ��, ��
c. và �� tương ứng d. � � � e. � �
f.Một câu hỏi cần đặt ra liệu LFoC, ��, có cấu trúc ngữ nghĩa không, và nếu có (kí hiệu là ��) thì liệu nó có phải là cấu trúc con của SA?
� � � � � � � �
g. Cấu trúc �� của biến ngôn ngữ A có tiềm năng vô hạn từ, nhưng ứng dụng thực tế, vào một thời điểm người ta chỉ sử dụng một tập con hữu hạn các từ,
��, với mức đặc tả là k. Tuy nhiên, về ngữ nghĩa định tính của một từ x bất kỳ được sử dụng, chúng
� �
j.
k. tôi cho rằng ngữ nghĩa của x phải được xác định trong ngữ cảnh toàn miền
�� của biến ngôn ngữ. Vì vậy, về mặt phương pháp luận cần đòi hỏi việc tính toán hay thao tác trên cấu trúc �� cũng chính là những tính toán hay thao tác trên toàn cấu trúc �� , nghĩa là �� phải cấu trúc con của �� .
l.Để trả lời cho câu hỏi trên, luận án phát biểu định lý sau đây:
m. Định lý 3.3. Mọi LFoC được khai báo của A có mức đặc tả k, �� = �� , có cấu
n. � )(((((((((((((((
o. trúc ngữ nghĩa �� = (��, ≤k, gk) là một cấu trúc con đóng của cấu trúc ngữ nghĩa
p. � �
q. SA= (XA, ≤, g) và có thể mở rộng.
r.Chứng minh: Cấu trúc SA = (XA, ≤, g) có hai quan hệ, quan hệ thứ tự toàn phần, hay tuyến tính, ≤, và quan hệ khái quát - đặc tả g, g(x, y) ⇔ H(y) ⊆ H(x). Trong cấu trúc ��, vì ≤ là toàn phần nên nó cảm sinh thứ tự x ≤k y, nghĩa là x ≤k y
⇒x ≤ y.
s. Theo định nghĩa, quan hệ bao hàm ⊆ trên XA cảm sinh một quan hệ bào hàm ⊆k
t. trên �� bằng hệ thức, U ⊆k Z ⇔U ∩�� ⊆Z ∩��, và gọi là quan hệ bao hàm của u. � v. XAhạn chế trên tập con ��. w. � �
x. Xét quan hệ gk được cảm sinh từ g, nghĩa là, với x, y ∈ , gk(x, y) là đúng nếu
y. H(y) ⊆H(x) được hạn chế trên tập �� là đúng, tức ta có H(y) ∩�� ⊆H(x) ∩��.
z. � � �
aa.Ngược lại, nếu gk(x, y) là đúng, tức ta có x, y ∈ và H(y) ∩�� ⊆H(x) ∩��.
ab. � ��
ac. Nếu x và y không có quan hệ khái quát - đặc tả, thì trong ĐSGT ta có H(x) ∩H(y) =
ad. ∅. Điều này mâu thuẫn với hệ thức bao hàm ngay trên. Do đó, nếu x và y có quan hệ khái quát - đặc tả thì từ hệ thức bao hàm đó ta suy ra g(x, y) là đúng.
ae. Như vậy ta rút ra kết luận cấu trúc �� là cấu trúc con đóng của �� .
af. Vì cấu trúc ngữ nghĩa của A là SA được biểu diễn bằng một bụi �� được mô tả trong Hình 1.2, có thể thấy rằng các nút của �� nằm trên mức l, l = 1, …, k, cùng với tất cả các cạnh hiện có của các nút này cũng tạo thành một bụi. Nó được gọi là bụi mức
ag. k và được ký hiệu là ��, có thể đại diện cho cấu trúc con ��. Bụi mức k �� có thể mô
ah. � � �
ai. tả rõ ràng hơn khả năng mở rộng của tập từ được khai báo ��: khi �� mở rộng thành
aj. � �
ak. �� thì cấu trúc ngữ nghĩa �� của ��chỉ cần bổ sung thêm các
nút trên mức k +
al. �+1 am.
�+1 an. �+1
1 và các cạnh hiện có của �� nối với các nút không thuộc ��. Do đó, sự mở rộng
ao. �+1 �
ap. này không thay đổi ngữ nghĩa của các từ của �� trong ngữ cảnh của �� . ∎
aq. �
ar.
as. 3.2.3 Khả năng mở rộng của các cấu trúc tr-MGr của LFoC at. �+1 � � � � � � � � � � � �
au. Trong mục này, luận án nghiên cứu khả năng mở rộng của các tập từ đang được sử dụng và cấu trúc tập mờ của chúng trong các LRBS để giải các bài toán hồi quy dựa trên việc khai thác các đặc điểm tri thức của con người sau đây:
ax.
- Thực tế không có hạn chế về số lượng các từ trên các miền từ của các biến ngôn ngữ của một tập dữ liệu trong miền tri thức của con người. Tuy nhiên, trong một số nghiên cứu tiếp cận dựa trên lý thuyết tập mờ, số lượng tập mờ được xây dựng cho một biến thường bị giới hạn bởi 7 ± 2. Giới hạn này là quá nhỏ so với số lượng từ ngôn ngữ có thể có của một biến. Bên cạnh đó, để giải một bài toán hồi quy, người ta có thể quan sát thấy rằng số lượng từ sử dụng cho các biến của tập dữ liệu càng nhiều thì các LRBS có thể tạo ra kết quả chính xác hơn.
- Ngoài ra, trong thực tế cũng không có giới hạn về kích thước của miền tri thức của con người. Tận dụng đặc điểm này cho việc thiết kế các LRBS, người ta cũng có thể nhận thấy rằng các cơ sở luật của LRBS càng phong phú (nhiều luật), thì kết quả của FRBS càng chính xác.
ay. Khi áp dụng LRBS để giải bài toán hồi quy cụ thể trong thực tế, sẽ thuận lợi khi thiết lập một phương pháp có thể phát triển các LRBS mà cơ sở luật của chúng có những tính chất ở trên. Tức là số từ sử dụng của mỗi biến là không hạn chế, và số luật của nó cũng không bị giới hạn. Trong quá trình ứng dụng chúng ta có thể cung cấp cho người dùng một cách tùy chọn để cải thiện độ chính xác của kết quả đầu ra bằng cách tăng kích thước cơ sở luật ngôn ngữ của các LRBS hiện có hoặc và tăng số từ sử dụng cho mỗi biến. Từ vấn đề này, phát sinh câu hỏi là làm thế nào thuật toán có thể thiết kế các LRBS độ chính xác cao hơn từ các LRBS đã được thiết kế để tận dụng tính tối ưu của LRBS đã có?
az. Yêu cầu này đòi hỏi cấu trúc tr-MGr � � của cấu
trúc ngữ nghĩa �� có khả
ba. ,,,,,,,,,,,,,,, �
bb. năng mở rộng. Cấu trúc tr-MGr �� có khả năng mở rộng nhằm đảm bảo rằng khi người dùng muốn nhận được LRBS có độ chính xác hơn từ LRBS đã được thiết kế bằng cách tăng mức đặc tả của các tập từ của một số biến và số lượng các LRB của chúng, trong khi vẫn bảo toàn ngữ nghĩa của các LRB và các từ hiện có của LRBS đã được xây dựng trước đó (tức là giữ nguyên mọi cấu trúc ngữ nghĩa của tập từ �� của
bc. ��).
bd.Định nghĩa 3.7 [65] Tập các tập mờ hình thang T(��) của tập từ �� được xây
be. � �
bf. dựng bởi thủ tục TrP có tính mở rộng được nếu tập từ �� của nó tăng kích cỡ lên thì
bg. các tập mờ hình thang T(��) không bị thay đổi.
bh. Với cấu trúc tr-MGr �� được xây dựng bởi thủ tục TrP, tương tự định
lý 4
bi. trong [65], ta có định lý sau:
bj.Định lý 3.4. Cấu trúc ngữ nghĩa �� = (��, ≤k, gk) của tập từ được khai báo ��
bk. � � �
bl. là có tính giải nghĩa được trong cấu trúc ��
của tập các tập mờ hình thang T(��) bm. ,,,,,,,,,,,,,,, � � � ��, � � � � � � � �� ,,,,,,,,,,,,,,,
bn. bo. bp.
bq. được xây
dựng bằng thủ tục TrP cho ��. Một cách tương đương, cấu trúc �� là
br. � ��,�
bs. một ảnh đẳng
cấu của ngữ nghĩa của �� = (��, ≤k, gk). Hơn nữa, cấu trúc �� của
bt. � �
bu. tập T(��) là có khả năng mở rộng.
bv. ��,�
bw. Chứng minh: Bằng thủ tục TrP được mô tả trong Mục 3.1.2, định nghĩa một phép biến đổi T: �� →T(��). Thủ tục này thực hiện gán mỗi hình thang
được xây bx. � �
by. dựng của T(��) với một từ của ��. Nó đòi hỏi T là một ảnh đẳng cấu của �� = (��,
bz. � � ��
ca. ≤k, gk), do đó nó phải bảo toàn được quan hệ thứ tự, quan hệ khái quát – đặc tả.
- Bảo toàn quan hệ khái quát – đặc tả:
cb. Giả sử x, y là 2 từ bất kỳ của ��, gk(x, y) ngụ ý rằng T(y) ⊂k T(x) trong T(��)
cc. � �
cd. hoặc tương đương Base(T(y)) ⊂k Base(T(x)), trong đó Base(T(.)) ký hiệu đáy lớn của hình thang T(.). Theo tính chất của đại số gia tử mở rộng thì lõi ngữ nghĩa của các từ {h0x: x ∈ XA} là thứ tự tuyến tính. Khi đó g(x, y) có nghĩa là y = σx với
σ=hi…h1 ∈ H*. Chúng ta có thể chứng minh rằng gk(x, hx) có nghĩa là Base(T(hx))
⊂k Base(T(x)). Không mất tính tổng quát, giả sử x > hx > xL, trong đó xL là từ liền kề
bên trái của từ x trong tập ��. Để đơn giản, giả sử rằng |H-| =|H+| = 2, H- = {h1,
h2} và |H+| = {k1, k2} và xem xét 4 từ của �� nằm giữa xL và x; chúng được sắp xếp như sau h1xL ≤xL ≤k1xL ≤ k2xL ≤h2x ≤h1x ≤x ≤k1x. Do đó, lõi ngữ nghĩa của từ
x là đáy nhỏ của tập mờ hình thang biểu diễn ngữ nghĩa của x, và nó được sắp xếp nằm giữa lõi ngữ nghĩa của xL và k1x. Dựa vào giả thiết ở trên, y = hx < x ta có hx ∈