Trong chương này, luận án đã hệ thống lại những kiến thức cơ sở liên quan đến các hệ dựa trên luật ngơn ngữ mờ, giới thiệu cấu trúc của hệ dựa trên tri thức luật ngơn ngữ mờ và ứng dụng giải bài tốn phân lớp dựa trên luật ngơn ngữ mờ. Mức độ cần thiết của các kiến thức này đối với luận án như sau:
- Nghiên cứu các thành phần của hệ dựa trên tri thức luật ngơn ngữ mờ là cơ sở để thiết kế và tối ưu hĩa hệ này khi ứng dụng giải bài tốn phân lớp dựa trên luật ngơn ngữ mờ trong các chương sau.
- Các cơng thức tính độ tin cậy, tính độ hỗ trợ, tính trọng số luật và các phương pháp lập luận để phân lớp dữ liệu đều được kế thừa áp dụng trong các tiếp cận thiết kế tự động FLRBC với ngữ nghĩa tính tốn của các từ ngơn ngữ được xác định dựa trên ĐSGT.
Chương này cũng trình bày những khái niệm cơ bản của ĐSGT, phương pháp lượng hĩa ĐSGT truyền thống và ý nghĩa ứng dụng của ĐSGT trong giải quyết các bài tốn ứng dụng thực tiễn nĩi chung và ứng dụng trong thiết kế FLRBC nĩi riêng. Các vấn đề cịn tồn tại của các phương pháp thiết kế FLRBC đã được đề xuất trước đĩ và hướng giải quyết của luận án cũng được trình bày trong chương này.
CHƯƠNG 2
LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG CỦA KHUNG NHẬN THỨC NGƠN NGỮ VÀ ỨNG DỤNG GIẢI BÀI TỐN PHÂN LỚP
Chương này nghiên cứu phát triển mở rộng lý thuyết ĐSGT mơ hình hĩa lõi ngữ nghĩa của các từ ngơn ngữ nhằm thiết lập một cơ chế hình thức cho việc sinh ngữ nghĩa tính tốn dựa trên tập mờ hình thang của khung nhận thức và cĩ thể được ứng dụng để giải quyết các bài tốn khác nhau, luận án sẽ chứng tỏ tính hiệu quả trong ứng dụng thiết kế tự động FLRBC.
2.1. MỞ RỘNG ĐẠI SỐ GIA TỬ CHO VIỆC MƠ HÌNH HĨA LÕI NGỮ NGHĨA
CỦA CÁC TỪ NGƠN NGỮ
ĐSGT cung cấp một cơ sở hình thức tốn học cho việc mơ hình hĩa và thiết kế các từ ngơn ngữ cùng với ngữ nghĩa tính tốn dựa trên tập mờ của chúng và cĩ thể được ứng dụng để giải quyết các bài tốn ứng dụng trong thực tiễn như điều khiển mờ, hồi quy và dự báo, phân lớp dựa trên luật ngơn ngữ mờ, … Trong những mơ hình ứng dụng như vậy, ngữ nghĩa tính tốn dựa trên tập mờ của các từ ngơn ngữ được sử dụng trong biểu diễn các luật ngơn ngữ mờ được xây dựng trực tiếp từ ngữ nghĩa định tính vốn cĩ của các từ ngơn ngữ. Các từ ngơn ngữ này được lựa chọn tự động từ các khung nhận thức ngơn ngữ (linguistic frames of cognition - LFoC), kí hiệu là , bao gồm tập hợp các từ ngơn ngữ được sắp thứ tự truyền đạt ngữ nghĩa nghĩa vốn cĩ của chúng [58]. Với việc cảm sinh các từ ngơn ngữ của các ĐSGT của các biến ngơn ngữ và biểu diễn chính tắc dưới dạng chuỗi của chúng thì mỗi LFoC đủ giàu đối với biến ngơn ngữ tương ứng và đáp ứng yêu cầu lựa chọn các từ ngơn ngữ cho quá trình nhận thức trong các ứng dụng thực tiễn.
Ta cĩ thể hình dung khái niệm lõi ngữ nghĩa (semantics core) của các từ ngơn ngữ từ quan sát sau. Mọi từ mang ngữ nghĩa mờ x của một biến ngơn ngữ với miền tham chiếu số U biểu diễn mối quan hệ của x với các giá trị của U, tức là mỗi giá trị số của U phù hợp với x ở một độ chắc chắn nhất định. Trong thực tiễn, chẳng hạn, các từ mơ tả biến vật lý phản ảnh một tập liên tục các trạng thái như từ “rất nhanh” chỉ về tốc độ của xe ơ tơ, nĩ biểu thị một khoảng, ví dụ [120, 150] theo đơn vị km/h. Khoảng này cĩ thể chứa một miền giá trị phù hợp với ngữ nghĩa “rất nhanh” nhất. Ví dụ, mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngơn ngữ TOCDO và các giá trị của U cĩ thể được biểu diễn dưới dạng các tập mờ như trong Hình 2.1. Như vậy, ngữ nghĩa của mỗi từ đều cĩ lõi và được gọi là lõi ngữ nghĩa. Ký hiệu Core(x) là lõi ngữ nghĩa của x thì Core(x) = {u: (u) = 1} và ngữ nghĩa
của x là tập Sem(x) = {u:x(u) (0, 1]}. Như vậy, với việc biểu diễn ngữ nghĩa tính tốn của x dưới dạng tập mờ, ta cĩ mơ hình số của lõi ngữ nghĩa là Core(x) và của ngữ nghĩa của từ là Sem(x). Từ ngữ nghĩa trực quan của lõi ngữ nghĩa và tính thứ tự của các từ của X, ta nhận thấy rằng lõi ngữ nghĩa của hai từ ngơn ngữ bất kỳ x, y
X và ngữ nghĩa tương ứng của chúng thỏa các điều kiện sau: (C1) Core(x) Sem(x);
(C2) Nếu x ≤ y thì Core(x) ≤ Core(y), Core(x) ≤ Sem(y) và Sem(x) ≤ Core(y).
Hình 2.1. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngơn ngữ TOCDO và các giá trị của tập nền U được biểu diễn dưới dạng các tập mờ. Câu hỏi được đặt ra là khái niệm lõi ngữ nghĩa được hình thức hĩa dưới dạng các tiên đề với cấu trúc của ĐSGT như thế nào, hay nĩi cách khác, lõi ngữ nghĩa của các từ ngơn ngữ cĩ thể được mơ hình hĩa dưới dạng quan hệ thứ tự ngữ nghĩa hay khơng? Nếu câu trả lời được khẳng định, ta cĩ một cơ chế hình thức dựa trên ngữ nghĩa vốn cĩ của các từ ngơn ngữ để thiết kế tự động ngữ nghĩa dựa trên tập mờ của các từ ngơn ngữ cĩ lõi của các tập mờ là các khoảng.
Trong phương pháp hình thức hĩa ĐSGT, lõi ngữ nghĩa của từ ngơn ngữ x cần được sinh từ gia tử nên một gia tử nhân tạo h0 được bổ sung nhằm cảm sinh lõi ngữ nghĩa của x là h0x. Ý tưởng đặt ra là tận dụng gia tử đặc biệt h0 trong các nghiên cứu [53, 54], trong đĩ h0 được xem như tốn tử đồng nhất I (tốn tử đơn vị). Với tốn tử
I, ta cĩ Ix = x, x X và chỉ đĩng vai trị kỹ thuật hình thức để bảo đảm rằng x
HI(x), xX. Khi I xuất hiện trong biểu diễn chính tắc của một từ x thì khơng cịn hiệu lực tác động đối với các gia tử lên x, ta cĩ hm…hjIhj-1…h1c = Ihj-1…h1c = hj-
1…h1c. Tương tự, ta giả thiết gia tử nhân tạo h0 chỉ sinh ra phần tử h0x, với x X \ C, mà khơng thể tham gia sinh thêm các từ mới từ phần tử h0x X, nghĩa là h0 cĩ tính chất ℎ = ℎ , trong đĩ σH. 1 150 70 rất nhanh nhanh lõi
Nội dung tiếp theo sẽ chỉ ra rằng bất kỳ ĐSGT AX = (X, C, G, H, ) tuyến tính và tự do đều cĩ thể được mở rộng bằng việc bổ sung thêm một gia tử h0 với chức năng cảm sinh duy nhất một từ ngơn ngữ cĩ dạng h0x với mọi x X \ C. Việc mở rộng một ĐSGT tuyến tính AX được thực hiện như sau.
Định nghĩa 2.1. Mở rộng ngữ cảnh của một ĐSGT tuyến tính và tự do AX = (X, C,
G, H, ) là ĐSGT mở rộng AXmr = (Xmr, C, G, Hmr, ), trong đĩ C cũng là tập các hằng tử của AXmr, Hmr = HI {h0} = H+ H {I, h0}, ở đĩ H = {h-q, …, h-2, h-
1}, h-q < ... < h-2 < h-1 và H+ = {h1, h2 ,... , hp}, h1 < h2 < ... < hp, HI = H {I}, Xmr =
X {h0x: x X \ C} và ≤ là quan hệ thứ tự mở rộng của X trên Xmr, nếu nĩ thỏa các tiên đề sau:
(A1) Tốn tử đơn vị V trong H+ là dương hoặc âm đối với mọi tốn tử trong H. Chẳng hạn, V là dương đối với chính nĩ và đối với tốn tử đơn vị L trong H-. (A2) Nếu u, vX là độc lập, tức là uHI(v) và vHI(u) thì xHI(u) x
HI(v).
(A3) Kế thừa của gia tử: Với x X, h, k, h’, k’ H, ta cĩ: (i) x ≠ hxxHI(hx).
(ii) h ≠ k & hx kx h’hx k’kx.
(iii)hx ≠ kx thì hx và kx là độc lập.
(A4) u X, nếu vHI(u) và v u (v ≥ u) thì v hu (v ≥ hu) với h HI. (A5mr) Các tiên đề về lõi ngữ nghĩa của từ ngơn ngữ: với x, y Xmr và x ≠ y,
(i) hh0x = h0x với h Hmr, tức là h0x bao giờ cũng là điểm bất động đối với mọi gia tử và với x X, h0x = x khi và chỉ khi x là hằng, ngược lại x và h0x là khơng sánh được với nhau.
(ii) Với ∀ , ∈ , < ⟹ ℎ < & < ℎ . □
Trong Định nghĩa 2.1, các tiên đề của ĐSGT tuyến tính và tự do AX, từ (A1)
đến (A4), vẫn được giữ nguyên để đảm bảo rằng ĐSGT mở rộng AXmr được giới hạn trên tập các từ X trùng khớp với ĐSGT AX. Các tiên đề của AXmr được bổ sung nhằm mục đích mơ tả các đặc trưng của lõi ngữ nghĩa của các từ ngơn ngữ dưới dạng quan hệ thứ tự.
mệnh đề được chứng minh trên AX vẫn đúng đối với AXmr. Nhớ rằng, trong ĐSGT
AX ta đã cĩ:
hpx ≥ x h–qx ≤ … ≤ h–1x ≤ x ≤ h1x ≤ … ≤ hpx
hpx ≤ x hpx ≤ … ≤ h1x ≤ x ≤ h–1x ≤ … ≤ h–qx
Vì ĐSGT AX là tuyến tính nên theo tính chất (2) của Định lý 1.1, ta cĩ: {0} ≤ Hmr(c) ≤ {W} ≤ Hmr(c+) ≤ {1}
hpx ≥ x Hmr(h–qx) ≤ … ≤ Hmr(h–1x) ≤ x ≤ Hmr(h1x) ≤ … ≤ Hmr(hpx) (2.1)
hpx ≤ x Hmr(hpx) ≤ … ≤ Hmr(h1x) ≤ x ≤ Hmr(h–1x) ≤ … ≤ Hmr(h–qx) (2.2) Theo biểu diễn chính tắc của x và z, nếu ∉ ( ) thì ∉ (ℎ … ℎ ) với
hm, …, h1 là các gia tử bất kỳ trong H và (ℎ … ℎ ) ⊆ ( ). Từ (A5mr) ta cĩ:
hpx ≥ x Hmr(h–qx) ≤ … ≤ Hmr(h–1x) ≤ h0x ≤ Hmr(h1x) ≤ … ≤ Hmr(hpx) (2.1mr)
hpx ≤ x Hmr(hpx) ≤ … ≤ Hmr(h1x) ≤ h0x ≤ Hmr(h–1x) ≤ … ≤ Hmr(h–qx) (2.2mr) Nghĩa là cả x và h0x đều nằm xen giữa Hmr(h–1x) và Hmr(h1x). Tuy nhiên, ta thấy
x và h0x khơng cĩ quan hệ thứ tự với nhau và ngữ nghĩa của h0x bị ngậm trong ngữ nghĩa của x. Vì h0 là gia tử nhân tạo khơng cĩ trong ngơn ngữ tự nhiên, nên nếu nĩ xuất hiện và khơng dư thừa, thì chỉ xuất hiện một lần ở đầu một xâu x, tức là nĩ cĩ dạng x = h0hm ... h1c, với hjh0, j = 1, …, m. Khi h0 đã xuất hiện trong x thì ta quy ước mọi h (kể cả h0) tác động vào x đều khơng cĩ tác dụng nữa, nghĩa là hh0x = h0x.
Ví dụ 2.1. Ta cĩ các phần tử sinh G = {0, “trẻ”, W, “già”, 1}, các hằng C = {0, W,
1}, gia tử âm H = {“ít”} và gia tử dương H+ = {“rất”}. Hmr = H+ H {I, h0}. Ở đây ta cĩ thể coi W = “trung niên”.
Với k = 2, trong AX, ta cĩ X2 = {“rất trẻ”, “ít trẻ”, “ít già”, “rất già” }. Trong
AXmr, = {h00, “rất trẻ”, “h0trẻ”, “ít trẻ”, h0W, “ít già”, “h0già”, “rất già”, h01}. Trong ngữ cảnh này, hai từ “trẻ” và “già” vẫn xuất hiện cùng với các từ cĩ độ dài 2 khác nhưng ngữ nghĩa của chúng bị co lại thành lõi ngữ nghĩa tương ứng. □
Các tính chất sau của AXmr mơ tả chi tiết hơn về lõi ngữ nghĩa của các từ ngơn ngữ và cấu trúc thứ tự của Xmr.
Định lý 2.1. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến tính và tự do AX = (X, C, G, H, ). Khi đĩ,
(ii) x, y Xmr, x ≠ y, ta cĩ < ⟺ < ℎ ⟺ ℎ < ⟺ ℎ < ℎ . Vì vậy tập {h0x: x X} được sắp tuyến tính.
(iii)Tập = ∪ {ℎ : ∈ ( )} được sắp tuyến tính. □
Chứng minh.
(i) Khẳng định đầu tiên của tính chất (i) được suy ra từ tiên đề (A5mr)(i) và thực tế là các hằng số trong C là những điểm bất động cho mỗi ĐSGT. Khẳng định cịn lại h0x X được suy từ tính tuyến tính của X và tính khơng sánh được của x và
h0x.
(ii) Để chứng minh tính chất (ii), giả sử thứ nhất là cả x, y X, nghĩa là x, y
{h0u: u X}, các phép tương đương là hiển nhiên vì chúng là những điểm bất động. Vì vậy, ta giả sử, hoặc x, hoặc y, hoặc cả hai thuộc X.
Trường hợp 1: Chỉ x hoặc y thuộc X, giả sử x X và y X, cĩ nghĩa là y = h0v
với v X. Vì y là điểm bất động, do đĩ h0y = y, các phép tương đương trong (ii) thu về một phép tương đương < ℎ ⟺ ℎ < ℎ , phép này hiển nhiên đúng bởi (A5mr)(ii) do h0v đĩng vai trị của y.
Trường hợp 2: Cả x, y X. Do x < y x < h0y được suy trực tiếp từ (A5mr)(ii) nên để chứng minh phép suy ngược lại ta giả sử x < h0y. Vì x, y X, giả sử x > y thì khi đĩ x > h0y, trái với bất đẳng thức giả thiết. Điều này chỉ ra tính đúng đắn của phép tương đương thứ nhất trong (ii).
Việc chứng minh < ⟺ ℎ < tương tự như trên.
Giờ ta chứng minh phép tương đương < ⟺ ℎ < ℎ . Nếu cả x, y C thì chúng là các điểm bất động, khi đĩ phép tương tương hiển nhiên đúng. Giờ ta giả sử chỉ một trong x và y thuộc C. Vì X \ C = HI(c-) HI(c+), ta cĩ yHI(c) với c {c-, c+} và vì AX là sinh tự do nên hy ≠ y với h H. Ta sẽ chỉ ra rằng, tồn tại v
X sao cho x < v < y. Thật vậy, nếu x C thì từ x < y ta cĩ < ( ) ∋ , dẫn đến x
< HI(y) vì HI(y) HI(c). Vì H bao gồm các gia tử âm và gia tử dương nên cĩ một h
H sao cho hy < y và ta cĩ v = hy, là từ ta cần. Bây giờ ta xem xét trường hợp x
C, cĩ nghĩa là x HI(c’). Giả sử c’ ≠ c, ta cĩ x < W < HI(y) và khi đĩ v = W, là từ ta cần. Giả sử c’ = c, khi đĩ x và y cĩ xâu con chung lớn nhất là hj-1, …, h1c và ta cĩ thể viết x = σxhu và σyku, trong đĩ h ≠ k, h, k HI và σx, σyH*, tập tất cả các xâu gia tử trong H. Từ (2.1) và (2.2), x < y kéo theo hu < ku, dẫn đến HI(hu) < HI(ku), dù h = I hay khơng. Vì cĩ ít nhất một trong các gia tử h và k khơng phải là I nên
khơng làm mất tính tổng quát ta giả sử k ≠ I. Do H bao gồm các gia tử âm và dương nên tồn tại h’ H sao cho h’y < y. Vì h’y HI(ku) và x HI(hu) và HI(hu)
HI(ku) nên suy ra v = h’y thỏa các bất đẳng thức x < v < y. Như vậy, ta vừa chứng minh rằng, với x, yX và { , } ⊈ luơn tồn tại vHI(y) sao cho x < v < y.
Vì x < v < y và do (A5mr)(ii), ta suy ra h0x < v < h0y, điều này chỉ ra rằng chiều thuận () trong phép tương đương cần chứng minh là đúng đắn. Để chứng minh chiều nghịch (), ta giả sử h0x < h0y nhưng x ≥ y. Vì dấu bằng khơng thể xảy ra nên ta cĩ x > y và kéo theo h0x > h0y như đã được chứng minh ở trên, trái với giả thiết ta đưa ra. Các phép tương đương của tính chất (ii) đã được chứng minh.
Vì X được sắp tuyến tính, khẳng định cịn lại của (ii) được suy trực tiếp từ bất đẳng thức < ⟺ ℎ < ℎ .
(iii)Vì Xk và {h0z : z X(k-1)} là các tập được sắp tuyến tính, để chứng minh tính chất (iii) chỉ cần xét trường hợp xXk và y = h0z, với z X(k-1). Vì X được sắp tuyến tính và x và z khơng bằng nhau nên ta cĩ thể giả sử x < z hoặc x > z. Tuy nhiên, theo tính chất (ii) đã được chứng minh ở trên, cả hai trường hợp đều dẫn đến
x và z là sánh được với nhau.
Với hệ tiên đề được đưa ra theo cách ĐSGT AX là cấu trúc con của ĐSGT AXmr
và Xmr = X {h0x: x X \ C}, tất cả các từ ngơn ngữ và các gia tử trong các tiên đề từ (A2) đến (A4) đều được giả định là của AX. Do vậy, AXmr được xem là một mở rộng đơn giản của AX. Tuy nhiên, các tiên đề từ (A2) đến (A4) vẫn đúng đối với AXmr qua định lý sau.
Định lý 2.2. Cho AXmr = (Xmr, C, G, Hmr, ) là một ĐSGT mở rộng của một ĐSGT tuyến tính và tự do AX = (X, C, G, H, ). Nếu các tập X và H xuất hiện trong các tiên đề (A2), (A3), (A4) được thay thế tương ứng bởi Xmr và Hmr thì các mệnh đề được ký hiệu tương ứng là (A2mr), (A3mr), (A4mr) vẫn đúng đối với AXmr. □
Chứng minh. Để chứng minh tính đúng đắn của (A2mr), (A3mr), (A4mr), ta cần xem xét các từ và gia tử mà các tiên đề (A2), (A3), (A4) khơng thể áp dụng.
(A2mr) Ta xem xét hai từ độc lập u, v Xmr, nghĩa là ∉ ( ) và ∉ ( ) và ta chỉ xem xét các từ u và v mà (A2) khơng thể áp dụng. Vì vậy, trước tiên ta giả thiết u = h0z và v X. Theo (A5mr)(i) thì h0z là một điểm bất động, ta cĩ
( ) = {ℎ } và vì vậy, điều kiện ∈ ( ) dẫn đến x = h0z. Vì u = h0z và v
Bây giờ ta giả sử uX và v = h0z, và vì vậy ( ) = {ℎ }. Bởi u và v là độc