Khoảng tính mờ (fuzziness interval) của các khái niệm mờ là một khái niệm rất quan trọng làm cơ sở cho việc nghiên cứu và xây dựng các mô hình ứng dụng. Trong ĐSGT, dựa trên độ đo tính mờ fm, chúng ta sẽ định nghĩa khoảng tính mờ của các hạng từ. Gọi Itv([0, 1]) là họ các đoạn con của đoạn [0, 1], ký hiệu || là độ dài của đoạn “”.
Định nghĩa 1.8 [35]: Khoảng tính mờ của các hạng từ xX, ký hiệu
fm(x), là một đoạn con của đoạn [0, 1], fm(x) Itv([0, 1]). Nếu nó có độ dài bằng độ đo tính mờ, |fm(x)| = fm(x), và được xác định bằng qui nạp theo độ dài của x như sau:
(i) Với độ dài của x bằng 1 (l(x) = 1), tức là x {c-, c+}, khi đó |fm(c-)| = fm(c-), |fm(c+)| = fm(c+) và fm(c-) fm(c+);
(ii) Giả sử x có độ dài n (l(x) = n) và khoảng tính mờ fm(x) đã được định
nghĩa với |fm(x)| = fm(x). Khi đó tập các khoảng tính mờ {fm(hjx): - qjp và
j 0} Itv([0,1]) được xây dựng sao cho nó là một phân hoạch của fm(x), và
thỏa mãn |fm(hjx)| = fm(hjx) và có thứ tự tuyến tính tương ứng với thứ tự của
tập {h-qx, h-q+1x, ..., hpx}, tức là nếu h-qx>h-q+1x> ... >hpx thì fm(h-qx) >fm(h-
rằng hệ phân hoạch như vậy luôn tồn tại dựa vào tính chất i) trong Mệnh đề 1.1.
Hình 1.8. Khoảng tính mờ của các hạng từ của biến TRUTH
Trường hợp độ dài của x bằng k, l(x) = k, ta ký hiệu k(x) thay cho
fm(x), khi đó ta nói khoảng tính mờ của x có độ sâu k hay khoảng tính mờ mức k.
Ánh xạ nếu:
có thứ tự theo ngữ nghĩa của nó nên trong ĐSGT đã thiết lập một hàm định lượng ngữ nghĩa của các từ với các giá trị nằm trong đoạn [0, 1], các giá trị tương ứng với các từ đảm bảo thứ tự này.
Định nghĩa 1.9: [35] Cho AX = (X,G,H,) là một ĐSGT tuyến tính.
: X [0,1] được gọi là một hàm định lượng ngữ nghĩa của AX
(i) là ánh xạ 1-1 từ tập X vào đoạn [0, 1] và bảo toàn thứ tự trên X, tức là x, yX, x<y (x) < (y) và (0) = 0, (1) = 1.
(ii) liên tục: trù mật trong [0, 1], nghĩa là (a, b) ≠ và (a, b)[0, 1], (a, b) ≠ .
Điều kiện (i) là bắt buộc tối thiểu đối với bất kỳ phương pháp định lượng nào, còn điều kiện (ii) đảm bảo tính trù mật của H(G) trong X. Dựa trên những ràng buộc này, các tác giả trong [50] đã xây dựng một phương
pháp định lượng ngữ nghĩa của các hạng từ trong ĐSGT. Trước hết chúng ta xét định nghĩa về dấu của các hạng từ như sau.
Định nghĩa 1.10 [35] : Cho ĐSGT tuyến tínhAX = (X, G, H,), ta định nghĩa:
1) Hàm sign(k, h) ∈ {-1, 1} được gọi là hàm dấu tương đối (relative) của k đối với h nếu sign(k, h) = 1((x≤ hx) hx ≤ khx)(x≥hx) hx≥khx)), và sign(k, h) = -1 ((x ≤ hx) hx≥ khx ≥ x) (x ≥ hx) hx≤ khx≤
x))
2) Hàm Sign: X {-1, 0, 1} được gọi là hàm dấu của các từ x nếu hn…
h1c, c∈G, là biểu diễn chính tắc, tức là hjhj-1 … h1c ≠ hj-1 … h1c, với mọi j =1, …, n và h0 = Id, phép đồng nhất, tức là h0c = c, thì ta có:
Sign(x) = Sign(hnhn-1 …h1c)= sign(hn,hn-1)×…×sign(h2,h1)× sign(h1) ×sign(c).
Dựa trên định nghĩa hàm dấu, chúng ta có tiêu chuẩn để so sánh hx và x.
Mệnh đề 1.2 [35]. Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx>x; nếu
Sign(hx) = -1 thì hx<x và nếu Sign(hx) = 0 thì hx = x. Từ mệnh đề trên ta có:
0≤H(x) ≤ 1 vàH(x) ≤H(y), x,y, tức làxH(x) và yH(y) (1.2)
Sign(hpx) =+1H(h-qx) ≤…≤ H(h-1x) ≤ x ≤ H(h1x) ≤…≤ H(hpx) (1.3)
Sign(hpx) =1H(h-qx) ≥…≥ H(h-1x) ≥ x ≥ H(h1x) ≥…≥ H(hpx) (1.4)
Định nghĩa 1.11 [35] : Cho AX là một ĐSGT tuyến tính và fm là một độ đo tính mờ trên X. Ta nói ánh xạ : X [0, 1] được cảm sinh bởi độ đo tính mờ fm nếu được định nghĩa bằng đệ qui như sau:
(i) (W)==fm(c-), (c-) = – fm(c-) = .fm(c-), (c+) = +fm(c+); (ii) (hjx) = (x)+ isign( j ) Sign(hj x) isign( j ) (h ) i fm(x)(h jx)(hj) fm(x) , (1.5) với mọi j, –qjp và j 0, trong đó:
(h j x) 1
21 Sign(h j x)Sign(hp h j x)( ), ;
Với định nghĩa này, đã được chứng minh nó thỏa mãn các yêu cầu của một hàm định lượng ngữ nghĩa và đảm bảo tính trù mật của nó đối với các hạng từ của AX trong đoạn [0, 1].
Ví dụ 1.5 : Xét đại số gia tử với biến TUỔI trong ví dụ 1.4 với độ đo tính mờ của các hạng tử và gia tử chính là fm(trẻ)=0,4375; fm(già)= 0,5625;
(V)= 0,15 ; (M)= 0,35; (A)= 0,26; (L)= 0,24. Vì vậy, q = p = 2 và =
=0.5. Ta có tính được giá trị định lượng ngữ nghĩa của một số hạng tử ngôn
ngữ của TUỔI như sau :
Cho x = trẻ, ta có (trẻ) =fm(trẻ) = 0.5 x 0.4375 =0.21875. Với miền của TUỔI là [0,80], giá trị thực của trẻ là 80 x 0.21875 = 17.5 ;
(già) = fm(trẻ) + fm(già) = 0.71875 và giá trị thực của già là 57.5 For hjx = Lc-= Ltrẻ, ta có j = -2 và (hjx) = (c-)+ 21 - )(h ) fm(c) (h c)(h ) fm(c) Sign(Lc j j i1 i = (trẻ)+ {(A) fm(trẻ)+(L) fm(trẻ)} với Sign(Ltrẻ)= +1 và Sign(Ltrẻ) Sign(VLtrẻ)=(-1)(-1) (+1) (-1) (-1) = +1, nghĩa là ω(Lx) = .
Vậy, (Ltrẻ) = 0.21875 + {0.26 x 0.4375 + 0.5 x 0.24 x 0.4375} = 0.385 và giá trị thực của Ltrẻ là 80 x 0.385 = 30.8
I.7. Kết luận chương 1
Trong chương này, LA đã tóm tắt những kiến thức cơ sở làm nền tảng phục vụ trong quá trình nghiên cứu, bao gồm những nội dung chính sau đây:
- Lý thuyết tập mờ bao gồm các khái niệm tập mờ, phương pháp xây dựng tập mờ, biến ngôn ngữ, phân hoạch mờ, hệ mờ và các ứng dụng.
- Hệ thống lý thuyết của ĐSGT với những khái niệm nền tảng như: ĐSGT, ĐSGT tuyến tính, ĐSGT tuyến tính đầy đủ, độ đo tính mờ của gia tử, phần tử sinh, phương pháp xác định giá trị định lượng của từ ngôn ngữ, khoảng tính mờ và khoảng tương tự của từ ngôn ngữ.
Với những kiến thức cơ sở được trình bày trong chương này là nền tảng đủ để thực hiện các mục tiêu đã đặt ra của luận án.
CHƯƠNG 2. TÍNH GIẢI NGHĨA ĐƯỢC CỦA
KHUNG NHẬNTHỨC NGÔN NGỮ TRONG CÁC
HỆ MỜ NGÔN NGỮ
II.1. Mở đầu
Các hệ dựa trên luật mờ (Fuzzy rule based systems - FRBSs) đã được phát triển mạnh mẽ những năm gần đây bởi có nhiều chức năng đặc biệt ưu việt như hoạt động dựa trên các kiến thức ngôn ngữ chuyên gia, được thiết kế di truyền tức là chúng được tạo ra bằng phương pháp có khả năng học và, đặc biệt, có tính giải nghĩa được để tương tác với con người bằng ngôn ngữ tự nhiên. Trong đó, các tính năng có thể kết hợp với tri thức ngôn ngữ của con người có thể được coi là một trong những mục tiêu chính của việc thiết kế FRBSs, do đó khả năng giải nghĩa được của các FRBS thu hút nhiều sự chú ý của cộng đồng nghiên cứu về lĩnh vực này.
Các nghiên cứu của Mencar và cộng sự [19], một trong những người đầu tiên đi vào bản chất ngữ nghĩa của luật mờ, đã đề xuất một khái niệm khá mới và thực chất hơn về tính giải nghĩa được của FRBS, nhằm đo mức độ tương tự giữa ngữ nghĩa biểu diễn bởi một luật mờ và biểu diễn bởi luật ngôn ngữ. Trong đó một luật mờ được biểu diễn bằng một biểu thức tập mờ và khi thay thế các tập mờ đó bằng các nhãn từ ngôn ngữ tương ứng ta được luật ngôn ngữ. Đây là một ý tưởng rất hay và có tính cơ bản của khái niệm tính giải nghĩa được. Lưu ý rằng tính giải nghĩa được quan tâm từ những năm 1990 đến nay chủ yếu được nghiên cứu trên quan điểm tính dễ hiểu và do đó 02 thuật ngữ ‘interpretability’ và ‘comprehensiveness’ được xem như đồng nghĩa. Vì vậy, thường tính dễ hiểu được nghiên cứu dựa trên quan sát thực tế là con người sẽ khó hiểu những hệ luật mà tiền đề có nhiều điều kiện, hệ luật có quá nhiều luật, tập các từ ngôn ngữ của khung nhận thức (Frame of Cognition) có nhiều hơn 7 ± 2 dựa trên kết luận của các nhà tâm lý rằng con người chỉ có thể xử lý tốt với số lượng thông tin không quá con số nói trên, v.v…
Trong lĩnh vực khoa học tính toán và máy tính, khái niệm giải nghĩa được (interpretation) nhằm giải quyết mối quan hệ giữa các biểu thức kí hiệu của một ngôn ngữ kí hiệu với cú pháp của nó, vốn không có ngữ nghĩa, và
Nếu là một ngôn ngữ toán học, ngữ nghĩa của các biểu thức của nó được gán cho các đối tượng toán học, nhưng mục tiêu cuối cùng của ngữ nghĩa của chúng là ngữ nghĩa thế giới thực. Vì vậy, khái niệm giải nghĩa được theo ngữ nghĩa thế giới thực có vai trò quan trọng để bảo đảm ngữ nghĩa toán học mô phỏng được các quan hệ và các quá trình trong thế giới thực. Đặc biệt, nó rất quan trọng trong lĩnh vực xử lý thông tin ngôn ngữ mờ như các hệ mờ, vì con người thao tác trên thông tin ngôn ngữ bằng một cơ chế khác biệt về bản chất với cơ chế toán học thao tác trên ngữ nghĩa tính toán (biểu diễn bằng các đối tượng tính toán trong một cấu trúc tính toán do các chuyên gia xây dựng). Việc các biểu diễn tính toán đó có chuyển tải đúng ngữ nghĩa mong muốn của các biểu thức ngôn ngữ của con người phụ thuộc vào việc xác lập các ánh xạ giải nghĩa đúng đắn cho chúng.
Vấn đề cơ bản của tính giải nghĩa được trong môi trường thông tin ngôn ngữ mờ, không chắc chắn chính là đảm bảo quá trình mô hình hóa các mô phỏng quá trình ngoài thế giới thực dựa trên các hệ tính toán hình thức là đúng đắn, phù hợp với quá trình trong thực tế. Ta biết rằng, ngôn ngữ chỉ là các xâu kí hiệu và ngữ nghĩa của chúng là cái con người gán cho nó, do đó, khi gán đối tượng toán học cho từ ngôn ngữ để tính toán thay cho chúng đòi hỏi cần có cơ sở phương pháp luận hình thức hóa. Điều này cũng tương tự như vấn đề giải nghĩa của các ngôn ngữ thuật toán cho máy tính: cần có phương pháp luận cho các ngôn ngữ lập trình, trong đó có vấn đề gán ngữ nghĩa để cho phép máy tính thao tác trên kí hiệu nhưng kết quả máy tính đưa ra là các dữ liệu tính toán.
Như vậy, tuy ý tưởng đề cập ở trên là mới trong khuôn khổ các hệ mờ, nhưng về bản chất đã được nghiên cứu trong lôgic toán và trong ngôn ngữ lập trình. Tuy nhiên, miền các biến trong các lĩnh vực này, trừ các biến kí tự, đều là những cấu trúc toán học, trong khi biến ngôn ngữ trong lĩnh vực lý thuyết tập mờ lại chưa được mô hình hóa toán học. Vì vậy, trong [9] các tác giả cho rằng, khi miền từ của các biến ngôn ngữ vẫn chưa được hình thức hóa toán học và ngữ nghĩa của từ, của các luật mờ, các cơ sở luật mờ, và thậm chí cả ngữ nghĩa của chính phương pháp suy luận mờ, vẫn chưa được định nghĩa một cách hình thức hóa, thì sẽ rất khó khăn để tiếp tục nghiên cứu phát triển ý tưởng này một cách đúng đắn.
Đại số gia tử (ĐSGT) được phát triển để mô hình hoá ngữ nghĩa vốn có của miền từ các biến ngôn ngữ. Nó thiết lập một cách tiếp cận tự nhiên không chỉ đến ngữ nghĩa của các từ riêng lẻ, mà còn đến ngữ nghĩa của miền từ ngôn ngữ. Ngoài ra, các phần tử của nó chính là xâu gia tử tác động vào phần tử sinh có hình thức giống như trong các từ của ngôn ngữ tự nhiên. Điều này sẽ tạo ra một cơ sở thuận lợi để định nghĩa và khảo sát một cách hình thức hóa ngữ nghĩa của từ, của các luật mờ và các phương pháp suy luận mờ ..., và do đó có thể nghiên cứu khám phá tính giải nghĩa được dựa trên ngữ nghĩa của các FRBSs trên một cơ sở hình thức hóa mới. Trong phương pháp tiếp cận đại số gia tử (phương pháp tiếp cận ĐSGT) đến ngữ nghĩa của các thành phần cấu thành FRBSs, ngữ nghĩa của một mô hình mờ (fuzzy model) bắt nguồn từ ngữ nghĩa dựa trên thứ tự của các từ ngôn ngữ, nên chúng tôi sử dụng thuật ngữ các hệ dựa trên luật ngôn ngữ LRBSs (Linguistic rule based systems) thay vì dùng FRBSs để nhấn mạnh vai trò thực sự của ngữ nghĩa các từ. Dựa trên quan điểm này, trong chương này, chúng tôi sẽ thảo luận và, sau đó, đề xuất những ngữ nghĩa thích hợp của các thành phần FRBS bao gồm như: những từ có thể hiện diện trong các cơ sở luật; khung nhận thức ngôn ngữ (Linguistic Frame of Cognition - LFoC) của mỗi biến (hay thuộc tính ngôn ngữ), tương ứng với khái niệm khung nhận thức mờ FoC (dựa trên tập mờ) đã khảo sát (bởi Cios và cộng sự [50].).
Các phương pháp tiếp cận hiện tại tập trung chính vào việc khảo sát các khía cạnh ngữ nghĩa của tập mờ do nhà nghiên cứu gán một cách trực giác cho các từ xuất hiện trong các FRBSs và đề xuất của các ràng buộc trên chúng cũng dựa trên trực giác của nhà nghiên cứu để xử lý ngữ nghĩa. Ngược lại, trong [9] xem xét tất cả các FRBS như một biểu thức hình thức, nghiên cứu tập trung vào việc biểu diễn ngữ nghĩa các thành phần cú pháp của các biểu thức FRBS thành các đối tượng tính toán (comput-objects) và các ràng buộc trên biểu diễn ngữ nghĩa tính toán của chúng.
Trong chương này, chúng tôi sẽ làm rõ khái niệm về tính giải nghĩa được LRBS và đề xuất các ràng buộc ngữ nghĩa bổ sung trên các phép giải nghĩa các yếu tố cơ bản của LRBS. Tiếp theo sẽ khảo sát các biểu diễn cấu trúc đa thể hạt được sinh ra từ các ngữ nghĩa của miền từ và cho thấy những biểu diễn này thỏa mãn các ràng buộc liên quan.
II.2. Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ
Như đã đề cập trước kia, tính giải nghĩa được nghiên cứu trong luận án theo cách tiếp cận của ngôn ngữ lập trình về ngữ nghĩa dấu hiệu (denotational semantics), chẳng hạn trong [55] hay [53], trong đó việc giải nghĩa được hiểu là một ánh xạ giải nghĩa các biểu thức kí hiệu chưa có nghĩa sang các đối tượng toán học với cấu trúc mong muốn. Tuy nhiên, ngữ nghĩa trong lập trình chủ yếu là các đối tượng toán học, nhưng vốn các lý tuyết toán học vốn đã mô hình hóa thế giới thực nên chúng giải nghĩa được théo thế giới thực.
Các từ hay các câu trong ngôn ngữ tự nhiên lại chuyển tải được ngữ nghĩa thế giới thực, nhưng lại không phải là các đối tượng toán học để tính toán được. Để tính toán được trên ngữ nghĩa của các từ ngôn ngữ, chúng cần được giải nghĩa bằng ánh xạ giải nghĩa sang các đối tượng toán học trong một cấu trúc mong muốn sao cho nó bảo toàn ngữ nghĩa cấu trúc của từ và của tập các trừ. Mục này, luận án tập trung giải quyết vấn đề đặt ra trên ở mức từ.
Tất cả các ngôn ngữ, như ngôn ngữ tự nhiên của con người hoặc các ngôn ngữ hình thức dựa trên các lý thuyết toán học hoặc vật lý ..., được hình thành từ các biểu thức ký hiệu. Các biểu thức ký hiệu, được tạo ra từ các ký hiệu cơ bản bằng các quy tắc cú pháp đơn thuần, không có ý nghĩa gì cho đến khi chúng được đưa ra để giải nghĩa các đối tượng toán học hoặc vật lý. Khái niệm giải nghĩa là nhằm mục đích dịch các biểu thức ký hiệu, bao gồm các ký hiệu và các toán tử riêng của một ngôn ngữ hình thức hóa, thành các công thức toán học hoặc cấu trúc tính toán tương ứng. Khái niệm này là rất quan trọng và cốt yếu đối với các ngôn ngữ hình thức được sử dụng trong toán học, logic, và lý thuyết khoa học máy tính. Tương tự, các từ hoặc các biểu thức từ, cũng như các biểu thức ký hiệu, không có ý nghĩa cho đến khi chúng được giải nghĩa. Tuy nhiên, trong khuôn khổ mờ, với các từ hay các biểu thức từ, ví dụ các luật ngôn ngữ, được gán các biểu thức tập mờ có bản chất khá khác với chúng, thậm chí không có bất kỳ sự giải thích hình thức rõ ràng nào.
Ví dụ:
Giả sư là một giải nghĩa kí hiệu sang số thực ta có:
(a * (b c) a * b a*c) = ( a * ( b c) a * b a * c) = (ra *(rb
rc) ra *rb ra*rc) => Ngữ nghĩa là tương đồng với biểu thức ký hiệu ban đầu
2) Cho biểu thức các từ của biến chân lý = (true OR Very true)= Very true , giải nghĩa biểu thức từsang biểu thức tập mờ, (True) = Atrue,
(V_True) = BV_true => (True OR V_true) = Atrue (OR) BV_true = Atrue
BV_true => Hai ngữ nghĩa có tương đồng?
Từ đó đặt ra vấn đề là với biểu thức = r1 OR … OR rn khi giải nghĩa sang biểu thức tập mờ thì ngữ nghĩa của hai biểu thức có giống nhau?
Về bản chất, mỗi hệ mờ là một biểu thức tập mờ được thao tác dựa trên một cơ sở hình thức tính toán nào đó trong lý thuyết tập mờ (như đại số các tập mờ, phương pháp lập luận …).Trong đó mỗi tập mờ được gán nhãn ngôn ngữ và chúng được xem như là biểu diễn ngữ nghĩa tính toán của các nhãn ngôn ngữ của chúng. Do vậy, mỗi biểu thức tập mờ được tương ứng với một