Cấu trúc đại số cho miền giá trị của biến ngôn ngữ

Một phần của tài liệu Luận án tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 46 - 52)

CHƯƠNG 1 MỘT SỐ KIẾN THỨC CƠ SỞ

1.5. Lý thuyết đại số gia tử

1.5.1. Cấu trúc đại số cho miền giá trị của biến ngôn ngữ

1.5.1.1.Cấu trúc đại số dựa trên quan hệ thứ tự ngữ nghĩa

Khi quan sát và phân tích thứ tự ngữ nghĩa trong thực tế của các hạng từ trong miền LDA của biến ngôn ngữ A, LDA được coi như một cấu trúc đại số dựa trên thứ tự ngữ nghĩa, ký hiệu là AA = (X, G, C, H, ≤). Trong đó: X = LDA là miền hạng từ của biến ngôn ngữ A; G = {c–, c+} là các phần tử sinh hoặc hạng từ nguyên tử; C là tập các hằng ngôn ngữ, 0 tương ứng với hạng từ có ngữ nghĩa nhỏ nhất, 1 tương ứng với hạng từ có ngữ nghĩa lớn nhất, W tương ứng với hạng từ có ngữ nghĩa trung bình; H là tập các gia tử ngôn ngữ; ≤ là ký hiệu cho quan hệ thứ tự ngữ nghĩa trong X. Các hạng từ trong cấu trúc AAcó dạng hn,…, h1c, với 𝑐 ∈ {𝑐−, 𝑐+} và

hjH, j = 1, …, n.

Xem xét ví dụ miền hạng từ của biến ngôn ngữ AGE trong ngôn ngữ tự nhiên tạo thành một cấu trúc đại số với các thành phần như sau:

o G = {‘young’, ‘old’}, ‘young’ và ‘old’ lần lượt được gọi là phần tử sinh âm và phần tử sinh dương. Đây là hai phần tử sinh trong cấu trúc đại số AAGE. o Tập các gia tử ngơn ngữ H có thể gồm các từ như ‘very’ (V), ‘more’ (M),

extremely’ (E), ‘rather’ (R), ‘little’ (L). Các gia tử ngơn ngữ là các từ có thể làm thay đổi ngữ nghĩa của hạng từ mà nó tác động để tạo ra một hạng từ mới. Hạng từ mới và hạng từ ban đầu luôn so sánh được với nhau về thứ

tự ngữ nghĩa. Ví dụ như ‘very old’ ≥ ‘old’, ‘little old’ ≤ ‘old’. Các gia tử ngôn ngữ được coi như các tốn tử một ngơi trong AAGE.

o Tồn tại một quan hệ thứ tự ≤ trong X sản sinh từ ngữ nghĩa vốn có của các hạng từ. Ví dụ: ‘young’ ≤ ‘old’ ≤ ‘very old’ hoặc ‘rather very old’ ≥ ‘old’. Quan hệ ≤ được gọi là quan hệ thứ tự ngữ nghĩa.

o C là tập các hạng từ như ‘absolutely young’, ‘middle age’, ‘absolutely old’ mà ngữ nghĩa của chúng không thể bị thay đổi bởi tác động của gia tử ngôn ngữ. Những hạng từ này được coi là các hằng ngôn ngữ trong X, được ký hiệu lần lượt là 0, W và 1. Ta ln có thứ tự ngữ nghĩa giữa các hằng ngôn ngữ là 0 ≤ W ≤ 1.

1.5.1.2.Tính chất ngữ nghĩa của cấu trúc dựa trên quan hệ thứ tự a)Dấu đại số của gia tử và các hạng từ củaAA.

Các hạng từ nguyên thủy c− và c+ có xu hướng ngữ nghĩa khác nhau được xác định bởi Vc− ≤ c−, nhưng c+ ≤ Vc+. Ví dụ: ‘very young ’ ≤ ‘young’, ‘old’ ≤ ‘veryold’. Do đó, với mọi biến ngơn ngữ A, dấu của hai hạng từ nguyên thủy được xác định là sign(c−) = −1 và sign(c+) = +1. Với gia tử ‘rather’, ta có ‘rather young’ ≥ ‘young’, nhưng ‘rather old’ ≤ ‘old’. Dựa trên các quan hệ thứ tự của các từ mới sinh ra khi sử dụng các gia tử so với từ ban đầu, ‘rather’ được coi như gia tử âm và

sign(R) = −1, ‘very’ được coi là gia tử dương và sign(V) = +1. Ký hiệu H− là tập các gia tử âm, , H+ là tập các gia tử dương. Trong ví dụ về biến ngơn ngữ AGE, ta có:

H+ = {M, V, E} và H− = {R, L}.

b)Quan hệ dấu giữa các gia tử và dấu của hạng từ

Ngữ nghĩa dựa trên thứ tự của các từ chỉ ra rằng bất cứ gia tử h’ nào cũng đều có thể tác động đến ảnh hưởng của gia tử h trong hạng từ hx, xX, để tạo ra sự thay đổi xu hướng ngữ nghĩa của hx, có thể là cùng xu hướng (dương) hoặc đảo ngược xu hướng (âm) của gia tử h khi tác động vào hạng từ x. Nếu cùng xu hướng thì dấu của h’ đối với h là dấu dương và ký hiệu là sign(h’, h) = +1. Nếu ngược xu hướng thì dấu của h’ đối với h là dấu âm và ký hiệu là sign(h’, h) = −1. Ví dụ: h’ =

‘extremely’ (E), h’’ = ‘rather’ (R) và h = ‘very’ (V), ta có sign(E, V) = +1 vì ‘young’

Với H+ = {M, V, E} và H− = {R, L}, bảng dấu giữa các gia tử dựa trên xu hướng thay đổi ngữ nghĩa trong ngôn ngữ tự nhiên được cho như trong Bảng 1.4.

Bảng 1.4: Quan hệ dấu giữa một gia tử trên dòng với gia tử trên cột

sign(k, h) E V M R L E + + + – + V + + + – + M + + + – + R – – – + – L – – – + –

Với mọi hạng từ xX có dạng x = hnh1c, cG, dấu của x được xác định bởi công thức sign(x) = sign(hn, hn−1) … sign(h2, h1)sign(h1)sign(c) {−1, +1}. Ý nghĩa của dấu hạng từ được thể hiện như sau:

sign(hx) = −1 hxxsign(hx) = +1  hxx (1.8)

c)Cấu trúc ngữ nghĩa của miền hạng từ

Vì các gia tử là các phần tử có tác dụng thay đổi ngữ nghĩa của từ mà chúng tác động, với mọi xX, tập H(x) = {x: ∈ H*} ( =  hoặc  = hmh1, hjH

với j = 1, …, m) là tập tất các các từ sản sinh từ hạng từ x khi áp dụng các gia tử trong tập H. Dựa trên vai trò ngữ nghĩa của các gia tử ngôn ngữ, hạng từ x vẫn kế thừa ngữ nghĩa vốn có của hạng từ x nên tập H(x) được coi như mơ hình mờ (fuzziness model) về ngữ nghĩa của x. Các gia tử đóng vai trị rất quan trọng trong hình thành cấu trúc ngữ nghĩa của miền hạng từ của các biến ngôn ngữ, cấu trúc ngữ nghĩa này rất phong phú bởi có nhiều tính chất liên quan đến các gia tử như trong các công thức sau:

{𝟎} ≤ 𝐻(𝑐−) ≤ {𝑊} ≤ 𝐻(𝑐+) ≤ {𝟏}

𝐻(𝑐−) 𝐻(𝑐+) = 𝑋 \ 𝐶 } (1.9)

H(x) = H(Lx) H(Rx)  {x} H(Mx) H(Vx) (1.10)

sign(Vx) = +1 H(Lx) ≤ H(Rx) ≤ {x} ≤ H(Mx) ≤ H(Vx) (1.11)

Trong cú pháp ngữ nghĩa của miền hạng từ ngôn ngữ, ký hiệu Xk = {xX: |x| = k}, tức là tập Xkgồm các tất cả các hạng từ trong X ở mức tính riêng k. Ta có đẳng thức sau đây:

⋃𝑥∈𝑋𝑘𝐻(𝑥) = 𝑋 \ 𝐶, với k ≥ 1 (1.13) Trong đó, 𝑋1 = {𝑐−, 𝑐+}, 𝑋𝑘 = {ℎ𝑘−1… ℎ1𝑐: ℎ𝑗 ∈ 𝐻}.

1.5.1.3.Định lượng ngữ nghĩa trong Đại số gia tử a) Ánh xạ định lượng ngữ nghĩa

Các hạng từ trong miền ngôn ngữ của biến ngơn ngữ A có thứ tự dựa trên ngữ nghĩa vốn có, do đó giá trị định lượng ngữ nghĩa của mỗi hạng từ trong miền tham chiếu [0,1] (miền tham chiếu chuẩn hóa cho mọi biến ngôn ngữ A) cần đảm bảo duy trì quan hệ thứ tự giữa các hạng từ.

Định nghĩa 1.5 [84]: Một ánh xạ f: X → [0, 1], gán mỗi hạng từ trong X bởi một giá trị trong khoảng [0, 1], được gọi là ánh xạ định lượng ngữ nghĩa (a semantically quantifying mapping - SQM) khi thỏa các điều kiện sau đây:

i. f là ánh xạ một – một và f(X) trù mật trong [0, 1], tức là mọi giá trị trong [0, 1] được xấp xỉ với ngữ nghĩa số của một hạng từ nào đó trong X, với mức độ mờ cho trước.

ii. f bảo toàn thứ tự ngữ nghĩa trong X, tức là x, yX, x y thì f(x) ≤ f(y). Cho một ánh xạ định lượng ngữ nghĩa f: X → [0, 1], ký hiệu (x) là khoảng con nhỏ nhất của [0, 1] chứa mọi ảnh của f(H(x)), khoảng này là khoảng đóng bên trái và mở bên phải, ngoại trừ bên phải là giá trị 1. Từ các tính chất (1.9) – (1.13), ta có các khẳng định sau:

i. Họ {(hx): hH} là phân hoạch của (x), với mọi xX

ii. Họ {(x): xXk} là phân hoạch của [0, 1]. Khi k = 1, {(c−), (c+)} là phân hoạch của [0, 1]

iii. Họ {(y): yXk+1} tạo phân hoạch mịn hơn {(x): xXk}, và ta có

(x) = ⋃{ℑ(y): y∈ Xk+1& y = hx & h ∈ H}

H(x) gồm các hạng từ mà vẫn chứa ngữ nghĩa vốn có của x nên H(x) được coi là mơ hình mờ của x. Do đó, khoảng (x) được gọi là khoảng tính mờ của x và độ dài của (x), |(x)|, được hiểu là độ đo tính mờ của x. Ký hiệu fm(x) = |(x)|, với mọi xH(G). Xét về ngữ nghĩa, (x) chứa các giá trị số mà chúng tương thích với ngữ nghĩa của x ở mức độ được xác định bởi k = |x|, nên (x) được gọi là k-khoảng tính mờ của x. Ví dụ như trong Hình 1.9 dưới đây minh họa cho các khoảng tính mờ của các hạng từ trong tập X(2) của một cấu trúc ĐSGT với tập gia tử H = {L, V}.

Hình 1.9: Các khoảng tính mờ của các hạng từ trong X(2) với tập gia tử H = {L, V} Giả sử mọi gia tử h khi tác động lên các hạng từ thì hiệu quả tác động làm thay đổi ngữ nghĩa là như nhau, tức là gia tử h độc lập với ngữ cảnh. Khi đó, tỷ số |(hx)|/ |(x)| không phụ thuộc vào hạng từ x. Tỷ số này được coi là độ đo tính mờ của gia tử h, ký hiệu là µ(h). Các tác giả trong [54] đã đưa ra một số tính chất của độ đo tính mờ của hạng từ và gia tử như sau:

(fm1) fm(c−) + fm(c+) = 1 và ∑hHfm(hx)= fm(x)

(fm2) ∑hHμ(h) = α, ∑hH+μ(h) = 𝛽, với ,  > 0 và  + =1

(fm3) ∑xXkfm(x) = 1, trong đó Xk là tập các hạng từ có độ dài đúng bằng k

(fm4) fm(hx) = µ(h).fm(x). Với x = hn…h1c thì fm(x) = µ(hn)… µ(h1)fm(c) Độ đo tính mờ của các hạng từ và các gia tử có thể được định nghĩa dựa trên một phương pháp hình thức hóa của ngữ nghĩa dựa trên thứ tự của các hạng từ. Khái niệm này đóng vai trị trung tâm trong việc xác định các khái niệm định lượng khác của các hạng từ. Các đại lượng fm(c−), fm(c+) và µ(h), hH, là các tham số tính mờ của thuộc tính A để tính tốn tất cả các đặc trưng ngữ nghĩa định lượng khác của hạng từ.

Giá trị định lượng ngữ nghĩa của x được coi là giá trị lõi của khoảng tính mờ

(x), tương tự như khái niệm lõi ngữ nghĩa của một tập mờ. Trong lý thuyết ĐSGT, chúng ta có thể tính giá trị định lượng ngữ nghĩa của x khi biết các tham số tính mờ. Với các tham số tính mờ fm(c−), fm(c+) và µ(h), hH đã cho trước, từ công thức (1.11) và (1.12) và tính chất duy trì quan hệ thứ tự giữa các hạng từ của ánh xạ SQM f, chúng ta thấy rằng giá trị f(x) nên được xác định là một giá trị nằm giữa các khoảng tính mờ của (hx), hH−, và các khoảng tính mờ của (hx), hH+. Tức là nằm giữa (h-1x) và (h1x), với H−= {hq, hq+1, …, h−1} và H+ = { h1, h2, …, hp}. Giá trị f(x) được tính theo cơng thức đệ quy như sau:

(SQM1) f(W) =  = fm(c−), f(c−) = −.fm(c−), f(c+) =  + .fm(c+).

(SQM2) f(hjx) = f(x) + sign(hjx)[(∑𝑗𝑖=𝑠𝑖𝑔𝑛(𝑗)𝑓𝑚(ℎ𝑖𝑥)) −(hjx).fm(hjx)], trong đó (hjx) = 1

2[1 + sign(hjx).sign(hphjx)(−)], với mọi j [−q, p]

Như vậy trong lý thuyết ĐSGT, các giá trị độ đo tính mờ của các hạng từ sinh fm(c−), fm(c+) (thỏa ràng buộc (fm1)) và µ(h) (hH) (thỏa ràng buộc (fm2)) được coi là các tham số tính mờ độc lập của một cấu trúc ĐSGT. Nếu cho trước các tham số tính mờ này, hồn tồn xác định được tất cả các đại lượng ngữ nghĩa định lượng khác như độ đo tính mờ của các hạng từ, khoảng tính mờ của các hạng từ và giá trị định lượng ngữ nghĩa của các hạng từ trong toàn bộ tập X.

Trong ĐSGT, độ đo tính mờ của các hằng ngôn ngữ trong tập {0, W, 1}

được coi bằng 0, fm(0) = fm(W) = fm(1) = 0, giá trị định lượng ngữ nghĩa của các hạng từ khác là một số trong [0, 1]. Các ứng dụng ĐSGT cơ bản, sử dụng giá trị định lượng ngữ nghĩa của mỗi hạng từ x để xây dựng các tập mờ tam giác biểu diễn ngữ nghĩa cho x với đỉnh của tam giác tương ứng là giá trị định lượng ngữ nghĩa của x. Ví dụ như trong Hình 1.10, khi xây dựng tập mờ hình thang biểu diễn ngữ nghĩa của các hạng từ trong tập X(2) = {0, Vc−, c−, Lc−, W, Lc+, c+, Vc+, 1}, các giá trị định lượng ngữ nghĩa của các hằng ngôn ngữ f(0) = 0, f(W) = fm(c−), f(1) = 1, các hạng từ khác được tính theo cơng thức (SQM1) và (SQM2) khi đã biết giá trị của bộ tham số tính mờ gồm có fm(c−), fm(c+) và µ(h). Các giá trị định lượng ngữ nghĩa này là tọa độ đỉnh của các tập mờ tam giác, đáy của tam giác được xác định sao cho các tập mờ tạo thành một phân hoạch mạnh của miền tham chiếu [0, 1].

Hình 1.10: Các tập mờ tam giác xây dựng từ giá trị định lượng ngữ nghĩa

Một phần của tài liệu Luận án tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 46 - 52)

Tải bản đầy đủ (PDF)

(148 trang)