Đại số gia tử tuyến tính đầy đủ

Một phần của tài liệu cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (Trang 30)

Cho một ĐSGT tuyến tính đầy đủAX = (X, G, H,Σ,Φ,≤), trong đóDom(X) = X là miền các giá trị ngôn ngữ của thuộc tính ngôn ngữ X được sinh tự do

từ tập các phần tử sinh G = {1, c−,W, c+,0} bằng việc tác động tự do các phép toán một ngôi trong tập H, Σ và Φ là hai phép tính với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x), tức là Σx = supermumH(x) and Φx = inf imumH(x), trong đó H(x) là tập các phần tử sinh ra từ x, còn quan hệ là quan hệ sắp thứ tự tuyến tính trên X cảm sinh từ ngữ nghĩa của ngôn ngữ.

1.4.2.1 Một số khái niệm

1. Khoảng mờ của khái niệm mờ

Giả sử thuộc tính (hay biến ngôn ngữ) X có miền tham chiếu thực là khoảng [a, b]. Để chuẩn hóa, nhờ một phép biến đổi tuyến tính, ta giả thiết mọi miền như vậy đều là khoảng [0, 1]. Khi đó, tính chất (2) trong mệnh đề 1.2 cho phép ta xây dựng hai khoảng mờ của hai khái niệm nguyên thủy c−c+, ký hiệu là I(c−) và I(c+) với độ dài tương ứng là f m(c−) và f m(c+) sao cho chúng tạo thành một phân hoạch của miền tham chiếu [0, 1] và f m(c−) và f m(c+) là đồng biến với c−c+, tức là c−≤c+ kéo theo I(c−)≤I(c+).

2. Khoảng mờ mức k

Một cách quy nạp, giả sử rằng với ∀x Xk−1 = {x X : x có độ dài

|x| = k 1}, ta đã xây dựng được hệ các khoảng mờ {I(x) : x Xk−1 và

|I(x)| = f m(x)} sao cho chúng là đồng biến và tạo thành một phân hoạch của đoạn [0, 1]. Khi đó, trên mỗi khoảng mờ I(x), độ dài f m(x) của x ∈Xk−1, nhờ tính chất (4) trong mệnh đề 1.2, ta có thể xây dựng được họ {I(hix) : −q

i ≤p, i ̸= 0,|I(hix)| = f m(hix)} sao cho chúng là một phân hoạch của khoảng mờ I(x). Có thể thấy họ {I(hix) : −q i p, i ̸= 0,|I(hix)| = f m(hix) và

x Xk−1} = {I(y) : y Xk|I(y)| = f m(y)} là một phân hoạch của [0, 1]. Các khoảng này gọi là các khoảng mờ mức k.

Như vậy, có một sự liên hệ chặt chẽ giữa ngữ nghĩa ngôn ngữ của các khái niệm mờ và các khoảng mờ trong đoạn [0, 1] như sau:

bằng độ đo tính mờ của x.

Nếu x′ là hậu tố củax, tức là nó là xâu con bên trái cùng của xâux, hay nói khác đi, x′ sinh ra xâu x, thì I(x)⊂I(x′).

Nếu xx′ có cùng độ dài và x ≤x′ thì I(x)≤I(x′).

Đây là những tính chất rất quan trọng của các khoảng mờ được định nghĩa dựa trên cấu trúc ĐSGT và là cơ sở để định nghĩa hệ lân cận ngữ nghĩa của x

đã được định nghĩa trong [33], sẽ được trình bày tóm tắt dưới đây.

Định nghĩa 1.14. [33] Ánh xạ f:X [0, 1] được gọi là ánh xạ định lượng của ĐSGT AX nếu nó thỏa mãn các điều kiện sau:

(1) f là đơn ánh,

(2) f bảo toàn quan hệ thứ tự ngữ nghĩa trên X, nghĩa làx < y ⇒f(x) <(y) và f(0) = 0,f(1) =1;

(3) f liên tục theo ngữ nghĩa với ∀x X, fx) = inf f(H(x)) và fx) = sup f(H(x)).

Định nghĩa 1.15. [33] Giả sử AX = (X, G, H,Σ,Φ,≤) là một ĐSGT đầy đủ, tuyến tính và tự do, f m(x) và µ(h) tương ứng là các độ đo tính mờ của ngôn ngữ và của gia tử h thỏa mãn các tính chất trong mệnh đề 1.2. Khi đó, ta nói v

là ánh xạ cảm sinh bởi độ đo tính mờ f m của ngôn ngữ nếu nó được xác định như sau: (1) v(W) = k = f m(c−), v(c−) = k−αf m(c−) = βf m(c−), v(c+) = k + αf m(c+). (2) υ(hjx) = υ(x) + Sgn(hjx){j i=Sgn(j)µ(hi)f m(x) −ω(hjx)µ(hj)f m(x)}, trong đó ω(hjx) = 12[1+Sgn(hjx)Sgn(hphjx)(β−α)]∈ {α, β}, với mọij,−q ≤j ≤pj ̸= 0. (3) vc−) = 0, vc−) =k = vc+), vc+) = 1, và với mọi j,−q ≤j ≤pj ̸= 0.

Ta có: vhjx) =v(x) +Sgn(hjx){j−1

i=sign(j)µ(hi)f m(x)}

vhjx) =v(x) +Sgn(hjx){j

i=sign(j)µ(hi)f m(x)}

Thực chất của ánh xạvlà mọix =hju,v(x)chính là điểm chia trong khoảng mờ I(x) theo tỷ lệ α:β nếu Sgn(hphju) = +1 và nếu ngược lại, nó là điểm chia trong khoảng I(x) theo tỷ lệ β:α. Như vậy, chúng ta có mối quan hệ chặt chẽ giữa giá trị ánh xạ định lượng của ĐSGT và ngữ nghĩa của giá trị ngôn ngữ được biểu thị qua các khoảng mờ của chúng.

Từ mệnh đề 1.2 và định nghĩa 1.5 chúng ta thấy, với bất kỳ một ĐSGT, ta luôn xây dựng được độ đo tính mờ và hàm định lượng cảm sinh từ độ đo tính mờ bằng cách lựa chọn các giá trị độ đo tính mờ của các phần tử nguyên thủy c−

c+, và của các gia tử sao cho chúng thỏa mãn tính chất (2) và (5) của mệnh đề 1.2, và được gọi là bộ tham số định lượng. Nói khác đi, chúng ta có một bộ tham số để điều chỉnh cho thích ứng với một ứng dụng cụ thể nào đó. Ta có các khoảng mờ I(x) = (vAx), vAx)].

1.4.2.2 Các tính chất tôpô

Định lý 1.2. [33] AX = (X, G, H,Σ,Φ,≤) là một ĐSGT đầy đủ, và v được định nghĩa như trong định nghĩa 1.5. Khi đó, v(H(x)) là trù mật trong khoảng

[vAx), vx)], ∀x X. Hơn nữa, vx) = inf v(H(x)),vx) = sup v(H(x))

f m(x) = vx)−vx), do đó f m(x) = d(v(H(x))), ở đây d(A) [0, 1] được định nghĩa là đường kính của A. vì thế v[H(G)] trù mật trong [0, 1].

Định lý 1.3. [33] Giả thiết cho như trong định lý 1.2, khi đó, ta có tỉ lệ

d(v(H(hx)))

d(v(H(x))) = dd((vv((HH((hyy)))))) là đúng ∀x, y X.

Định lý 1.4. [33] Cho AX = (X, G, H,Σ,Φ,≤) là một ĐSGT tuyến tính đầy đủ tự do, với H− = {h−1, h−2,. . ., h−q}, h−1 < h−2 <. . .< h−q H+ = {h1,

h2,. . ., hp}, h1 < h2 <. . .< hp. Giả sử rằng ánh xạ v: X∗ [0, 1] thỏa mãn các điều kiện sau:

(2) Ảnh v(H(c−, c+)) = v(H(c−)) v(H(c+)) là trù mật trong đoạn [0, 1]; (3) Tỉ lệ dd((vv((HH((hxx)))))) = dd((vv((HH((hyy)))))) là đúng ∀x, y X.

Khi đóv là ánh xạ định lượng ngữ nghĩa trong định nghĩa 1.6, và ta cóµ(h) = dd((vv((HH((hxx)))))) và µ(c+) = d(H(c+)).

1.4.2.3 Ngữ nghĩa dữ liệu dựa trên lân cận tôpô của ĐSGT

Xét một CSDL {U; Const}, trong đó U ={A1, A2, ..., An} là tập vũ trụ các thuộc tính, Const là một tập các ràng buộc dữ liệu của CSDL. Mỗi thuộc tính

A được gắn với một miền giá trị thuộc tính, ký hiệu là Dom(A), trong đó một số thuộc tính cho phép nhận các giá trị ngôn ngữ trong lưu trữ trong CSDL hay trong các câu hỏi truy vấn và được gọi là thuộc tính ngôn ngữ. Những thuộc tính còn lại được gọi là thuộc tính thực hay kinh điển. Thuộc tính thực A được gắn với một miền giá trị kinh điển, ký hiệu là DA. Thuộc tính ngôn ngữ A sẽ được gắn một miền giá trị kinh điển DA và một miền giá trị ngôn ngữ LDA hay là tập các phần tử của một ĐSGT. Để bảo đảm tính nhất quán trong xử lý ngữ nghĩa dữ liệu trên cơ sở thống nhất kiểu dữ liệu của thuộc tính ngôn ngữ, mỗi thuộc tính ngôn ngữ sẽ được gắn với một ánh xạ định lượng vA : LDA DA

được xác định bởi một bộ tham số định lượng của A. Như vậy, mỗi giá trị ngôn ngữ x của A sẽ được gán một nhãn giá trị thực vA DA được xem như giá trị đại diện của x. Việc đánh giá độ tương tự giữa các dữ liệu của một thuộc tính

A được dựa trên khái niệm lân cận mức k của một giá trị ngôn ngữ, với k là số nguyên dương.

Các tác giả trong [5][10] đã lấy các khoảng mờ của các phần tử độ dàik làm độ tương tự giữa các phần tử, nghĩa là các phần tử mà các giá trị đại diện của chúng thuộc cùng một khoảng mờ mức k là tương tự mức k. Tuy nhiên, theo cách xây dựng các khoảng mờ mức k, giá trị đại diện của các phần tử x có độ dài nhỏ hơn k luôn là đầu mút của các khoảng mờ mức k. Do vậy, khi xác định lân cận mức k mong muốn, các giá trị đại diện như vậy phải là điểm trong của

Ta luôn luôn giả thiết rằng mỗi tập H−H+ chứa ít nhất hai gia tử. Xét

Xk là tập tất cả các phần tử độ dài k. Dựa vào khoảng mờ mức kmức k+1

các tác giả [5],[10] đã xây dựng một phân hoạch của miền [0, 1] như sau:

Với k = 1, các khoảng mờ mức 1 gồm I(c−) và I(c+). Các khoảng mờ mức 2 trên khoảng I(c+) là I(h−qc+) I(h−q+1c+)... I(h−2c+) I(h−1c+)

vA(c+) ≤I(h1c+) I(h2c+) ≤... ≤I(hp−1c+) I(hpc+). Khi đó, ta xây dựng phân hoạch về độtương tự mức 1 gồm các lớp tương đương sau:S(0) =I(hpc−);

S(c−) = I(c−)\[I(h−qc−) I(hpc−)]; S(W) = I(h−qc−) ∪I(h−qc+); S(c+) =

I(c+)\[I(h−qc+)∪I(hpc+)] và S(1) =I(hpc+).

Ta thấy, trừ hai điểm đầu mút vA(0) = 0 và vA(1) = 1, các giá trị đại diện

vA(c−), vA(W),vA(c+) đều là điểm trong tương ứng của các lớp tương tự mức 1

S(c−), S(W) và S(c+).

Tương tự, với k = 2, chẳng hạn, I(hic+) = (vAhic+), vAhic+)] với hai khoảng mờ kề là I(hi−1c+) và I(hi+1c+), ta sẽ có các lớp tương đương dạng sau: S(hic+) = I(hic+)\[I(hphic+)∪I(h−qhic+)]; Shic+) = I(h−qh(i−1)c+)

I(h−qhic+) và Shic+) = I(hphic+)∪I(hphic+), với i sao cho −q i p

i ̸= 0.

Bằng cách tương tự như vậy, có thể xây dựng các phân hoạch các lớp tương tự mức k bất kỳ. Tuy nhiên, trong thực tế ứng dụng theo [6] thìk≤4, tức có tối đa 4 gia tử tác động liên tiếp lên phần tử nguyên thủy c−c+. Các giá trị rõ và các giá trị mờ gọi là có độ tương tự mức k nếu các giá trị đại diện của chúng cùng nằm trong một lớp tương tự mức k.

Lân cận mức k của khái niệm mờ: Giả sử phân hoạch các lớp tương tự mức k là các khoảng S(x1), S(x2), ..., S(xm). Khi đó, mỗi giá trị ngôn ngữfu chỉ và chỉ thuộc về một lớp tương tự, chẳng hạn đó làS(xi)và nó gọi là lân cậnmức k của fu và ký hiệu là F Nk(f u).

Một phần của tài liệu cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (Trang 30)

Tải bản đầy đủ (PDF)

(115 trang)