Lập luận xấp xỉ dựa trờn đại số gia tử

3.1 .Cơ sở dữ liệu mờ

3.1.2. Lập luận xấp xỉ dựa trờn đại số gia tử

Cho đại số gia tử AH = (X, C, H, ), với X là tập nền, C= {c+

, c- }, với c+ và c-

tương ứng với phần tử sinh dương và õm. H= H+  H- và H- = {h1, h2, …,hp

}, H+ = {hp+1, hp+2, …,hp+q },h1> h2> …>hp và hp+1< hp+2< …<hp+q

Định nghĩa 3.1.1[4]: f: X [0,1] gọi là hàm định lượng ngữ nghĩa của X nếu h, k H+ hoặc h, k H-và x, y X, ta cú:

Với đại số gia tử và hàm định lượng ngữ nghĩa ta cú thể định nghĩa tớnh mờ của một khỏi niệm mờ.

3.1.3. Tớnh mờ (fuzziness) của một giỏ trị ngụn ngữ

Xột cỏc giỏ trị : True, Very false,..

Cho trước hàm định lượng ngữ nghĩa f của X. Xột bất kỳ x X. Tớnh mờ của x khi đú được đo bằng đường kớnh của tập fs(H(x))  [0,1]

Định nghĩa 3.1.2[4] Cho fm: X [0,1] được gọi là độ đo tớnh mờ trờn X nếu thoả món cỏc điều kiện sau:

(1)fm(c-) = w >0 và fm(c+) =1- w >0 (2)Với c {c+, c- } thỡ

(3)Với x, y X và h H,

với c {c+, c- }, nghĩa là tỉ số này khụng phụ thuộc vào x vào y, được ký hiệu là (h) gọi là độ đo tớnh mờ của gia tử h

1/2 Little True 1

Poss True

True More

True Very True

ĐK của

f(H(Little True))

ĐK của f(H(Poss True)) ĐK của f(H(More True)) ĐK của f(H(Very True)) ĐK của f(H(True)) ) ( ) ( ) ( ) ( x f kx f x f hx f   ) ( ) ( ) ( ) ( y f ky f y f hy f   ) ( ) ( 1 c fm c h fm q p i i    ) ( ) ( ) ( ) ( ) ( ) ( ( c fm hc fm y fm hy fm x fm x h fm  

Mệnh đề 3.1.1[4]

(1)fm(hx) = (h) fm(x) với x X

(2) , trong đú c {c+, c- } (3) với x X

(4) và với , >0 và + =1

3.1.4.Xõy dựng hàm định lƣợng ngữ nghĩa trờn cơ sở độ đo tớnh mờ của gia tử

Định nghĩa 3.1.3[4]: Hàm sgn: X {-1,0,1} là một ỏnh xạ được định nghĩa đệ qui như sau, với : h, h‟H

(1)sign(c-) = -1 và sign(hc-) = +sign(c-) nếu hc-

<c- sign(hc-) =-sign(c-) nếu hc-

>c- sign(c+) = +1 và sign(hc+

) = +sign(c+) nếu hc+

>c+ sign(hc+) =-sign(c-) nếu hc+

<c+

(2)sign(h‟hx) = -sign(hx) nếu h‟ là negative với h và h‟hx  hx (3)sign(h‟hx) = +sign(hx) nếu h‟ là positive đối với h và h‟hx  hx (4)sign(h‟hx) = 0 nếu h‟hx =hx

Định nghĩa 3.1.4[4]

Giả sử cho trước độ đo tớnh mờ của cỏc gia tử (h), và cỏc giỏ trị độ đo tớnh mờ của cỏc phần tử sinh fm(c-

), fm(c+) và w là phần tử trung hoà. Hàm định lượng ngữ nghĩa  của X được xõy dựng như sau với x = him…hi2hi1c:

1). (c-) = w- fm(c-) và ) (c+) = w+ fm(c+)

2). (hjx) = (x)+sign(hjx)[ -1/2(1-sign(hix)sign(h1hix)(- )fm(hix)] nếu 1 jp

(hjx) = (x)+sign(hjx)[ -1/2(1-sign(hjx)sign(h1hjx)(-)fm(hjx)] nếu j>p

3.1.5. Xõy dựng quan hệ đối sỏnh trong miền trị của thuộc tớnh

í tưởng của việc mở rộng cơ sở dữ liệu quan hệ là làm thế nào để phản ỏnh một cỏch chớnh xỏc, đầy đủ những thụng tin khụng chắc chắn, thụng tin mờ. Trong tạp chớ tin học và điều khiển học, T17 S3(2001), 41-47 cỏc tỏc giả Hồ

) ( ) ( 1 c fm c h fm q p i i    ) ( ) ( 1 x fm x h fm q p i i       p i i h 1 ) (       q p p i i h 1 ) (   ) (   p j i i x h fm ) ( 1    j p i i x h fm

thuần, Hồ Cẩm Hà đó mở rộng mụ hỡnh của P.Buckles và E.Petry theo cỏch tiếp cận tương tự bằng cỏch cho phộp giỏ trị tại mỗi thuộc tớnh cú thể là một tập cỏc giỏ trị và cỏc giỏ trị này khụng bị đũi hỏi phải tương tự nhau theo một ngưỡng cho trước. Nếu xem mỗi miền giỏ trị của thuộc tớnh là một đại số gia tử, mỗi giỏ trị ngụn ngữ cú thể định lượng được thỡ đõy là một sự mở rộng cú ý nghĩa về ngữ nghĩa mờ trong cơ sở dữ liệu.

3.1.5.1. Phõn hoạch dựa trờn độ đo mờ của cỏc giỏ trị ngụn ngữ trong đại số gia tử. gia tử.

Vỡ độ đo tớnh mờ của cỏc từ là một khoảng của đoạn [0,1] và họ cỏc khoảng như vậy của cỏc từ cú cựng độ dài sẽ tạo thành phõn hoạch của [0,1]. Phõn hoạch ứng với độ dài từ lớn hơn sẽ mịn hơn và khi độ dài lớn vụ hạn thỡ độ dài của cỏc khoảng phõn hoạch giảm dần về 0.

Định nghĩa 3.1.5 [4]: Gọi fm là độ đo tớnh mờ trờn đại số gia tử X. Với mỗi x  X, ta ký hiệu I(x)  [0,1] và |I(x)| là độ dài của I(x)

Một họ cỏc  = {I(x):x  X} được gọi là phõn hoạch của [0,1] gắn với x nếu:

1) {I(c+), I(c-)} là phõn hoạch của [0,1] sao cho |I(c)|= fm(c), với c {c+, c-} 2) Nếu đoạn I(x) đó được định nghĩa và |I(x)| = fm(x) thỡ {I(hi(x): i=1..p+q} được định nghĩa là phõn hoạch của I(x) sao cho thoả điều kiện |I(hix)| = fm(hix) là tập sắp thứ tự tuyến tớnh.

Tập I(hi(x)} được gọi là phõn hoạch gắn với phần tử x. Ta cú: = fm(x)

3.1.5.2. Xấp xỉ cỏc giỏ trị ngụn ngữ trong phõn hoạch.

Gọi Xk

= {x  X: x = k} là tập cỏc từ cú cựng độ dài k trờn đại số gia tử X, Pk = {I(x): x  Xk }. Khi đú theo định nghĩa 3.1.5 thỡ Pk là phõn hoạch của [0,1].

Vớ dụ 1: Cho đại số gia tử (X, C, H, ) trong đú H= H+  H- và H+ = {h1, h2 }, h1< h2 , H- = {h3,h4 }h3 >h4, C ={c+, c- } . Ta cú P1={I(c+), I(c-)} là một phõn hoạch của [0,1]. Tương tự P2

={I(h1c+), I(h2c+), I(h3c+), I(h4c+), I(h1c-), I(h2c-), I(h3c-), I(h4c-)} là phõn hoạch của [0,1].

Định nghĩa 3.1.6 [4]:Cho Pk = {I(x): x  Xk }là một phõn hoạch ta núi rằng u xấp xỉ v theo mức k trong đú Pk

được ký hiệu u ≈k v khi và chỉ khi u và ) ( ( 1 x I h I q p i i   

v cựng thuộc một khoảng trong Pk. Cú định nghĩa là: u,vX, u ≈k v  k  Pk: I(u) kvà I(v) k Vớ dụ 2: Theo vớ dụ 1 P1 là phõn hoạch của [0,1]. Ta cú h1c+1 h2c+ vỡ 1 = I(c+) P1 màI(h1c+) 1và I(h2c+) 1 P2 là phõn hoạch của [0,1]. Ta cú h2c+ 2 h1h2c+ vỡ 2 = I(h2c+) P2 mà I(h2c+)2và I(h1h2c+) 2

Bổ đề 3.1.1.: Quan hệ k là quan hệ tương đương trờn Dom(Ai) Chứng minh: (1)Tớnh phản xạ Ta chứng minh bằng qui nạp - x  Dom(Ai) nếu |x| = 1 thỡ x= c+ hoặc x= c- - Ta cú 1

= I(c+) P1 : I(c+) = I(x)  1hoặc 1

= I(c-) P1 : I(c-) = I(x)

1

. Vậy k đỳng với k=1 hay x1x

-Giả sử |x| = n đỳng, cú nghĩa k đỳng với k = n, hay x k x. Ta cần chứng minh k đỳng với k = n+1.

Đặt x = h1x‟ , với |x‟| = n . Vỡ x n x nờn theo định nghĩa ta cú:nPn : I(x) n. Mặt khỏc ta cú Pn+1

= {I(h1x‟), I(h2x‟), ….}, với h1h2… là một phõn hoạch của I(x‟). Do đú (n+1)

=I(h1x‟)P(n+1):I(h1x‟)=I(x)n. Vậy k đỳng với k = n+1 hay xn+1x

(2) Tớnh đối xứng: x,y  Dom(Ai), nếu xky thỡ theo định nghĩa k

Pk : I(x) k và I(y)  k hay kPk : I(y) k và I(x) k . Vậy x1y thỡ ykx (3)Tớnh bắc cầu

Ta chứng minh bằng phương phỏp qui nạp Trường hợp k=1

Ta cú P1

={I(c+), I(c-)}, nếu xky và ykz thỡ 1

= I(c+) P1 : I(x)  1và I(z)  1 hoặc 1 = I(c-) P1 : I(x)  1 và I(y)  1 và I(z)  1, cú nghĩa là 1P1 : I(x) 1 : I(x) 1và I(z)  1

hay x1z. Vậy k đỳng với k=1

Giả sử quan hệ k đỳng với trường hợp k=n cú nghĩa là ta cú x,y,z 

Ta cần chứng minh quan hệ k đỳng với k = n+1. Cú nghĩa là x,y,z 

Dom(Ai), nếu xn+1y và yn+1z thỡ xn+1z.

Theo giả thiết nếu xn+1y và yn+1z thỡ (n+1)P(n+1):I(x) (n+1)và I(y)  (n+1)

và I(z)  (n+1)cú nghĩa là (n+1)P(n+1):I(x)  (n+1)và I(z)  (n+1)Vậy xn+1z

Bổ đề 3.1.2[4]. Cho u = hn….h1x và v = h‟m….h‟1x là biểu diễn chớnh tắc của u và v đối với x

(1): Nếu u=v thỡ ukv với mọi k (2): Nếu h1 h‟1 thỡ u ≈|x| v

Chứng minh

(1)Theo bổ đề 3.1.2, vỡ u =v nờn ta cú uku hay vkv với mọi k

(2) Nếu tức là u = h1x và v = h‟1x, do h1  h‟1 nờn u  v. Ta cú I(h1x)  I(x), I(h‟1x)  I(x) và I(h1x)  I(h‟1x) nờn 1

= I(x) P1 : I(h1x)  1

và I(h‟1x) 1

hay h1x 1 h‟1x. Vậy u ≈|x| v

- Nếu |u|  |v|, do h1 h‟1 nờn I(h1x)  I(h‟1x) (*)

Giả sử  k>1 sao cho ukv thỡ kPk = {I(hk-1, …h1x), I(h‟k-1, …h‟1x)}, với Pk

là một phõn hoặc của I(x): I(u) k

, I(v) k

- Nếu chọn k

= I(hk-1,…,h1x) thỡ I(u)I(hk-1, …h1x) và I(v) I(hk-1, …h1x) hay I(hn….h1x )  I(hk-1, …h1x), I(h‟m….h‟1x )  I(hk-1, …h1x) điều này mõu thuẫn vỡ I(hn….h1x ) I(h‟k-1, …h‟1x) do (*)

- Nếu chọn k=I(h‟k-1,…h‟1x) thỡ I(hn...h1x)  I(h‟k-1,…h‟1x) và I(h‟m….h‟1x)  I(h‟k-1, …h‟1x), điều này mõu thuẫn vỡ I(h‟m….h‟1x )I(hk-1,…, h1x) do (*)

Vậy khụng tồn tại k > 1 sao cho u k v hay k=1. Vậy u ≈|x| v

Định lý 3.1.2[4]. Cho Pk = {I(x): x  Xk }, u = hn….h1x và v = h‟m….h‟1x là biểu diễn chớnh tắc của u và v đối với x

(1) Nếu u k v thỡ u k‟ v với mọi 0<k‟<k

(2) Nếu  Max{j}  Min(m,n)sao cho s= 1…Max{j}, hs = h‟s thỡ u ≈max(j)+|x| v Chứng minh. (1)Ta cú Pk = {I(h , …h x), I(h‟ , …h‟ x} 2   v u

Vỡ u k v nờn theo định nghĩa kPk: I(u) k và I(v) k

(*) Ta lại cú P1

={I(x)}, P2={I(h1x), I(h‟1x)},…Pk

={I(hk-1, …h1x), I(h‟k-1, …, h‟1x}. Mặt khỏc ta cú I(hk-1, …h1x)I(hk-2, …h1x)….I(h1x)I(x) và I(h‟k-1 …, h‟1x)  I(h‟k-2, …, h‟1x) …. I(h‟1x)  I(x) nờn k

=I(hk-1, …h1x) Pk hoặc

k

= I(h‟k-1, …h‟1x) Pk và k-1

= I(hk-2, …h1x) Pk-1 hoặc k-1 =I(h‟k-2,…, h‟1x)  Pk-1 …. Và 2

=I(h1x) P2 hoặc 2=I(h‟1x) P2 và 1

=I(x) P1 sao cho kk-1…2 1

(**)

Từ (*) và (**) ta cú I(u) k k-1 …2 1

và I(v) k k-1

…2 1, cú nghĩa là với mọi 0<k‟<k luụn k‟Pk‟: I(u) k‟và I(v) k‟

. Vậy 0 < k‟ <k nếu ukv thỡ uk‟v

(2) Nếu Max{j} = 1 ta cú h1 = h‟1, khi đú u = hn….h2h1x và v = h‟m…h‟2h‟1x hay u = hn….h2h1x và v = h‟m…h‟2h1x . Đặt x‟ = h1x ta cú u = hn….h2x„ và v = h‟m…h‟2x‟. Vỡ h2  h‟2 nờn theo bổ đề 6.2 ta cú u ≈|x‟| v (do |x‟|=2, |x| =1) hay u2v . Vậy u ≈Max(j)+|x| v

- Giả sử, với k=Max{j}, Ta cần chứng minh u ≈k+|x|v

Vỡ ukv nờn theo giả thuyết ta cú s =1…k ta cú hs= h‟s. Khi đú u = hn….h2h1x và v = h‟m…h‟2h‟1x hay u =hn…hkhk-1,…h1x và v = h‟m…hkhk-1,…, h1x. Đặt x‟=hkhk-1, …h1x ta cú u =hn….hk+1x‟ và v = h‟m…h‟k+1x‟.Vỡ hk+1  h‟k+1

nờn theo bổ đề 6.2 ta cú u ≈|x‟|v hay u ≈k+|x v (do |x‟|=k, |x| =1)

Định nghĩa 3.1.7[4]. Cho Pk = {I(x): x  Xk } là một phõn hoạch, ta núi rằng u khụng xấp xỉ v theo mức k trong Pk

được ký hiệu u!kv khi và chỉ khi u và v khụng cựng thuộc một khoảng trong Pk

. Cú nghĩa là u,vX, u!kv  k

Pk : I(u) kvà I(v) k

Vớ dụ 3 Theo vớ dụ 1

P2={I(h1c+), I(h2c+), I(h3c+), I(h4c+), I(h1c-), I(h2c-), I(h3c-), I(h4c-)} là phõn hoạch của [0,1]. Vỡ 2

=I(h1c+) P2 ta cú I(h1c+)  2 và I(h2c+)2 (*). Mặt khỏc 2I(h2c+) P2 ta cú I(h1c+)  2và I(h2c+)  2(**). Từ (*) và (**) ta suy ra h1c+!2 h2c+

Định lý 3.1.3[4]. Cho Pk = {I(x): x  Xk } u = hn….h1x và v = h‟m….h‟1x là biểu diễn chớnh tắc của u và v đối với x . Nếu tồn tại số k lớn nhất sao cho ukv thỡ u!k‟v 0<k‟<k

Hệ quả 3.1.2

(1)Nếu u H(v) thỡ u!|v|+1v

(2)Nếu u!kv thỡ u!k‟v 0<k‟<k

3.1.6. Một số cỏch tiếp cận mụ hỡnh cơ sở dữ liệu mờ.

Mụ hỡnh theo cỏch tiếp cận đại số gia tử cú ưu điểm là: -Đảm bảo tớnh thuần nhất về kiểu dữ liệu.

-Việc tổ chức lưu trữ và thao tỏc dữ liệu trở nờn đơn giản, trực quan hơn bởi vỡ khi ta cú một giỏ trị ngụn ngữ cú nghĩa là đó xỏc định được một đoạn con [0,1], khi tỏc động cỏc gia tử vào cỏc từ sẽ tạo ra cỏc phõn hoạch mịn hơn, muốn định lượng giỏ trị ngụn ngữ ta sử dụng hàm v.

-Tập trung vào việc lựa chọn độ đo tớnh mờ của cỏc gia tử và chỳng trở thành hệ tham số của cỏch tiếp cận. Vỡ vậy, cỏch quản lý ngữ nghĩa dữ liệu rừ ràng.

- Khụng cần phương phỏp khử mờ .

Một số cỏch tiếp cận mụ hỡnh cơ sở dữ liệu mờ khỏc.

a. Mụ hỡnh tập con mờ [3]

Cỏch tiếp cận này khụng mở rộng miền giỏ trị thuộc tớnh mà mở rộng ngữ nghĩa của dữ liệu bằng cỏch thờm mỗi bộ dữ liệu một giỏ trị  [0,1] để đỏnh giỏ độ thuộc của bộ dữ liệu vào quan hệ đú. Tuy nhiờn để định giỏ  cho mỗi bộ dữ liệu là rất khú và đụi khi cũn mang tớnh chuyờn gia hoặc cảm tớnh. Để so sỏnh hai giỏ trị trờn miền thuộc tớnh, trong mụ hỡnh này sử dụng quan hệ giống nhau được định nghĩa thụng qua hàm thuộc EQ cú hai tớnh chất phản xạ và đối xứng. Vỡ vậy ứng với mỗi lượng đồ cơ sở dữ liệu khỏc nhau thỡ phải định nghĩa hàm thuộc EQ khỏc nhau.

b. Mụ hỡnh dựa trờn quan hệ tƣơng tự [9]

Hướng tiếp cận này được Bluckles và Petry đề xuất vào những năm 1982. Trong mụ hỡnh này, gớa trị tại mỗi thuộc tớnh cú thể là đa trị và trờn mỗi miền trị được định nghĩa một quan hệ tương tự để so sỏnh độ gần nhau giữa cỏc giỏ trị. Quan hệ này thoả món ba tớnh chất: phản xạ, đối xứng và bắc cầu Max- Min. Hạn chế của mụ hỡnh này là sử dụng quan hệ tương tự, đõy là một dạng quan hệ yờu cầu khỏ chặt do tớnh chất bắc cầu Max-Min, đồng thời khi gớa trị tại một thuộc tớnh nào đú là đa trị thỡ cỏc giỏ trị này đũi hỏi phải “đủ tương tự nhau”, điều này hạn chế khả năng biểu diễn những quan hệ trong thực tế.

c. Mụ hỡnh dựa trờn lý thuyết khả năng [17]

Mụ hỡnh này được nghiờn cứu và đề xuất bởi Prade và Tesemale. Cỏc tỏc giả đó làm mờ hoỏ cỏc giỏ trị thuộc tớnh bằng việc cho phộp cỏc phõn bố khả năng xuất hiện như một giỏ trị thuộc tớnh. Dựng phõn bố khả năng cho phộp biểu diễn nhiều dữ liệu, tuy nhiờn vẫn cũn phụ thuộc vào giỏ trị của hàm thuộc khi biểu diễn.

3.2. Luật kết hợp mờ. 3.2.1. Luật kết hợp 3.2.1. Luật kết hợp

3.2.1.1. í nghĩa của luật kết hợp

Luật kết hợp là một lĩnh vực quan trọng trong khai phỏ dữ liệu. Luật kết hợp giỳp chỳng ta tỡm được mối liờn hệ giữa cỏc mục dữ liệu (items) của cơ sở dữ liệu. Bài toỏn tỡm luật kết hợp boolean đầu tiờn trong. Vớ dụ cho luật này cú thể là như sau: “90% số người mua bơ và sữa sẽ mua cả bỏnh mỳ”. Đó cú nhiều thuật toỏn đưa ra nhằm giải quyết bài toỏn này như Apriori, FP-growth, Eclat…

Thụng tin đưa lại bởi luật kết hợp cú sự khỏc biệt cơ bản so với thụng tin thu được từ cỏc cõu lệnh truy vấn dữ liệu thụng thường như ngụn ngữ SQL. Đú là những tri thức, những mối liờn hệ chưa biết trước và mang tớnh dự bỏo đang tiềm ẩn trong dữ liệu. Những tri thức này khụng đơn giản chỉ là kết quả của phộp nhúm, tớnh tổng hay sắp xếp mà là kết quả của một quỏ trỡnh tớnh toỏn khỏ phức và tốn nhiều thời gian.

Tuy luật kết hợp là dạng luật khỏ đơn giản nhưng lại mang khỏ nhiều ý nghĩa. Thụng tin mà dạng luật này đem lại là rất đỏng kể và hỗ trợ khụng nhỏ trong quỏ trỡnh ra quyết định. Tỡm kiếm được cỏc luật kết hợp “qỳy hiếm” và mang nhiều thụng tin từ cơ sở dữ liệu tỏc nghiệp là một trong những hướng tiếp cận chớnh của lĩnh vực khai thỏc dữ liệu

3.2.1.2 Một số hƣớng tiếp cận trong khai thỏc luật kết hợp

Lĩnh vực khai thỏc luật kết hợp cho đến nay đó được nghiờn cứu và phỏt triển theo nhiều hướng khỏc nhau. Cú những đề xuất nhằm cải tiến tốc độ thuật toỏn cú những thuật toỏn nhằm tỡm kiếm luật cú ý nghĩa hơn, sau đõy là một số hướng tiếp cận trong khai thỏc luật kết hợp:

Luật kết hợp nhị phõn (binary association rule[23]): là hướng nghiờn cứu đầu tiờn của luật kết hợp. Trong dạng luật kết hợp này cỏc mục (thuộc tớnh) chỉ được quan tõm là cú hay khụng xuất hiện trong giao tỏc của cơ sở dữ liệu chữ khụng quan tõm về mức độ xuất hiện. Thuật toỏn tiờu biểu nhất để khai phỏ dạng

luật này là thuật toỏn Apriori và cỏc biến thể của nú. Đõy là dạng luật đơn giản và cỏc luật khỏc cũng cú thể chuyển về dạng luật này nhờ một số phương phỏp như rời rỏc hoỏ, mờ hoỏ…

Luật kết hợp cú thuộc tớnh số và thuộc tớnh hạng mục[23] (quantitative

Lập luận xấp xỉ dựa trờn đại số gia tử

Cài đặt thuật toỏn F-Apriori