KHÁI NIỆM LÂN CẬN NGỮ NGHĨA TRÊN DỮ LIỆU GIÁ TRỊ NGÔN

Một phần của tài liệu lập luận mờ trên cơ sở đại số gia tử và một số ứng dụng trong tin học (Trang 27 - 30)

NGÔN NGỮ ([6])

Trong phần này giới thiệu các kết quả chính về mô hình cơ sở dữ liệu quan hệ mờ giá trị ngôn ngữ theo quan niệm của nhóm nghiên cứu của Nguyễn Cát Hồ. Các kết quả cụ thể xin xem thêm trong [13].

={U, R1, R2, ..., Rm; Const}. Ở đây U={A1, A2, ...An , Rj là một lƣợc đồ quan hệ, Rj là một tập con của U. j=1,2,…m. Const là một tập các ràng buộc trên dữ liệu trong CSDL.

i

– (Ai) của một biến ngôn ngữ có không gian vũ trụ là khoảng DAi của tập số thựcR Ai

(Ai

đầy đủ AXi = (Xi, G, H, , , ). Đặt D(Ai)= DAi LDom(Ai).

I.1. Khái niệm lân cận ngữ nghĩa

I.1.1. Định nghĩa khoảng lân cận độ sâu k trên D(Ai)

Nhƣ đã biết (xem [12 AXi = (Xi, G, H,

, , ), tập J’={H(x): x H(G)} {Xi} tạo thành một cơ sở của một tôpô J và (X,J) là một không gian tôpô.

Với ánh xạ lƣợng hóa ngữ nghĩa trên Xi, trƣớc hết cần phải lƣu ý rằng trên các thuộc tính mờ Ai mà các giá trị của chúng có thể bao gồm các giá trị rõ trên DAi và các giá trị mờ biểu diễn dƣới dạng giá trị ngôn ngữ trên LDom(Ai) thì việc so sánh giữa một giá trị rõ y và một giá trị mờ x không thể thực hiện qua việc sử dụng giá trị của ánh xạ lƣợng hóa ngữ nghĩa Ai(x) để so sánh với y, vì Ai(x) chỉ biểu diễn cho một giá trị mờ x. Hơn nữa ngoài quan hệ tƣơng tự mờ, nhằm tiện cho việc quản lý ngữ nghĩa của dữ liệu cần phải mở rộng các quan hệ so sánh chẳng hạn quan hệ giữa giá trị x và giá trị y. Vì vậy cần phải xây dựng các khái niệm lân cận ngữ nghĩa của một giá trị mờ x qua độ đo mờ fm(x) và ánh xạ lƣợng hóa ngữ nghĩa

Ai(x).

Gọi (x) = ( Ai ( x), Ai ( x)] là phần tử lân cận (khoảng lân cận) ngữ nghĩa của x.

+ Gọi Xk là tập các từ (term) có độ dài k trong AXi , Xk = {x Xi: l(x)=k}. Phần tử bé nhất trong Xk đƣợc kí hiệu là xok. Đặt (xok) = [ Ai( xok), Ai( xok)].

+ Gọi (Xk) = { (xok) = [ Ai ( xok), Ai ( xok)]} { (x) = ( Ai ( x), Ai ( x)]: x Xk, x xok} là các khoảng lân cận độ sâu k. Khi đó (Xk) trở thành 1 phân hoạch của khoảng DAi sao cho:

- Hai lân cận khác nhau trong (Xk) là rời nhau.

- Hợp các khoảng lân cận độ sâu k (Xk) đúng bằng DAi + Với mỗi khoảng (Xk+1), tồn tại (Xk) sao cho (Xk+1) (Xk).

+ Với mọi x Xj với j k, ta có (x) luôn là điểm cuối hay điểm đầu của các khoảng phân hoạch (Xk+1).

I.1.2. Định nghĩa hệ thống cơ sở lân cận ngữ nghĩa

Xét x=hk-1...h1c với độ dài k, c G. Hệ thống cơ sở lân cận ngữ nghĩa với độ sâu d của x dƣới ánh xạ lƣợng hóa ngữ nghĩa Ai, đƣợc kí hiệu là NeiGd (x), k d, bao gồm các khoảng nhƣ sau:

1) k(x) = (x) =( Ai( x), Ai( x) ], khoảng lân cận độ sâu k của x. Với k là độ dài của x.

2) j(x), với k<j d, j(x) là khoảng đƣợc định nghĩa bởi hợp của hai khoảng độ sâu j có A(x) là điểm đầu của khoảng này và điểm cuối của khoảng kia. j(x)

cũng đƣợc gọi là khoảng lân cận độ sâu j của x.

Định nghĩa 2.1 (Lân cận độ sâu k)

Với mỗi số nguyên dƣơng k, đặt X(k)={x

LDom(Ai):l(x) k}=X1 X2... Xk..

X(k) là tập các term x có độ dài không lớn hơn k. Chúng ta định nghĩa lân cận độ sâu k của x nhƣ sau:

(N1) Với mỗi x X(k-1), lân cận với độ sâu k của x là k(x) k(x). Theo định nghĩa của k(x) ở trên thì k(x) là hợp của hai khoảng lân cận có độ sâu k+1 bên trái và bên phải của điểm Ai(x).

(N2) Với mỗi y Xk, đặt ( ) ( )\ ( 1) ( );

k X

x k

k y y x

(N3) Với mỗi x=hj-1...h1c Xj, ở đây c G và j>k, đặt

) ... ( )

(y hk 1 h1c

k nghĩa là lân cận độ sâu k của một từ với độ dài lớn hơn k cũng là lân cận độ sâu k của phần hậu tố của nó với độ dài k.

Định lí 2.1. ([13])

Cho AX = (X, G, H, , , ) là một đại số gia tử tuyến tính đầy đủ, có tập các gia tử H và H+ có tối thiểu hai phần tử. Khi đó, họ các khoảng { k(x):x X}

được gọi là lân cận độ sâu k của dữ liệu ngôn ngữ của thuộc tính Ai là một phân hoạch của DAi và mỗi giá trị x của Ai có một lân cận độ sâu k xác định. Hơn nữa, với x X, Ai(x)là một điểm trong của k(x).

Chú ý rằng họ { k(x):x X(k)}là một phân hoạch của DAi. Hơn nữa, )

( )

(x k x

Ai và là một điểm trong của k(x)(theo nghĩa tôpô), với x X(k) và do đó k(x) k(x) đƣợc gọi là hệ lân cận với độ sâu k của các giá trị ngôn ngữ của thuộc tính Ai dƣới ánh xạ Ai.

I.2. Quan hệ so sánh trên miền giá trị ngôn ngữ LDom(Ai) Định nghĩa 2.2. (Quan hệ bằng nhau mức k) ([13]) Định nghĩa 2.2. (Quan hệ bằng nhau mức k) ([13])

Giả sử t và u là hai bộ trên U, ta sẽ viết t Ai .k u Ai và gọi là quan hệ bằng nhau mức k, nếu thoả mãn các điều kiện sau:

(i). Nếu t Ai , u Ai DAi, thì t Ai =u Ai ;

(ii). Nếu một trong t Ai , u Ai là dữ liệu ngôn ngữ, giả sử i

A

t LDom(Ai) thì u Ai k(t Ai ).

(iii). Nếu cả t Ai , u Ai là dữ liệu ngôn ngữ thì k(u Ai ) k(t Ai ).

Khi đó ta hiểu t Ai .ku Ai theo nghĩa phủ định của t Ai .k u Ai .

Nhận xét:

- Quan hệ bằng nhau mức k ( .k) được định nghĩa trên toàn bộ miền dữ liệu D(Ai) và là một quan hệ tương đương, vì vậy nó là quan hệ tương tự.

- Với ánh xạ lượng hóa ngữ nghĩa v, nếu t1[Ai] v,k t2[Ai] thì t1[Ai]=v,k’t2[Ai] với mọi k’: k k’ 0.

Để đơn giản trong định nghĩa quan hệ so sánh giữa các phần tử trong D(Ai), không mất tính tổng quát chúng ta giả thiết nhƣ sau:

Với t[Ai] DAi thì k(t[Ai]) cũng chính là giá trị thực t[Ai ]. Với t[Ai] là dữ liệu ngôn ngữ thì k(t Ai ) là lân cận mức k đƣợc định nghĩa nhƣ trên.

Với bất kì hai lân cận k(x), k(y), chúng ta viết k(x) k(y) nếu u<v với mọi u k(x)và với mọi v k(y).

Định nghĩa 2.3. (Quan hệ so sánh mức k) ([13])

Với giả thiết như trên, ta nói: k i A t , u Ai nếu t Ai .k u Ai hoặc k(t Ai ) k(u Ai ); k i A t , u Ai nếu k(t Ai ) k(u Ai ); k i A t , u Ai nếu k(t Ai ) k(u Ai );

Trong thực tiễn ứng dụng, chúng ta thƣờng giới hạn độ dài của giá trị ngôn ngữ, vì không ai dùng quá nhiều từ nhấn trong một từ để mô tả một vấn đề nào đó mà chỉ dùng hữu hạn từ nhấn. Bởi vậy độ dài của một giá trị ngôn ngữ trong một thuộc tính đƣợc giả sử có độ dài tối đa là ki xác định. Khi đó, các phép toán quan hệ so sánh mức k có một vài tính chất sau đây.

Định lí 2.2. ([13])

Giả sử tập LDom(Ai) các dữ liệu ngôn ngữ của thuộc tính Ai, được xét trên tập giá trị X của đại số gia tử tuyến tính đầy đủ AX, là hữu hạn và một term trong LDom(Ai) có độ dài lớn nhất là ki thì:

(i) Tất cả các phép toán quan hệ mờ k k k k k, ,k , , , , , , , , , với k>ki, là

trường hợp này chúng ta sẽ sử dụng các kí hiệu , , , , , để thay cho ki ki ki ki ki ki, , , , , , , , , , , .

(ii) Các phép toán quan hệ , , , , , được định nghĩa trên LDom(Ai) là đồng nhất với , , , , , được định nghĩa trên X.

Nhận xét:

Nhƣ vậy, nếu giả sử các giá trị ngôn ngữ trong LDom(Ai) có độ dài lớn nhất là k. Khi đó, theo định nghĩa k(x) và theo định lý 2.2. các phép toán quan hệ

, , , ,

, là đủ để so sánh trên các giá trị của thuộc tính D(Ai) bao gồm giá trị thực DAi và giá trị ngôn ngữ LDom(Ai), hơn nữa các quan hệ so sánh trên vẫn có nghĩa với các term có độ dài khác nhau, chứ không nhất thiết có độ dài k.

Một phần của tài liệu lập luận mờ trên cơ sở đại số gia tử và một số ứng dụng trong tin học (Trang 27 - 30)