Các khái niệm và thuật toán thu gọn hệ sinh AXĐ

Một phần của tài liệu Nghiên cứu hệ sinh ánh xạ đóng và ứng dụng trong thể hiện ngữ nghĩa dữ liệu (Trang 81)

Định nghĩa 3.8

Cho hai hệ sinh  = (U,F),  = (V,G) và tập MU. Ta nói hệ sinh  nhận được từhệ sinh  qua phép thu gọn theo tập M, và ký hiệu là  = \M, nếu sau khi loại bỏ mọi xuất hiện của các phần tử của M trong hệ sinh  thì thu được hệ sinh . Thao tác loại bỏ M được thực hiện trên hệ sinh  = (U,F) để thu được hệ sinh

 = (V,G) như sau:

1. Tính V = U\M có độ phức tạp O(n) với n = |U|.

2. Với mỗi luật sinh XY trong F, ta tạo một luật sinh X\MY\M cho G. Thủ tục này xác định tập các luật sinh được ký hiệu là F\M. Để đơn giản ta ký hiệu

G = F\M với ý nghĩa tập luật sinh G nhận được từ tập luật sinh F sau khi thực hiện thủ tục thu gọn như trên. Tính F\M đòi hỏi độ phức tạp O(mn), với m = |F|.

Như vậy  = \M = (U\M, F\M) được thực hiện với độ phức tạp O(mn), tức là tuyến tính theo chiều dài dữ liệu vào của hệ sinh .

Sau khi thực hiện thủ tục G = F\M, nếu:

- G chứa các luật sinh tầm thường (dạng XY, X Y) thì ta loại các luật sinh này khỏi G,

- G chứa các luật sinh trùng lặp thì ta lược bớt các luật sinh này.

Thí dụ 3.6

Cho hệ sinh  = (U, F), U = ABCDEH, F = { AH D, A DE, BC H,

HBC}. Với M = ADE. Hãy xác định  = (V,G) = \M.

Ta có, V = U\ADE = ABCDEH\ADE = BCH, G = {H   (loại),   

(loại), BCH, HBC} ≡ {BCH, HBC}.

Khi thực hiện phép thu gọn một hệ sinh, ta có một số nhận xét sau đây,

Phép thu gọn thỏa tính chất kết hợp, nghĩa là nếu gọi  là hệ sinh trên tập U

80

Để tiện theo dõi, thuật toán Reduce sau đây sẽ trình bày lại cách thu gọn một hệ sinh,

Thuật toán 3.5 [5]

AlgorithmReduce

Format:Reduce (,M)

Input: - Hệ sinh AXĐ  = (U,F)

- Tập con MU

Output: - Hệ sinh AXĐ = (V,G) =\M, V=U\M, G=F\M.

Begin

V := U \ M;

G := ;

for each rule LRin Fdo

G := G{L\MR\M};

endfor; (adsbygoogle = window.adsbygoogle || []).push({});

G:= NR(G);

return (V,G);

EndReduce.

Thuật toán Reduce được thực hiện có độ phức tạp O(mn), với m là số lượng luật sinh, n là số phần tử trong tập U. Nói cách khác, độ phức tạp của thuật toán là tuyến tính theo chiều dài dữ liệu vào của hệ sinh .

Một phần của tài liệu Nghiên cứu hệ sinh ánh xạ đóng và ứng dụng trong thể hiện ngữ nghĩa dữ liệu (Trang 81)