Phép toán hội

Một phần của tài liệu Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu (Trang 49)

Định nghĩa 2.2.1

Cho các AXĐ f và g trên tập U hữu hạn. Ta xác định ánh xạ h trên U như sau, h(X) = f(X)  g(X), với mọi X  U. Ta gọi ánh xạ h là hội của các AXĐ f và g,

ký hiệu là h = f*g.

Mệnh đề sau đây trong [4] đã phát biểu và chứng minh rằng hội của hai AXĐ là một AXĐ. Nói cách khác, không gian các AXĐ đóng với phép toán hội.

Mệnh đề 2.2.1 [4]

Hội của hai AXĐ trên U là một AXĐ trên U.

2.2.2. Phép hợp thành các ánh xạ đóng

Với phép toán hội trình bày ở phần trên đã cho thấy hội của hai AXĐ là một AXĐ. Tuy nhiên, với phép toán hợp thành các AXĐ thì tính chất này lại không thỏa mãn. Phần sau đây sẽ trình bày các định nghĩa, mệnh đề có liên quan đến phép toán hợp thành các AXĐ và sẽ chỉ ra phép hợp thành chỉ thỏa các tính chất phản xạ và đồng biến của AXĐ. Ngoài ra, phần này cũng sẽ trình bày các định lý phát biểu một số các điều kiện cần và đủ để hợp thành các AXĐ là một ánh xạ đóng cũng như đóng góp của luận văn với các bổ đề về điều kiện đủ để phép hợp thành các AXĐ là một AXĐ và điều kiện để một họ con các AXĐ đóng với phép hợp thành.

Định nghĩa 2.2.2

Cho hai AXĐ f và g trên tập U hữu hạn. Ta xác định ánh xạ k trên U như sau

k(X) = f(g(X)), với mọi X  U. Ta gọi k là hợp thành của hai ánh xạ đóng f và g,

ký hiệu là k = fg

Mệnh đề sau đây trong [4] đã phát biểu và chứng minh tính phản xạ, tính đồng biến thì luôn đúng với phép hợp thành của hai ánh xạ đóng,

Mệnh đề 2.2.2 [4]

Hợp thành của hai AXĐ thỏa các tính chất phản xạ và đồng biến.

Ta xây dựng một phản thí dụ chứng tỏ rằng hợp thành của hai AXĐ không thoả tính lũy đẳng. Giả sử có các ánh xạ đóng f và g trên tập U = ABC như sau:

Đặt C là phần tử cố định trong U. Giả sử X  U. Nếu C X ta đặt g(X)=X, ngược lại ta đặt g(X) = U. Đối với ánh xạ f , X  U, ta đặt f(X) = Xc.

Do ánh xạ tịnh tiến f = hC là AXĐ. Ta sẽ chứng minh g cũng là AXĐ.

Tính phản xạ và lũy đẳng của g là hiển nhiên. Ta kiểm tra tính đồng biến của

g. Giả sử X  Y  U. Nếu C X thì C Y và do đó g(X)=g(Y)=U. Nếu C Y thì C X và ta có g(X) = X  Y = g(Y). Nếu C Y và C X thì g(X) = X  U = g(Y). Vậy g thỏa tính đồng biến. Hay nói cách khác, g là AXĐ.

Đặt k = fg, ta chứng minh k không là AXĐ. Thật vậy, xét tập X ={A}. Khi đó, k(X)= f(g(A) )= f(A)= A C. Mặ t k h á c , k(k(X) )= k(A C)= f(g(AC))=f(U)=U.

Bất đẳng thức k(k(X))  k(X) cho thấy hợp thành của hai AXĐ không thoả tính lũy đẳng và do đó k không phải là AXĐ.

Từ thí dụ trên, ta có nhận xét: f.g(a) = f(a) = ac, trong khi g.f(a) = g(ac) = U.

Mệnh đề 2.2.3 [4]

Hợp thành của hai AXĐ nói chung không giao hoán.

Định nghĩa 2.2.3

Với tập U hữu hạn cho trước, ta ký hiệu Map(U) là tập các ánh xạ từ

Subset(U)  Subset(U), với Subset(U) là họ toàn thể các tập con chứa trong U.

Mệnh đề 2.2.4 [4]

Phép hợp thành của các ánh xạ trong Map(U) có tính kết hợp, do đó trong

biểu thức gồm một dãy các phép hợp thành của các ánh xạ trong Map(U) ta có thể gộp các phép hợp thành liên tiếp nhau thành từng nhóm bằng cách sử dụng các cặp dấu ngoặc.

Định nghĩa 2.2.4

Cho tập hữu hạn U và các ánh xạ f, g  Map(U). Ta nói ánh xạ f hẹp hơn

Nếu ánh xạ f hẹp hơn ánh xạ g, ta cũng nói ánh xạ g rộng hơn ánh xạ f và ký hiệu là g  f.

Mệnh đề sau sẽ trình bày về các tính chất của quan hệ “hẹp hơn” của các ánh xạ trên Map(U),

Mệnh đề 2.2.5[4]

Với mọi ánh xạ f, g, h  Map(U), quan hệ “hẹp hơn”  thoả các tính chất sau: (i) Phản xạ: f  f,

(ii) Phản xứng: Nếu f  g và g  f thì f = g, (iii) Bắc cầu: Nếu f  g và g  h thì f  h.

Như vậy quan hệ “hẹp hơn”  là thứ tự bộ phận trên Map(U).

Tính thành phần của quan hệ “hẹp hơn” được trình bày qua mệnh đề sau đây,

Mệnh đề 2.2.6 [4]

Hợp thành của hai AXĐ không hẹp hơn mỗi ánh xạ thành phần, tức là, với mọi AXĐ f và g, ta có:

1. fg  f ,

2. fg  g .

Mệnh đề sau phát biểu và chứng minh về tính gia tăng của quan hệ “hẹp hơn”

Mệnh đề 2.2.7 [4]

Với mọi AXĐ f, g và h trên U, nếu f  g thì

1. fh  gh,

2. hf  hg.

Tính tương đẳng của quan hệ “hẹp hơn” được trình bày qua mệnh đề sau,

Mệnh đề 2.2.8 [4]

Từ các tính chất đã trình bày của quan hệ “hẹp hơn” và các tính chất của AXĐ, mệnh đề sau đây phát biểu một số các điều kiện tương đương

Mệnh đề 2.2.9 [4]

Với mọi AXĐ f, g  CloseU ba điều kiện sau đây là tương đương: (i) f  g,

(ii) fg = g,

(iii) gf = g.

Định lý sau đây trong [4] đã phát biểu và chứng minh điều kiện cần và đủ thứ nhất để hợp thành hai AXĐ là một AXĐ.

Định lý 2.2.1 [4]

Cho hai AXĐ f và g. Các hợp thành fg và gf đồng thời là các AXĐ khi và chỉ

khi chúng giao hoán, tức là:

( f, g  Close(U): (fg, gf  Close(U)  fg = gf)

Bổ đề 2.2.1

Cho các ánh xạ đóng f, g trên tập U hữu hạn. Nếu f  g hay g  f thì hợp thành

f.g và g.f là các ánh xạ đóng.

Chứng minh

Nếu f  g thì theo mệnh đề 2.3.7 ta có f.g = g và g.f = g. Suy ra f.g = g.f. Hay nói cách khác thì f và g giao hoán. Áp dụng định lý 2.2.1 thì các hợp thành f.g và g.f là các ánh xạ đóng.

Tuy nhiên, mệnh đề đảo của bổ đề trên thì không đúng. Chúng ta hãy cùng xem qua phản thí dụ sau,

Xét các ánh xạ đóng f, g trên tập U hữu hạn chứa ít nhất ba phần tử là A, B, C. Ta đặt: f(X)=XB, nếu X chứa A, f(X)=X nếu X không chứa A.

Theo cách thiết lập trên thì f, g là các ánh xạ đóng. Ta sẽ chứng tỏ hợp thành

f.g cũng là ánh xạ đóng nhưng f và g không so sánh được với nhau. Theo mệnh đề 2.2.1 thì hợp thành f.g thỏa các tính chất phản xạ và đồng biến. Ta chỉ cần kiểm tra

tính chất lũy đẳng.

Gọi Z là tập con của U và không chứa các phần tử A và B. Ta xét các tập con X của U lần lượt thuộc một trong ba dạng: X = Z, X = AZ, X = BZ, X = ABZ. Ta có:

g(ABZ) = f(ABZ) = ABZ, f(Z) = g(Z) = Z,

f(BZ) = BZ, f(AZ) = ABZ, g(BZ) = ABZ, g(AZ) = AZ

Do đó:

f.g(Z)= Z, f.g.f.g(Z) = f.g(Z) = Z

f.g(AZ)f(AZ) = ABZ, f.g.f.g(AZ) = f.g(ABZ) = ABZ = f.g(AZ) f.g(BZ)f(ABZ) = ABZ, f.g.f.g(BZ) = f.g(ABZ) = ABZ = f.g(BZ)

f.g(ABZ)f(ABZ )= ABZ, f.g.f.g(ABZ) = f.g(ABZ) = ABZ = f.g(ABZ)

Vậy hợp thành f.g thỏa tính chất lũy đẳng và do đó f.g là ánh xạ đóng. Mặt

khác, các đẳng thức f(bZ) = bZ, g(bZ) = abZ và f(aZ) = abZ, g(aZ) = aZ cho thấy f và g không sánh được với nhau, tức là f không hẹp hơn g và g không hẹp hơn f.

Ngoài đóng góp trên, luận văn cũng đề xuất bổ đề phát biểu và chứng minh điều kiện để một họ con các AXĐ trong tập toàn thể các AXĐ trên tập U hữu hạn đóng với phép hợp thành sau đây.

Bổ đề 2.2.2

Cho G  Close(U) với Close(U) là tập toàn thể các AXĐ trên U hữu hạn. Họ

con các AXĐ G đóng với phép hợp thành nếu G là một thứ tự toàn phần đối với

phép  “hẹp hơn”.

Chứng minh

Do G  Close(U), theo giả thiết tạo thành một quan hệ thứ tự toàn phần. Xét hai AXĐ bất kỳ f, g  G. Ta có f  g hay g  f. Áp dụng bổ đề 2.3.1 thì các hợp thành

f.g và g.f là các AXĐ. Hay nói cách khác tập G Close(U) đóng với phép hợp

thành do hợp thành của hai AXĐ bất kỳ trên G là một AXĐ.

2.3. Giàn giao ánh xạ đóng

Trong một số lĩnh vực như cơ sở dữ liệu, khai thác dữ liệu,… thì giàn giao AXĐ được sử dụng như một công cụ có nhiều đóng góp và ứng dụng nhất định. Phần này sẽ trình bày một số khái niệm, tính chất cơ bản về điểm bất động (hay còn gọi là tập đóng) và lý thuyết giàn giao AXĐ cùng với các bổ đề và định lý phát biểu về sự tương quan giữa các tập đặc trưng trong một giàn giao.

2.3.1. Điểm bất động

Định nghĩa 2.3.1 [3]

Cho AXĐ f trên tập U hữu hạn. Tập X  U gọi là điểm bất động (còn gọi là

tập đóng) của AXĐ f nếu f(X) = X .

Fix(f) là ký hiệu tập toàn bộ các điểm bất động của AXĐ f. Fix(f) luôn chứa U

do f(U) = U. Mặt khác, dựa vào tính lũy đẳng của các AXĐ, ta còn có thể mô tả Fix(f) như sau, Fix(f) = { f(X) | X  U }.

2.3.2. Giàn giao ánh xạ đóng

Định nghĩa 2.3.2 [3]

Gọi G là một họ các tập con của tập hữu hạn U đóng với phép giao, hay nói

cách khác là giao của mọi họ con trong G đều cho kết quả là một tập con trong G,

G  SubSet(U): ( H  G  H X X  G)

G được gọi là giàn giao trên tập hữu hạn U. Khi đó, một họ con duy nhất S chứa trong G sao cho mọi phần tử của G đều được biểu diễn qua giao của các phần tử trong S. Nói cách khác, S là tập con nhỏ nhất của G thỏa tính chất:

G = { X1  …  Xk| k  0, X1, … , Xk  S }

Theo quy ước, do giao của một họ rỗng các tập con là U, nên mọi giàn giao đều chứa U.

Tập sinh S trong giàn giao AXĐ có vai trò rất quan trọng. Để biểu diễn tập sinh theo nhiều ngữ nghĩa khác nhau, ta cùng xem xét định lý sau.

Định lý 2.3.1 [3]

Cho G là giàn giao trên tập hữu hạn U. Khi đó bốn tập dưới đây bằng nhau: (i) Gen(G)

(ii) { VG | VU, (X,YG, X V, Y V)  XYV }

(iii) { VG | VU,(V=X1…Xk; X1,…,XkG, k1) (i,1ik:V = Xi )}

(iv) { V  G | V  X V G X X   } Định nghĩa 2.3.3[3]

Cho (M, ) là một tập hữu hạn có thứ tự bộ phận. Phần tử m trong M được gọi là cực đại nếu từ m  x và xM, ta luôn có m=x. Ta ký hiệu MAX(M) là tập các

phần tử cực đại của M. Có thể nhận thấy là với mỗi phần tử x trong M luôn tồn tại một phần tử m trong MAX(M) thỏa x  m.

Xét thứ tự bộ phận  cho mỗi họ các tập con của tập hữu hạn U. Phần tử cực đại thuộc các tập được trình bày qua mệnh đề sau,

Mệnh đề 2.3.1 [4]

Cho (M,) là một tập hữu hạn, có thứ tự bộ phận và P  Q  M. Khi đó, nếu

X  MAX(Q) và X  P thì X  MAX(P).

Sự tương quan giữa các tập cực đại trong giàn giao và tập sinh của giàn giao được trình bày qua bổ đề sau đây.

Bổ đề 2.3.1[4]

Một trong những kết quả cũng được trình bày trong [4] đã chứng minh là tập các điểm bất động cũng tạo thành một giàn giao. Kết quả này được thể hiện qua định lý sau.

Định lý 2.3.2 [4]

Cho AXĐ f trên tập hữu hạn U. Khi đó, Fixf là một giàn giao với phần tử

cực đại U.

Khi làm việc với giàn giao thì các tác giả trong [4] cũng đã đưa ra các khái niệm về đối nguyên tử và tập Coatom của một giàn giao. Các khái niệm này được trình bày qua định nghĩa sau.

Định nghĩa 2.3.4 [4]

Cho G là giàn giao trên tập U. Ta ký hiệu Coatom(G) = MAX(G \ {U}) và gọi các phần tử trong Coatom(G) là đối nguyên tử của giàn giao G.

Bổ đề 2.3.1 đã trình bày về mối quan hệ giữa các tập cực đại trong giàn giao và tập sinh cùng với định nghĩa về khái niệm đối nguyên tử và tập Coatom trong

giàn giao. Đặc trưng của tập Coatom được trình bày qua định lý sau.

Định lý 2.3.3 [4]

Với mọi giàn giao G trên tập hữu hạn U, ta có CoatomG = MAXGenG. Để xác định tập các đối nguyên tử Coatom T và tập sinh Gen S của giàn giao

G cho trước, chúng ta cùng xem thuật toán Gen trong [4] được trình bày sau đây.

Thuật toán 2.3.1 Algorithm Gen

Input: - Giàn giao G

Output: - S = Gen(G) - T = Coatom(G)

Begin

1. Xây dựng đồ thị có hướng H, trong đó mỗi đỉnh của đồ thị là một phần tử của G, cung X  Y nếu X bao trực tiếp Y.

2. Ký hiệu d(X) là bậc vào của đỉnh X (số cung đi đến X). 3. Return

- T = { X  G | U  X } - S = { X G | d(X) = 1}

End Gen.

Tính đúng của thuật toán Gen trên được trình bày qua định lý sau.

Định lý 2.3.4 [4]

Với mọi giàn giao G trên tập hữu hạn U, thuật toán Gen tìm đúng tập đối nguyên tử

CoatomG và tập sinh GenG với độ phức tạp tính toán Onm2, trong đó n là số

Chương 3

ẨN CÁC TẬP MỤC NHẠY CẢM 3.1. Giàn giao AXĐ và bài toán ẩn tập mục nhạy cảm

Khai thác tri thức từ dữ liệu là lĩnh vực cung cấp các nguyên lý và thuật toán phát hiện các luật từ dữ liệu. Một vấn đề thường gặp là khi cung cấp dữ liệu cho các trung tâm khai thác tri thức, một số cơ sở không muốn công bố các luật vi phạm đến tính riêng tư của cá nhân hoặc của xí nghiệp. Thí dụ, nếu X là tập mục về giá trị gói thầu, Y là tập mục về chi phí quà biếu thì việc công bố tương quan giữa X và Y rõ ràng là điều bất lợi. Các tập mục X và Y như trên được gọi là các tập mục nhạy cảm. Một lẽ tự nhiên là cơ sở cung cấp dữ liệu sẽ phải loại bỏ các tập mục nhạy cảm X và

Y khỏi danh mục cần cung cấp. Tuy nhiên, việc làm này đôi khi lại vi phạm luật về

cung cấp thông tin. Giải pháp thứ hai thường được các cơ sở lách luật chọn là vẫn công bố đầy đủ các tập mục nhưng tìm cách sửa tần suất xuất hiện của các tập mục nhạy cảm xuống dưới ngưỡng phổ biến . Khi đó các tập mục nhạy cảm sẽ trở thành các tập mục không phổ biến và do đó chúng không thể trở thành các thành phần trong bất kỳ luật nào. Giải pháp thứ hai này được gọi là ẩn các tập mục nhạy cảm (và phổ biến). Hướng nghiên cứu này rõ ràng là cần thiết cho trường hợp cần bảo vệ bí mật và tính riêng tư của các tình huống hợp pháp, đồng thời có thể phát hiện giả mạo, lách luật trong các tình huống cần ngăn chặn.

Ở đây đề xuất một tiếp cận cho bài toán ẩn các tập mục nhạy cảm. Vận dụng lý thuyết giàn giao ta có thể xác định một cận trên đúng và sau đó là cận dưới đúng đối với một tập mục nhạy cảm cho trước. Hướng tiếp cận này có những điểm đặc biệt sau đây. Thứ nhất, chứng minh rằng họ các tập phổ biến tạo thành một giàn giao. Thứ hai, nhờ vận dụng các tính chất của giàn giao đã chỉ ra rằng có thể sử dụng lý thuyết đồ thị để xác định các tập mục gây ảnh hưởng và các tập mục chịu ảnh hưởng trực tiếp khi sửa giao tác trên tập mục nhạy cảm cần ẩn, do đó làm giảm thời gian truy xuất các giao tác và hạn chế được việc gây ra các hiệu ứng phụ theo nghĩa là ẩn nhầm các tập mục phổ biến khác.

3.2. Phát biểu bài toán

Cho một bảng trị T 0/1 gồm N dòng và M cột. Các cột được gán tên lần lượt A, B, C,… lấy từ một tập hữu hạn các phần tử U. Mỗi phần tử trong U gọi là một

mục, mỗi tập con X của U gọi là một tập mục. Mỗi dòng t của bảng T dược gọi là

một giao tác. Theo truyền thống của lý thuyết khai thác tri thức ta ký hiệu tập mục như một dãy các kí tự viết liền nhau, hợp của hai tập mục X và Y được kí hiệu là XY. Với mỗi giao tác t  T và mỗi mục A  U ta kí hiệu t.A là trị tương ứng xuất hiện

Một phần của tài liệu Ứng dụng lý thuyết giàn giao trong khai thác dữ liệu (Trang 49)

Tải bản đầy đủ (PDF)

(77 trang)