Nghiên cứu hệ sinh ánh xạ đóng và ứng dụng trong thể hiện ngữ nghĩa dữ liệu (tóm tắt)

27 576 0
Nghiên cứu hệ sinh ánh xạ đóng và ứng dụng trong thể hiện ngữ nghĩa dữ liệu (tóm tắt)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN Cơng trình hồn thành tại: Viện Cơng nghệ Thông tin - Viện Khoa học Công nghệ Việt nam BÙI ĐỨC MINH Người hướng dẫn khoa học PGS TSKH NGUYỄN XUÂN HUY NGHIÊN CỨU HỆ SINH ÁNH XẠ ĐÓNG VÀ ỨNG DỤNG TRONG THỂ HIỆN NGỮ NGHĨA DỮ LIỆU Chuyên ngành: BẢO ĐẢM TOÁN HỌC CHO MÁY TÍNH VÀ HỆ THỐNG TÍNH TỐN Mã số: 62.46.35.01 TS HOÀNG QUANG Phản biện 1: ………………………………………… Phản biện 2: ………………………………………… Phản biện 3: ……………………………………… Luận án bảo vệ trước Hội đồng chấm luận án cấp nhà nước TĨM TẮT LUẬN ÁN TIẾN SĨ TỐN HỌC họp tại: …………………………………………………………… …………………………………………………………………… vào hồi ngày tháng năm 20… Có thể tìm hiểu luận án thư viên: …………………………… HÀ NỘI - 2014 …………………………………………………………………… PHẦN MỞ ĐẦU Đặt vấn đề Trong nghiên cứu mô tả giới thực, với việc phản ánh ngữ nghĩa liệu sở liệu lý thuyết phụ thuộc liệu đóng vai trị quan trọng Phụ thuộc liệu thiết kế quản trị sở liệu hiểu mô tả ràng buộc mà liệu phải thỏa mản toán thực tế yếu tố định đến chất lượng liệu trình xử lý quản trị hệ thống Một số kết nghiên cứu năm gần cho thấy vận dụng khái niệm ánh xạ đóng để tiếp tục nghiên cứu vấn đề thuộc ngữ nghĩa liệu Các cơng trình nghiên cứu lý thuyết giàn giao từ cuối năm 90 đến có nhiều đóng góp lĩnh vực khai phá liệu sở liệu Việc tiếp tục nghiên cứu ứng dụng lý thuyết giàn giao vấn đề đáng quan tâm Mỗi ánh xạ đóng đặc trưng thơng qua hệ suy dẫn gọi hệ sinh Để quản lý hệ suy dẫn lớn, phức tạp cần phải có nhiều thuật tốn hiệu để tính tốn đối tượng Nếu kích thước hệ suy dẫn nhỏ hiệu thuật toán đạt cao Kỹ thuật thu gọn hệ sinh tiếp cận để giải toán với ý tưởng loại bỏ khỏi hệ sinh ban đầu số phần tử để thu hệ sinh có kích thước nhỏ biểu diễn lại đối tượng hệ sinh ban đầu theo đối tượng hệ sinh Kỹ thuật nhà khoa học từ đầu năm 2000 đến công bố nhiều công trình Vấn đề chọn lựa tập phần tử để loại bỏ để đạt hiệu toán cần tiếp tục nghiên cứu Bên cạnh đó, tốn đặt ngồi kỹ thuật thu gọn hệ sinh ta cịn sử dụng phương pháp để thu nhỏ kích thước hệ suy dẫn? Đây toán cần khảo sát nghiên cứu Mục đích luận án Mục đích luận án tìm kiếm, phát triển công cụ phương pháp biểu diễn đối tượng hệ suy dẫn nhằm rút gọn không gian lưu trữ nâng cao hiệu tính tốn Trên sở đó, vận dụng kết thu mặt lý thuyết vào ứng dụng cụ thể số lĩnh vực sở liệu khai phá liệu Phương pháp nghiên cứu Tổng hợp tài liệu kết nghiên cứu cơng bố có liên quan đến đề tài Trao đổi, học hỏi với chuyên gia làm việc lĩnh vực nghiên cứu lĩnh vực có liên quan Đối sánh kết thu mặt lý thuyết thuật toán với kết công bố nhằm đánh giá ý nghĩa hiệu kết khuôn khổ luận án Vận dụng phương pháp cấu trúc tốn học rời rạc (bao gồm logic hình thức) để chứng minh số kết luận án Bố cục luận án Luận án trình bày 03 chương, phần mở đầu, phần kết luận Chương Một số khái niệm sở liệu quan hệ khai phá liệu Chương đề cập đến số khái niệm chung lý thuyết sở liệu quan hệ, cụ thể khái niệm quan hệ, bộ, thuộc tính, LĐQH, khái niệm phụ thuộc hàm, bao đóng tập phụ thuộc hàm, bao đóng tập thuộc tính, tốn thành viên, khóa phản khóa, … Ngồi ra, chương trình bày số khái niệm sử dụng khai phá liệu khái niệm sở liệu giao tác, tập phổ biến, luật kết hợp, …, kết nối Galois số tính chất Chương Ánh xạ đóng & Lý thuyết giàn giao ứng dụng Chương giới thiệu số khái niệm, tính chất ánh xạ đóng lý thuyết giản giao Kết chương gồm có phát biểu điều kiện đủ để phép hợp thành AXĐ AXĐ điều kiện để họ AXĐ đóng với phép hợp thành Ngồi ra, số kết đạt xây dựng ứng dụng AXĐ, lý thuyết giàn giao toán khai phá liệu lý thuyết sở liệu trình bày Chương Hệ sinh ánh xạ đóng số kết nghiên cứu Trong chương chủ yếu trình bày định nghĩa, tính chất quan trọng hệ sinh AXĐ định lý, bổ đề biểu diễn sở, phản sở hệ sinh AXĐ thông qua kỹ thuật thu gọn hệ sinh Kết chủ yếu chương đề xuất dạng biểu diễn phản sở hệ sinh theo vế phải tối đại tập luật sinh với thuật toán thu gọn hệ sinh hệ sinh đơn giản gọi hệ sinh cân định lý tính thuật tốn Bên cạnh đó, chương trình bày số kết nghiên cứu thu xây dựng dạng giản lược tập luật sinh, tương quan đối tượng hệ sinh AXĐ, … CHƯƠNG 1: MỘT SỐ KHÁI NIỆM CƠ BẢN TRONG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ KHAI PHÁ DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm sở liệu quan hệ Cơ sở liệu quan hệ khái niệm công bố nhiều cơng trình Ở trình bày tóm tắt lại khái niệm quan hệ, thuộc tính, vài ký hiệu quy ước Định nghĩa 1.1 Định nghĩa 1.3 Cho tập hữu hạn khác rỗng U = {A1, A2 , , An} với n 1 Các phần tử thuộc U gọi thuộc tính Với thuộc tính AiU, i = 1, 2, , n tập tương ứng dom(Ai) với dom(Ai) gọi miền giá trị thuộc tính Ai Gọi D hợp dom(Ai), i = 1,2, ,n Ta ký hiệu quan hệ R với thuộc tính U R(U), với R tập ánh xạ t: UD với t(Ai) dom(Ai), AiU Mỗi ánh xạ gọi quan hệ R 1.2 Phụ thuộc hàm Ta nói PTH f suy dẫn theo tiên đề (suy dẫn logic) từ tập PTH F ký hiệu F╞ f, f  F +, F╞ f  f  F + Định nghĩa 1.4 Gọi F tập PTH tập thuộc tính U f PTH U PTH f nói suy dẫn theo quan hệ từ tập PTH F, ký hiệu F├ f, quan hệ R(U) thoả F thoả f, F├ f  SAT(F)  SAT(f) Định nghĩa 1.5 Phụ thuộc hàm lớp phụ thuộc logic đề xuất có vai trị quan trọng việc thiết kế xử lý sở liệu Trong phần trình bày khái niệm phụ thuộc hàm, bao đóng tập phụ thuộc hàm, loại suy dẫn, bao đóng tập thuộc tính, … 1.2.1 Khái niệm phụ thuộc hàm Cho tập PTH F tập thuộc tính U, ta ký hiệu F* tập PTH f U suy dẫn theo quan hệ từ tập PTH F Ta viết: F * = { f: XY | X,Y  U, F├ f } Cho tập thuộc tính U hữu hạn khác rỗng Một phụ thuộc hàm (PTH) U có dạng f: XY ; X,Y  U Nếu XY PTH U ta nói tập thuộc tính Y phụ thuộc vào tập thuộc tính X, tập thuộc tính X xác định hàm tập thuộc tính Y Cho tập thuộc tính U F tập PTH U Gọi f PTH U f gọi PTH suy dẫn theo quan hệ có khơng q p từ F viết F ├p f, quan hệ R RELp(U) thoả tập F R thoả f Ta viết: F├p f  SATp(F)  SATp(f) Cho quan hệ R(U) PTH f: XY U Ta nói quan hệ R thoả PTH f viết R(f), hai tuỳ ý R giống X chúng giống Y, R(XY)  (u,v  R): (u.X = v.X)  (u.Y = v.Y) Cho tập PTH F tập thuộc tính U Ta nói quan hệ R(U) thoả tập PTH F, viết R(F), R thoả PTH F, R(F)  ( f  F): R(f) Nếu quan hệ R thỏa PTH f ta nói PTH f quan hệ R 1.2.2 Lược đồ quan hệ Cặp a = (U, F) gọi lược đồ quan hệ (LĐQH) với U tập hữu hạn thuộc tính, F tập PTH tập thuộc tính U 1.2.3 Bao đóng tập phụ thuộc hàm Định nghĩa 1.2 Cho tập PTH F tập thuộc tính U Tập nhỏ PTH U chứa F gọi bao đóng F, ký hiệu F+ thoả tính chất F1-F3 hệ tiên đề Armstrong Ao trình bày sau: X, Y, Z  U: F1 Tính phản xạ: Nếu X  Y XY  F + F2 Tính gia tăng: Nếu XY  F + XZYZ  F + F3 Tính bắc cầu: Nếu XY  F + YZ  F + XZ  F + Ta khẳng định suy dẫn theo quan hệ suy dẫn theo tiên đề một, nghĩa F = F * Nói cách khác, ta có, F╞ f  F├ f Định nghĩa 1.6 + Gọi F tập PTH tập thuộc tính U, F' tập PTH f U suy dẫn theo quan hệ có khơng q hai từ tập PTH F Khi đó, F' = { f: XY | X,Y  U, F├2 f } Để chứng tỏ loại suy dẫn theo tiên đề, suy dẫn theo quan hệ suy dẫn theo quan hệ có khơng q P hồn toàn tương đương, ta xem định lý sau, 1.2.4 Định lý tương đương Định lý 1.1 F + = F * = F' 1.2.5 Bao đóng tập thuộc tính Cho tập PTH F tập thuộc tính U tập thuộc tính X U Bao đóng tập thuộc tính X, ký hiệu X+ tập thuộc tính X+ = {A U | X  AF+} Bao đóng có số tính chất sau, Cho LĐQH a = (U,F) Khi  X, Y  U ta có (i) Tính phản xạ: X  X + (ii) Tính đồng biến: X  Y X + Y + (iii) Tính lũy đẳng: (X +)+ = X + 1.2.6 Bài toán thành viên Bài toán phát biểu: Cho tập thuộc tính U, tập PTH F U PTH f: XY U Hỏi rằng, f  F+ hay không? Định lý thành viên phát biểu sau, phụ thuộc hàm XY  F+ Y  X+ ii AU \ P: PA = U 1.3 Khóa phản khóa LĐQH 1.4 Một số khái niệm khai phá liệu Khi làm việc với lược đồ quan hệ khóa phản khóa khái niệm quan trọng Sau phần trình bày lại số khái niệm tính chất có liên quan đến khóa phản khóa lược đồ quan hệ 1.3.1 Khố lược đồ quan hệ Định nghĩa 1.7 Cho LĐQH a = (U, F) Tập thuộc tính K  U gọi khoá LĐQH a nếu, (i) K + = U (ii) A K: (K \ A)+ U Nếu K thoả điều kiện (i) K gọi siêu khố Định nghĩa 1.8 Tập thuộc tính Y U gọi phụ thuộc đầy đủ vào tập thuộc tính X U, Khai phá liệu lĩnh vực quan tâm Trong phần trình bày số khái niệm sở liệu giao dịch, khái niệm tập phổ biến, luật kết hợp số khái niệm khác có liên quan đến khai phá liệu Cũng phần này, kết nối Galois số tính chất đề cập 1.4.1 Một số khái niệm ký hiệu X  Y nếu, (i) X Y, (ii) (A X): X \ A ↛ Y Khi nghiên cứu khóa LĐQH, nhiều cơng trình tác giả phát biểu số tính chất khóa sau: Cho LĐQH a = (U, F) Khi đó: (i) K  U khoá U phụ thuộc đầy đủ vào K (ii) Hai khoá khác LĐQH khơng bao (iii) Mọi LĐQH có khố Ngồi ra, tính chất đặc trưng thuộc tính khóa LĐQH phát biểu sau, Cho K khóa LĐQH a = (U,F) Khi đó, X  K: X+ K=X Bên cạnh đó, cơng thức tính giao khóa LĐQH trình bày sau, Cho LĐQH a = (U,F) với n thuộc tính U m PTH F Gọi UI giao khóa a Khi đó, giao khóa tính qua cơng thức sau , U I  U \  (R \ L) L  R F Từ cơng thức tính giao khóa, tính chất khóa LĐQH phát biểu sau, Cho LĐQH a = (U,F) Gọi UI giao khóa a Khi a có khóa UI + = U 1.3.2 Phản khóa lược đồ quan hệ Định nghĩa 1.9 Cho LĐQH a = (U, F) Tập P  U gọi phản khóa a nếu: i P+  U, Cơ sở liệu giao dịch định nghĩa cặp α = (T, I) với I = {x1, x2, …, xn} tập mục liệu T = {t1, t2, …, tm} tập giao tác α Mỗi giao tác t  T biểu diễn dạng vector nhị phân, giá trị vị trí i cho biết mục xi xuất t, cho biết mục xi không xuất t Cho tập mục X  I Ta gọi độ phổ biến X α số giao tác α chứa X, ký hiệu (X) Tập X  I gọi tập phổ biến (X) ≥ minsup với minsup ngưỡng phổ biến người dùng quy định Từ khái niệm trên, ta nhận xét sau, Mọi tập tập phổ biến tập phổ biến Ngược lại, tập cha tập khơng phổ biến khơng phổ biến 1.4.2 Luật kết hợp kết nối Galois Định nghĩa 1.10 Luật kết hợp (Association Rule) sở liệu giao dịch α = (T, I) biểu thức có dạng X1 → X2, với X1, X2  I X1 ∩ X2 =  + Độ phổ biến luật kết hợp, X1 → X2, ( X1  X2)= (X1X2) + Độ tin cậy luật kết hợp, X1 → X2, tỷ số  (X1X2) / (X1) + Ta gọi X1 → X2 luật phổ biến (X1X2) ≥ minsup, luật tin cậy  (X1X2) / (X1) ≥ minconf với minsup, minconf ngưỡng phổ biến ngưỡng tin cậy người dùng quy định Định nghĩa 1.11 Cho sở liệu giao dịch α = (T, I) Gọi Subset(X) tập chứa tất tập X Ta định nghĩa ánh xạ sau, t: Subset(I) → Subset(T), t(X) = {u  T | u.X =1} Nói cách khác t(X) tập tất giao tác T chứa mục liệu X i: Subset(T) → Subset(I), i(Y) = {x  I | t  Y, t.x =1} Nói cách khác i(Y) tập tất mục liệu thuộc I có mặt tất giao tác t thuộc Y Cặp ánh xạ (t, i) gọi kết nối Galois Kết nối Galois thỏa tính chất sau, Y, Y1, Y2  T X, X1, X2  I,: (i) Y1  Y2  i(Y2)  i(Y1) 2.1.3 Điểm bất động (tập đóng) ánh xạ đóng (ii) X1  X2  t(X2)  t(X1) (iii) Y  t(i(Y)), X  i(t(X)) (iv) i(Y1  Y2) = i(Y1)  i(Y2) Cho AXĐ f tập U hữu hạn Tập X  U gọi điểm bất động (hay tập đóng) AXĐ f f(X) = X (v) t(X1  X2) = t(X1)  t(X2) Ta ký hiệu Fix(f) tập toàn điểm bất động AXĐ f Vì f(U) = U nên Fix(f) ln chứa U Mặt khác, dựa vào tính lũy đẳng AXĐ ta mơ tả Fix(f) sau, Fix(f) = { f(X) | X  U} CHƯƠNG 2: ÁNH XẠ ĐÓNG & LÝ THUYẾT GIÀN GIAO VÀ ỨNG DỤNG 2.1 Ánh xạ đóng Ánh xạ đóng thuộc họ ánh xạ sử dụng để thiết lập mối quan hệ tập tập hữu hạn thỏa tính chất phản xạ, đồng biến lũy đẵng Trong chương luận án trình bày số định nghĩa tính chất ánh xạ đóng, vai trị ánh xạ đóng việc ứng dụng giải toán khai phá liệu lý thuyết sở liệu 2.1.1 Các khái niệm tính chất ánh xạ đóng Định nghĩa 2.1 Cho tập U hữu hạn Ánh xạ f: SubSet(U)  SubSet(U) gọi đóng U với tập X, Y  U thỏa tính chất sau, (i) Tính phản xạ: f(X)  X, (ii) Tính đồng biến: Nếu X  Y f(X)  f(Y), (iii) Tính lũy đẳng: f(f(X)) = f(X) Ngồi ba tính chất trên, ánh xạ đóng (AXĐ) cịn thỏa tính chất sau, Gọi f AXĐ cho trước U Khi đó, với X,Y  U ta thu được, (iv) f(f(X)Y) = f(Xf(Y)) = f(XY) (v) fXY  fXfY (vi) f(XY)  f(X) f(Y) Ngoài khái niệm trên, định nghĩa định lý sau trình bày phép hạn chế AXĐ tập Đây xem tính chất quan trọng AXĐ, cụ thể hạn chế AXĐ tập AXĐ 2.1.2 Phép hạn chế ánh xạ đóng Định nghĩa 2.2 Cho AXĐ f U tập M U Hạn chế ánh xạ f M, ký hiệu fM ánh xạ M xác định sau: X  M, fM(X) = f(X )  M Ngoài ra, nhà nghiên cứu chứng minh với AXĐ f U với tập M U, fM AXĐ M Bên cạnh khái niệm tính chất trình bày AXĐ, nghiên cứu phép tốn AXĐ phép tốn hội phép tốn hợp thành AXĐ đóng vai trị việc giải toán ứng dụng sở liệu Phần sau trình bày định nghĩa mệnh đề, định lý có liên quan đến phép tốn Ngoài kết tác giả khác công bố, luận án phát biểu thêm điều kiện đủ để phép toán hợp thành AXĐ AXĐ, đồng thời điều kiện để họ AXĐ đóng với phép hợp thành 2.2 Các phép tốn ánh xạ đóng Bên cạnh khái niệm tính chất trình bày AXĐ, phép toán hội phép toán hợp thành AXĐ đóng vai trị giải toán ứng dung sở liệu Phần trình bày số khái niệm có liên quan đến phép tốn với số kết nghiên cứu liên quan đến phép toán hợp thành AXĐ 2.2.1 Phép toán hội Định nghĩa 2.3 Cho AXĐ f, g tập U hữu hạn Ta xác định ánh xạ h U sau, h(X) = f(X)  g(X), X  U Ta gọi h hội AXĐ f g ký hiệu h = f*g Các nhà nghiên cứu chứng minh hội hai AXĐ U AXĐ U Nói cách khác, khơng gian AXĐ đóng với phép toán hội 2.2.2 Phép toán hợp thành Định nghĩa 2.4 Cho hai AXĐ f, g tập U hữu hạn Ánh xạ k xác định U sau, k(X) = f(g(X)), X  U k gọi hợp thành hai AXĐ f g, ký hiệu k = f g Tuy nhiên, nhà nghiên cứu chứng minh phép hợp thành AXĐ thỏa tính phản xạ đồng biến khơng thỏa tính lũy đẵng khơng có tính chất giao hốn Định nghĩa 2.5 Cho tập hữu hạn U ánh xạ f, g  Map(U) Ta nói ánh xạ f hẹp ánh xạ g ký hiệu f  g, với X  U ta ln có f(X)  g(X) Với ánh xạ f, g, h  Map(U), quan hệ “hẹp hơn”  thoả tính chất sau: Để tiện trình bày, ta ký hiệu f, g, h ánh xạ tính bao đóng tập thuộc tính theo tập phụ thuộc hàm F, G, H tương ứng Cụ thể ta viết f(X) = XF+, g(X) = XG+, h(X) = XH+ (i) Phản xạ: f  f, (ii) Phản xứng: Nếu f  g g  f f = g, (iii) Bắc cầu: Nếu f  g g  h f  h Mệnh đề 2.1 Hợp thành hai AXĐ không hẹp ánh xạ thành phần, tức là, với AXĐ f g, ta có: fg  f , fg  g Mệnh đề 2.2 Với AXĐ f, g h U, f  g fh  gh, hf  hg Mệnh đề 2.3 Với AXĐ f, g, k h U, f  k g  h fg  kh Mệnh đề 2.4 Với AXĐ f, g  CloseU ba điều kiện sau tương đương: (i) f  g, (ii) fg = g, (iii) gf = g Để phép hợp thành AXĐ AXĐ điều kiện cần đủ thứ phát biểu qua định lý sau, Định lý 2.1 Do f, g ánh xạ đóng U nên tập phụ thuộc hàm H tồn phép hợp thành f.g ánh xạ đóng Lúc này, ta vận dụng định lý 2.1, 2.2 hệ 2.1 phép hợp thành AXĐ trình bày mục 2.2.2 2.3 Cơ sở phản sở ánh xạ đóng Trong phần trình bày số định nghĩa sở phản sở ánh xạ đóng Một số bổ đề, tính chất định lý có liên quan đến kết nghiên cứu phản sở luận án trình bày 2.3.1 Cơ sở ánh xạ đóng Định nghĩa 2.6 Cho AXĐ f U Tập K U gọi sở AXĐ f K thỏa đồng thời hai tính chất sau i Tính tồn thể: fK = U, ii Tính tối tiểu:  X  K: fX  U Nếu K thỏa tính chất (i) K gọi siêu sở AXĐ f Base(f) ký hiệu tập sở AXĐ f Cho hai AXĐ f g Các hợp thành fg gf đồng thời AXĐ chúng giao hoán Một đặc trưng sở AXĐ trình bày sau: Nếu gọi K sở AXĐ f tập U Khi đó: X  K: f(X)  K = X Định lý sau phát biểu điều kiện cần đủ thứ hai để hợp thành AXĐ AXĐ, Định lý 2.2 Hợp thành f.g hai AXĐ f g AXĐ fgf = fg Sau phần trình bày vài kết nghiên cứu phép hợp thành, Hệ 2.1 Từ đặc trưng trên, ta nhận thấy, X = f(X)  K = fK(X), nên X điểm bất động (tập đóng) fK Cho ánh xạ đóng f, g tập U hữu hạn Nếu f  g hay g  f hợp thành f.g g.f ánh xạ đóng Bổ đề 2.1 Việc xác định sở ánh xạ đóng theo đặc trưng trình bày sau: Cho AXĐ f U siêu sở K f Nếu X  K: f(X)  K = X K sở f Định nghĩa 2.7 đóng với phép hợp thành G thứ tự toàn phần phép  “hẹp hơn” 2.2.3 Ứng dụng phép toán hợp thành Cho f AXĐ U Phần tử A U gọi phần tử sở phần tử nguyên thủy AXĐ f A xuất sở f A gọi phần tử phi sở phần tử phi nguyên thủy AXĐ f A khơng có sở f Ta ký hiệu UB tập phần tử sở AXĐ f U; Uo tập phần tử phi sở f UI tập giao sở f Khi đó, U = UB | Uo phân hoạch U Bài toán phát biểu sau: Cho hai tập phụ thuộc hàm F G tập thuộc tính U Có tồn hay khơng tập phụ thuộc hàm H U thỏa tính chất sau: X  U: (X )H+ = ((X )G+)F+ Ngoài ra, nhà nghiên cứu trình bày phát biểu cơng thức tính giao sở ánh xạ đóng sau, Cho AXĐ f tập hữu hạn U Khi đó: U I  U \  ( f ( X ) \ X ) Cho G  Close(U) với Close(U) tập toàn thể AXĐ U hữu hạn Tập G X U 10 Bên cạnh đó, phát biểu điều kiện cần đủ để AXĐ có sở nhà nghiên cứu trình bày sau, Nếu gọi f AXĐ tập hữu hạn U f có sở f(UI) = U, UI giao sở 2.3.2 Phản sở ánh xạ đóng Như trình bày phần trước, khái niệm đối ngẫu với sở AXĐ phản sở AXĐ Khái niệm đối ngẫu theo nghĩa sở tập phần tử nhỏ có ảnh U, cịn phản sở tập lớn chứa phần tử có ảnh khác U Ta sử dụng phản sở thay cho vai trị sở, thuật tốn xác định phản sở từ sở ngược lại có độ phức tạp tuyến tính Các khái niệm tính chất liên quan đến phản sở AXĐ trình bày qua định nghĩa, bổ đề định lý sau đây, Định nghĩa 2.8 Cho AXĐ f U Tập P U gọi phản sở AXĐ f nếu: i fP  U, ii A U \ P: fPA = U Ta ký hiệu AntiBase(f) tập phản sở AXĐ f 2.4 Giàn giao ánh xạ đóng Trong số lĩnh vực sở liệu, khai phá liệu,… giàn giao AXĐ sử dụng cơng cụ tốn học có nhiều đóng góp, ứng dụng hiệu Phần sau trình bày khái niệm, tính chất điểm bất động (hay cịn gọi tập đóng) lý thuyết giàn giao AXĐ với bổ đề, định lý phát biểu tương quan tập đặc trưng giàn giao 2.4.1 Một số khái niệm Định nghĩa 2.9 Gọi G họ tập tập hữu hạn U đóng với phép giao, cụ thể giao họ G cho kết tập G, G  SubSet(U): (H  G   X  G) X H G gọi giàn giao tập hữu hạn U Khi tồn họ S chứa G cho phần tử G biểu diễn qua giao phần tử S Nói cách khác, S tập nhỏ G thỏa tính chất: G = {X1    Xk | k X1,…, Xk S} S gọi tập sinh giàn giao G ký hiệu Gen(G) Để biểu diễn tập sinh theo nhiều ngữ nghĩa khác nhau, tác giả tập sau giàn giao G cho trước, 11 (i) Gen(G) (ii) { VG | VU, (X,YG, X V, Y V)  XYV } (iii) { VG | VU,(V=X1…Xk; X1,…,XkG, k1) (i,1ik:V = Xi )} (iv) { V  G | V   X } X G V X Định nghĩa 2.10 Cho (M, ) tập hữu hạn có thứ tự phận Phần tử A M gọi cực đại từ A  B BM, ta ln có A=B Ta ký hiệu MAX(M) tập phần tử cực đại M Với họ tập tập hữu hạn, xét thứ tự phận  Phần tử cực đại thuộc tập cơng trình nghiên cứu tác giả trình bày sau: Cho (M, ) tập hữu hạn có thứ tự phận P  Q  M Khi đó, X  MAX(Q) X  P X  MAX(P) Bổ đề 2.2 Cho giàn giao G tập hữu hạn U, ta có, MAX(Gen(G)) = MAX(G\{U}) Khẳng định tập đóng (tập điểm bất động) AXĐ tạo thành giàn giao trình bày sau, Cho AXĐ f U hữu hạn Khi đó, Fixf giàn giao với phần tử cực đại U Khi làm việc với giàn giao tác giả đưa khái niệm đối nguyên tử tập Coatom giàn giao Các khái niệm trình bày qua định nghĩa sau, Định nghĩa 2.11 Cho G giàn giao tập U Ta ký hiệu Coatom(G) = MAX(G \ {U}) gọi phần tử Coatom(G) đối nguyên tử giàn giao G Định lý sau trình bày đặc trưng tập đối nguyên tử (coatom) giàn giao AXĐ, Định lý 2.3 Với giàn giao G tập hữu hạn U, ta có CoatomG = MAXGenG 2.4.2 Sự tương quan tập phản sở tập đối ngun tử Tính đóng tập phản sở trình bày qua bổ đề sau đây, Bổ đề 2.3 Với AXĐ f tập hữu hạn U, ta có AntiBasef)  MAX(Fix(f)\{U}) Ngồi tính đóng tập phản sở trên, tương quan tập phản sở tập đối nguyên tử giàn giao qua định lý sau đây, Định lý 2.4 Với AXĐ f tập hữu hạn U, AntiBasef) = Coatom(f) 12 2.5 Ứng dụng giàn giao với toán ẩn tập mục nhạy cảm 2.5.1 Đặt vấn đề Bài toán khai thác tri thức nhằm phát luật phổ biến tập mục phổ biến Một số tập mục khơng muốn hiển thị lý gọi tập mục nhạy cảm Giải pháp thường lựa chọn cơng bố đầy đủ tập mục tìm cách sửa tần suất xuất tập mục nhạy cảm xuống ngưỡng phổ biến  Khi đó, tập mục nhạy cảm trở thành tập mục khơng phổ biến chúng khơng thể trở thành thành phần luật Giải pháp gọi ẩn tập mục nhạy cảm Hướng nghiên cứu rõ ràng cần thiết cho trường hợp cần bảo vệ bí mật tính riêng tư số tình 2.5.2 Phát biểu toán Bài toán ẩn tập mục nhạy cảm phát biểu sau: Cho bảng T gồm N giao tác M mục Cho ngưỡng hỗ trợ  danh sách P tập mục phổ biến theo ngưỡng  Cho tập mục nhạy cảm H  P Yêu cầu toán ẩn tập mục nhạy cảm H theo nghĩa: cần vị trí cần sửa liệu bảng T cho (X) <  tập mục phổ biến khác bị ảnh hưởng 2.5.3 Cơ sở lý thuyết Mệnh đề 2.5 Họ tập mục phổ biến P tạo thành giàn giao AXĐ Khi xét tập mục phổ biến X P, ta nhận thấy tập Poset(X)  P giàn giao đầy đủ với tập Gen gồm phần tử hàng thứ hai Ngoài ra, ta có thêm số nhận xét sau, (i) Nếu tập phổ biến X ẩn tập phổ biến Y chứa X ẩn theo (ii) Nếu X  P Update(A,X,T,d), A  X kéo theo Update(A,Y,T,d), Y  X, A  Y tức độ phổ biến tập chứa A X bị giảm d đơn vị (iii) Các tập mục Y mô tả (i) gọi tập mục chịu hiệu ứng phụ cập nhật (xóa) mục A tập mục X Điều cho thấy, cập nhật mục A tập mục X cần ý đến tập mục chứa A X Nếu độ phổ biến chúng lớn ngưỡng  khơng nhiều chúng có nguy bị ẩn theo 2.5.4 Thuật toán ẩn tập mục nhạy cảm Từ định lý 2.3, mệnh đề 2.5 nhận xét trên, thuật toán Itemhide đề xuất để ẩn tập mục nhạy cảm H cho trước 2.6 Giàn giao ứng dụng khai thác tập phổ biến Phần minh họa cho việc vận dụng AXĐ lý thuyết giàn giao vào lĩnh vực khai phá liệu, cụ thề trình bày phương pháp xác định tập phổ biến tối 13 đại với mục đích thu nhỏ số lượng tập phổ biến cần quản lý đảm bảo việc sinh luật kết hợp đầy đủ 2.6.1 Cơ sở lý thuyết Định nghĩa 2.12 Cho sở liệu giao dịch α =(T, I) tập mục X  I Ta nói X tập phổ biến tối đại X tập phổ biến X không tập thực tập phổ biến Ký hiệu MFI họ tập phổ biến tối đại α Ta nhận thấy rằng, với mỗt tập phổ biến, tồn tập phổ biến tối đại chứa 2.6.2 Thuật tốn xác định tập phổ biến tối đại Thuật toán 2.5 Tư tưởng thuật toán Coatom đề xuất với ý tưởng từ sở liệu giao dịch cho trước, trước hết xác định họ tập phổ biến với thuật toán đó, chẳng hạn thuật tốn khai thác song song với thuật tốn SABMA Sau đó, từ họ tập phổ biến thu ta xây dựng đồ thị có hướng H để xác định họ tập phổ biến tối đại CHƯƠNG 3: HỆ SINH ÁNH XẠ ĐÓNG VÀ MỘT SỐ KẾT QUẢ NGHIÊN CỨU 3.1 Hệ sinh ánh xạ đóng Mỗi ánh xạ đóng mô tả thông qua hệ suy dẫn gọi hệ sinh AXĐ Phần sau trình bày khái niệm tập luật sinh, hệ sinh, tập bao tập phần tử, ánh xạ cảm sinh số tính chất quan trọng hệ sinh 3.1.1 Khái niệm hệ sinh ánhxạ đóng Định nghĩa 3.1 Cho tập hữu hạn U, luật sinh f U biểu thức dạng f: L  R; L, R  U Các tập L R gọi tương ứng vế trái vế phải luật sinh f ký hiệu tương ứng LS(f) RS(f) Ta ký hiệu  = (U, F) hệ sinh ánh xạ đóng, U tập hữu hạn, F tập luật sinh U Định nghĩa 3.2 Cho hệ sinh AXĐ  = (U, F) tập X, Z U Ta gọi Z tập bao tập X hệ sinh  Z thỏa, (i) Z  X, (ii) L  R  F, L  Z R  Z Kí hiệu [X] họ tập bao X hệ sinh cho trước 14 3.1.2 Ánhxạ cảm sinh Định nghĩa 3.3 Cho  = (U,F) Ánh xạ f: SubSet(U)  SubSet(U) xác định sau, X  U: f(X) = [X] Nói cách khác, f(X) tập nhỏ U thỏa tính chất sau: (i) f(X)  X, (ii)  L  R  F, L  f(X)  R  f(X) f gọi ánh xạ cảm sinh , X vật, f(X) ảnh f Ta nhận thấy, f(X) tập bao nhỏ X hệ sinh  Khẳng định hệ sinh xác định AXĐ ngược lại AXĐ xác định hệ sinh trình bày qua định lý sau đây, Định lý 3.1 (i) Với hệ sinh  = (U,F), ánh xạ cảm sinh f AXĐ U (ii) Với AXĐ h U, tồn hệ sinh  = (U,F) thỏa tính chất,  X  U: f(X) = h(X) 3.1.3 Thuật toán xác định ảnh tập hệ sinh Thuật toán 3.1 Cho hệ sinh  = (U,F) tập X U Hãy tính f(X) Thuật tốn Image tính f(X) với độ phức tạp thời gian đa thức theo chiều dài liệu vào 3.2 Giản lược tập luật sinh Trong hệ sinh AXĐ, số lượng luật sinh hay số phần tử tham gia vào luật sinh khơng nhiều khơng gian lưu trữ rút gọn hiệu tính tốn đối tượng hệ sinh cải thiện Phần trình bày tiếp cận theo hướng giản lược tập luật sinh cách xây dựng số khái niệm bao gồm khái niệm tập luật sinh tương đương, dạng suy dẫn tập luật sinh dạng giản lược tập luật sinh tập giản lược tự nhiên, tập giản lược không dư với thuật toán tương ứng để giản lược tập luật sinh ban đầu dạng thu gọn 3.2.1 Một số khái niệm sở Để xây dựng khái niệm trình bày trên, trước hết phần trình bày cách xây dựng số khái niệm sở ảnh tập luật sinh, dạng suy dẫn logic (còn gọi suy dẫn theo tiên đề) luật sinh, thuật toán xác định luật sinh có thuộc tập luật sinh hay không qua định nghĩa định lý sau đây, Định nghĩa 3.4 F1 Tính phản xạ: Nếu X  Y X  Y  F* F2 Tính gia tăng: Nếu X  Y  F* XZ  YZ  F* F3 Tính bắc cầu: Nếu X  Y  F* Y  Z  F* X  Z  F* Từ khái niệm tính chất trên, kết nghiên cứu dạng giản lược tập luật sinh số khái niệm sau đề xuất luận án, + Một luật sinh f suy dẫn logic (hay suy dẫn theo tiên đề) từ tập luật sinh F, ký hiệu F╞ f, f  F* Ta viết: F╞ f  f  F* + Cho hai tập luật sinh F G U hữu hạn Ta nói F suy dẫn G, ký hiệu F╞ G, gG: F╞ g Ta nói F tương đương với G, ký hiệu F  G, F╞ G G╞ F Ký hiệu F ≢ G có nghĩa F G khơng tương đương Định nghĩa 3.5 Cho hệ sinh  = (U,F) Ta gọi ảnh ánh xạ cảm sinh f tập X, f(X) ảnh X hệ sinh , ký hiệu X* hay X * (nếu làm việc hệ sinh) Định lý 3.2 Cho hệ sinh AXĐ  = (U,F), ta có, X  Y  F* Y  X* 3.2.2 Tập giản lược tự nhiên Định nghĩa 3.6 Cho hai tập luật sinh F G U G gọi tập giản lược tự nhiên F nếu: (i) G tương đương F, (ii) G có dạng giản lược tự nhiên với ý nghĩa sau: + Hai vế trái phải luật sinh G rời nhau:  f  G: LS(f)  RS(f) =  + Các vế trái luật sinh G khác đôi một:  f, g  G: f  g  LS(f)  LS(g) 3.2.3 Tập giản lược không dư Định nghĩa 3.7 Cho hai tập luật sinh F G tập U hữu hạn G gọi tập giản lược không dư F nếu, (i) G tương đương F, (ii) G có dạng giản lược khơng dư theo nghĩa sau: gG: G \{g} ≢ G Cho tập luật sinh F tập U hữu hạn Ảnh F, ký hiệu F* tập nhỏ luật sinh U chứa F thỏa tính chất hệ tiên đề Armstrong sau:  X, Y, Z  U: Trong quản lý hệ suy dẫn lớn phức tạp địi hỏi phải có nhiều thuật tốn hữu hiệu để tính tốn đối tượng ảnh, sở, phản sở, Một thuật toán tốt 15 16 3.3 Thu gọn hệ sinh ánh xạ đóng theo nghĩa độ phức tạp tính tốn giới hạn hàm tuyến tính đa thức theo chiều dài liệu vào Bên cạnh đó, ta nhận thấy, kích thước hệ suy dẫn nhỏ thuật toán phát huy hiệu Một số hướng nghiên cứu tinh giản hệ suy dẫn thực thông qua phép biến đổi 3.4 Cơ sở phản sở hệ sinh ánh xạ đóng 3.4.1 Cơ sở hệ sinh ánh xạ đóng Định nghĩa 3.9 tương đương, chẳng hạn, phần luận án trình bày dạng giản lược Ta gọi sở hệ sinh sở ánh xạ cảm sinh hệ sinh Với hệ sinh  = (U,F), ta ký hiệu Base() tập sở ánh xạ cảm sinh hệ tập luật sinh sinh ; UB tập phần tử sở hệ sinh , tức tập phần tử có Trong phần luận án trình bày theo cách tiếp cận khác sử dụng sở ; U0 tập phần tử phi sở , tức tập phần tử khơng có kỹ thuật thu gọn hệ suy dẫn Bản chất kỹ thuật loại bỏ khỏi hệ suy dẫn ban đầu số phần tử không quan trọng theo nghĩa chúng không làm ảnh hưởng sở ; UI giao sở  Khi đó, UB | U0 phân hoạch U đến kết tính tốn đối tượng quan tâm ảnh, sở, phản sở, Mặc dù hệ suy dẫn thu qua phép thu gọn không tương đương với hệ suy dẫn ban đầu, điểm đặc biệt ta thu đối tượng cần tìm phép Ngoài phương pháp sử dụng để biểu diễn sở hệ sinh theo phép thu gọn hệ sinh cơng bố cách tiếp cận khác để biểu diễn sở hệ sinh dựa kỹ thuật thu gọn hệ sinh, điểm đặc biệt cách tiếp cận tập thu gọn vế trái tối tiểu tập luật sinh hệ sinh cho trước 3.4.2 Phản sở hệ sinh ánh xạ đóng tốn đơn giản loại bỏ thêm vào số phần tử 3.3.1 Các khái niệm thuật toán thu gọn hệ sinh AXĐ Định nghĩa 3.8 Cho hai hệ sinh  = (U,F),  = (V,G) tập M  U Ta nói hệ sinh  nhận từ hệ sinh  qua phép thu gọn theo tập M, kí hiệu  = \M, sau loại bỏ xuất phần tử M hệ sinh  thu hệ sinh  Sau thực thủ tục G = F\M, nếu: - G chứa luật sinh tầm thường (dạng XY, X  Y) ta loại luật sinh khỏi G, - G chứa luật sinh trùng lặp ta lược bớt luật sinh 3.3.2 Biểu diễn ảnh tập theo phép thu gọn hệ sinh AXĐ Công thức biểu diễn ảnh tập theo phép thu gọn hệ sinh trình bày qua định lý sau, Định lý 3.3 Cho hệ sinh  = (U,F) hai tập không giao X Y U Khi đó: * (XY)  = X (Y) * \X Hệ 3.1 Cho hệ sinh  = (U,F) tập X  U Khi đó: X* = X ()*\X Phần sau trình bày số khái niệm tính chất sở, phản sở hệ Một số định nghĩa, định lý sau trình bày khái niệm phản sở cách biểu diễn phản sở hệ sinh ánh xạ đóng theo phép thu gọn hệ sinh Mặt khác, phần trình bày điều kiện cần đủ bảo tồn tập phản sở thơng qua phép thu gọn hệ sinh Định nghĩa 3.10 Ta gọi phản sở hệ sinh phản sở ánh xạ cảm sinh hệ sinh Với hệ sinh  = (U,F) Ta ký hiệu, AntiBase() tập phản sở hệ sinh ; Fix họ điểm bất động hệ sinh ; UB tập phần tử phản sở  tức phần tử có mặt phản sở hệ sinh ; UI giao phản sở  tức phần tử có mặt phản sở hệ sinh ; Uo tập phần tử phản sở hệ sinh  Ta nhận thấy Uo | UB phân hoạch U Các tính chất liên quan đến tập đóng(tập điểm bất động) thu gọn hệ sinh trình bày qua định lý sau đây, Định lý 3.4 Cho hai hệ sinh AXĐ  = (U, F)  = (V,G) Biết  = \XvớiX, M  U, X  M =  Khi đó: sinh AXĐ phát biểu biểu diễn đối tượng theo kỹ thuật thu gọn hệ sinh Trong phần giới thiệu kết nghiên cứu phương pháp biểu XM  Fix M  Fix XM  Gen M  Gen diễn phản sở hệ sinh theo vế phải cực đại tập luật sinh XM  Coatom M  Coatom XM  AntiBase M  AntiBase Ngoài ra, nhiều cơng trình, tác giả trình bày phương pháp 17 18 3.7.2 Một dạng biểu diễn phản khóa lược đồ quan hệ Định lý 3.8 Mọi phản khóa LĐQH a = (U, F) biểu diễn dạng RM với R vế phải cực đại khơng chứa khóa tập phụ thuộc hàm M phản khóa lược đồ quan hệ b = a\R Mỗi AXĐ mô tả thông qua hệ suy dẫn gọi hệ sinh AXĐ Việc nghiên cứu hệ sinh nói chung, biểu diễn đối tượng hệ sinh nói riêng địi hỏi phải có thuật tốn hiệu thuật tốn giản lược tập luật sinh, với kỹ thuật làm cho việc biểu diễn đối tượng trở nên đơn giản kỹ thuật thu gọn hệ sinh, xây dựng hệ sinh mới, đặc biệt hệ sinh cân bằng,… Từ nhận xét trên, luận án thu số kết nghiên cứu hệ sinh AXĐ sau, KẾT LUẬN + Xây dựng khái niệm, thuật toán giản lược tập luật sinh hệ sinh AXĐ dạng tập giản lược tự nhiên tập giản lược không dư Luận án trình bày cách khái quát số nội dung lược đồ quan hệ lý thuyết sở liệu Từ đó, luận án sử dụng ánh xạ đóng cơng cụ tốn học việc biễu diễn lại đối tượng lĩnh vực Hơn nữa, luận án việc áp dụng lý thuyết ánh xạ đóng lĩnh vực khai phá liệu áp dụng lý thuyết giàn giao ánh xạ đóng để ẩn tập mục nhạy cảm hay xác định quản lý tập phổ biến tối đại trình bày chương Luận án đề cập hệ suy dẫn gọi hệ sinh ánh xạ đóng với kỹ thuật thu gọn hệ sinh, trình bày cách biểu diễn ảnh, sở phản sở hệ suy dẫn đề xuât dạng biểu diễn phản sở hệ sinh theo vế phải tối đại tập luật sinh Ý nghĩa việc giản lược tập luật sinh hệ suy dẫn dạng giản lược tập luật sinh với thuật tốn trình bày luận án Cuối cùng, luận án xây dựng thuật toán với định lý chứng minh tính thuật tốn thu gọn hệ sinh dạng cân Cụ thể, luận án tập trung nghiên cứu, đóng góp số vấn đề qua nội dung sau: Ánh xạ đóng xem cơng cụ tốn học có nhiều ứng dụng giải số toán hệ suy dẫn Luận án thu số kết nghiên cứu phép toán hợp thành AXĐ lý thuyết giàn giao Cụ thể, kết đạt sau: + Phát biểu, chứng minh điều kiện đủ để phép hợp thành AXĐ AXĐ + Phát biểu, chứng minh điều kiện để họ AXĐ đóng với phép hợp thành + Ứng dụng lý thuyết giàn giao AXĐ để giải toán ẩn tập mục nhạy cảm khai thác luật kết hợp khai phá liệu Cụ thể toán này, luận án phát biểu chứng minh họ tập phổ biến tạo thành giàn giao, đồng thời xây dựng thuật toán ItemHide để ẩn tập mục nhạy cảm khai thác luật kết hợp sở liệu giao dịch + Phát biểu bổ đề định lý để biểu diễn phản sở hệ sinh theo vế phải tối đại tập luật sinh + Phát biểu định lý tương quan tập sở tập phản sở hệ sinh AXĐ + Xây dựng thuật tốn chứng minh tính đắn thuật toán thu gọn hệ sinh dạng hệ sinh cân (HSCB) Các kết có ý nghĩa lý thuyết thực tiển Cụ thể là, + Đóng góp cho việc phát triển khái niệm cơng cụ tốn học bao gồm lý thuyết giàn giao, lý thuyết ánh xạ đóng, lý thuyết sở liệu quan hệ hệ suy dẫn + Cung cấp số thuật tốn tiện ích cho thiết kế sở liệu, hệ sinh hệ suy dẫn Cung cấp số dạng thu gọn hệ sinh dạng biểu diễn đối tượng hệ suy dẫn sở, phản sở Các thuật toán cho phép thu gọn không gian lưu trữ luật tăng tốc độ xử lý luật Các nghiên cứu đóng góp luận án chủ yếu sử dụng cơng cụ ánh xạ đóng đặc trưng qua hệ suy dẫn gọi hệ sinh để giải toán biểu diễn đối tượng hệ suy dẫn ứng dụng đặc trưng, tính chất hệ suy dẫn để giải số tốn Bài tốn đặt với cơng cụ ánh xạ đóng việc biểu diễn đối tượng sở, phản sở hệ suy dẫn cịn biểu diễn theo phương pháp khác hay không? Đây hướng cần tiếp tục nghiên cứu Bên cạnh đó, qua số ứng dụng trình bày luận án cho thấy khả sử dụng cơng cụ ánh xạ đóng nhiều lĩnh vực Việc lĩnh vực áp dụng cơng cụ tốn mở thú vị vấn đề cần tiếp tục nghiên cứu, phát triền thời gian tới + Ứng dụng lý thuyết giàn giao để xác định tập phổ biến tối đại nhằm tiết kiệm không gian lưu trữ thời gian trao đổi liệu toán khai thác luật kết hợp 23 24 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ LIÊN QUAN LUẬN ÁN BUI DUC MINH, Closure mappings and the problem of determining maximal [1] frequent itemsets in data mining, Journal Mathematics-Physics, VietNam National University HaNoi,Vol.29, No.2, 2013, 48-54 BÙI ĐỨC MINH, Hệ sinh ánh xạ đóng tốn biểu diễn phản sở, [2] Chun san cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT, Tạp chí Cơng nghệ thông tin & Truyền thông, Tập V-1, Số 10 (30), tháng 12/2013, 34-39 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, CAO TÙNG ANH, [3] NGUYỄN GIA NHƯ, NGUYỄN XUÂN HUY, Biểu diễn sở hệ sinh ánh xạ đóng, Kỷ yếu Hội thảo Quốc gia "Một số vấn đề chọn lọc Công nghệ thông tin", Hưng yên, 19-20/08/2010, NXB KHKT Hà Nội, 2011, 51-58 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, NGUYỄN MINH [4] HIỆP, BÙI DUY TUẤN, NGUYỄN XUÂN HUY, Ánh xạ đóng ứng dụng, Kỷ yếu Hội thảo khoa học Công nghệ Thông tin năm 2010, Trường Đại học Đà lạt, Đà lạt, 03/12/2010, 31-38 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, Hệ sinh cân [5] toán biểu diễn sở hệ sinh ánh xạ đóng, Chun san cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT, Tạp chí Cơng nghệ thông tin & Truyền thông, Tập V-1, Số (25), tháng 6/1011, 15-21 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, CAO TÙNG ANH, NGUYỄN GIA NHƯ, Hệ sinh cân thuật toán cân hệ sinh, Kỷ [6] yếu Hội thảo Khoa học Quốc gia “Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông”, Cần Thơ, 07-08/10/2011, NXB KHKT, 2012, 575-586 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN BÙI ĐỨC MINH NGHIÊN CỨU HỆ SINH ÁNH XẠ ĐÓNG VÀ ỨNG DỤNG TRONG THỂ HIỆN NGỮ NGHĨA DỮ LIỆU Chuyên ngành: BẢO ĐẢM TỐN HỌC CHO MÁY TÍNH VÀ HỆ THỐNG TÍNH TỐN Mã số: 62.46.35.01 TĨM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC NGUYỄN XUÂN HUY, LÊ THỊ MỸ HẠNH, LƯƠNG NGUYỄN HOÀNG HOA, BÙI ĐỨC MINH, NGUYỄN ĐỨC VŨ, Thiết kế sở liệu theo tiếp [7] cận dịch chuyển lược đồ quan hệ, Kỷ yếu Hội thảo Khoa học Quốc gia “Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông”, Đại lãi, 1415/09/2007, NXB KHTN CN, 2008, 499-506 NGUYỄN XUÂN HUY, LÊ QUỐC HẢI, NGUYỄN GIA NHƯ, CAO TÙNG ANH, BÙI ĐỨC MINH, Lý thuyết giàn ứng dụng thuật toán ẩn tập [8] mục nhạy cảm, Kỷ yếu Hội thảo Khoa học Quốc gia “Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông”, Biên hòa, 05-06/08/2009, NXB KHKT, 2010, 161-170 HÀ NỘI - 2014 PHẦN MỞ ĐẦU Cơng trình hồn thành tại: Viện Công nghệ Thông tin - Viện Khoa Đặt vấn đề học Công nghệ Việt nam Trong nghiên cứu mô tả giới thực, với việc phản ánh ngữ nghĩa liệu sở liệu lý thuyết phụ thuộc liệu đóng vai trò quan trọng Phụ thuộc liệu thiết kế quản trị sở liệu hiểu mô tả ràng buộc mà liệu phải thỏa mản toán thực tế yếu tố định đến chất lượng liệu trình xử lý quản trị hệ thống Một số kết nghiên cứu năm gần cho thấy vận dụng khái niệm ánh xạ đóng để tiếp tục nghiên cứu vấn đề thuộc ngữ nghĩa liệu Các cơng trình nghiên cứu lý thuyết giàn giao từ cuối năm 90 đến có nhiều đóng góp lĩnh vực khai phá liệu sở liệu Việc tiếp tục nghiên cứu ứng dụng lý thuyết giàn giao vấn đề đáng quan tâm Mỗi ánh xạ đóng đặc trưng thơng qua hệ suy dẫn gọi hệ sinh Để quản lý hệ suy dẫn lớn, phức tạp cần phải có nhiều thuật tốn hiệu để tính tốn đối tượng Nếu kích thước hệ suy dẫn nhỏ hiệu thuật tốn đạt cao Kỹ thuật thu gọn hệ sinh tiếp cận để giải toán với ý tưởng loại bỏ khỏi hệ sinh ban đầu số phần tử để thu hệ sinh có kích thước nhỏ biểu diễn lại đối tượng hệ sinh ban đầu theo đối tượng hệ sinh Kỹ thuật nhà khoa học từ đầu năm 2000 đến công bố nhiều cơng trình Vấn đề chọn lựa tập phần tử để loại bỏ để đạt hiệu toán cần tiếp tục nghiên cứu Bên cạnh đó, tốn đặt ngồi kỹ thuật thu gọn hệ sinh ta cịn sử dụng phương pháp để thu nhỏ kích thước hệ suy dẫn? Đây tốn cần khảo sát nghiên cứu Người hướng dẫn khoa học PGS TSKH NGUYỄN XUÂN HUY TS HOÀNG QUANG Phản biện 1: ………………………………………… Phản biện 2: ………………………………………… Phản biện 3: ……………………………………… Luận án bảo vệ trước Hội đồng chấm luận án cấp nhà nước họp tại: …………………………………………………………… …………………………………………………………………… vào hồi ngày tháng năm 20… Mục đích luận án Mục đích luận án tìm kiếm, phát triển công cụ phương pháp biểu diễn đối tượng hệ suy dẫn nhằm rút gọn không gian lưu trữ nâng cao hiệu tính tốn Trên sở đó, vận dụng kết thu mặt lý thuyết vào ứng dụng cụ thể số lĩnh vực sở liệu khai phá liệu Phương pháp nghiên cứu Tổng hợp tài liệu kết nghiên cứu cơng bố có liên quan đến đề tài Trao đổi, học hỏi với chuyên gia làm việc lĩnh vực nghiên cứu lĩnh vực có liên quan Có thể tìm hiểu luận án thư viên: …………………………… …………………………………………………………………… Đối sánh kết thu mặt lý thuyết thuật toán với kết công bố nhằm đánh giá ý nghĩa hiệu kết khuôn khổ luận án Vận dụng phương pháp cấu trúc tốn học rời rạc (bao gồm logic hình thức) để chứng minh số kết luận án Bố cục luận án Định nghĩa 1.1 Luận án trình bày 03 chương, phần mở đầu, phần kết luận Chương Một số khái niệm sở liệu quan hệ khai phá liệu Chương đề cập đến số khái niệm chung lý thuyết sở liệu quan hệ, cụ thể khái niệm quan hệ, bộ, thuộc tính, LĐQH, khái niệm phụ thuộc hàm, bao đóng tập phụ thuộc hàm, bao đóng tập thuộc tính, tốn thành viên, khóa phản khóa, … Ngồi ra, chương trình bày số khái niệm sử dụng khai phá liệu khái niệm sở liệu giao tác, tập phổ biến, luật kết hợp, …, kết nối Galois số tính chất Chương Ánh xạ đóng & Lý thuyết giàn giao ứng dụng Chương giới thiệu số khái niệm, tính chất ánh xạ đóng lý thuyết giản giao Kết chương gồm có phát biểu điều kiện đủ để phép hợp thành AXĐ AXĐ điều kiện để họ AXĐ đóng với phép hợp thành Ngoài ra, số kết đạt xây dựng ứng dụng AXĐ, lý thuyết giàn giao toán khai phá liệu lý thuyết sở liệu trình bày Chương Hệ sinh ánh xạ đóng số kết nghiên cứu Trong chương chủ yếu trình bày định nghĩa, tính chất quan trọng hệ sinh AXĐ định lý, bổ đề biểu diễn sở, phản sở hệ sinh AXĐ thông qua kỹ thuật thu gọn hệ sinh Kết chủ yếu chương đề xuất dạng biểu diễn phản sở hệ sinh theo vế phải tối đại tập luật sinh với thuật toán thu gọn hệ sinh hệ sinh đơn giản gọi hệ sinh cân định lý tính thuật tốn Bên cạnh đó, chương trình bày số kết nghiên cứu thu xây dựng dạng giản lược tập luật sinh, tương quan đối tượng hệ sinh AXĐ, … CHƯƠNG 1: MỘT SỐ KHÁI NIỆM CƠ BẢN TRONG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ KHAI PHÁ DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1.1 Khái niệm sở liệu quan hệ Cơ sở liệu quan hệ khái niệm công bố nhiều cơng trình Ở trình bày tóm tắt lại khái niệm quan hệ, thuộc tính, vài ký hiệu quy ước Cho tập hữu hạn khác rỗng U = {A1, A2 , , An} với n 1 Các phần tử thuộc U gọi thuộc tính Với thuộc tính AiU, i = 1, 2, , n tập tương ứng dom(Ai) với dom(Ai) gọi miền giá trị thuộc tính Ai Gọi D hợp dom(Ai), i = 1,2, ,n Ta ký hiệu quan hệ R với thuộc tính U R(U), với R tập ánh xạ t: UD với t(Ai) dom(Ai), AiU Mỗi ánh xạ gọi quan hệ R 1.2 Phụ thuộc hàm Phụ thuộc hàm lớp phụ thuộc logic đề xuất có vai trò quan trọng việc thiết kế xử lý sở liệu Trong phần trình bày khái niệm phụ thuộc hàm, bao đóng tập phụ thuộc hàm, loại suy dẫn, bao đóng tập thuộc tính, … 1.2.1 Khái niệm phụ thuộc hàm Cho tập thuộc tính U hữu hạn khác rỗng Một phụ thuộc hàm (PTH) U có dạng f: XY ; X,Y  U Nếu XY PTH U ta nói tập thuộc tính Y phụ thuộc vào tập thuộc tính X, tập thuộc tính X xác định hàm tập thuộc tính Y Cho quan hệ R(U) PTH f: XY U Ta nói quan hệ R thoả PTH f viết R(f), hai tuỳ ý R giống X chúng giống Y, R(XY)  (u,v  R): (u.X = v.X)  (u.Y = v.Y) Cho tập PTH F tập thuộc tính U Ta nói quan hệ R(U) thoả tập PTH F, viết R(F), R thoả PTH F, R(F)  ( f  F): R(f) Nếu quan hệ R thỏa PTH f ta nói PTH f quan hệ R 1.2.2 Lược đồ quan hệ Cặp a = (U, F) gọi lược đồ quan hệ (LĐQH) với U tập hữu hạn thuộc tính, F tập PTH tập thuộc tính U 1.2.3 Bao đóng tập phụ thuộc hàm Định nghĩa 1.2 Cho tập PTH F tập thuộc tính U Tập nhỏ PTH U chứa F gọi bao đóng F, ký hiệu F+ thoả tính chất F1-F3 hệ tiên đề Armstrong Ao trình bày sau: X, Y, Z  U: F1 Tính phản xạ: Nếu X  Y XY  F + F2 Tính gia tăng: Nếu XY  F + XZYZ  F + F3 Tính bắc cầu: Nếu XY  F + YZ  F + XZ  F + Định nghĩa 1.3 sau, phụ thuộc hàm XY  F+ Y  X+ Ta nói PTH f suy dẫn theo tiên đề (suy dẫn logic) từ tập PTH F ký hiệu F╞ f, f  F +, F╞ f  f  F + Định nghĩa 1.4 1.3 Khóa phản khóa LĐQH Gọi F tập PTH tập thuộc tính U f PTH U PTH f nói suy dẫn theo quan hệ từ tập PTH F, ký hiệu F├ f, quan hệ R(U) thoả F thoả f, F├ f  SAT(F)  SAT(f) Định nghĩa 1.5 Cho tập PTH F tập thuộc tính U, ta ký hiệu F* tập PTH f U suy dẫn theo quan hệ từ tập PTH F Ta viết: F * = { f: XY | X,Y  U, F├ f } Ta khẳng định suy dẫn theo quan hệ suy dẫn theo tiên đề một, nghĩa F = F * Nói cách khác, ta có, F╞ f  F├ f Định nghĩa 1.6 + Cho tập thuộc tính U F tập PTH U Gọi f PTH U f gọi PTH suy dẫn theo quan hệ có không p từ F viết F ├p f, quan hệ R RELp(U) thoả tập F R thoả f Ta viết: F├p f  SATp(F)  SATp(f) Gọi F tập PTH tập thuộc tính U, F' tập PTH f U suy dẫn theo quan hệ có khơng q hai từ tập PTH F Khi đó, F' = { f: XY | X,Y  U, F├2 f } Để chứng tỏ loại suy dẫn theo tiên đề, suy dẫn theo quan hệ suy dẫn theo quan hệ có khơng q P hoàn toàn tương đương, ta xem định lý sau, 1.2.4 Định lý tương đương Định lý 1.1 F + = F * = F' 1.2.5 Bao đóng tập thuộc tính Cho tập PTH F tập thuộc tính U tập thuộc tính X U Bao đóng tập thuộc tính X, ký hiệu X+ tập thuộc tính X+ = {A U | X  AF+} Bao đóng có số tính chất sau, Cho LĐQH a = (U,F) Khi  X, Y  U ta có (i) Tính phản xạ: X  X + (ii) Tính đồng biến: X  Y X + Y + (iii) Tính lũy đẳng: (X +)+ = X + 1.2.6 Bài toán thành viên Bài tốn phát biểu: Cho tập thuộc tính U, tập PTH F U PTH f: XY U Hỏi rằng, f  F+ hay không? Định lý thành viên phát biểu Khi làm việc với lược đồ quan hệ khóa phản khóa khái niệm quan trọng Sau phần trình bày lại số khái niệm tính chất có liên quan đến khóa phản khóa lược đồ quan hệ 1.3.1 Khoá lược đồ quan hệ Định nghĩa 1.7 Cho LĐQH a = (U, F) Tập thuộc tính K  U gọi khoá LĐQH a nếu, (i) K + = U (ii) A K: (K \ A)+ U Nếu K thoả điều kiện (i) K gọi siêu khoá Định nghĩa 1.8 Tập thuộc tính Y U gọi phụ thuộc đầy đủ vào tập thuộc tính X U, ký hiệu X  Y nếu, (i) X Y, (ii) (A X): X \ A ↛ Y Khi nghiên cứu khóa LĐQH, nhiều cơng trình tác giả phát biểu số tính chất khóa sau: Cho LĐQH a = (U, F) Khi đó: (i) K  U khố U phụ thuộc đầy đủ vào K (ii) Hai khố khác LĐQH khơng bao (iii) Mọi LĐQH có khố Ngồi ra, tính chất đặc trưng thuộc tính khóa LĐQH phát biểu sau, Cho K khóa LĐQH a = (U,F) Khi đó, X  K: X+ K=X Bên cạnh đó, cơng thức tính giao khóa LĐQH trình bày sau, Cho LĐQH a = (U,F) với n thuộc tính U m PTH F Gọi UI giao khóa a Khi đó, giao khóa tính qua cơng thức sau , U I  U \  (R \ L) L  R F Từ cơng thức tính giao khóa, tính chất khóa LĐQH phát biểu sau, Cho LĐQH a = (U,F) Gọi UI giao khóa a Khi a có khóa UI + = U 1.3.2 Phản khóa lược đồ quan hệ Định nghĩa 1.9 Cho LĐQH a = (U, F) Tập P  U gọi phản khóa a nếu: i P+  U, ii AU \ P: PA = U (ii) X1  X2  t(X2)  t(X1) 1.4 Một số khái niệm khai phá liệu Khai phá liệu lĩnh vực quan tâm Trong phần trình bày số khái niệm sở liệu giao dịch, khái niệm tập phổ biến, luật kết hợp số khái niệm khác có liên quan đến khai phá liệu Cũng phần này, kết nối Galois số tính chất đề cập 1.4.1 Một số khái niệm Cơ sở liệu giao dịch định nghĩa cặp α = (T, I) với I = {x1, x2, …, xn} tập mục liệu T = {t1, t2, …, tm} tập giao tác α Mỗi giao tác t  T biểu diễn dạng vector nhị phân, giá trị vị trí i cho biết mục xi xuất t, cho biết mục xi không xuất t Cho tập mục X  I Ta gọi độ phổ biến X α số giao tác α chứa X, ký hiệu (X) Tập X  I gọi tập phổ biến (X) ≥ minsup với minsup ngưỡng phổ biến người dùng quy định Từ khái niệm trên, ta nhận xét sau, Mọi tập tập phổ biến tập phổ biến Ngược lại, tập cha tập khơng phổ biến khơng phổ biến 1.4.2 Luật kết hợp kết nối Galois Định nghĩa 1.10 Luật kết hợp (Association Rule) sở liệu giao dịch α = (T, I) biểu thức có dạng X1 → X2, với X1, X2  I X1 ∩ X2 =  + Độ phổ biến luật kết hợp, X1 → X2, ( X1  X2)= (X1X2) + Độ tin cậy luật kết hợp, X1 → X2, tỷ số  (X1X2) / (X1) + Ta gọi X1 → X2 luật phổ biến (X1X2) ≥ minsup, luật tin cậy  (X1X2) / (X1) ≥ minconf với minsup, minconf ngưỡng phổ biến ngưỡng tin cậy người dùng quy định Định nghĩa 1.11 Cho sở liệu giao dịch α = (T, I) Gọi Subset(X) tập chứa tất tập X Ta định nghĩa ánh xạ sau, t: Subset(I) → Subset(T), t(X) = {u  T | u.X =1} Nói cách khác t(X) tập tất giao tác T chứa mục liệu X i: Subset(T) → Subset(I), i(Y) = {x  I | t  Y, t.x =1} Nói cách khác i(Y) tập tất mục liệu thuộc I có mặt tất giao tác t thuộc Y Cặp ánh xạ (t, i) gọi kết nối Galois Kết nối Galois thỏa tính chất sau, Y, Y1, Y2  T X, X1, X2  I,: (iii) Y  t(i(Y)), X  i(t(X)) (iv) i(Y1  Y2) = i(Y1)  i(Y2) (v) t(X1  X2) = t(X1)  t(X2) CHƯƠNG 2: ÁNH XẠ ĐÓNG & LÝ THUYẾT GIÀN GIAO VÀ ỨNG DỤNG 2.1 Ánh xạ đóng Ánh xạ đóng thuộc họ ánh xạ sử dụng để thiết lập mối quan hệ tập tập hữu hạn thỏa tính chất phản xạ, đồng biến lũy đẵng Trong chương luận án trình bày số định nghĩa tính chất ánh xạ đóng, vai trị ánh xạ đóng việc ứng dụng giải toán khai phá liệu lý thuyết sở liệu 2.1.1 Các khái niệm tính chất ánh xạ đóng Định nghĩa 2.1 Cho tập U hữu hạn Ánh xạ f: SubSet(U)  SubSet(U) gọi đóng U với tập X, Y  U thỏa tính chất sau, (i) Tính phản xạ: f(X)  X, (ii) Tính đồng biến: Nếu X  Y f(X)  f(Y), (iii) Tính lũy đẳng: f(f(X)) = f(X) Ngồi ba tính chất trên, ánh xạ đóng (AXĐ) cịn thỏa tính chất sau, Gọi f AXĐ cho trước U Khi đó, với X,Y  U ta thu được, (iv) f(f(X)Y) = f(Xf(Y)) = f(XY) (v) fXY  fXfY (vi) f(XY)  f(X) f(Y) Ngoài khái niệm trên, định nghĩa định lý sau trình bày phép hạn chế AXĐ tập Đây xem tính chất quan trọng AXĐ, cụ thể hạn chế AXĐ tập AXĐ 2.1.2 Phép hạn chế ánh xạ đóng Định nghĩa 2.2 Cho AXĐ f U tập M U Hạn chế ánh xạ f M, ký hiệu fM ánh xạ M xác định sau: X  M, fM(X) = f(X )  M Ngoài ra, nhà nghiên cứu chứng minh với AXĐ f U với tập M U, fM AXĐ M (i) Y1  Y2  i(Y2)  i(Y1) 2.1.3 Điểm bất động (tập đóng) ánh xạ đóng Cho AXĐ f tập U hữu hạn Tập X  U gọi điểm bất động (hay tập đóng) AXĐ f f(X) = X Ta ký hiệu Fix(f) tập toàn điểm bất động AXĐ f Vì f(U) = U nên Fix(f) chứa U Mặt khác, dựa vào tính lũy đẳng AXĐ ta mơ tả Fix(f) sau, Fix(f) = { f(X) | X  U} Bên cạnh khái niệm tính chất trình bày AXĐ, nghiên cứu phép tốn AXĐ phép tốn hội phép tốn hợp thành AXĐ đóng vai trị việc giải toán ứng dụng sở liệu Phần sau trình bày định nghĩa mệnh đề, định lý có liên quan đến phép tốn Ngoài kết tác giả khác công bố, luận án phát biểu thêm điều kiện đủ để phép toán hợp thành AXĐ AXĐ, đồng thời điều kiện để họ AXĐ đóng với phép hợp thành 2.2 Các phép tốn ánh xạ đóng Bên cạnh khái niệm tính chất trình bày AXĐ, phép toán hội phép toán hợp thành AXĐ đóng vai trị giải toán ứng dung sở liệu Phần trình bày số khái niệm có liên quan đến phép tốn với số kết nghiên cứu chúng tơi liên quan đến phép tốn hợp thành AXĐ 2.2.1 Phép toán hội Định nghĩa 2.3 Cho AXĐ f, g tập U hữu hạn Ta xác định ánh xạ h U sau, h(X) = f(X)  g(X), X  U Ta gọi h hội AXĐ f g ký hiệu h = f*g Các nhà nghiên cứu chứng minh hội hai AXĐ U AXĐ U Nói cách khác, khơng gian AXĐ đóng với phép tốn hội 2.2.2 Phép tốn hợp thành Định nghĩa 2.4 Cho hai AXĐ f, g tập U hữu hạn Ánh xạ k xác định U sau, k(X) = f(g(X)), X  U k gọi hợp thành hai AXĐ f g, ký hiệu k = f g Tuy nhiên, nhà nghiên cứu chứng minh phép hợp thành AXĐ thỏa tính phản xạ đồng biến khơng thỏa tính lũy đẵng khơng có tính chất giao hốn Định nghĩa 2.5 Cho tập hữu hạn U ánh xạ f, g  Map(U) Ta nói ánh xạ f hẹp ánh xạ g ký hiệu f  g, với X  U ta ln có f(X)  g(X) Với ánh xạ f, g, h  Map(U), quan hệ “hẹp hơn”  thoả tính chất sau: (i) Phản xạ: f  f, (ii) Phản xứng: Nếu f  g g  f f = g, (iii) Bắc cầu: Nếu f  g g  h f  h Mệnh đề 2.1 Hợp thành hai AXĐ không hẹp ánh xạ thành phần, tức là, với AXĐ f g, ta có: fg  f , fg  g Mệnh đề 2.2 Với AXĐ f, g h U, f  g fh  gh, hf  hg Mệnh đề 2.3 Với AXĐ f, g, k h U, f  k g  h fg  kh Mệnh đề 2.4 Với AXĐ f, g  CloseU ba điều kiện sau tương đương: (i) f  g, (ii) fg = g, (iii) gf = g Để phép hợp thành AXĐ AXĐ điều kiện cần đủ thứ phát biểu qua định lý sau, Định lý 2.1 Cho hai AXĐ f g Các hợp thành fg gf đồng thời AXĐ chúng giao hoán Định lý sau phát biểu điều kiện cần đủ thứ hai để hợp thành AXĐ AXĐ, Định lý 2.2 Hợp thành f.g hai AXĐ f g AXĐ fgf = fg Sau phần trình bày vài kết nghiên cứu phép hợp thành, Hệ 2.1 Cho ánh xạ đóng f, g tập U hữu hạn Nếu f  g hay g  f hợp thành f.g g.f ánh xạ đóng Bổ đề 2.1 Cho G  Close(U) với Close(U) tập toàn thể AXĐ U hữu hạn Tập G đóng với phép hợp thành G thứ tự toàn phần phép  “hẹp hơn” 2.2.3 Ứng dụng phép toán hợp thành Bài toán phát biểu sau: Cho hai tập phụ thuộc hàm F G tập thuộc tính U Có tồn hay khơng tập phụ thuộc hàm H U thỏa tính chất sau: X  U: (X )H+ = ((X )G+)F+ Để tiện trình bày, ta ký hiệu f, g, h ánh xạ tính bao đóng tập thuộc tính theo tập phụ thuộc hàm F, G, H tương ứng Cụ thể ta viết f(X) = XF+, g(X) = XG+, h(X) = XH+ Do f, g ánh xạ đóng U nên tập phụ thuộc hàm H tồn phép hợp thành f.g ánh xạ đóng Lúc này, ta vận dụng định lý 2.1, 2.2 hệ 2.1 phép hợp thành AXĐ trình bày mục 2.2.2 2.3 Cơ sở phản sở ánh xạ đóng Trong phần trình bày số định nghĩa sở phản sở ánh xạ đóng Một số bổ đề, tính chất định lý có liên quan đến kết nghiên cứu phản sở luận án trình bày 2.3.1 Cơ sở ánh xạ đóng Định nghĩa 2.6 Cho AXĐ f U Tập K U gọi sở AXĐ f K thỏa đồng thời hai tính chất sau i Tính tồn thể: fK = U, Bên cạnh đó, phát biểu điều kiện cần đủ để AXĐ có sở nhà nghiên cứu trình bày sau, Nếu gọi f AXĐ tập hữu hạn U f có sở f(UI) = U, UI giao sở 2.3.2 Phản sở ánh xạ đóng Như trình bày phần trước, khái niệm đối ngẫu với sở AXĐ phản sở AXĐ Khái niệm đối ngẫu theo nghĩa sở tập phần tử nhỏ có ảnh U, phản sở tập lớn chứa phần tử có ảnh khác U Ta sử dụng phản sở thay cho vai trò sở, thuật toán xác định phản sở từ sở ngược lại có độ phức tạp tuyến tính Các khái niệm tính chất liên quan đến phản sở AXĐ trình bày qua định nghĩa, bổ đề định lý sau đây, Định nghĩa 2.8 Cho AXĐ f U Tập P U gọi phản sở AXĐ f nếu: i fP  U, ii A U \ P: fPA = U Ta ký hiệu AntiBase(f) tập phản sở AXĐ f ii Tính tối tiểu:  X  K: fX  U Nếu K thỏa tính chất (i) K gọi siêu sở AXĐ f Base(f) ký hiệu tập sở AXĐ f Một đặc trưng sở AXĐ trình bày sau: Nếu gọi K sở AXĐ f tập U Khi đó: X  K: f(X)  K = X Từ đặc trưng trên, ta nhận thấy, X = f(X)  K = fK(X), nên X điểm bất động (tập đóng) fK Việc xác định sở ánh xạ đóng theo đặc trưng trình bày sau: Cho AXĐ f U siêu sở K f Nếu X  K: f(X)  K = X K sở f Định nghĩa 2.7 Cho f AXĐ U Phần tử A U gọi phần tử sở phần tử nguyên thủy AXĐ f A xuất sở f A gọi phần tử phi sở phần tử phi ngun thủy AXĐ f A khơng có sở f Ta ký hiệu UB tập phần tử sở AXĐ f U; Uo tập phần tử phi sở f UI tập giao sở f Khi đó, U = UB | Uo phân hoạch U Ngoài ra, nhà nghiên cứu trình bày phát biểu cơng thức tính giao sở ánh xạ đóng sau, Cho AXĐ f tập hữu hạn U Khi đó: U I  U \  ( f ( X ) \ X ) 2.4 Giàn giao ánh xạ đóng Trong số lĩnh vực sở liệu, khai phá liệu,… giàn giao AXĐ sử dụng cơng cụ tốn học có nhiều đóng góp, ứng dụng hiệu Phần sau trình bày khái niệm, tính chất điểm bất động (hay gọi tập đóng) lý thuyết giàn giao AXĐ với bổ đề, định lý phát biểu tương quan tập đặc trưng giàn giao 2.4.1 Một số khái niệm Định nghĩa 2.9 Gọi G họ tập tập hữu hạn U đóng với phép giao, cụ thể giao họ G cho kết tập G, G  SubSet(U): (H  G   X  G) X H G gọi giàn giao tập hữu hạn U Khi tồn họ S chứa G cho phần tử G biểu diễn qua giao phần tử S Nói cách khác, S tập nhỏ G thỏa tính chất: G = {X1    Xk | k X1,…, Xk S} S gọi tập sinh giàn giao G ký hiệu Gen(G) Để biểu diễn tập sinh theo nhiều ngữ nghĩa khác nhau, tác giả tập sau giàn giao G cho trước, X U 10 11 (i) Gen(G) (ii) { VG | VU, (X,YG, X V, Y V)  XYV } (iii) { VG | VU,(V=X1…Xk; X1,…,XkG, k1) (i,1ik:V = Xi )} (iv) { V  G | V   X } 2.5 Ứng dụng giàn giao với toán ẩn tập mục nhạy cảm 2.5.1 Đặt vấn đề Phần tử cực đại thuộc tập cơng trình nghiên cứu tác giả trình bày sau: Cho (M, ) tập hữu hạn có thứ tự phận P  Q  M Khi đó, Bài tốn khai thác tri thức nhằm phát luật phổ biến tập mục phổ biến Một số tập mục không muốn hiển thị lý gọi tập mục nhạy cảm Giải pháp thường lựa chọn công bố đầy đủ tập mục tìm cách sửa tần suất xuất tập mục nhạy cảm xuống ngưỡng phổ biến  Khi đó, tập mục nhạy cảm trở thành tập mục không phổ biến chúng khơng thể trở thành thành phần luật Giải pháp gọi ẩn tập mục nhạy cảm Hướng nghiên cứu rõ ràng cần thiết cho trường hợp cần bảo vệ bí mật tính riêng tư số tình 2.5.2 Phát biểu toán X  MAX(Q) X  P X  MAX(P) Bổ đề 2.2 Cho giàn giao G tập hữu hạn U, ta có, MAX(Gen(G)) = MAX(G\{U}) Bài tốn ẩn tập mục nhạy cảm phát biểu sau: Cho bảng T gồm N giao tác M mục Cho ngưỡng hỗ trợ  danh sách P tập mục phổ biến theo ngưỡng  Cho tập mục nhạy cảm H  P Khẳng định tập đóng (tập điểm bất động) AXĐ tạo thành giàn giao trình bày sau, Cho AXĐ f U hữu hạn Khi đó, Fixf giàn giao với phần tử cực đại U Yêu cầu toán ẩn tập mục nhạy cảm H theo nghĩa: cần vị trí cần sửa liệu bảng T cho (X) <  tập mục phổ biến khác bị ảnh hưởng 2.5.3 Cơ sở lý thuyết Mệnh đề 2.5 Họ tập mục phổ biến P tạo thành giàn giao AXĐ X G V X Định nghĩa 2.10 Cho (M, ) tập hữu hạn có thứ tự phận Phần tử A M gọi cực đại từ A  B BM, ta ln có A=B Ta ký hiệu MAX(M) tập phần tử cực đại M Với họ tập tập hữu hạn, xét thứ tự phận  Khi làm việc với giàn giao tác giả đưa khái niệm đối nguyên tử tập Coatom giàn giao Các khái niệm trình bày qua định nghĩa sau, Định nghĩa 2.11 Cho G giàn giao tập U Ta ký hiệu Coatom(G) = MAX(G \ {U}) gọi phần tử Coatom(G) đối nguyên tử giàn giao G Định lý sau trình bày đặc trưng tập đối nguyên tử (coatom) giàn giao AXĐ, Định lý 2.3 Với giàn giao G tập hữu hạn U, ta có CoatomG = MAXGenG 2.4.2 Sự tương quan tập phản sở tập đối ngun tử Tính đóng tập phản sở trình bày qua bổ đề sau đây, Bổ đề 2.3 Với AXĐ f tập hữu hạn U, ta có AntiBasef)  MAX(Fix(f)\{U}) Ngồi tính đóng tập phản sở trên, tương quan tập phản sở tập đối nguyên tử giàn giao qua định lý sau đây, Định lý 2.4 Với AXĐ f tập hữu hạn U, AntiBasef) = Coatom(f) 12 Khi xét tập mục phổ biến X P, ta nhận thấy tập Poset(X)  P giàn giao đầy đủ với tập Gen gồm phần tử hàng thứ hai Ngoài ra, ta có thêm số nhận xét sau, (i) Nếu tập phổ biến X ẩn tập phổ biến Y chứa X ẩn theo (ii) Nếu X  P Update(A,X,T,d), A  X kéo theo Update(A,Y,T,d), Y  X, A  Y tức độ phổ biến tập chứa A X bị giảm d đơn vị (iii) Các tập mục Y mô tả (i) gọi tập mục chịu hiệu ứng phụ cập nhật (xóa) mục A tập mục X Điều cho thấy, cập nhật mục A tập mục X cần ý đến tập mục chứa A X Nếu độ phổ biến chúng lớn ngưỡng  khơng nhiều chúng có nguy bị ẩn theo 2.5.4 Thuật toán ẩn tập mục nhạy cảm Từ định lý 2.3, mệnh đề 2.5 nhận xét trên, thuật toán Itemhide đề xuất để ẩn tập mục nhạy cảm H cho trước 2.6 Giàn giao ứng dụng khai thác tập phổ biến Phần minh họa cho việc vận dụng AXĐ lý thuyết giàn giao vào lĩnh vực khai phá liệu, cụ thề trình bày phương pháp xác định tập phổ biến tối 13 đại với mục đích thu nhỏ số lượng tập phổ biến cần quản lý đảm bảo việc sinh luật kết hợp đầy đủ 2.6.1 Cơ sở lý thuyết Định nghĩa 2.12 Cho sở liệu giao dịch α =(T, I) tập mục X  I Ta nói X tập phổ biến tối đại X tập phổ biến X không tập thực tập phổ biến Ký hiệu MFI họ tập phổ biến tối đại α Ta nhận thấy rằng, với mỗt tập phổ biến, tồn tập phổ biến tối đại chứa 2.6.2 Thuật tốn xác định tập phổ biến tối đại Thuật toán 2.5 Tư tưởng thuật toán Coatom đề xuất với ý tưởng từ sở liệu giao dịch cho trước, trước hết xác định họ tập phổ biến với thuật toán đó, chẳng hạn thuật tốn khai thác song song với thuật tốn SABMA Sau đó, từ họ tập phổ biến thu ta xây dựng đồ thị có hướng H để xác định họ tập phổ biến tối đại CHƯƠNG 3: HỆ SINH ÁNH XẠ ĐÓNG VÀ MỘT SỐ KẾT QUẢ NGHIÊN CỨU 3.1 Hệ sinh ánh xạ đóng Mỗi ánh xạ đóng mô tả thông qua hệ suy dẫn gọi hệ sinh AXĐ Phần sau trình bày khái niệm tập luật sinh, hệ sinh, tập bao tập phần tử, ánh xạ cảm sinh số tính chất quan trọng hệ sinh 3.1.1 Khái niệm hệ sinh ánhxạ đóng Định nghĩa 3.1 Cho tập hữu hạn U, luật sinh f U biểu thức dạng f: L  R; L, R  U Các tập L R gọi tương ứng vế trái vế phải luật sinh f ký hiệu tương ứng LS(f) RS(f) Ta ký hiệu  = (U, F) hệ sinh ánh xạ đóng, U tập hữu hạn, F tập luật sinh U Định nghĩa 3.2 Cho hệ sinh AXĐ  = (U, F) tập X, Z U Ta gọi Z tập bao tập X hệ sinh  Z thỏa, (i) Z  X, (ii) L  R  F, L  Z R  Z Kí hiệu [X] họ tập bao X hệ sinh cho trước 14 3.1.2 Ánhxạ cảm sinh Định nghĩa 3.3 Cho  = (U,F) Ánh xạ f: SubSet(U)  SubSet(U) xác định sau, X  U: f(X) = [X] Nói cách khác, f(X) tập nhỏ U thỏa tính chất sau: (i) f(X)  X, (ii)  L  R  F, L  f(X)  R  f(X) f gọi ánh xạ cảm sinh , X vật, f(X) ảnh f Ta nhận thấy, f(X) tập bao nhỏ X hệ sinh  Khẳng định hệ sinh xác định AXĐ ngược lại AXĐ xác định hệ sinh trình bày qua định lý sau đây, Định lý 3.1 (i) Với hệ sinh  = (U,F), ánh xạ cảm sinh f AXĐ U (ii) Với AXĐ h U, tồn hệ sinh  = (U,F) thỏa tính chất,  X  U: f(X) = h(X) 3.1.3 Thuật toán xác định ảnh tập hệ sinh Thuật toán 3.1 Cho hệ sinh  = (U,F) tập X U Hãy tính f(X) Thuật tốn Image tính f(X) với độ phức tạp thời gian đa thức theo chiều dài liệu vào 3.2 Giản lược tập luật sinh Trong hệ sinh AXĐ, số lượng luật sinh hay số phần tử tham gia vào luật sinh khơng nhiều khơng gian lưu trữ rút gọn hiệu tính tốn đối tượng hệ sinh cải thiện Phần trình bày tiếp cận theo hướng giản lược tập luật sinh cách xây dựng số khái niệm bao gồm khái niệm tập luật sinh tương đương, dạng suy dẫn tập luật sinh dạng giản lược tập luật sinh tập giản lược tự nhiên, tập giản lược không dư với thuật toán tương ứng để giản lược tập luật sinh ban đầu dạng thu gọn 3.2.1 Một số khái niệm sở Để xây dựng khái niệm trình bày trên, trước hết phần trình bày cách xây dựng số khái niệm sở ảnh tập luật sinh, dạng suy dẫn logic (còn gọi suy dẫn theo tiên đề) luật sinh, thuật toán xác định luật sinh có thuộc tập luật sinh hay không qua định nghĩa định lý sau đây, Định nghĩa 3.4 Cho tập luật sinh F tập U hữu hạn Ảnh F, ký hiệu F* tập nhỏ luật sinh U chứa F thỏa tính chất hệ tiên đề Armstrong sau:  X, Y, Z  U: 15 F1 Tính phản xạ: Nếu X  Y X  Y  F* F2 Tính gia tăng: Nếu X  Y  F* XZ  YZ  F* F3 Tính bắc cầu: Nếu X  Y  F* Y  Z  F* X  Z  F* Từ khái niệm tính chất trên, kết nghiên cứu dạng giản lược tập luật sinh số khái niệm sau đề xuất luận án, + Một luật sinh f suy dẫn logic (hay suy dẫn theo tiên đề) từ tập luật sinh F, ký hiệu F╞ f, f  F* Ta viết: F╞ f  f  F* + Cho hai tập luật sinh F G U hữu hạn Ta nói F suy dẫn G, ký hiệu F╞ G, gG: F╞ g Ta nói F tương đương với G, ký hiệu F  G, theo nghĩa độ phức tạp tính tốn giới hạn hàm tuyến tính đa thức theo chiều dài liệu vào Bên cạnh đó, ta nhận thấy, kích thước hệ suy dẫn nhỏ thuật toán phát huy hiệu Một số hướng nghiên cứu tinh giản hệ suy dẫn thực thông qua phép biến đổi tương đương, chẳng hạn, phần luận án trình bày dạng giản lược tập luật sinh Trong phần luận án trình bày theo cách tiếp cận khác sử dụng kỹ thuật thu gọn hệ suy dẫn Bản chất kỹ thuật loại bỏ khỏi hệ suy dẫn ban đầu số phần tử không quan trọng theo nghĩa chúng không làm ảnh hưởng đến kết tính tốn đối tượng quan tâm ảnh, sở, phản sở, Mặc dù hệ suy dẫn thu qua phép thu gọn không tương đương với hệ suy dẫn ban đầu, điểm đặc biệt ta thu đối tượng cần tìm phép F╞ G G╞ F Ký hiệu F ≢ G có nghĩa F G khơng tương đương toán đơn giản loại bỏ thêm vào số phần tử Định nghĩa 3.5 3.3.1 Các khái niệm thuật toán thu gọn hệ sinh AXĐ Định nghĩa 3.8 Cho hệ sinh  = (U,F) Ta gọi ảnh ánh xạ cảm sinh f tập X, f(X) ảnh X hệ sinh , ký hiệu X* hay X * (nếu làm việc hệ sinh) Định lý 3.2 Cho hệ sinh AXĐ  = (U,F), ta có, X  Y  F* Y  X* 3.2.2 Tập giản lược tự nhiên Định nghĩa 3.6 Cho hai tập luật sinh F G U G gọi tập giản lược tự nhiên F nếu: (i) G tương đương F, (ii) G có dạng giản lược tự nhiên với ý nghĩa sau: + Hai vế trái phải luật sinh G rời nhau:  f  G: LS(f)  RS(f) =  + Các vế trái luật sinh G khác đôi một:  f, g  G: f  g  LS(f)  LS(g) 3.2.3 Tập giản lược không dư Định nghĩa 3.7 Cho hai tập luật sinh F G tập U hữu hạn G gọi tập giản lược không dư F nếu, (i) G tương đương F, (ii) G có dạng giản lược khơng dư theo nghĩa sau: gG: G \{g} ≢ G 3.3 Thu gọn hệ sinh ánh xạ đóng Cho hai hệ sinh  = (U,F),  = (V,G) tập M  U Ta nói hệ sinh  nhận từ hệ sinh  qua phép thu gọn theo tập M, kí hiệu  = \M, sau loại bỏ xuất phần tử M hệ sinh  thu hệ sinh  Sau thực thủ tục G = F\M, nếu: - G chứa luật sinh tầm thường (dạng XY, X  Y) ta loại luật sinh khỏi G, - G chứa luật sinh trùng lặp ta lược bớt luật sinh 3.3.2 Biểu diễn ảnh tập theo phép thu gọn hệ sinh AXĐ Công thức biểu diễn ảnh tập theo phép thu gọn hệ sinh trình bày qua định lý sau, Định lý 3.3 Cho hệ sinh  = (U,F) hai tập không giao X Y U Khi đó: (XY)* = X (Y)*\X Hệ 3.1 Cho hệ sinh  = (U,F) tập X  U Khi đó: X* = X ()*\X Phần sau trình bày số khái niệm tính chất sở, phản sở hệ sinh AXĐ phát biểu biểu diễn đối tượng theo kỹ thuật thu gọn hệ sinh Trong phần giới thiệu kết nghiên cứu phương pháp biểu diễn phản sở hệ sinh theo vế phải cực đại tập luật sinh Trong quản lý hệ suy dẫn lớn phức tạp đòi hỏi phải có nhiều thuật tốn hữu hiệu để tính tốn đối tượng ảnh, sở, phản sở, Một thuật toán tốt 16 17 3.4 Cơ sở phản sở hệ sinh ánh xạ đóng 3.4.1 Cơ sở hệ sinh ánh xạ đóng Định nghĩa 3.9 Ta gọi sở hệ sinh sở ánh xạ cảm sinh hệ sinh Với hệ sinh  = (U,F), ta ký hiệu Base() tập sở ánh xạ cảm sinh hệ sinh ; UB tập phần tử sở hệ sinh , tức tập phần tử có sở ; U0 tập phần tử phi sở , tức tập phần tử khơng có sở ; UI giao sở  Khi đó, UB | U0 phân hoạch U Ngoài phương pháp sử dụng để biểu diễn sở hệ sinh theo phép thu gọn hệ sinh cơng bố cách tiếp cận khác để biểu diễn sở hệ sinh dựa kỹ thuật thu gọn hệ sinh, điểm đặc biệt cách tiếp cận tập thu gọn vế trái tối tiểu tập luật sinh hệ sinh cho trước 3.4.2 Phản sở hệ sinh ánh xạ đóng Một số định nghĩa, định lý sau trình bày khái niệm phản sở cách biểu diễn phản sở hệ sinh ánh xạ đóng theo phép thu gọn hệ sinh Mặt khác, phần trình bày điều kiện cần đủ bảo tồn tập phản sở thơng qua phép thu gọn hệ sinh Định nghĩa 3.10 Ta gọi phản sở hệ sinh phản sở ánh xạ cảm sinh hệ sinh Với hệ sinh  = (U,F) Ta ký hiệu, AntiBase() tập phản sở hệ sinh ; Fix họ điểm bất động hệ sinh ; UB tập phần tử phản sở  tức phần tử có mặt phản sở hệ sinh ; UI giao phản sở  tức phần tử có mặt phản sở hệ sinh ; Uo tập phần tử khơng có phản sở hệ sinh  Ta nhận thấy Uo | UB phân hoạch U Các tính chất liên quan đến tập đóng(tập điểm bất động) thu gọn hệ sinh trình bày qua định lý sau đây, Định lý 3.4 Cho hai hệ sinh AXĐ  = (U, F)  = (V,G) Biết  = \XvớiX, M  U, X  M =  Khi đó: XM  Fix M  Fix XM  Gen M  Gen XM  Coatom M  Coatom XM  AntiBase M  AntiBase biểu diễn phản sở hệ sinh AXĐ với kỹ thuật thu gọn hệ sinh Cụ thể gọi hệ sinh  = U,F với tập AntiBase ≠  Đặt  =  \ X, X  U Khi đó, ta thu được, AntiBase() = AntiBase() X =  AntiBase() = X  AntiBase() X  UI 3.4.3 Một dạng biểu diễn phản sở hệ sinh AXĐ Trong phần giới thiệu thêm kết dạng biểu diễn phản sở hệ sinh theo vế phải cực đại tập luật sinh Khái niệm vế phải cực đại tập luật sinh với việc phát biểu chứng minh bổ đề, định lý sau minh họa cho dạng biểu diễn phản sở Định nghĩa 3.11 Cho hệ sinh =(U, F) Ta ký hiệu MR(F) tập vế phải cực đại F, MR(F) = MAX {RS(f) | f  F} Bổ đề 3.1 Cho hệ sinh  = (U, F) Nếu R  MR(F) R tập phản sở  R*  U Định lý 3.5 Mọi phản sở hệ sinh AXĐ  = (U, F) biểu diễn dạng RM với R vế phải cực đại không chứa sở tập luật sinh M phản sở hệ sinh  = \R 3.4.4 Sự tương quan đối tượng hệ sinh AXĐ Bên cạnh phương pháp biểu diễn phản sở trình bày, phần sau giới thiệu thêm số kết nghiên cứu mối tương quan đối tượng hệ sinh AXĐ Bổ đề 3.2 Cho hai tập luật sinh F G U Khi F G tương đương X  U: XF* = XG* Định lý sau trình bày mối tương quan tập sở tập phản sở hệ sinh AXĐ, Định lý 3.6 Cho hai hệ sinh  = U,F  = U,G Khi đó, Base=Base  AntiBase=AntiBase Bổ đề 3.3 Cho hai tập luật sinh F G U Nếu F G tương đương hai hệ sinh AXĐ  = U,F  = U,G có tập sở có tập phản sở, Base = Base, AntiBase = AntiBase Ngồi ra, nhiều cơng trình, tác giả trình bày phương pháp 18 19 3.5 Ứng dụng hệ sinh AXĐ giải toán hệ suy dẫn 3.5.1 Các khái niệm quy tắc suy dẫn Định nghĩa 3.12 Hệ suy dẫn cặp  = (U,F) U tập (tập kiện), F tập luật dẫn dạng L  R; L, R  U Một số quy tắc suy dẫn Áp dụng hệ tiên đề Armstrong , L, R, V  U: F1 Tiên đề phản xạ: L  R  L  R, F2 Tiên đề gia tăng: L  R  LV RV, F3 Tiên đề bắc cầu: LR  RV  LV 3.5.2 Một số dạng toán suy dẫn Trong thực tế, sử dụng hệ suy dẫn để giải số toán Vận dụng khái niệm hệ sinh ánh xạ đóng để minh họa cho việc giải dạng toán sau (1) Cho hệ suy dẫn  = (U,F) luật dẫn h: X  Y Hãy cho biết tính luật dẫn h theo nghĩa, luật dẫn h xuất phát từ tập luật dẫn F ban đầu, sau hữu hạn bước vận dụng tiên đề F1-F3 hệ Armstrong ta thu h Vận dụng khái niệm hệ sinh AXĐ, ta mệnh đề h: XY Y  f(X), với f ánh xạ cảm sinh  (2) Cho hệ suy dẫn  = (U,F) hai tập kiện X Y Cho biết xuất phát từ kiện X suy kiện số kiện Y Với dạng toán này, sử dụng tính chất ánh xạ cảm sinh hệ sinh phép giao tập hợp, ta khẳng định từ kiện X suy kiện f(X)  Y số kiện Y 3.6 Hệ sinh cân Phần sau trình bày số khái niệm tính chất hệ sinh đặc biệt gọi hệ sinh cân Kết nghiên cứu luận án làm việc với hệ suy dẫn xây dựng thuật tốn trình bày cách thu gọn hệ sinh dạng hệ sinh cân phát biểu định lý chứng minh tính thuật tốn 3.6.1 Các khái niệm sơ tính chất Định nghĩa 3.13 Hệ sinh α = (U,F) gọi cân α thỏa tính chất sau đây: (B1) Hợp vế trái, vế phải luật sinh F tập U: LS(F) = RS(F) = U (B2) F không chứa luật sinh tầm thường, luật sinh có vế trái chứa vế phải: 20  X,Y  U: X  Y  (X  Y  F) (B3) Hai vế trái phải luật sinh F rời (không giao nhau):  f  F: LS(f)  RS(f) =  (B4) Các vế trái luật sinh F khác đôi một:  f, g  F: LS(f) = LS(g)  f = g Ngoài bốn tính chất trình bày trên, hệ sinh cân cịn thỏa số tính chất sau đây, Tính chất 3.1 Hệ sinh cân thỏa số tính chất sau, (B5) Nếu tập luật sinh F hệ sinh AXĐ α = (U,F) thỏa B2-B4 có luật sinh α khơng thể HSCB (B6) Từ B5 ta suy hệ sinh AXĐ có thuộc tính khơng thể HSCB (B7) Trong HSCB  = (U,F), giao sở UI =  (B8) Nếu hệ sinh α = (U,F) HSCB A  U, ta có α\A HSCB 3.6.2 Thuật toán thu gọn hệ sinh AXĐ dạng cân Thuật tốn BS trình bày mô tả bước để thu gọn hệ sinh AXĐ dạng hệ sinh cân Thuật toán thu gọn hệ sinh ban đầu dạng hệ sinh cân với bước có độ phức tạp khơng O(mn), với m số lượng luật sinh tập luật F, n số lượng phần tử có U Định lý 3.7 Hệ sinh thu sau thực thuật toán BS hệ sinh cân 3.7 Ứng dụng hệ sinh AXĐ sở liệu Các khái niệm lược đồ quan hệ trình bày chương trường hợp riêng hệ sinh AXĐ thông qua số tương ứng trình bày sau Thơng qua tương ứng cho thấy vận dụng cơng cụ hệ sinh AXĐ để nhận lại kết khóa, phản khóa, bao đóng, … CDSL Mặt khác, sử dụng cơng cụ cịn giải số toán khác CSDL Cơ sở liệu Tập thuộc tính Phụ thuộc hàm LĐQH Bao đóng tập thuộc tính Khóa Phản khóa Dạng chuẩn 21 Ánh xạ đóng Tập phần tử Luật sinh Hệ sinh Ánh xạ đóng Cơ sở Phản sở Dạng chuẩn 3.7.1 Bài toán phân rã kết nối quan hệ Định nghĩa 3.14 3.7.2 Một dạng biểu diễn phản khóa lược đồ quan hệ Định lý 3.8 Cho quan hệ r(R) s(S) với R, S tập thuộc tính Đặt T=RS, phép kết quan hệ r s, ký hiệu r*s quan hệ q(T) cho tr  r ts  s thỏa tr = t[R] ts = t[S] Định nghĩa 3.15 Mọi phản khóa LĐQH a = (U, F) biểu diễn dạng RM với R vế phải cực đại không chứa khóa tập phụ thuộc hàm M phản khóa lược đồ quan hệ b = a\R Cho quan hệ s1(S1), s2(S2), …, sm(Sm) quan hệ r(R) cho R = S1S2…Sm Gọi t1, t2, …, tm thỏa t1  s1, t2  s2, …, tm sm Ta nói, t1, t2, …, tm khả kết tồn t  r(R) thỏa ti = t(Si),  i  m Bộ t gọi kết phép kết t1, t2, …, tm, t  s1*s2*…*sm Định nghĩa 3.16 Các quan hệ s1, s2, …, sm gọi kết đầy đủ quan hệ si,  i  m thành phần số khả kết quan hệ Mệnh đề 3.1 Cho q(U) quan hệ tập thuộc tính U, Si tập U,  i  k Ta định nghĩa si = q[Si],  i  k Các quan hệ s1, s2, …, sk kết đầy đủ Bài toán phân rã Cho lược đồ quan hệ a = (U, F) Với phép phân rã m = (M1, M2, …, Mk) U, ta xét phép toán mU sau, Gọi REL(U) tập toàn thể quan hệ U, với quan hệ r REL(U), ta đặt mU(r) = r[M1]*r[M2]*…*r[Mk] Tính chất 3.2 Nếu gọi mU(r) = r[M1]*r[M2]*…*r[Mk] mU ánh xạ đóng, nghĩa mU thỏa tính chất sau: Gọi r, s quan hệ tập thuộc tính U, (i) Tính phản xạ: r  mU(r), (ii) Tính đồng biến: r  s  mU(r)  mU(s), (iii) Tính lũy đẵng: mU(mU(r))= mU(r) Nhận xét 3.1 Khi thực phép toán trên, ta nhận kết phép kết quan hệ quan hệ ban đầu phép kết gọi kết không mát thông tin Cụ thể, gọi r(U) quan hệ trước phân rã mU(r) quan hệ sau kết mU(r)=r(U) Hay nói cách khác, theo ngơn ngữ ánh xạ đóng r(U) điểm bất động (tập đóng) ánh xạ đóng mU 22 KẾT LUẬN Luận án trình bày cách khái quát số nội dung lược đồ quan hệ lý thuyết sở liệu Từ đó, luận án sử dụng ánh xạ đóng cơng cụ tốn học việc biễu diễn lại đối tượng lĩnh vực Hơn nữa, luận án việc áp dụng lý thuyết ánh xạ đóng lĩnh vực khai phá liệu áp dụng lý thuyết giàn giao ánh xạ đóng để ẩn tập mục nhạy cảm hay xác định quản lý tập phổ biến tối đại trình bày chương Luận án đề cập hệ suy dẫn gọi hệ sinh ánh xạ đóng với kỹ thuật thu gọn hệ sinh, trình bày cách biểu diễn ảnh, sở phản sở hệ suy dẫn đề xuât dạng biểu diễn phản sở hệ sinh theo vế phải tối đại tập luật sinh Ý nghĩa việc giản lược tập luật sinh hệ suy dẫn dạng giản lược tập luật sinh với thuật toán trình bày luận án Cuối cùng, luận án xây dựng thuật toán với định lý chứng minh tính thuật tốn thu gọn hệ sinh dạng cân Cụ thể, luận án tập trung nghiên cứu, đóng góp số vấn đề qua nội dung sau: Ánh xạ đóng xem cơng cụ tốn học có nhiều ứng dụng giải số toán hệ suy dẫn Luận án thu số kết nghiên cứu phép toán hợp thành AXĐ lý thuyết giàn giao Cụ thể, kết đạt sau: + Phát biểu, chứng minh điều kiện đủ để phép hợp thành AXĐ AXĐ + Phát biểu, chứng minh điều kiện để họ AXĐ đóng với phép hợp thành + Ứng dụng lý thuyết giàn giao AXĐ để giải toán ẩn tập mục nhạy cảm khai thác luật kết hợp khai phá liệu Cụ thể toán này, luận án phát biểu chứng minh họ tập phổ biến tạo thành giàn giao, đồng thời xây dựng thuật toán ItemHide để ẩn tập mục nhạy cảm khai thác luật kết hợp sở liệu giao dịch + Ứng dụng lý thuyết giàn giao để xác định tập phổ biến tối đại nhằm tiết kiệm không gian lưu trữ thời gian trao đổi liệu toán khai thác luật kết hợp 23 Mỗi AXĐ mô tả thông qua hệ suy dẫn gọi hệ sinh AXĐ Việc nghiên cứu hệ sinh nói chung, biểu diễn đối tượng hệ sinh nói riêng địi hỏi phải có thuật tốn hiệu thuật toán giản lược tập luật sinh, với kỹ thuật làm cho việc biểu diễn đối tượng trở nên đơn giản kỹ thuật thu gọn hệ sinh, xây dựng hệ sinh mới, đặc biệt hệ sinh cân bằng,… Từ nhận xét trên, luận án thu số kết nghiên cứu hệ sinh AXĐ sau, + Xây dựng khái niệm, thuật toán giản lược tập luật sinh hệ sinh AXĐ dạng tập giản lược tự nhiên tập giản lược không dư + Phát biểu bổ đề định lý để biểu diễn phản sở hệ sinh theo vế phải tối đại tập luật sinh + Phát biểu định lý tương quan tập sở tập phản sở hệ sinh AXĐ + Xây dựng thuật tốn chứng minh tính đắn thuật toán thu gọn hệ sinh dạng hệ sinh cân (HSCB) Các kết có ý nghĩa lý thuyết thực tiển Cụ thể là, + Đóng góp cho việc phát triển khái niệm cơng cụ tốn học bao gồm lý thuyết giàn giao, lý thuyết ánh xạ đóng, lý thuyết sở liệu quan hệ hệ suy dẫn + Cung cấp số thuật toán tiện ích cho thiết kế sở liệu, hệ sinh hệ suy dẫn Cung cấp số dạng thu gọn hệ sinh dạng biểu diễn đối tượng hệ suy dẫn sở, phản sở Các thuật toán cho phép thu gọn không gian lưu trữ luật tăng tốc độ xử lý luật Các nghiên cứu đóng góp luận án chủ yếu sử dụng cơng cụ ánh xạ đóng đặc trưng qua hệ suy dẫn gọi hệ sinh để giải toán biểu diễn đối tượng hệ suy dẫn ứng dụng đặc trưng, tính chất hệ suy dẫn để giải số tốn Bài tốn đặt với cơng cụ ánh xạ đóng việc biểu diễn đối tượng sở, phản sở hệ suy dẫn biểu diễn theo phương pháp khác hay không? Đây hướng cần tiếp tục nghiên cứu Bên cạnh đó, qua số ứng dụng trình bày luận án cho thấy khả sử dụng cơng cụ ánh xạ đóng nhiều lĩnh vực Việc lĩnh vực cịn áp dụng cơng cụ tốn mở thú vị vấn đề cần tiếp tục nghiên cứu, phát triền thời gian tới 24 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ LIÊN QUAN LUẬN ÁN BUI DUC MINH, Closure mappings and the problem of determining maximal [1] frequent itemsets in data mining, Journal Mathematics-Physics, VietNam National University HaNoi,Vol.29, No.2, 2013, 48-54 BÙI ĐỨC MINH, Hệ sinh ánh xạ đóng tốn biểu diễn phản sở, [2] Chun san cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT, Tạp chí Cơng nghệ thông tin & Truyền thông, Tập V-1, Số 10 (30), tháng 12/2013, 34-39 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, CAO TÙNG ANH, [3] NGUYỄN GIA NHƯ, NGUYỄN XUÂN HUY, Biểu diễn sở hệ sinh ánh xạ đóng, Kỷ yếu Hội thảo Quốc gia "Một số vấn đề chọn lọc Công nghệ thông tin", Hưng yên, 19-20/08/2010, NXB KHKT Hà Nội, 2011, 51-58 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, NGUYỄN MINH [4] HIỆP, BÙI DUY TUẤN, NGUYỄN XUÂN HUY, Ánh xạ đóng ứng dụng, Kỷ yếu Hội thảo khoa học Công nghệ Thông tin năm 2010, Trường Đại học Đà lạt, Đà lạt, 03/12/2010, 31-38 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, Hệ sinh cân [5] toán biểu diễn sở hệ sinh ánh xạ đóng, Chun san cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT, Tạp chí Cơng nghệ thông tin & Truyền thông, Tập V-1, Số (25), tháng 6/1011, 15-21 BÙI ĐỨC MINH, LƯƠNG NGUYỄN HOÀNG HOA, CAO TÙNG ANH, NGUYỄN GIA NHƯ, Hệ sinh cân thuật toán cân hệ sinh, Kỷ [6] yếu Hội thảo Khoa học Quốc gia “Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông”, Cần Thơ, 07-08/10/2011, NXB KHKT, 2012, 575-586 NGUYỄN XUÂN HUY, LÊ THỊ MỸ HẠNH, LƯƠNG NGUYỄN HOÀNG HOA, BÙI ĐỨC MINH, NGUYỄN ĐỨC VŨ, Thiết kế sở liệu theo tiếp [7] cận dịch chuyển lược đồ quan hệ, Kỷ yếu Hội thảo Khoa học Quốc gia “Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông”, Đại lãi, 1415/09/2007, NXB KHTN CN, 2008, 499-506 NGUYỄN XUÂN HUY, LÊ QUỐC HẢI, NGUYỄN GIA NHƯ, CAO TÙNG ANH, BÙI ĐỨC MINH, Lý thuyết giàn ứng dụng thuật toán ẩn tập [8] mục nhạy cảm, Kỷ yếu Hội thảo Khoa học Quốc gia “Một số vấn đề chọn lọc Công nghệ thông tin Truyền thơng”, Biên hịa, 05-06/08/2009, NXB KHKT, 2010, 161-170 ... phản sở hệ sinh ánh xạ đóng 3.4.1 Cơ sở hệ sinh ánh xạ đóng Định nghĩa 3.9 Ta gọi sở hệ sinh sở ánh xạ cảm sinh hệ sinh Với hệ sinh  = (U,F), ta ký hiệu Base() tập sở ánh xạ cảm sinh hệ sinh ;... CHƯƠNG 3: HỆ SINH ÁNH XẠ ĐÓNG VÀ MỘT SỐ KẾT QUẢ NGHIÊN CỨU 3.1 Hệ sinh ánh xạ đóng Mỗi ánh xạ đóng mơ tả thơng qua hệ suy dẫn gọi hệ sinh AXĐ Phần sau trình bày khái niệm tập luật sinh, hệ sinh, ... CHƯƠNG 3: HỆ SINH ÁNH XẠ ĐÓNG VÀ MỘT SỐ KẾT QUẢ NGHIÊN CỨU 3.1 Hệ sinh ánh xạ đóng Mỗi ánh xạ đóng mơ tả thơng qua hệ suy dẫn gọi hệ sinh AXĐ Phần sau trình bày khái niệm tập luật sinh, hệ sinh,

Ngày đăng: 18/08/2014, 09:24

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan