1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu lý thuyết ứng dụng hệ thống thông tin và những vấn đề liên quan (tt)

20 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG QUÁCH THỊ QUỲNH TRANG NGHIÊN CỨU LÝ THUYẾT, ỨNG DỤNG HỆ THỐNG THÔNG TIN VÀ NHỮNG VẤN ĐỀ LIÊN QUAN CHUYÊN NGÀNH: TRUYỀN DỮ LIỆU VÀ MẠNG MÁY TÍNH MÃ SỐ: 60.48.15 Người hướng dẫn khoa học: PGS.TS NGUYỄN BÁ TƯỜNG LUẬN VĂN THẠC SĨ KỸ THUẬT HÀ NỘI - 2010 PHẦN MỞ ĐẦU Cơ sở khoa học thực tiễn đề tài Hệ thống thông tin gọi tắt hệ tin (system information) lần đề xuất Z Pawlak nhanh chóng xem cơng cụ hữu hiệu xử lý thông tin dạng bảng Hệ tin trường hợp tổng quát hệ định, hệ chuyên gia, hệ khai thác liệu Phương pháp trình bày hệ tin đóng vai trị quan trọng lĩnh vực trí tuệ nhân tạo ngành khoa học khác liên quan đến nhận thức, đặc biệt lĩnh vực máy học, thu nhận tri thức, phân tích định, phát khám phá tri thức từ sở liệu, hệ chuyên gia, hệ hỗ trợ định, lập luận dựa bảng có thuộc tính Hệ tin cơng cụ đắc lực thiếu lý thuyết tập thô, tập mờ Hệ tin trường hợp tổng quát mơ hình quan hệ Tất các tính chất, ứng dụng quan hệ mở rộng áp dụng hệ tin Khi diễn đạt, trình bày thuật toan Quinlan, K_Mean, hệ tin tạo phương pháp diễn đạt rõ ràng, dễ hiểu mạch lạc phương pháp cũ Mục đích, đối tượng phạm vi nghiên cứu đề tài Nghiên cứu Hệ thống thông tin vấn đề liên quan đến hệ thống thông tin gọi tắt Hệ Tin cấp bách cần thiết hệ tin xuất hầu khắp lĩnh vực khoa học máy tính Tuy nhiên luận văn em muốn nêu vấn đề gắn chặt với hệ tin toán gắn với phân loại theo quan điểm giống thuộc tính, quan hệ bất khả phân biệt IND(X) với X tập thuộc tính Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan Chương I LÝ THUYẾT TẬP HỢP 1.1 Giới thiệu tập hợp Trong toán học, tập hợp hiểu tổng quát tụ tập số hữu hạn hay vô hạn đối tượng Các đối tượng gọi phần tử tập hợp Tập hợp khái niệm tảng (fundamental) quan trọng Lý thuyết tập hợp thừa nhận có tập hợp không chứa phần tử nào, gọi tập hợp rỗng, ký hiệu Các tập hợp có chứa phần tử gọi tập hợp khơng rỗng  Tập hợp xác định lời: A tập hợp bốn số nguyên dương B tập hợp màu quốc kỳ Pháp  Có thể xác định tập hợp cách liệt kê phần tử chúng cặp dấu { }, chẳng hạn: C = {4, 2, 1, 3} D = {đỏ, trắng, xanh} 1.2 Quan hệ tương đương - tính chất quan hệ tương đương R 1.1 Phản xạ: xRx với x  U 1.2 Đối xứng: xRy suy yRx với x,y  U 1.3 Bắc cầu: xRy yRz suy xRz với x, y, z  U - Nếu quan hệ R thoả mãn hai tính chất phản xạ đối xứng mà khơng thoả mãn tính chất bắc cầu gọi quan hệ dung sai (Tolerance relation) - Nếu R quan hệ dung sai hai phần tử x, y  U gọi tương tự theo R (R-similar); - Nếu R quan hệ tương đương hai phần tử x, y  U gọi phân biệt R (R-indiscernable) Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan Chương II HỆ TIN VÀ VẤN ĐÊ LIÊN QUAN 2.1 Định nghĩa Hệ thống thông tin Hệ thống thông tin gọi tắt Hệ Tin (Information System) cặp S = (O, U) Trong đó:  O tập hữu hạn khác rỗng đối tượng  U tập hữu hạn khác rỗng thuộc tính cho với thuộc tính a  U, a có miền giá trị Va  o  O vµ a  U, o giá trị thuộc tính a f(o, a) 2.2 Sự dư thừa thông tin Một hệ định (Bảng định) biểu diễn tất tri thực mơ hình Bảng có kích thước lớn cách khơng cần thiết bảng tồn hai khả dư thừa thông tin sau:  Nhiều đối tượng giống nhau, hay phân biệt thể lặp lại nhiều lần  Một số thuộc tính dư thừa, nghĩa thuộc tính điều kiện ta cụ thể bỏ thuộc tính thừa khơng làm thay đổi nhóm phân loại theo thuộc tính định Ví dụ: Trong bảng hệ thống thơng tin với ba thuộc tính điều kiện {A, B, C} thuộc tính định {D} Bảng 2.1: Hệ định dư thừa thông tin Đối tượng A B C D 0 0 0 0 0 0 0 Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 0 0 10 0 11 0 Nếu xét ba điều kiện {A, B, C} bỏ thuộc tính C mà phân loại đối tượng theo thuộc tính AB ta nhóm phân loại theo thuộc tính AB 2.3 Quan hệ bất khả phân biệt ( quan hệ nhau) hệ tin Cho hệ thông tin S = (O, U) với tập thuộc tính P  R có quan hệ tương đương ký hiệu INDS(P) INDS(P) = {(x, y)  U2,  A  P, A(x) = A(y)} INDS(P) gọi quan hệ bất khả phân biệt theo P ( Ký hiệu S quan hệ bất khả phân biệt thường loại bỏ ta xác định khảo sát hệ thông tin nào, ta ký hiệu IND(P)) Nếu (x, y)  INDS(P) , đối tượng x y phân biệt qua tập thuộc tính P Các lớp tương đương quan hệ bất khả phân biệt theo P ký hiệu [x]P Quan hệ bất khả phân biệt theo P phân hoạch tập đối tượng O thành lớp tương đương mà ta ký hiệu O/ IND(P) ( O/P) Ví dụ: Xét hệ tin sinh viên O = { 1, 2, 3, 4, 5, 6, 7, 8}, U = { Hoten, NS, Que} Bảng 2.2 : Ví dụ quan hệ bất khả phân biệt Hoten NS QUE Anh 82 Hà Nội Bình 82 Hà Nội Linh 82 Nghệ An Ngọc 83 Nghệ An Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 5 Hùng 83 Thái Nguyên Trường 84 Thái Nguyên Trang 84 Hà Tĩnh Hồn 84 Hà Tĩnh Khi đó: IND(NS) & IND(NS) & IND(NS)1& IND(NS) & IND(NS) Rõ ràng quan hệ IND(X) quan hệ tương đương Khi O/IND(X) phân hoạch tương đương O/IND(X) = { p1, p2, …, pk} mà pi nhóm gồm đối tượng giống tập X Xét ví dụ tập sinh viên O/IND(NS) = {p1, p2, p 3}= {{ 1, 2, 3}, {4, 5}, {6, 7, 8} O/IND({NS,QUE}) = { p1, p2, p3, p4, p5, p6}={{1, 2}, {3}, {4}, {5}, {6}, {7, 8}} Tương tự O/IND(Hoten) = O/IND(Hote, NS, Que) = O/IND(U) = {{1}, {2}, {3}, {4}, {5}, {6}, {7}, {8} }, phần tử nhóm 2.4 Sự phụ thuộc hàm Giả sử D C tập U Vùng dương phân hoạch O/IND(D) tập thuộc tính C gọi vùng dương C định nghĩa là: C ( X ) POSC ( D )  X O / IND ( D ) Đây tập đối tượng U mà cách sử dụng tập thuộc tính C ta phân loại chúng cách chắn vào lớp phân hoạch O theo tập thuộc tính D Ta nói D phụ thuộc vào C với mức k (  k 1) biểu thị C k D nếu: k   (C , D)  Vì POSC ( D)  | POSC ( D ) | |O|  C ( X ) , suy  (C , D)  X O / IND ( D ) | C(X ) | |O| X O / IND ( D )  Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan Nếu k = ta nói D phụ thuộc hồn tồn vào C, D < ta nói D phụ thuộc phần vào C Hệ số k diễn tả tỷ lệ thành phần tập tổng thể, với phân loại thành khối phân hoạch U/D, thuộc tính sử dụng C gọi mức phụ thuộc Dễ thấy D phụ thuộc hoàn toàn vào C IND(C)  IND(D), nghĩa phân hoạch sinh C tốt phân hoạch sinh bới D Ví dụ: Xét hệ thơng tin bảng sau: U Bảng 2.3: Một hệ thông tin đơn giản a0 a1 a2 a3 a4 x0 A 34 Vàng x1 A 23 Trắng x2 B 33 Xanh x3 B 11 Vàng x4 B 33 Trắng x5 B 11 Vàng Tập thuộc tính điều kiện: D = {a0, a2} Tập thuộc tính định: C = {a1} O/IND(D) = {{x0, x3}, {x1}, {x2}, {x4}, {x5}} O/IND(C) = {{x0, x1}, {x2, x3, x4, x5}} Ta có POSC(D) = {x1}{x2}{x3}{x4}{x5} = {x1, x2, x3, x4, x5} Vậy độ phụ thuộc k tính sau: k x1 , x , x , x , x x , x1 , x , x , x , x  2.5 Hệ định Hệ định hay hệ chuyên gia hệ tin có dạng S = (O, U) với U=CD, C ( condition) gọi tập thuộc tính điều kiện, D = {d1, d2, , dk}(decision) tập thuộc tính định C  D =  Đôi ta viết hệ định S = ( O, C  D) Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan Ví dụ: Trong ví dụ ta xét hệ tin học sinh thi vào Đại học Quốc gia có thuộc tính định ( KQ ) có hai giá trị (trượt) 1(đậu) Các thuộc tính điều kiện như: Mơn 1,Mơn 2, Mơn 3, Điểm ưu tiên (ĐƯT), Khu vực (KV): Bảng 2.4: Hệ tin HS thi vào ĐHQGia HỌC SINH _ THI ĐẠI HỌC SBD Môn Môn Môn ĐƯT KV KQ AH01 7.25 5.0 6.5 1 AH02 7.0 5.5 8.0 AH03 1.75 4.0 3.5 2NT AH04 1.55 5.0 4.0 1 AH05 1.5 5.0 6.0 1.5 2NT Một lớp tốn liên quan đến hệ định tìm luật hệ định: từ tập thuộc tính điều kiện làm để có giá trị mong muốn tập định Ví dụ nhìn vào bảng ta thấy có số luật sau: Rule Nếu (Môn = 7.25) & (Môn = 5.0) & (Môn = 6.5) & ( ĐƯT = 1) & ( KV=1) & ( KQ = 1) đậu vào trường Đại học Quốc gia Rule Nếu (Môn = 7.0) & (Môn = 5.5) & (Môn = 8.0) & ( ĐƯT = 0) & ( KV=2) &(KQ = 1) đậu vào trường Đại học Quốc gia Rule Nếu (Môn = 1.75) & (Môn = 4.0) & (Môn = 3.5) & ( ĐƯT = 0) & ( KV=2NT ) &(KQ = 0) khơng đậu vào trường Đại học Quốc gia Rule Nếu (Môn = 1.55) & (Môn = 5.0) & (Môn = 4.0) & ( ĐƯT = 1) & ( KV=1) &(KQ = 0) khơng đậu vào trường Đại học Quốc gia Rule Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan Nếu (Môn = 1.5) & (Môn = 5.0) & (Môn = 6.0) & ( ĐƯT = 1.5) & ( KV=2NT) &(KQ = 0) khơng đậu vào trường Đại học Quốc gia 2.6 Hệ khai thác liệu ( data mining system) Hệ khai thác liệu hệ tin S = ( O, U, V, f) Trong tập O gọi tập hóa đơn Tập U = { i1, i2, , in} gọi tập mặt hàng Tập V={0,1} Ví dụ: Giá trị f(oj, ik) =1 cho ta biết hóa đơn o j chứa mặt hàng ik f(oj, ik) = có nghĩa hóa đơn oj khơng chứa mặt hàng ik Bảng 2.5: Ví dụ hệ khai thác liệu i1 i2 i3 i4 i5 i6 i7 o1 1 1 1 o2 1 0 o3 1 0 o4 0 0 o5 0 0 0 2.7 Độ phổ biến Độ phổ biến hay gọi độ thường xuyên tập hàng s tập hóa đơn Độ phổ biến tập mặt hàng s, ký hiệu sp(s) tỷ số số lần xuất hóa đơn tập s số tất hóa đơn Hay gọi m số hóa đơn ta có Sp(s) = (số lần xuất s)/m Ví dụ: Xét lại ví dụ bảng Ta có sp({i1}) = 5/5 = 1; sp({i2,i3}) = 2/5 ; sp({i2,i3,i4}) = 1/5; sp({i7}) = 1/5 Vậy với tập hàng s  I  sp(s)  số minsup  (0,1] chia họ tập I thành hai phần Một phần gồm tập s mà sp(s) < minsup phần gồm tập s mà sp(s) mà sp(s)  minsup Trong khai thác liệu tập {s Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan  I : sp(s)  minsup} gọi tập phổ biến với ngưỡng minsup Gọi FS họ tập s mà sp(s)  minsup Một toán quan trọng khai thác liệu tìm thuật tốn có độ phức tạp bé để tính FS 2.8 Luật kết hợp Cho hai tập hàng X, Y  I Luật kết hợp X Y ký hiệu X  Y luật khả xuất Y X xuất Giả sử lấy X = {i1, i2} Y = X khả xuất Y X xuất 100% luật X  Y có độ tin cậy 100% Như luật kết hợp có độ tin cậy CF(X  Y) khai thác liệu CF(X  Y) = sp(X  Y)/sp(X) Vậy độ tin cậy luật X  Y, ký hiệu CF(X  Y) đại lượng sp(X  Y)/sp(X), tức CF(X  Y) = sp(X  Y)/sp(X) Xét liệu ví dụ ta có CF({i1,i2}  {i3,i4,i5}) = sp({i1,i2,i3,i4,i5}) / sp({i1,i2}) = 1/3 CF({i1}  {i2}) = sp({i1,i2}) / sp({i1}) = (3/5)/(5/5) = 3/5 2.9 Rút gọn hệ tin Cho hệ tin S = ( O, U) Khi ta có PART(U) = {E1, E2, , Ek} Tập thuộc tính reduct  U gọi rút gọn U( đơi ta cịn gọi rút gọn hệ tin S) reduct tập tối thiểu mà PART(reduct) = PART(U) Nói cách khác reduct  U gọi rút gọn U : (1) PART(U) = PART(reduct) (2) reduct tối thiểu Thí dụ: Xét hệ tin S = (O, U); với O = R = {t1, t2, t3, t4, t5, t6, t7} quan hệ U={A, B, C, D, E, H, I, J, L, M, N} hàm thông tin cho bảng sau : Bảng 2.6: Ví dụ hàm thông tin R A B C D E H I J L M N Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 10 t1 3 2 t2 0 0 3 3 t3 1 2 1 t4 4 5 5 5 5 t5 3 7 t6 6 8 t7 2 4 Khi ta có reduct hệ tin : Reduct1 = B ; reduct2 = C; reduct3 = H ; reduct4 = I; reduct5 = J ; reduct6 = L; Reduct7 = M ; reduct2 = N; reduct8 = AD ; reduct9 = AE ; reduct10 = DE a Thuật toán tìm rút gọn S = ( O,U ) dựa vào ma trận E Input : S = ( O, U) dạng bảng Output : k - reduct S Nội dung thuật tốn: Bước 1: Tính nửa E Bước 2: Lập họ cực đại M E M gồm phần tử E ( không xét đường chéo chính) khơng chứa phần tử khác Tức M = {eij mà khơng có ekl chứa eij} Bước 3: Đặt k = U Bước 4: Lặp for each A in U k- A không chứa phần tử then k:= k-A; { A gọi thuộc tính thừa} { kết thúc vòng lặp ta reduct S} b Thuật tốn tìm hết Reduct S = ( O, U) dựa vào ma trận D Input S = ( O, U) Output k1, k2, …, kl reduct S Nội dung thuật toán 2.2 : Bước 1: Tính nửa D Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan M 11 Bước 2: Coi thuộc tính U biến logic đặt log = ٨(٧ dij ).{ đọc hội tuyển dij} Bước 3: Tối giản log đưa log dạng tuyển hội log = k1  k2 …  kl Khi ki reduct c Thuật tốn tìm rút gọn hệ tin S = ( O, U) - Trường hợp S hệ tin dạng quan hệ, đối tượng đơi khác U, thuật tốn tìm rút gọn, tìm tất rút gọn tiến hành thuật tốn tìm khóa dựa vào ma trận nhau, ma trận khác xét quan hệ r - Trường hợp S hệ tin dạng khơng phải quan hệ ; tức có đối tượng giống tập thuộc tính Khi thực hai bước : Bước 1: Trong nhóm đối tượng giống U chọn đại diện Bước 2: Gọi r tập đại diện thực phần a thuật tốn 2.3 2.10 Quan hệ tập thuộc tính U Mỗi tập r tích Descartes (Decac) miền giá trị V(Ai) với i = 1, 2, 3, , n gọi quan hệ U Về sau ta thường ký hiệu r R quan hệ U Vậy R quan hệ tập thuộc tính U nếu: R  V(A1)  V(A2)   V(An) Từ định nghĩa ta thấy tích Decac V(A1)  V(A2)  V(An) có nhiều tập nên U có nhiều quan hệ khác 2.11 Quan hệ R tập thuộc tính U Hệ tin Từ định nghĩa Quan hệ định nghĩa Hệ tin ta nhận thấy rằng: Mọi quan hệ r U, với R = {t1, t2, , tm}; S = ( R, U ) hệ tin, với f(o i, Aj) = f(ti, Aj) = ti.Aj Ví dụ: Xét hệ tin S = (O, U) ; Tập miền trị V hàm f xác định bảng sau: Bảng 2.7: Hệ tin có đối tượng giống HOTEN NS QUE Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 12 o1 Q.Anh 83 NA o2 Q.Anh 83 NA o3 Q.Anh 83 NA o4 Q.Anh 83 NA o5 Q.Anh 83 NA Đây hệ tin mà đối tượng giống ( bất khả phân biệt ) tập thuộc tính U Tức hệ tin ta ln có: f( o 1, HOTEN) = Q.ANH, f( o1, NS) = 83, f( o 1, QUE) = NA f( o 2, HOTEN) = Q.ANH, f( o2, NS) = 83, f( o 2, QUE) = NA f( o 3, HOTEN) = Q.ANH, f( o3, NS) = 83, f( o 3, QUE) = NA f( o 4, HOTEN) = Q.ANH, f( o4, NS) = 83, f( o 4, QUE) = NA f( o 5, HOTEN) = Q.ANH, f( o5, NS) = 83, f( o 5, QUE) = NA Theo định nghĩa quan hệ R U giống tồn tập thuộc tính U phải coi phần tử quan hệ Vậy hệ tin biểu thị quan hệ R tập thuộc tính U = {HOTEN, NS, QUE} quan hệ phần tử: R HOTEN NS QUE Q ANH 83 NA 2.12 Định nghĩa khoá (key) tối thiểu Cho sơ đồ quan hệ W = < U, F > Trong U = {A1, A2, , An} tập thuộc tính, F tập phụ thuộc hàm U (Khái niệm phụ thuộc hàm đề cập phần sau) Tập thuộc tính k  U gọi khoá tối thiểu W = < U, F > thoả mãn hai điều kiện: (1) k + = U ( hay k  U) (2) k tối thiểu Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 13 Như tập k  U gọi khóa tối thiểu sơ đồ quan hệ W = < U, F > k tập tối thiểu kéo theo U Tức k khoá tối thiểu nếu: k + = U ( hay k  U) bớt khỏi k dù phần tử bao đóng tập cịn lại khác U Vậy tập k  U gọi khóa tối thiểu nếu: k+=U (k - A) +  U, với A thuộc k Trực quan từ định nghĩa, ta thấy k tập thuộc tính mà k + = U từ k ta bớt dần phần tử k, để nhận tập k tối thiểu có bao đóng U khóa tối thiểu sơ đồ quan hệ Thuật tốn 2.4: Thuật tốn tìm khố sơ đồ quan hệ Input: W= < U, F >; Output: k khóa W; Algorithm: Bước 1: Gán k = U Bước 2: A thuộc tính k, đặt k' = k - A Nếu k'+ = U gán k = k' Thực bước Thuật tốn tìm tất khố Bước 1: Xác định tất tập khác rỗng U Kết tìm giả sử tập thuộc tính A1, A2, , A2n-1 Bước 2: Tìm bao đóng Ai Bước 3: Siêu khố Ai bao đóng U Giả sử ta có siêu khố S = {S1, S2, , Sm } Bước 4: Xây dựng tập chứa tất khoá W từ tập S cách xét Si, Sj S (i ≠ j), Si  Sj ta loại Sj ( i, j = n), kết lại S tất khố cần tìm Thuật toán cải tiến Trước vào thuật toán cải tiến, ta cần quan tâm số khái niệm sau: Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 14 + Tập thuộc tính nguồn (TN) chứa tất thuộc tính có xuất vế trái khơng xuất vế phải phụ thuộc hàm thuộc tính khơng xuất vế trái lẫn vế phải phụ thuộc hàm + Tập thuộc tính đích (TD) chứa tất thuộc tính có xuất vế phải khơng xuất vế trái phụ thuộc hàm + Tập thuộc tính trung gian (TG) chứa tất thuộc tính xuất vế trái lẫn vế phải phụ thuộc hàm Hệ quả: Nếu k khóa W TN  k TD ∩ k =  Chứng minh TN  k Theo hệ thuật tốn tìm bao đóng ta có k+  k  TD  TG Ta chứng minh A  TN  A  k Thật vậy: Nếu A ∉ k  k+  k  TD  TG  U - A  K khơng khóa  mâu thuẫn Chứng minh TD ∩ k = ∅ Giả sử có thuộc tính A TD ∩ k ta dẫn đến điều mâu thuẫn Thật vậy: Theo hệ thuật tốn tìm bao đóng k+ = (k - A)+  A A TD  có X vế trái phụ thuộc hàm F cho X→A (1) A ∉ X  X  k+ = ( k - A)+  A A ∉ X X  (k - A)+ (k - A) → X (2) Từ (1) (2) ta có (k - A) → A A  (k - A)+  (k - A)+  A = (k - A)+  k+ = (k - A)+ mâu thuẫn với điều k khóa Dựa vào hệ ta có thuật tốn tìm tất khóa sau: Dữ liệu vào: Lược đồ quan hệ Q tập phụ thuộc hàm F Dữ liệu ra: Tất khóa quan hệ Thuật tốn 2.7: Thuật tốn tìm tất khóa lược đồ quan hệ Bước 1: Tạo tập thuộc tính nguồn TN, tập thuộc tính trung gian TG Bước 2: if TG = ∅ then lược đồ quan hệ có khóa k Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 15 k = TN kết thúc Ngược lại Qua bước Bước 3: Tìm tất tập Xi tập trung gian TG Bước 4: Tìm siêu khóa Si cách Xi if (TN Xi)+ = Q+ then Bước 5: Si = TN Xi Tìm khóa cách loại bỏ siêu khóa không tối thiểu Si, Sj S if Si Sj then Loại Sj khỏi Tập siêu khóa S S cịn lại tập khóa cần tìm Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 16 Chương III: PHỤ THUỘC HÀM TRÊN QUAN HỆ R VÀ PHỤ THUỘC HÀM SUY RỘNG 3.1 Phụ thuộc hàm quan hệ R Chúng ta có khái niệm phụ thuộc hàm (Functional Dependency) quan hệ Phụ thuộc hàm có tầm quan trọng lớn việc phân tích thiết kế mơ hình liệu Khái niệm: Quan hệ R định nghĩa tập thuộc tính U = { A1, A2, , An} A, B U tập tập thuộc tính U Nếu tồn ánh xạ f: A  B ta nói A xác định hàm B, hay B phụ thuộc hàm vào A, ký hiệu A  B Định nghĩa hình thức phụ thuộc hàm sau: Quan hệ Q (A, B, C) có phụ thuộc hàm A xác định B (ký hiệu A  B) nếu: " q, q’ € Q, cho q.A = q’.A q.B = q’.B (Nghĩa là: ứng với giá trị A có giá trị B) A vế trái phụ thuộc hàm, B vế phải phụ thuộc hàm A  B gọi phụ thuộc hàm hiển nhiên B  A Nghĩa là, tập A lớn bao tập B A xác định giá trị thuộc tính tập B điều hiển nhiên A  B gọi phụ thuộc hàm nguyên tố, nói cách khác, B gọi phụ thuộc hàm đầy đủ (fully functional dependence) vào A "A’ A khơng có A’  B Ví dụ : Trong lược đồ CSDL quản lý hóa đơn bán hàng cho quan hệ HĨAĐƠN (Số-hóađơn, Số_chủng_loại_mặt_hàng, Tổng-trị-giá) có phụ thuộc hàm sau: f1: Số-hóa-đơn  Số_chủng_loại_mặt_hàng; f2: Số-hóa-đơn  Tổng-trị-giá; Số-hóa-đơn khóa lược đồ quan hệ HĨAĐƠN Nếu biết số hóa đơn ta xác định tất thơng tin cịn lại liên quan đến hóa đơn đó, có thơng tin Số_chủng_loại_mặt_hàng Tổng-trị-giá tất mặt hàng Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 17 hóa đơn Các phụ thuộc hàm nguyên tố Quan hệ CHITIẾT_HĐ (Số-hóa-đơn, Mã-hàng, Số-lượng-đặt, Đơn-giá, Trị-giá) có phụ thuộc hàm sau: f1: Số-hóa-đơn, Mã-hàng  Số-lượng-đặt f2: Số-hóa-đơn, Mã-hàng  Đơn-giá f3: Số-hóa-đơn, Mã-hàng  Trị-giá f4: Số-lượng-đạt, Đơn-giá  Trị-giá Thuộc tính Đơn-giá phụ thuộc hàm khơng đầy đủ vào khóa (Số-hóa-đơn, Mã-hàng), phụ thuộc vào mặt hàng (thông qua Mã-hàng) 3.2 Phụ thuộc hàm quan hệ dựa vào quan hệ bất khả phân biệt IND(X), IND(Y) Cho quan hệ R tập thuộc tính A = { A1, A2, , An} ; X, Y  A Phụ thuộc hàm quan hệ R dựa vào quan hệ IND(X), IND(Y) Ta nói X xác định phụ thuộc hàm Y ( Y phụ thuộc hàm vào X ) R, ký hiệu X  Y IND(X)  IND(Y) Khi ta nói R thoả phụ thuộc hàm X→ Y Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 18 KẾT LUẬN Hệ tin công cụ đắc lực thiếu lý thuyết tập thô, tập mờ Hệ tin trường hợp tổng qt mơ hình quan hệ Tất các tính chất, ứng dụng quan hệ mở rộng áp dụng hệ tin Vậy nghiên cứu phổ biến rộng rãi đề tài hệ tin vấn đề cấp bách cần thiết Luận văn nghiên cứu vấn đề sau: - Lý thuyết tập thô, quan hệ tương đương, lớp tương đương - Khái niệm hệ tin rút gọn hệ tin - Nghiên cứu phụ thuộc hàm quan hệ R phụ thuộc hàm suy rộng Luận văn định hướng áp dụng nhiều thực tế ứng dụng hệ chuyên giạ hệ định hay tốn tìm kiếm phân loại văn … TÀI LIỆU THAM KHẢO [1] Pawlak z., Systemy informacyjne warszawa 1983 [2] Pawlak z., Knowledge, Uncertainty and Indiscernibility A Rough set Perspective, October 1990 [3] Đỗ Phúc - Giáo trình khai thác liệu NXB ĐH QG TP Hồ Chí Minh 2006 [4] Nguyễn Bá Tường - Cơ sở liệu - Lý thuyết thực hành NXB KH&KT 2005 Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 19 DANH MỤC BẢNG Bảng 2.1: Hệ định dư thừa thông tin Bảng 2.2 : Ví dụ quan hệ bất khả phân biệt Bảng 2.3: Một hệ thông tin đơn giản Bảng 2.4: Hệ tin HS thi vào ĐHQGia Bảng 2.5: Ví dụ hệ khai thác liệu Bảng 2.6: Ví dụ hàm thơng tin Bảng 2.7: Hệ tin có đối tượng giống 11 Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan ... (R-indiscernable) Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan Chương II HỆ TIN VÀ VẤN ĐÊ LIÊN QUAN 2.1 Định nghĩa Hệ thống thông tin Hệ thống thông tin gọi tắt Hệ Tin (Information... thuyết ứng dụng hệ thống thông tin vấn đề liên quan 18 KẾT LUẬN Hệ tin công cụ đắc lực thiếu lý thuyết tập thô, tập mờ Hệ tin trường hợp tổng quát mơ hình quan hệ Tất các tính chất, ứng dụng quan hệ. .. liệu - Lý thuyết thực hành NXB KH&KT 2005 Nghiên cứu lý thuyết ứng dụng hệ thống thông tin vấn đề liên quan 19 DANH MỤC BẢNG Bảng 2.1: Hệ định dư thừa thông tin Bảng 2.2 : Ví dụ quan hệ bất

Ngày đăng: 19/03/2021, 18:00

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN