Tai liệu Cơ sở dữ liệu suy diễn
1 NGUYEN MAU HAN, PhD. HUE COLLEGE OF SCIENCES CƠ SỞ DỮ LIỆU SUY DIỄN 2 Định nghĩa 1.1 Bộ ký tự bao gồm các lớp ký hiệu sau: Hằng, thường ký hiệu là các chữ cái thường a, b, c, . Biến, thường ký hiệu bởi X, Y, Z, . Các ký hiệu hàm, thường ký hiệu bởi f, g, h, . Các ký hiệu vị từ, thường ký hiệu bởi p, q, r, . Các hằng vị từ: true, false Các ký hiệu kết nối: (phủ định), (tuyển), (hội), (kéo theo), (tương đương) Các ký hiệu lượng tử: (với mọi), (tồn tại) Dấu ngoặc đơn trái (, dấu ngoặc đơn phải ), dấu phẩy ,. 1.1 Lý thuyết ngôn ngữ bậc nhất 3 Định nghĩa 1.2 Hạng thức được định nghĩa đệ quy như sau: (i) Mỗi hằng là một hạng thức, (ii) Mỗi biến là một hạng thức, (iii) Nếu f là ký hiệu hàm n-ngôi và t 1 , .,t n là các hạng thức thì f(t 1 , .,t n ) là một hạng thức, (iv) Hạng thức chỉ được sinh ra bởi các quy tắc trên. 1.1 Lý thuyết ngôn ngữ bậc nhất 4 Định nghĩa 1.3 Giả sử t 1 , .,t n là các hạng thức, p là ký hiệu vị từ n- ngôi thì p(t 1 , .,t n ) được gọi là một công thức nguyên tố (hoặc nguyên tố). Định nghĩa 1.4 Nguyên tố nền là nguyên tố không chứa bất kỳ biến nào. 1.1 Lý thuyết ngôn ngữ bậc nhất 5 Định nghĩa 1.5 Công thức được định nghĩa đệ quy như sau: Mỗi nguyên tố là một công thức, Các hằng vị từ true và false là các công thức, Nếu E và F là các công thức thì: (E F), (E), (EF), (E F), (E F) là các công thức, Nếu E là công thức, X là biến thì X (E), X(E) là các công thức, Công thức chỉ được sinh ra bởi một số hữu hạn các quy tắc trên. Ta quy ước viết F E thay cho công thức E F. 1.1 Lý thuyết ngôn ngữ bậc nhất 6 Định nghĩa 1.6 Một ngôn ngữ bậc nhất gồm một bộ ký tự và những công thức xây dựng trên bộ ký tự đó. Định nghĩa 1.7 Nguyên tố hoặc phủ định của một nguyên tố được gọi là một literal. Một literal dương là một nguyên tố, literal âm là phủ định của một nguyên tố. 1.1 Lý thuyết ngôn ngữ bậc nhất 7 Định nghĩa 1.8 Một CSDL suy diễn là một tập hữu hạn các mệnh đề có dạng: p 1 . p m q 1 . q n (m 0, n 0) (1) trong đó: p i (i = 0, .,m) là các nguyên tố và q j ,j=0 n là các literal. Tất cả các đối số của p i và q j là hằng hoặc biến. 1.2 Cơ sở dữ liệu suy diễn 8 Một số trường hợp đặc biệt của p 1 . p m q 1 . q n (1): Trường hợp m=1, n1. (1) có dạng: p q 1 . q n và gọi là một quy tắc. Trường hợp m>1, n=0. (1) có dạng: p 1 .p m và nếu tất cả các đối trong mọi vị từ p i là hằng thì nó được gọi là sự kiện tuyển. Trường hợp m>1, n 1. (1) có dạng: p 1 .p m q 1 . q n và được gọi là quy tắc Datalog dạng tuyển. 1.2 Cơ sở dữ liệu suy diễn 9 Một CSDL suy diễn xác định (còn gọi là chương trình Datalog) chỉ bao gồm các quy tắc xác định, nghĩa là các quy tắc có dạng: p q 1 . q n (n0) Một CSDL suy diễn dạng tuyển cho phép chứa các quy tắc có dạng: p 1 .p m q 1 . q n , (m>1, n0) 1.2 Cơ sở dữ liệu suy diễn 10 Định nghĩa 1.9 Cho P là CSDL suy diễn xác định. •Vị từ IDB là vị từ được định nghĩa bởi các quy tắc trong P. •Vị từ EDB là vị từ không được định nghĩa qua các quy tắc, nó chỉ xuất hiện trong thân quy tắc. •CSDL EDB của P là tập các sự kiện nền đối với các vị từ EDB. •CSDL IDB là tập các sự kiện nền được tính đối với các vị từ IDB bằng cách áp dụng việc suy diễn trên các quy tắc của P với CSDL ban đầu EDB. 1.2 Cơ sở dữ liệu suy diễn [...]...1.2 Cơ sở dữ liệu suy diễn Định nghĩa 1.10 Với mỗi vị từ k-ngôi q được đặt tương ứng một quan hệ Q có k thuộc tính Giá trị của quan hệ Q là một tập các bộ, một bộ của quan hệ Q có k thuộc tính được biểu thị bởi bộ (a1, ,ak), trong đó các ai là hằng, q(a1, ,ak) là đúng nếu (a1, ,ak) thuộc Q Quan hệ đối với vị từ EDB (tương ứng IDB) gọi là quan hệ EDB (tương ứng IDB) 11 1.2 Cơ sở dữ liệu suy diễn Định... Cho P là CSDL suy diễn xác định 1 Vũ trụ Herbrand của P, ký hiệu UP, là tập tất cả các hằng của P 2 Cơ sở Herbrand của P, ký hiệu BP, là tập tất cả các nguyên tố nền của P 3 Thể hiện Herbrand là một tập con I bất kỳ của cơ sở Herbrand BP của P - Nếu AI, ta nói rằng sự kiện A đúng trong I và viết I A - Nếu ABP nhưng AI, ta nói rằng A sai trong I và viết I A 12 1.2 Cơ sở dữ liệu suy diễn Định nghĩa... Cơ sở dữ liệu suy diễn Ví dụ 1.1 Xét CSDL suy diễn xác định P gồm các quy tắc như sau: q(a,b) q(b,c) p(X,Y) q(X,Y) p(X,Y) p(X,Z) p(Z,Y) Vũ trụ Herbrand của P là UP = { a, b, c } và cơ sở Herbrand của P là: BP = { p(a,a), p(a,b), p(a,c), p(b,a), p(b,b), p(b,c), p(c,a), p(c,b), p(c,c), q(a,a), q(a,b), q(a,c), q(b,a), q(b,b), q(b,c), q(c,a), q(c,b), q(c,c) } Để ý rằng vũ trụ Herbrand và cơ sở. .. Ngữ nghĩa của CSDL suy diễn dạng tuyển 1.3.1 Ngữ nghĩa của CSDL suy diễn xác định Định nghĩa 1.16 Giả sử P là CSDL suy diễn xác định Ngữ nghĩa của P là mô hình nhỏ nhất của P Chú ý: Có thể tìm ra mô hình nhỏ nhất này bằng cách dùng toán tử hệ quả trực tiếp TP được định nghĩa như sau: 18 1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển Định nghĩa 1.17 sử P là CSDL suy diễn xác định, BP là cơ sở Herbrand Bp của... p(c,a), p(c,b), p(c,c), q(a,a), q(a,b), q(a,c), q(b,a), q(b,b), q(b,c), q(c,a), q(c,b), q(c,c) } Để ý rằng vũ trụ Herbrand và cơ sở Herbrand của CSDL suy diễn xác định đều là những tập hữu hạn 14 1.2 Cơ sở dữ liệu suy diễn Định nghĩa 1.12 Một CSDL suy diễn dạng tuyển là một tập hữu hạn các mệnh đề có dạng: p1 pm q1 qn (m > 1, n 0), trong đó các pi (i=1 m), qj (j=1 n) là các nguyên tố Định... J := Tp(DB I); end; 22 output I; 1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển 1.3.2 Ngữ nghĩa của CSDL suy diễn dạng tuyển Trong trường hợp CSDL suy diễn dạng tuyển, có thể tồn tại nhiều mô hình cực tiểu và có thể không có mô hình nhỏ nhất Trong trường hợp này một tiếp cận ngữ nghĩa được đề xuất như sau: Định nghĩa 1.18 Ngữ nghĩa của CSDL suy diễn dạng tuyển được xác định bởi tập các mô hình cực tiểu... sao cho p = A và q1, ,qn I } Đối với một thể hiện Herbrand I cho trước của CSDL suy diễn xác định P, toán tử Tp xây dựng nên một thể hiện Herbrand của P là Tp(I) - chứa các sự kiện được dẫn xuất bởi các quy tắc trong P từ những sự kiện trong I 19 1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển Ví dụ 1.1 Cho CSDL suy diễn xác định P chỉ gồm một quy tắc: p(a, X)q(X,Y) r(Y,a) Giả sử q(b,c), r(c,a)... I và p(a,X) = p(a,b) nên suy ra p(a,b) Tp(I) 20 1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển Định lý sau đây cho ta một tính chất quan trọng của toán tử Tp: Định lý 1.1 Giả sử P là CSDL suy diễn xác định Lúc đó: (i) Toán tử TP là đơn điệu tăng và có điểm bất động nhỏ nhất (ii) Điểm bất động nhỏ nhất của toán tử TP chính là mô hình nhỏ nhất của P Mệnh đề sau đây được suy ra trực tiếp từ định lý trên:... chính là mô hình nhỏ nhất của P Mệnh đề sau đây được suy ra trực tiếp từ định lý trên: Mệnh đề 1.1 Cho P là CSDL suy diễn xác định Mô hình nhỏ nhất của P là giới hạn của dãy TPn, nN, trong đó: TP0=, TP(i+1) = TP(TPi) 21 1.3 Ngữ nghĩa của CSDL suy diễn dạng tuyển Thuật toán 1.1 Vào: CSDL suy diễn xác định P và DB là CSDL EDB đã cho Ra: Mô hình nhỏ nhất của P Phương pháp: Thuật toán được viết theo ngôn... viết ={X1/t1, , Xn/tn}, trong đó Xi là biến phân biệt, ti là hạng thức và Xi ti Mỗi cặp Xi/ti được gọi là một phép liên kết và ta nói rằng mỗi biến Xi được liên kết với hạng thức ti 15 1.2 Cơ sở dữ liệu suy diễn Định nghĩa 1.14 Một biểu thức là một hạng thức hoặc một literal hoặc hội các literal hoặc tuyển các literal Định nghĩa 1.15 Giả sử E là một biểu thức và = {X1/t1, , Xn/tn} là một phép thế