tài liệu về giới thiệu lý thuyết cơ bản trong lý thuyết CSDL
Trang 1Phần Giới Thiệu Về Đề Tài:
gày nay, trong nhiều ứng dụng thực tế, bên cạnh những dữ liệu tĩnh- dữ liệu có tính ổn định, còn có rất nhiều loại dữ liệu động- dữ liệu được truy xuất thay đổi theo thời gian Trong một số trường hợp, những dữ liệu động này có những quy luật thay đổi nào đó Vì vậy mô hình CSDL có tính thời gian(temporal database) được đề xuất để nghiên cứu vấn đề trên
N
Nhiều tác giả đã nghiên cứu về: mô hình dữ liệu có tính thời gian, và các dạng chuẩn có tính thời gian Có thể nêu một số những tên tuổi như: D.Dey đưa ra một số khái niệm về đại số quan hệ cho mô hình dữ liệu thời gian; Z.M Ozsoyoglu đề nghị mô hình quan hệ lồng nhau; J Wijsen, J Vandenbulcke và H Olive đề nghị một số khái niệm về các phụ thuộc hàm có tính thời gian; và gần đây S Y Liao, H.Q Wang, W.Y Liu đưa ra khái niệm về dạng chuẩn 3 có tính thời gian; E Bertino, C Bettini, E.Ferrari, P Samarati đưa
ra khái niệm về điều khiển truy xuất trong mô hình có tính thời gian
Trong đề tài này đề cập đến các khái niệm và một số kết quả về các vấn đề trong cơ sở dữ liệu có tính thời gian như sau:
- Các khái niệm về cơ sở dữ liệu có tính thời gian: lược đồ quan hệ tính
thới gian và quan hệ tính thời gian
- Các phép toán về đại số quan hệ trên CSDL có tính thời gian
- Các khái niệm về phụ thuộc hàm và các dạng chuẩn có tính thời gian
- Các ràng buộc ổn định có tính thời gian
- Phân rã bảo toàn thông tin có tính thời gian
-**** -
Trang 2Giới thiệu khái niệm cơ bản trong lý thuyết CSDL
PHẦN I
GIỚI THIỆU KHÁI NIỆM CƠ BẢN TRONG LÝ THUYẾT CSDL
I.1 Khái niệm về CSDL:
CSDL là một tập hợp có cấu trúc của dữ liệu được lưu trữ trên các thiết bị ký tin nhằm thỏa mãn đồng thời nhiều người sử dụng, một cách có chọn lọc vào lúc cần
I.2 Tập cấu trúc thuộc tính:
Một thuộc tính: mô tả một đặc tính hoặc đặc điểm nào đó của một thực thể(sự vật)
R={A1, A2,…,An} gọi là một tập cấu trúc thuộc tính nếu như R gồm hữu hạn các ký hiệu gọi là các thuộc tính
Mỗi thuộc tính Ai có giá trị thể hiện thuộc tập Di= Domain(Ai)
I.3 Quan hệ(biểu diễn quan hệ bằng ánh xạ):
• Một quan hệ r(R) là một tập hữu hạn các ánh xạ từ R={A1, A2,…,An} vào hợp miền giá trị các thuộc tính(ký hiệu: D= Υn là hợp miền giá trị các thuộc tính)
i i
D
1
=
• Một quan hệ r(R) với m ánh xạ cho như sau: r= {t1,t2,….,tm}, trong đó:
ti là ánh xạ: R Ỉ D
Aj Ỉ ti(Aj) ∈ Dj (i=1, ,m; j=1,…,n)
Ta có: ti(R)= {ti1,ti2,…tin}
I.4 Ràng buộc toàn vẹn:
• Là những ràng buộc, điều kiện bất biến mà CSDL phải thoả tại mọi thời điểm
• Ràng buộc toàn vẹn có thể định nghĩa trên một quan hệ hay nhiều quan hệ khác nhau
• Ràng buộc toàn vẹn trên một quan hệ:RBTV miền giá trị, RBTV liên bộ, RBTV liên thuộc tính
Trang 3Giới thiệu khái niệm cơ bản trong lý thuyết CSDL
• Ràng buộc toàn vẹn trên nhiều quan hệ: RBTV tham chiếu, RBTV do thuộc tính tổng hợp, RBTV liên bộ- liên quan hệ, RBTV liên thuộc tính liên quan hệ, RBTV chu trình
I.5 Phụ thuộc hàm trên tập(cấu trúc) thuộc tính R:
Một phụ thuộc hàm trên tập R có ký hiệu: (X,Y), hoặc XỈ Y
Trong đó: X,Y ⊆ R
I.6 Định nghĩa lược đồ quan hệ:
Một lược đồ quan hệ ký hiệu S là một bộ S=<R,F> Trong đó, R là tập cấu trúc thuộc tính nào đó cho trước và F là tập các phụ thuộc hàm trên tập R cho trước
Sau này ta còn gọi lược đồ quan hệ S là lược đồ quan hệ R, với R là tập cấu trúc thuộc tính nào đó cho trước và F là tập các phụ thuộc hàm trên tập R cho trước
I.7 Phụ thuộc hàm:
• Cho r(R) là một quan hệ trên tập thuộc tính R
X,Y ⊆ R, ta nói có phụ thuộc hàm: XỈY trên quan hệ r
Ký hiệu: (X,Y)r hay X⎯ ⎯→r Y
Nếu như: ∀ t,s ∈ r nếu t[X]= s[X] thì t[Y]= s[Y]
• Với r(R) là một quan hệ trên R sẽ tồn tại duy nhất một tập phụ thuộc hàm gồm tất cả các phụ thuộc hàm của quan hệ r, ký hiệu: Fr
I.8 Quan hệ hợp lệ:
• Cho tập thuộc tính R, X,Y ⊆ R Ta nói, phụ thuộc hàm (X,Y) đúng trên r(quan hệ r hợp lệ đối với phụ thuộc hàm (X,Y)) nếu như (X,Y) ∈ Fr
• Với S=<R,F> là một lược đồ quan hệ Ta nói quan hệ r(R) là hợp lệ đối với S nếu như nó hớp lệ đối với mọi phụ thuộc hàm trong F
• Cho R={A1, A2,…,An} là một lược đồ quan hệ, X,Y ⊆ R, ta nói có phụ thuộc hàm: XỈY của lược đồ quan hệ R(hay X xác định Y theo kiểu hàm; hay Y phụ thuộc hàm
Trang 4Giới thiệu khái niệm cơ bản trong lý thuyết CSDL
vào X) nếu:∀ r(R) hợp lệ(quan hệ r là giá trị hiện hành của R): XỈY là phụ thuộc hàm trên quan hệ r
Từ đó ta có khái niệm quan hệ hợp lệ như sau
I.9 Phụ thuộc hàm suy diễn và bao đóng của các tập phụ thuộc:
Cho LĐQH S=<R,F>, X,Y ⊆ R
• (X,Y) là phụ thuộc hàm được suy diễn từ các phụ thuộc hàm trong F(đối với các quan hệ hợp lệ) nếu như:
Với mọi quan hệ r(R) hợp lệ đối với F thì r(R) cũng hợp lệ đối với (X,Y)
• F+ được gọi là bao đóng(closure) của F nếu F+ gồm tất cả các phụ thuộc hàm được suy diễn từ các phụ thuộc hàm trong F, nghĩa là:
F+ ={(X,Y): (X,Y) được suy diễn từ các phụ thuộc hàm trong F
Nhận xét:
Chúng ta không xem xét một quan hệ r cụ thể của lược đồ R nhằm suy ra các phụ thuộc đúng trong R Tuy nhiên, chúng ta có thể xem xét một quan hệ cụ thể của R để khám phá ra một số phụ thuộc không đúng
I.10 Hệ tiên đề Amstrong:
Là một tập những quy tắc suy diễn đầy đủ, nhờ những quy tắc này ta có thể suy diễn tất cả các phụ thuộc hàm trong tập F+ từ tất cả các phụ thuộc hàm trong tập F(điều này đã được chứng minh):
Với X,Y,Z,T⊆R
• Quy tắc phản xạ: Nếu Y⊆ X thì XỈY, quy tắc này đưa ra những phụ hàm tầm thường
• Quy tắc tăng trưởng: Nếu XỈY, Z ⊆ R thì XZỈYZ
• Quy tắc bắc cầu: nếu XỈY, YỈZ thì XỈZ
Các luật suy diễn bổ sung:
Trang 5Giới thiệu khái niệm cơ bản trong lý thuyết CSDL
• Quy tắc tách: nếu XỈYZ thì XỈY và XỈZ
• Quy tắc tựa bắc cầu: nếu XỈY và YZỈT thì XZỈT
I.11 Bao đóng của tập thuộc tính:
Muốn kiểm tra phụ thuộc hàm XỈY có thuộc F+ hay không, ta xét thấy:
Bài toán tìm F+ từ F là khó thực hiện với số thuộc tính trong R lớn
Thay vì xác định F+ ta tính X+
F, nếu Y⊆ X+
F thì XỈY thuộc F+
I.12 Khoá của lược đồ quan hệ:
Để phân biệt các thực thể trong một tập thực thể ta có khái niệm khoá như sau:
Trang 6Các dạng chuẩn trong CSDL
PHẦN II
CÁC DẠNG CHUẨN TRONG CSDL
Việc chuẩn hoá các quan hệ cũng như các lược đồ quan hệ đóng vai trò cực kỳ quan trọng trong việc thiết kế các hệ quản trị cơ sở dữ liệu Nhờ có sự chuẩn hoá các quan hệ và các lược đồ quan hệ chúng ta tránh được việc dư thừa dữ liệu và tăng tốc độ của các phép toán xử lý quan hệ
Trong CSDL có sự trùng lắp thông tin
Dạng chuẩn: là các tiêu chuẩn để đánh giá độ trùng lắp thông tin trong CSDL
Dựa vào phụ thuộc hàm ta có những dạng chuẩn như sau:
Cho LĐQH S=<R,F>(còn gọi là LĐQH R)
F: là tập các phụ thuộc hàm
R: tập các thuộc tính
II.1 Định nghĩa Dạng chuẩn 1NF:
Lược đồ quan hệ R đạt dạng chuẩn 1NF nếu mọi thuộc tính của nó đều là thuộc tính đơn(nguyên tố )
Thuộc tính đơn(nguyên tố):miền giá trị không thể phân chia được nữa
Thuộc tính phức: miền giá trị có thể phân chia được
VD:
- MSSV là thuộc tính đơn
Trang 7Các dạng chuẩn trong CSDL
- NgaySinh là thuộc tính phức vì miền giá trị có thể phân chia thành các giá trị đơn: Ngay, Thang, Nam
Ý nghĩa của dạng chuẩn 1NF: loại bỏ mọi nhóm lặp
Một thiết kế CSDL gọi là ở dạng chuẩn 1NF nếu tất cả các LĐQH trong đó là 1NF
LĐQH R muốn đạt các chuẩn 2NF, 3NF và BCNF thì trước hết phải đạt chuẩn 1NF
II.2 Định nghĩa Dạng chuẩn 2NF:
Phụ thuộc hàm đầy đủ:
Một phụ thuộc hàm AỈ B được gọi là đầy đủ nếu:Không tồn tại một tập hợp A1⊂ A sao cho A1 Ỉ B
Trong trường hợp này ta nói: B phụ thuộc đầy đủ vào A Ngược lại, ta nói: B phụ thuộc bộ phận vào A
Như vậy, nếu A là một thuộc tính đơn thì phụ thuộc hàm AỈ B là đầy đủ
Thuộc tính thứ cấp: thuộc tính a∈R gọi là thứ cấp nếu và chỉ nếu a ∉ ∪K(a còn gọi là
thuộc tính không khoáù)
Ngược lại: nếu a ∈ ∪K ta gọi a là thuộc tính khoá
Từ đó ta có:
Lược đồ quan hệ R đạt 2NF khi và chỉ khi:
- Lược đồ quan hệ R đạt 1NF
- Mọi thuộc tính thứ cấp đều phụ thuộc đầy đủ vào khoá tối tiểu bất kỳ
Có thể thấy bản chất dạng chuẩn 2NF là loại bỏ các phụ thuộc bộ phận giữa các thuộc tính thứ cấp và các khoá tối tiểu
Các dạng chuẩn quan trọng nhất là dạng chuẩn cấp 3 và dạng chuẩn BCNF Mục đích của chúng là tránh được các dư thừa và các bất thường
II.3 Định nghĩa Dạng chuẩn 3NF:
Định nghĩa phụ thuộc hàm trực tiếp và phụ thuộc hàm bắc cầu:
Trang 8Các dạng chuẩn trong CSDL
Một phụ thuộc hàm AỈ C, được gọi là trực tiếp nếu không có B(B≠ A và B ≠C) thoả: AỈB và BỈC
Trong trường hợp nếu có B như vậy thì B được gọi là tập thuộc tính bắc cầu và AỈ C là phụ thuộc bắc cầu
Khi đó:
R là 3NF nếu và chỉ nếu:
- Lược đồ quan hệ R đạt 1NF
- Không có 1 thuộc tính thứ cấp nào của R phụ thuộc bắc cầu vào 1 khoá tối tiểu Lưu ý: ∀ XỈY∈F, F gọi là chính quy nếu và chỉ nếu:
φ
Y
Y X
Ta có định nghĩa tương tự:
LĐQH S=<R,F> 3NF nếu ∀ XỈY∈ F thì:
- Phu thuộc hàm XỈY là chính quy
- X là siêu khoá của S
- Y là thuộc tính khoá
II 4 Định nghĩa Dạng chuẩn BCNF:
R đạt dạng chuẩn BCNF nếu ∀ XỈY∈ F thì:
- Phu thuộc hàm XỈY là chính quy
- X là siêu khoá của S
Hay: R đạt dạng chuẩn BCNF ⇔∀ XỈY∈F: X+=R
Mục đích của dạng chuẩn BCNF là loại bỏ dư thừa mà các phụ thuộc hàm có thể gây ra Chúng ta kết luận rằng trong quan hệ có dạng BCNF, không có giá trị nào có thể tiên đoán từ những giá trị khác bằng cách chỉ dùng phụ thuộc hàm
Nhận xét:
• Tuỳ mục tiêu của CSDL mà quyết định chọn dạng chuẩn 3 hay BCNF, bởi vì:
Trang 9Các dạng chuẩn trong CSDL
o Mỗi dạng chuẩn đều có điểm mạnh yếu
o Dạng chuẩn 3 tuy đã loại bỏ được những phụ thuộc bắc cầu, bộ phận giữa các thuộc tính thứ cấp và các khoá tối tiểu, nhưng còn trùng lắp thông tin Tuy nhiên, điểm mạnh là kiểm tra ràng buộc ít tốn kém
o Dạng chuẩn BCNF ưu điểm là triệt tiêu sự trùng lắp thông tin nhưng nhược điểm là kiểm tra ràng buộc toàn vẹn tốn kém hơn
• Lớp quan hệ BCNF là lớp con thực sự của lớp quan hệ 3NF và lớp quan hệ 3NF là lớp con thực sự của lớp các quan hệ 2NF
II.5 Phân rã có nối không mất:
Nếu R là một LĐQH được phân rã thành các lược đồ R1, R2, ., Rn, F là tập phụ thuộc,
ta gọi đây là phân rã nối không mất(ứng với F) nếu với mỗi quan hệ r của R thoả F, ta có:
r = πR1(r)><πR2(r)>< .><πRn (r)
Nếu ρ=( R1, R2, ., Rn) là một phân rã thì mρ(r) là một ánh xạ được định nghĩa là
mρ(r)= ><n i=1πRi(r), nghĩa là mρ(r) là nối các hình chiếu của r trên các LĐQH trong ρ Vì vậy điều kiện nối không mất ứng với tập phụ thuộc F là: r= mρ(r)
Nhận xét: đặc tính nối không mất là cần thiết nếu quan hệ bị phân rã cần phải được
không phục từ phân rã của chính nó
Kiểm tra tính chất nối không mất:(tài liệu)
Định lý: nếu ρ=(R1,R2) là một phân rã của R, và F là tập các phụ thuộc hàm, thì ρ có nối không mất ứng với F nếu và chỉ nếu:
(R1∩R2)ỈR1 hoặc (R1∩R2)ỈR2
II.6 Phân rã bảo toàn phụ thuộc:
Nếu R là một LĐQH được phân rã thành các lược đồ R1, R2, ., Rn, F là tập phụ thuộc
Trang 10Các dạng chuẩn trong CSDL
Lý do ρ cần bảo toàn tập F đó là các phụ thuộc trong F có thể được xem là các ràng buộc toàn vẹn cho quan hệ R Nếu các phụ thuộc hình chiếu không suy ra được F thì khi biểu diễn R bằng ρ=( R1, R2, ., Rn), chúng ta có thể thấy rằng giá trị hiện hành của các
Ri biểu diễn một quan hệ R không thoả F, ngay cả nếu ρ nối không mất ứng với F Khi đó mỗi thao tác cập nhật trên Ri sẽ cần phải thực hiện một phép nối để kiểm tra lại các ràng buộc không vi phạm
Kiểm tra tính bảo toàn phụ thuộc:(tài liệu)
II.7 Thuật toán phân rã nối không mất thành dạng chuẩn BCNF
Nhập: LĐQH S=<R,F>
Xuất: Một phân rã của R có nối không mất, sao cho mỗi LĐQH trong phân rã có dạng
BCNF ứng với hình chiếu của F trên lược đồ
while (not done) do
if (có lược đồ Ri trong result mà không là BCNF)
then begin
Nếu AỈB là một phụ thuộc hàm không tầm thường trong Ri
mà AỈRi ∉F+
Trang 11Các dạng chuẩn trong CSDL
và A ∩ B = ∅;
result := (result – Ri ) ∪ (Ri – B) ∪ (A, B );
end
else done := true;
Nhận xét: chúng ta nhận thấy mọi LĐQH đều có một phân rã nối không mất thông tin
thành dạng chuẩn BCNF, tuy nhiên không phải phân rã nào cho một LĐQH thành dạng BCNF mà vẫn bảo toàn được phụ thuộc
Dạng chuẩn 3NF ít khắt khe hơn BCNR, không thể loại bỏ được tất cả các dư thừa Tuy nhiên một LĐQH phân rã thành dạng 3NF có nối không mất và bảo toàn phụ thuộc
II.8 Phủ tối thiểu:
Cho LĐQH S=<R,F>
F={f: XỈA}, A là một thuộc tính
• Phủ tối thiểu của F, ký hiểu PTT(F) là một tập phụ thuộc hàm thoả:
(PTT(F))+= F+
• Không có phụ thuộc hàm nào thừa trong PTT(F), tức là:
¬ ∃ f: XỈA, f ∈PTT(F) sao cho: (PTT(F)/f)+= F+
• PTT(F) chỉ gồm các phụ thuộc hàm đầy đủ
II.9 Thuật toán phân rã nối không mất thành dạng chuẩn 3NF:
Nhập:LĐQH R và tập phụ thuộc F, chúng ta có thể giả sử rằng F là phủ cực tiểu mà
không làm mất đi tính tổng quát
Xuất: một phân rã bảo toàn phụ thuộc của R sao cho mỗi LĐQH đều có dạng 3NF ứng
với hình chiếu của F trên lược đồ đó
Phương pháp:
Trang 12Các dạng chuẩn trong CSDL
Nếu có những thuộc tính của R không nằm trong một phụ thuộc nào của F dù ở vế phải hay vế trái, thì về nguyên tắc, mọi thuộc tính như thế đều có thể tạo ra một lược đồ và chúng ta có thể loại chúng ra khỏi R Nếu một trong những phụ thuộc trong F có chứa tất cả các thuộc tính của R thì kết xuất chính là R, ngược lại, phân rã kết xuất ρ sẽ chứa lược đồ XA cho mỗi phụ thuộc XỈA trong F
Nếu không có lược đồ nào trong ρ chứa một khoá bất kỳ của R thì ta thực hiện thêm vào
ρ một lược đồ có tập thuộc tính là một khoá bất kỳ của R
Minh hoạ:
Cho Fc là một phủ cực tiểu của F;
i := 0;
if không có lược đồ Rj, 1 ≤ j ≤ i chứa AB
Trang 13Khái niệm về CSDL có tính thời gian
PHẦN III
KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU CÓ TÍNH THỜI GIAN
Một thuộc tính: mô tả một đặc tính hoặc đặc điểm nào đó của một thực thể(sự vật)
Ví dụ: Mscb, HoTen, QueQuan, DiaChi, ChucVu, PhongBan, BacLuong
Có nhận xét rằng, trong tập thuộc tính có:
- Những thuộc tính mà giá trị ổn định theo thời gian Ví dụ: Mscb, HoTen,
- Những thuộc tính mà giá trị thay đổi theo thời gian.Ví du: DiaChi, ChucVu, PhongBan, BacLuong,
Như vậy, chúng ta sẽ mở rộng các khái niệm LĐQH, quan hệ, phụ thuộc hàm, thuộc tính thông thường với thuộc tính thời gian
III.1 Khái niệm thuộc tính thời gian:
Ta tìm hiểu về khái niệm thời điểm và khoảng thời gian trong thuộc tính thời gian
- Ta gọi không gian các thời điểm C: là không gian 1 chiều liên tục không âm [0,+∞] Và trên đó có xác định quan hệ thứ tự “≤”
0 C t i +∞
- Với ti ∈ C là một thời điểm bất kỳ, ta ký hiệu:
+ Một tập con các thời điểm α ⊂C được gọi là một khoảng thời gian nếu:
C,
∈
∀t1,t2,t3 t1 ≤t2 ≤t3, t1,t3∈α ⇒t2∈α + Gọi T là tập hợp tất cả các khoảng thời gian: α ⊂C
T={α :α ⊂C}
+ Hai khoảng kề nhau: α1vàα2gọi là kề nhau, ký hiệu α1 <α2nếu:
α1=[a,b) và α2=[c,d) và b=c
Hoặc α1=[a,b] và α2=[c,d] và b=c - 1
Trang 14Khái niệm về CSDL có tính thời gian
Ví dụ: Cho 3 thời điểm a,b,c biểu thị giá trị Năm như sau:
III.2 Lược đồ quan hệ có tính thời gian:
Mở rộng của LĐQH bình thường, LĐQH thời gian xét thêm vào trong tập thuộc tính R một thuộc tính thời gian
LĐQH có tính thời gian(TTG) ST là một bộ ST =(RT, FT)
Trong đó:
RT là tập thuộc tính
FT là tập các phụ thuộc hàm trên tập RT hay phụ thuộc hàm tính thời gian
Nhận xét: trong LĐQH TTG, các thuộc tính bao gồm :
- Thuộc tính có giá trị ổn định theo thời gian, gọi là thuộc tính ổn định, ký kiệu: R
- Thuộc tính có giá trị thay đổi theo thời gian, gọi là thuộc tính có tính thời gian, ký
hiệu: R
- T: là tập thuộc tính thời gian
Nhận xét: trong đề tài này, chỉ xét trường hợp tập thuộc tính thời gian gồm một thuộc
tính |T|=1
Xét thuộc tính thời gian:
- Trong một số bài báo đề xuất: giá trị thuộc tính thời gian T là một khoảng thời gian [Ts, Te] hoặc [Ts,Te)
- Trong một số bài báo khác lại đề xuất: giá trị thuộc tính thời gian T tách thành 2 giá trị thuộc tính thời gian Ts và Te
∀Ai ∈RT(i=1,…,n), mỗi thuộc tính Ai có miền giá trị D(Ai)=Di tương ứng
Trang 15Khái niệm về CSDL có tính thời gian
Nếu Ai=T(T: thuộc tính thời gian) thì D(Ai)⊂ T (T: là tập hợp các khoảng thời gian)
Ví dụ:
Xét quan hệ THÔNG_TIN_CÁN_BỘ(MACB, HOTEN, GIỚITINH, QUEQUAN, PHONGBAN, CHUCVU, LUONGHS, DANGVIEN)
1234 NG.V.A NỮ THANH HOA MOI TRUONG GIANG DAY CAN BO 2.34 KHÔNG
1235 NG.V.B NAM HA NOI HOA HOC GIANG DAY CAN BO 2.67 CÓ
1236 NG.V.C NAM TP.HCM VAT LY PHO KHOA 4.32 KHÔNG
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 3 KHÔNG
Bảng dữ liệu này lưu thông tin về cán bộ của một trường đại học trong khoảng thời gian [2004,2005] Mỗi dòng dữ liệu lưu thông tin của một cán bộ và một thông tin của một cán bộ chỉ được biểu diễn duy nhất trên một dòng Với quan hệ trên dễ dàng nhận thấy khoá của quan hệ Kr là MSCB
Trong quá trình quản lý, do thông tin của các cán bộ có sự thay đổi nên hàng năm sẽ có một bảng thông tin mới về các cán bộ Sự thay đổi có thể nằm ở các thuộc tính: PHONGBAN, CHUCVU, LUONGHS, DANGVIEN
Do yêu cầu quản lý, người sử dụng cần quan tâm tới thông tin về các cán bộ trong tất các khoảng thời gian
Như vậy ta có một quan hệ THÔNG_TIN_CÁN_BỘ mới thể hiên bởi một bảng dữ liệu chung, là tập hợp các bảng dữ liệu THÔNG_TIN_CÁN_BỘ trong tất cả các khoảng thời gian, như sau:
Trang 16Khái niệm về CSDL có tính thời gian
MSCB HOTEN TINH GIOI QUE QUAN PHONG BAN CHUC VU LUONG HS DANG VIEN THỜI GIAN
1234 NG.V.A NỮ THANH HOA MOI TRUONG CAN BO GIANG DAY 2.34 KHÔNG [2004,2005)
1234 NG.V.A NỮ THANH HOA MOI TRUONG CAN BO GIANG DAY 2.34 CÓ [2005,2006)
1235 NG.V.B NAM HA NOI HOA HOC CAN BO GIANG DAY 2.67 CÓ [2004,2005)
1235 NG.V.B NAM HA NOI HOA HOC CAN BO GIANG DAY 2.67 CÓ [2005,2006)
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG VIÊN 3.0 KHÔNG [2000,2001)
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG VIÊN 3.0 KHÔNG [2001,2002)
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG VIÊN 3.5 KHÔNG [2002,2003)
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG VIÊN 3.5 KHÔNG [2003,2004)
1236 NG.V.C NAM TP.HCM VAT LY PHO KHOA 4.32 KHÔNG [2004,2005)
1236 NG.V.C NAM TP.HCM VAT LY PHO KHOA 4.32 CÓ [2005,2006)
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 2.67 KHÔNG [2000,2001)
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 2.67 KHÔNG [2001,2002)
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 2.67 KHÔNG [2002,2003)
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 2.67 KHÔNG [2003,2004)
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 3.0 KHÔNG [2004,2005)
1237 NG.V.D NỮ HA TINH NGOAI NGU GIANG VIÊN 3.0 CÓ [2005,2006)
III.3 Định nghĩa quan hệ tính thời gian r(R T ) hay r T :
Cho: RT={A1, A2,…,An}
Một quan hệ r(RT) là một tập hữu hạn các ánh xạ từ tập thuộc tính RT vào hợp miền giá
trị các thuộc tính
Gọi D(RT)=D(R) ∪D(R) ∪D(T)là hợp miền giá trị các thuộc tính RT
Một quan hệ r(RT) (hay rT ) với m ánh xạ cho như sau: rT= {t1,t2,….,tm}, trong đó:
ti là ánh xạ: RT Ỉ D(RT)
Aj Ỉ ti(Aj) ∈ Dj (i=1, ,m; j=1,…,n) Như vậy: giá trị của ti(Aj) là giá trị ứng với khoảng thời gian ti(T), nói cách khác, mọi
thuộc tính của RT đều xét giá trị trên những khoảng thời gian
III.4 Định nghĩa tính tương đương:
Xét quan hệ r(RT) hay rT
Trang 17Khái niệm về CSDL có tính thời gian
Ta nói hai bộ t, t’∈rT là tương đương, KH: t≅t’
t≅ t’⇔(∀A∈R⇒t(A)=t'(A))
Ý nghĩa: Hai bộ tương đương nếu và chỉ nếu giá trị các thuộc tính ổn định (R) của chúng giống nhau trên 2 bộ
Ví dụ:
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG VIÊN 3.5 CÓ [2003,2004)
1236 NG.V.C NAM TP.HCM VAT LY PHO KHOA 4.32 CÓ [2004,2005)
Nhận xét:
Có sự trùng lắp thông tin ở những bộ tương đương Cụ thể là trùng lắp thông tin ở các thuộc tính ổn định
Có thể xóa bớt các bộ trùng lắp bằng phép hợp nhất, phép hợp nhất 2 bộ t’ và t” ∈rT
(KH: ⊕)được định nghĩa như sau:
t=t’⊕t” ⇔ (t' ≅t" ) ∧ ( ∀A∈R:t(A) =t' (A) ∪t" (A))
Vậy: muốn hợp nhất 2 bộ t’ và t” của quan hệ thời gian rT trước hết 2 bộ t’ và t” phải tương đương Kết quả của phép hợp nhất là bộ t có: giá trị những thuộc tính ổn định(R) của t giống hai bộ t’ và t”, giá trị những thuộc tính tính thời gian(R) của t là hợp của 2 bộ t’ và t”
- Tổng quát cho n bộ tương đương t1,t2, .,tn là: t= n i
Trang 18Khái niệm về CSDL có tính thời gian
gian thay đổi giá trị của từng thuộc tính và giúp giảm thiểu sự trùng lắp ở những bộ
tương đương
III.5 Quan hệ lồng với giá trị thời gian:(mô hình khắc phục)
Cũng tương tự như định nghĩa quan hệ thường, quan hệ lồng cũng có tập thuộc tính R
nhưng thuộc tính của quan hệ lồng được biểu diễn bởi 1 cặp <T,v> trong đó:
• T biểu diễn giá trị thời gian, cụ thể là khoảng thời gian
• v biểu diễn giá trị của thuộc tính tương ứng với khoảng thời gian t
Nhận thấy: trong quan hệ lồng không có thuộc tính thời gian T đứng độc lập mà thuộc
tính thời gian được lồng vào trong các thuộc tính khác
Ví dụ: xét một quan hệ QUAN_LY_NHÂN_VIÊN như sau:
<[1,10],1234> <[1,10],N.V.A> <(1,4),KẾ TOÁN>
<(5,10),THIẾTBỊ>
<(1,6),3.5>
<(7,10),4.2>
Nhận thấy: khoá của quan hệ là thuộc tính MSCB
Ta có thể phá quan hệ lồng thành quan hệ sau:
<[1,10],1234> <[1,10],N.V.A> <(1,4),KẾ TOÁN> <(1,6),3.5>
<[1,10],1234> <[1,10],N.V.A> <(5,10),THIẾTBỊ> <(1,6),3.5>
<[1,10],1234> <[1,10],N.V.A> <(5,10),THIẾTBỊ> <(7,10),4.2>
Một nhân viên trong suốt quá trình làm việc có thể làm ở nhiều phòng và có nhiều bậc
lương
Bảng thứ 2 có thể gây ra sư thừa dữ liệu khi cập nhật Lý do xảy ra tình trạng trên là tính
không phụ thuộc lẫn nhau giữa hai thuộc tính PHONGBAN và LUONGHS Ta có 2 phụ
thuộc đa trị :MSCB →→ PHONGBAN và MSCB →→LUONGHS
III.6 Các thao tác trên quan hệ có TTG:
Trang 19Khái niệm về CSDL có tính thời gian
Trong đề tài này chỉ xét giá trị thuộc tính thời gian T là một khoảng thời gian [Ts, Te] hoặc [Ts,Te) và trong tập thuộc tính RT có một thuộc tính thời gian duy nhất Nghĩa là: xét các thuộc tính theo một thuộc tính thời gian
Cho t, t’∈rT
Phép kéo theo:
Ta gọi t là kéo theo t’ trên rT, KH: t⎯ ⎯→T t’ nếu: t= t⊕t’
Nghĩa là: giá trị những thuộc tính TTG của t’ phải là tập con của t, t[R]⊃t’[R]
Ví dụ:(*)
Bộ t’ cho như sau:
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG VIÊN 3.0 KHÔNG [2000,2001)
Bộ t cho như sau:
1236 NG.V.C NAM TP.HCM VAT LY GIẢNG
VIÊN, PHÓ KHOA
3.0, 3.5, 4.32, 4.32
KHÔNG CÓ
[2000,2001), [2001,2002), [2002,2003), [2003,2004) [2004,2005) [2005.2006)
Quan hệ tính thời gian r T :
Cho r là một quan hệ bình thường, quan hệ TTG rT với thuộc tính thời gian T thêm vào trong tập thuộc tính
Khi đó quan hệ tính thời gian rT là tập hợp:
rT={t: ∃t'∈r,t'≅t:t⎯⎯→T t'}
Nhận xét: Các biểu diễn quan hệ tính thời gian như trong ví dụ (*) dễ dẫn tới tình trạng
thông tin không rõ ràng, vì không biết sự thay đổi của các thuôc tính ứng với khoảng thời gian nào Vì thế sau này, ta có thể dùng quan hệ lồng để biểu diễn quan hệ tính thời gian