Chuẩn hóa lược đồ quan hệ theo thời gian

Một phần của tài liệu nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen (Trang 46 - 49)

- Nếu F├f X →tY thì t là cận dưới lớn nhất (glb) của một số các kiểu thờ

i Y Áp dụng T4, ta có: F├ X →tY Định lý được chứng mnh □

2.4. Chuẩn hóa lược đồ quan hệ theo thời gian

Tương tự như CSDL truyền thống, hầu hết các lược đồ quan hệ trong CSDL có yếu tố thời gian bước đầu thường được xây dựng dựa trên kinh nghiệm của người thiết kế và khơng có một quy tắc hình thức nào, do đó sẽ có một số lược đồ được tạo ra khơng thích hợp với bài tốn, có thể xuất hiện các dư thừa dữ liệu và những dị thường khi cập nhật dữ liệu. Lý thuyết chuẩn hóa cho phép người thiết kế thu được những lược đồ mong muốn, khắc phục được những hạn chế kể trên.

Định nghĩa 2.24. (Phép chiếu tập TFD lên tập thuộc tính)

Cho M = (R, t,φ) với F là tập các TFD, và Z ⊆ R . Khi đó, phép chiếu tập phụ thuộc hàm theo thời gian F lên tập thuộc tính Z, ký hiệu πZ(F) là tập các

TFD được xác định như sau:

πZ(F) = {X →t Y | F ╞ X tY , XY ⊆ Z}

Nhận xét:

+ πZ(F) có thể là vơ hạn do có vơ số các TFD được suy dẫn logic từ tập F cho trước, hay có nhiều X →t Y ∈ F+.

+ Vì ta biết cách tính bao đóng của tập thuộc tính nên ta có thể tính một “phủ hữu hạn” của phép chiếu F lên Z như sau:

πZ(F) = {X →tA1 ... Am | XA1...Am ⊆ Z và (Ai, t) ∈ X+ với 1 ≤ i ≤ m}

Rõ ràng πZ(F) hữu hạn do X là hữu hạn. Với tính đầy đủ của ba tiên đề hệ

quả hữu hạn và định nghĩa F+, rõ ràng πZ(F) là một “phủ hữu hạn” của πZ(F).

Mệnh đề 2.2.

πZ(F) = {X →t’A1 ... Am | X tiAi ∈ πZ(F) với 1 ≤ i m và t’ ≼C{t1, ..., tm}}

Nhận xét:

πZ(F) bao gồm các TFD tầm thường và các TFD không tầm thường (là

TFD mà vế phải khơng là con của vế trái). Vì vậy, việc xác định Fi (i = 1,k) có thể dựa vào việc xác định phủ tối thiểu của πZ(F), theo thuật toán sau:

Thuật toán 2.3. (Chiếu tập TFD lên tập thuộc tính)

Vào: + Lược đồ môđun thời gian (R, t) và + Tập các phụ thuộc hàm theo thời gian F

Ra: πZ(F)

Phương pháp:

+ Bước1. Lần lượt tính các bao đóng của các tập con thực sự của Z trên F. + Bước 2. Suy ra các phụ thuộc hàm không tầm thường, ký hiệu F’ mà vế phải chỉ có một thuộc tính thuộc Z.

+ Bước 3. Tìm G là phủ tối thiểu của F’ Kết luận: πZ(F) = G

Ví dụ 2.22. Cho M = (R, Ngày, φ) với R = ABCD và

F = { A →NgàyD, D NgàyB, A ThángC}

Cho Z = (ABC). Áp dụng thuật tốn 2.3, ta có: Bước1. Tính các bao đóng:

A+

F = {(A, tTop); (D, Ngày); (B, Ngày); (C, Tháng)} B+

F = {(B, tTop)} C+

F = {(C, tTop)} AB+

F = {(A, tTop); (B, tTop); (D, Ngày); (C, Tháng)} AC+

F = {(A, tTop); (C, tTop); (D, Ngày); (B, Ngày)} BC+

F = {(B, tTop); (C, tTop)} Bước 2. Xác định F’:

F’ = {A →NgàyB, A ThángC, AB ThángC, AC NgàyB}

Bước 3. Tìm G là phủ tối thiểu của F’:

Ta có: π∅ (F’) = {A →B, A →C, AB →C, AC →B} Phủ tối thiểu của π∅ (F’) là: π∅(F’) = {A →B, A →C} + Với A → B ∈ π∅(F’): vì (B, Ngày) ∈ A+

+ Với A → C ∈ π∅(F’): vì (C, Tháng) ∈ A+

F nên ta có: G = {A →NgàyB, A ThángC}

Vậy πZ(F) = {A →NgàyB, A →ThángC}

Tương tự như CSDL truyền thống, với CSDL có yếu tố thời gian, sự dư thừa dữ liệu trong các lược đồ môđun thời gian thường được tạo ra từ tập các TFD cho trước. Chính vì thế, để tránh được điều này ta phải thực hiện việc chuẩn hóa lược đồ mơđun thời gian nhằm đưa nó về một dạng chuẩn nào đó. TBCNF là một trong các dạng chuẩn cho phép loại bỏ những dư thừa dữ liệu do các TFD gây nên.

Một phần của tài liệu nghiên cứu các phụ thuộc hàm theo thời gian, thông qua hai quan điểm của wang và wijsen (Trang 46 - 49)

Tải bản đầy đủ (DOC)

(112 trang)
w