Chương 5 : LÝ THUYẾT THIẾT KẾ CƠ SỞ DỮ LIỆU
1. Các vấn đề gặp phải khi tổ chức dữ liệu:
Mục tiêu: Trình bày được các vấn đề dị thường dữ liệu mắc phải khi thực hiện
tổ chức và thiết kế cơ sở dữ liệu.
Khi thiết kế, tổ chức cơ sở dữ liệu quan hệ ta thường đứng trước vấn đề lựa chọn các lược đồ quan hệ: lược đồ nào tốt hơn? Tại sao? Mục này sẽ nghiên cứu một
số tiêu chuẩn đánh giá lược đồ quan hệ và các thuật toán giúp chúng ta xây dựng được lược đồ cơ sở dữ liệu quan hệ có cấu trúc tốt.
Có thể nói tổng quảt, một lược đồ quan hệ có cấu trúc tốt là lược đồ không chứa
sự dư thừa dữ liệu và các dị thường dữ liệu.
- Dư thừa dữ liệu là sự trùng lặp thông tin trong cơ sở dữ liệu.
- Dị thường dữ liệu là các sự cố xảy ra khi cập nhật dữ liệu (lặp, dị thường chèn
bộ, dị thường xóa bộ, dị thường sửa bộ) làm cho dữ liệu khơng tương thích, bất định
hoặc mất mát.
+ Dị thường do dữ liệu lặp: một số thông tin có thể bị lặp lại một cách vơ ích. + Dị thường chèn bộ: không thể chèn bộ mới vào quan hệ, nếu khơng có đầy đủ
dữ liệu.
+ Dị thường xóa bộ: ngược lại với dị thường chèn bộ, việc xóa bộ có thể dẫn
đến mất thơng tin.
+ Dị thường sửa bộ: việc sửa đổi dữ liệu dư thừa có thể dẫn đến sự khơng tương thích dữ liệu.
Cơ sở lý thuyết của việc thiết kế lược đồ cơ sở dữ liệu quan hệ tốt là khái niệm
phụ thuộc dữ liệu. Phụ thuộc dữ liệu biểu diễn các quan hệ nhân quả giữa các thuộc tính trong quan hệ. Cũng dựa trên khái niệm phụ thuộc dữ liệu người ta định nghĩa các
dạng chuẩn của lược đồ quan hệ. Cịn q trình biến đổi lược đồ thành lược đồ tương đương thỏa mãn dạng chuẩn gọi là q trình chuẩn hóa lược đồ quan hệ.