Mục tiêu: Trình bày được các vấn đề dị thường dữ liệu mắc phải khi thực hiện tổ chức và thiết kế cơ sở dữ liệu.
Khi thiết kế, tổ chức cơ sở dữ liệu quan hệ ta thường đứng trước vấn đề lựa chọn các lược đồ quan hệ: lược đồ nào tốt hơn? Tại sao? Mục này sẽ nghiên cứu một số tiêu chuẩn đánh giá lược đồ quan hệ và các thuật toán giúp chúng ta xây dựng được lược đồ cơ sở dữ liệu quan hệ có cấu trúc tốt.
Có thể nói tổng quảt, một lược đồ quan hệ có cấu trúc tốt là lược đồ không chứa sự dư thừa dữ liệu và các dị thường dữ liệu.
- Dư thừa dữ liệu là sự trùng lặp thông tin trong cơ sở dữ liệu.
- Dị thường dữ liệu là các sự cố xảy ra khi cập nhật dữ liệu (lặp, dị thường chèn bộ, dị thường xóa bộ, dị thường sửa bộ) làm cho dữ liệu không tương thích, bất định hoặc mất mát.
+ Dị thường do dữ liệu lặp: một số thông tin có thể bị lặp lại một cách vô ích. + Dị thường chèn bộ: không thể chèn bộ mới vào quan hệ, nếu không có đầy đủ dữ liệu.
+ Dị thường xóa bộ: ngược lại với dị thường chèn bộ, việc xóa bộ có thể dẫn đến mất thông tin.
+ Dị thường sửa bộ: việc sửa đổi dữ liệu dư thừa có thể dẫn đến sự không tương thích dữ liệu.
Cơ sở lý thuyết của việc thiết kế lược đồ cơ sở dữ liệu quan hệ tốt là khái niệm phụ thuộc dữ liệu. Phụ thuộc dữ liệu biểu diễn các quan hệ nhân quả giữa các thuộc tính trong quan hệ. Cũng dựa trên khái niệm phụ thuộc dữ liệu người ta định nghĩa các dạng chuẩn của lược đồ quan hệ. Còn quá trình biến đổi lược đồ thành lược đồ tương đương thỏa mãn dạng chuẩn gọi là quá trình chuẩn hóa lược đồ quan hệ.