Các vấn đề gặp phải khi tổ chức dữ liệu:

Một phần của tài liệu Giáo trình cơ sở dữ liệu (nghề công nghệ thông tin cao đẳng) (Trang 59 - 60)

Mục tiêu: Trình bày được các vấn đề dị thường dữ liệu mắc phải khi thực hiện

tổ chức và thiết kế cơ sở dữ liệu.

Khi thiết kế, tổ chức cơ sở dữ liệu quan hệ ta thường đứng trước vấn đề lựa chọn các lược đồ quan hệ: lược đồ nào tốt hơn? Tại sao? Mục này sẽ nghiên cứu một

số tiêu chuẩn đánh giá lược đồ quan hệ và các thuật toán giúp chúng ta xây dựng được

lược đồ cơ sở dữ liệu quan hệ có cấu trúc tốt.

Có thể nói tổng quảt, một lược đồ quan hệ có cấu trúc tốt là lược đồ không chứa

sự dư thừa dữ liệu và các dị thường dữ liệu.

- Dư thừa dữ liệu là sự trùng lặp thông tin trong cơ sở dữ liệu.

- Dị thường dữ liệu là các sự cố xảy ra khi cập nhật dữ liệu (lặp, dị thường chèn

bộ, dị thường xóa bộ, dị thường sửa bộ) làm cho dữ liệu không tương thích, bất định hoặc mất mát.

+ Dị thường do dữ liệu lặp: một số thông tin có thể bị lặp lại một cách vô ích. + Dị thường chèn bộ: không thể chèn bộ mới vào quan hệ, nếu không có đầy đủ dữ liệu.

+ Dị thường xóa bộ: ngược lại với dị thường chèn bộ, việc xóa bộ có thể dẫn

đến mất thông tin.

+ Dị thường sửa bộ: việc sửa đổi dữ liệu dư thừa có thể dẫn đến sự không tương thích dữ liệu.

Cơ sở lý thuyết của việc thiết kế lược đồ cơ sở dữ liệu quan hệ tốt là khái niệm phụ thuộc dữ liệu. Phụ thuộc dữ liệu biểu diễn các quan hệ nhân quả giữa các thuộc tính trong quan hệ. Cũng dựa trên khái niệm phụ thuộc dữ liệu người ta định nghĩa các

dạng chuẩn của lược đồ quan hệ. Còn quá trình biến đổi lược đồ thành lược đồ tương

đương thỏa mãn dạng chuẩn gọi là quá trình chuẩn hóa lược đồ quan hệ.

Một phần của tài liệu Giáo trình cơ sở dữ liệu (nghề công nghệ thông tin cao đẳng) (Trang 59 - 60)