1. Định nghĩa các thuật ngữ: cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, hệ cơ sở dữ
15.2. Các dạng chuẩn
Sự cần thiết chuẩn hóa dữ liệu
Khi thực hiện các phép lưu trữ trên các quan hệ chưa được chuẩn hóa thường xuất hiện các dị thường thông tin. Nghĩa là trong dữ liệu lưu trữ, sự dư thừa, mất dữ liệu, mâu thuẫn hay không nhất quán dữ liệu có thể xảy ra khi cập nhật, bổ sung hay sửa đổi dữ liệu. Dị thường thông tin là nguyên nhân gây cản trở cho việc tìm khiếm, hỏi đáp thông tin. Mục tiêu của chuẩn hóa dữ liệu là triệt tiêu mứccao nhất khả năngxuất hiện các dị thường thông tin khi thực hiện các phép lưu trữ. Có như vậy mục tiêu của các hệ cơ sở mới được đảm bảo. Dữ liệu lưu trữ phản ánh thế giới hiện thực khách quan, đầy đủ hơn và sinh động hơn.
Khi thiết kế và cài đặt các hệ CSDL, chuẩn hóa là quá trình khảo sát dang sách các thuộc tính và áp dụng tập các quy tắc phân tích vào danh sách đó, biến đổichúng thành nhiều tập nhỏ hơn sao cho:
•Tối thiểuviệc lặplại.
•Tránh dị thường thông tin
•Xác định và giải quyếtđược sự không rõ ràng, nhập nhằng trong suy diễn.
Quá trình chuẩn hóa là quá trình tách lược đồ quan hệ về một nhóm tương đương các lược đồ quan hệ chiếu sao cho khi kết nốitựnhiên không làm tổn thất thông tin và bảo toàn được các phụ thuộc hàm. Cơ sở chuẩn hóa dựa trên các khái niệm về phụ thuộc hàm, phụ thuộc đầy đủ, khóa, các thuộc tính không khóa... Một mô hình được xem là mô hình chuẩn hóa tốt, lý tưởng là mô hình ở đó mỗi một thuộc thuộc tính không khóa phụ thuộc hàm vào khóa.
Quan hệ chuẩn hóa là những quan hệ mà mỗi giá trị thuộc tính trong bộ là những thuộc tính nguyên tố, không phân chia ra đựợc. Mói cách khác, mỗi toạ độcủahàng và cột trong quan hệ chỉ có đúngmột giá trị chứ không phải là một các giá trị.
Ví dụ:
Ngữ nghĩa dữ liệu như sau:
+, Trong một tuyến cáp, giá trịcủamộtloạicáp được xác định duy nhất. +, Mỗimã cáp xácđịnh mã nướcsản xuất cáp, và
+, Mã nước xác định tên nước sản xuất
F = {(TC#,MC#) →GTR, MC# →NSX, MC# → N#, N# → NSX} tập các phụ thuộc hàm. Các thuộc tính khóa: (TC#,MC# ) và các thuộc tính không khóa: GTR, N#, NSX.
GTC MC#
TC#
NSX
N#
Hình 15.1 Sơ đồ các phụ thuộc hàm trong lược đồ quan hệ QLCAP
TC# GTR MC# N# NSX T01 200 C01 HAQ Hàn Quốc T01 250 C02 HAQ Hàn Quốc T01 220 C03 VTN Việt Nam T02 500 C01 HAQ Hàn Quốc T02 400 C04 JAN Nhật Bản T03 100 C05 RUS Nga T04 400 C06 CHN Trung Quốc T05 450 C03 VTN Việt Nam
Hình 15.2. Một thể hiện của lược đồ quan hệ
15.2.1.Dạng chuẩn 1(1NF-first normal form)
Một lược đồ quan hệ =(U, F) được gọi làở dạng chuẩn 1(1 NF) nếu và chỉ nếu tất cả miền giá trị của các thuộc tính của R đều nguyên tố(không thể phân chia được).
Chú ý:Tính không thể phân chia được chỉ có tính chất tương đối.
Định nghĩa này cho thấy ngay rằng bất kỳ quan hệ chuẩn hóa nào cũng ở 1NF.
Ví dụ: Xét quan hệ S(S#, PRO), thấy rằng thuộc tính PRO chứa các giá trị không nguyên tố. Vì vậy quan hệ này không phải là quan hệ dạng chuẩn 1NF. S# PRO P# QTY S1 100 1 200 1 300 2 S2 100 2 200 2 S3 300 3 100 1 Hình 15.3. Một thí dụ quan hệ không 1NF