Một s Ā dạng chuẩn h漃Āa dZ liệu thông dụng là: o Dạng chuẩn thq nhất First Normal Form - 1NF o Dạng chuẩn thq hai Second Normal Form - 2NF o Dạng chuẩn thq ba Third Normal Form - 3NF o D
Trang 1TRƯỜNG ĐẠI HỌC: CÔNG NGHỆ TP.HCM
KHOA: CÔNG NGHỆ THÔNG TIN
BÁO CÁO TIỂU LUẬN Học phần: Cơ Sở Dữ Liệu Nâng Cao
Chuyên đề:
CHUẨN HOÁ DỮ LIỆU
Họ và tên – MSSV : Nguyễn Công Quý – 2180603884
Nguyễn Thị Hồng Vi – 2180609157 Huỳnh Trung Thiện – 2011069027 Trần Nguyễn Thảo Uyên - 2011068936
Giáo viên hướng dẫn: Phan Đức Trí
TP.HCM, tháng 9/2023
Trang 2BẢNG PHÂN CÔNG CÔNG VIỆC
1 Nguyễn Công Quý Tìm nội dung, Làm file word báo cáo,trình bày phần dạng chuẩn 4 100%
2 Nguyễn Thị Hồng Vi Tìm nội dung, Làm file word báo cáo,trình bày phần dạng chuẩn 3, BC 100%
3 Huỳnh Trung Thiện Tìm nội dung, Làm file ppt thuyết trình,trình bày phần dạng chuẩn 2 100%
4 Trần Nguyễn Thảo Uyên Tìm nội dung, Làm file ppt thuyết trình,trình bày phần dạng chuẩn 1 100%
Trang 3MỤC LỤC
BẢNG PHÂN CÔNG CÔNG VIỆC 1
I Mở đầu 3
II Giới thiệu 3
III Các dạng chuẩn hoá cơ bản 4
1 Dạng chuẩn 1 - 1NF (First Normal Form) 4
a Khái niệm thuộc tính đơn 4
b Định nghĩa Dạng chuẩn 1 4
c Ý nghĩa 4
d Chuẩn hoá 1NF 4
2 Dạng chuẩn 2 - 2NF (Second Normal Form) 5
a Khái niệm phụ thuộc hàm 5
b Định nghĩa Dạng chuẩn 2 5
c Chuẩn hoá 2NF 5
3 Dạng chuẩn 3 - 3NF (Third Normal Form) 5
a Khái niệm phụ thuộc bắc cầu 5
b Định nghĩa Dạng chuẩn 3 5
c Chuẩn hoá 3NF 6
4 Dạng chuẩn BCNF (Boyce - Codd Normal Form) 6
a Định nghĩa Dạng chuẩn BC 6
b Chuẩn hoá BCNF 6
5 Dạng chuẩn 4 - 4NF (Fourth Normal Form) 7
a Phụ thuộc đa trị 7
b Định nghĩa Dạng chuẩn 4 7
c Ý nghĩa 7
d Chuẩn hoá 4NF 7
IV Kết luận 8
TÀI LIỆU THAM KHẢO 9
Trang 4I Mở đầu
Chuẩn hoá dZ liê [u là mô [t ch\ đ] hay và c漃Ā ích Tìm hi]u v] ch\ đ] này dễ dàng tìm kiếm thông tin, gi甃Āp ch甃Āng ta biết ra v] cách giảm lưbng dZ liê [u dư thca và kidm soát không gian dZ liê [u, qua đ漃Ā ta c漃Ā thd giảm lưbng dZ liệu dư thca (ví dụ như lưu trZ cùng một dZ liệu trong 1 bảng) ảm bảo độc lập dZ liệu (dZ liệu liên quan đặt trong, đ
cùng 1 bảng) gi甃Āp giảm thidu không gian sử dụng trong cơ sở dZ liệu và đảm bảo dZ liệu đưbc lưu trZ một cách logic
II Giới thiệu
Chuẩn hoá là mô [t kn thuâ [t thiết kế cơ sở dZ liê [u tp chqc các bảng theo cách làm giảm sr dư thca và phụ thuô [ c c\a dZ liê [u N漃Ā chia các bảng lớn hơn thành các bảng nhs hơn và liên kết ch甃Āng btng các m Āi quan hê [
Chuẩn h漃Āa cơ sở dZ liệu là một phương pháp khoa học đd phân tách (scientific method of breaking down) một bảng c漃Ā cấu tr甃Āc phqc tạp (complex table structures) thành nhZng bảng c漃Ā cấu tr甃Āc đơn giản (simple table structures) theo nhZng quy luật đảm bảo (certain rule) không làm mất thông tin dZ liệu Kết quả là sẽ làm giảm bớt sr
Trang 5dư thca và loại bs nhZng sr c Ā mâu thuẫn v] dZ liệu, tiết kiệm đưbc không gian lưu trZ Một s Ā dạng chuẩn h漃Āa dZ liệu thông dụng là:
o Dạng chuẩn thq nhất (First Normal Form - 1NF)
o Dạng chuẩn thq hai (Second Normal Form - 2NF)
o Dạng chuẩn thq ba (Third Normal Form - 3NF)
o Dạng chuẩn Boyce-Codd (Boyce-Codd Normal Form - BCNF)
Chuẩn h漃Āa dZ liệu còn c漃Ā ý nghĩa khác ngoài việc lưu trZ dZ liệu trên các máy tính
Đ Āi với các văn bản, việc chuẩn h漃Āa dZ liệu c漃Ā thd làm cho văn bản trở nên dễ đọc hơn không vướng vào nhZng trường hbp v] hidn thị
Ví dụ: Tồn tại nhZng dòng mà chỉ c漃Ā 1 dấu “.” do c漃Ā khoảng trắng trước dấu chấm
cu Āi cùng Chuẩn h漃Āa dZ liệu khiến cho máy vi tính c漃Ā thd hidu đưbc ý nghĩa trong câu nếu nhZng tc ngZ đưbc viết đ甃Āng chuẩn
III Các dạng chuẩn hoá cơ bản
Dạng chuẩn c\a 1 lưbc đồ cơ sở dZ liệu là dạng chuẩn thấp nhất trong các LĐQH c\a LĐCSDL
C漃Ā 4 dạng chuẩn hoá cơ bản tc thấp đến cao: 1NF, 2NF, 3NF, BCNF
o Đd chuẩn hoá 2NF thì cơ sở dZ liê [u phải đạt chuẩn 1NF
o Đd chuẩn hoá 3NF thì cơ sở dZ liê [u phải đạt chuẩn 1NF và 2NF
o Chuẩn BCNF gồm 3 loại 1NF, 2NF, 3NF
1 Dạng chuẩn 1 - 1NF (First Normal Form)
a Khái niệm thuộc tính đơn
Trang 6Thuộc tính đơn: Giá trị c\a n漃Ā không phải là sr kết hbp bởi nhi]u thông tin c漃Ā ý nghĩa khác nhau và hệ th Āng luôn truy xuất trên toàn bộ giá trị c\a n漃Ā, ít truy xuất đến tcng phần dZ liệu c\a n漃Ā Ngưbc lại, là thuộc tính kép
b Định nghĩa Dạng chuẩn 1
Mô [t bảng cơ sở dZ liê [u đưbc gọi là ở dạng chuẩn 1NF khi và chỉ khi mi]n c\a mỗi thuộc tính chỉ chqa các giá trị nguyên t Ā (không thd phân chia) và giá trị c\a mỗi thuộc tính chỉ chqa một giá trị tc mi]n đ漃Ā
c Ý nghĩa
1NF là một thuộc tính thiết yếu c\a một m Āi quan hệ trong cơ sở dZ liệu quan hệ Chuẩn h漃Āa cơ sở dZ liệu là quá trình bidu diễn cơ sở dZ liệu theo quan hệ dưới dạng chuẩn, trong đ漃Ā 1NF là một yêu cầu t Āi thidu
Quy ước: mọi lưbc đồ quan hê [ đ]u đạt 1NF
d Chuẩn hoá 1NF
Giả sử K là kh漃Āa c\a lưbc đồ quan hệ R và A là thuộc tính đa trị hoặc là nh漃Ām thuộc tính lặp
Đd chuẩn h漃Āa R v] 1NF:
o Loại A ra khsi R
o Tạo một lưbc đồ quan hệ mới S(K, A) với kh漃Āa chính c\a S là:
{K, A} nếu A là thuộc tính đa trị
{K,KA} nếu A là nh漃Ām thuộc tính lặp, K là kh漃Āa bộ phận c\a AA
Ví dụ:
o Lưbc đồ DONVI(MaDV, TenDV, MaNQL, Diadiem), với Diadiem là thuộc tính đa trị
Loại Diadiem ra khsi DONVI: DONVI(MaDV, TenDV, MaNQL)
Tạo lưbc đồ quan hệ mới: DIADIEMDV(MaDV, Diadiem)
o Lưbc đồ NHANVIEN_LAMVIEC(MaDA, TenDA, MaNV, Sogio), trong đ漃Ā (MaNV, Sogio) là nh漃Ām thuộc tính lặp
Loại (MaNV, Sogio) ra khsi NHANVIEN_LAMVIEC: NHANVIEN_LAMVIEC (MaDA, TenDA)
Trang 7 Tạo lưbc đồ quan hệ mới: NHANVIEN_SOGIO(MaDA, MaNV, Sogio)
2 Dạng chuẩn 2 - 2NF (Second Normal Form)
a Khái niệm phụ thuộc hàm
o Một phụ thuộc hàm X Y là một phụ thuộc hàm đầy đ\ nếu bs đi bất kỳ một thuộc tỉnh A – X thì phụ thuộc hàm đ漃Ā không còn đ甃Āng nZa
o Nếu tồn tại một thuộc tính B sao cho (X – B) Y, ch甃Āng ta n漃Āi rtng Y phụ thuộc hàm bộ phận vào X
b Định nghĩa Dạng chuẩn 2
Mô [t bảng cơ sở dZ liê [u đưbc gọi là ở dạng chuẩn 2NF khi:
o Là dạng chuẩn 1NF
o Các thuô [c tính không khoá phải phụ thuô [c hàm đầy đ\ vào khoá
c Chuẩn hoá 2NF
o Giả sử R là lưbc đồ quan hệ ở dạng chuẩn 1NF và không là 2NF, c漃Ā kh漃Āa K
o Đd chuẩn h漃Āa R v] 2NF, đ Āi với mỗi nh漃Ām thuộc tính không kh漃Āa X p thuộc hàm bộ phận vào K:
Loại X ra khsi R
Gọi kh漃Āa bộ phận c\a K xác định hàm X là K : KX X X
Tạo lưbc đồ quan hệ mới S(K , X) với K là kh漃Āa chínhX X
Ví dụ:
o Lưbc đồ quan hệ ở dạng chuẩn 1NF:
NHANVIEN_DUAN(MaNV, MaDA, Sogio, Hoten, TenDA, Diadiem) với các phụ thuộc hàm:
{MaNV, MaDA} {Sogio, Hoten, TenDA, Diadiem}
MaNV Hoten (phụ thuộc hàm bộ phận)
MaDA {TenDA, Diadiem} (phụ thuộc hàm bộ phận)
o NHANVIEN_DUAN không là 2NF do Hoten, TenDA và Diadiem phụ thuộc hàm bộ phận vào kh漃Āa chính {MaNV, MaDA}
o Chuẩn h漃Āa v] 2NF:
Loại Hoten, TenDA, Diadiem ra khsi NHANVIEN_DUAN: NHANVIEN_DUAN1(MaNV, MaDA, Sogio)
Trang 8 Tạo lưbc đồ quan hệ mới 1: N (MaNV, Hoten) 1
Tạo lưbc đồ quan hệ mới 2: N (MaDA, TenDA, Diadiem)2
3 Dạng chuẩn 3 - 3NF (Third Normal Form)
a Khái niệm phụ thuộc bắc cầu
Một phụ thuộc hàm X Y trong một lưbc đồ quan hệ R là một phụ thuộc hàm bắc cầu nếu tồn tại một tập hbp thuộc tính Z c\a R không phải là kh漃Āa và không phải là tập con c\a kh漃Āa sao cho X Z và Z Y đ]u đ甃Āng.
b Định nghĩa Dạng chuẩn 3
Mô [t bảng cơ sở dZ liê [u đ\ tiêu chí dạng chuẩn 3NF khi:
o Là dạng chuẩn 2NF
o Không c漃Ā thuộc tính không khoá nào c\a lưbc đồ quan hệ phụ thuộc hàm bắc cầu vào khoá chính
c Chuẩn hoá 3NF
o Giả sử R là lưbc đồ quan hệ c漃Ā kh漃Āa chính K; R ở dạng chuẩn 2NF và không ở dạng chuẩn 3NF
o Đd chuẩn h漃Āa R v] 3NF, với mỗi thuộc tính X phụ thuộc bắc cầu vào K:
Loại bs X ra khsi R
Gọi Y là thuộc tính bắc cầu, ta c漃Ā: K → Y và Y X
Tạo lưbc đồ quan hệ mới S(Y,X) với Y là kh漃Āa chính
Ví dụ:
o Lưbc đồ LAMVIEC (MaNV, Hoten, Ngaysinh, MaDV, TenDV, MaDA, TenDA) với các thuộc tính đơn, ở dạng chuẩn 2NF vì kh漃Āa chính chỉ c漃Ā một thuộc tính ( không c漃Ā phụ thuộc hàm bộ phận), c漃Ā các phụ thuộc hàm:
MaNV {Hoten, Ngaysinh, MaDV, TenDV, MaDA, TenDA}
MaDV TenDV
MaDA TenDA
Trang 9LAMVIEC không ở dạng chuẩn 3NF vì các phụ thuộc hàm bắc cầu
MaNV MaDV TenDV và MaNV MaDA TenDA
o Chuẩn h漃Āa LAMVIEC v] 3NF:
Loại {TenDV, TenDA} phụ thuộc bắc cầu vào kh漃Āa chính: LAMVIEC (₁ MaNV, Hoten, Ngaysinh, MaDV, MaDA)
Tạo lưbc đồ quan hệ mới N (MaDV, TenDV)1
Tạo lưbc đồ quan hệ mới N (MaDA, TenDA)2
4 Dạng chuẩn BCNF (Boyce - Codd Normal Form)
a Định nghĩa Dạng chuẩn BC
Mô [t quan hê [ đạt chuẩn BCNF nếu quan hê [ đ漃Ā:
o Là dạng chuẩn 3NF
o Không c漃Ā thuô[c tính khoá phụ thuô [c hàm vào thuô[c tính không khoá
b Chuẩn hoá BCNF
o Giả sử R là lưbc đồ quan hệ c漃Ā kh漃Āa K, R là 3NF và không là BCNF
o Đd chuẩn h漃Āa R v] BCNF, đ Āi với mỗi thuộc tính không kh漃Āa A xác định hàm thuộc tính kh漃Āa A K , với K K: S S
Loại K ra khsi R và bp sung A vào kh漃Āa chính c\a R Kh漃Āa chính mớiS
c\a R là: K – K {A} S
Tạo lưbc đồ mới S(A, K ) với A là kh漃Āa chínhS
Ví dụ:
o Lưbc đồ R(A , A , A , A , A , A ) c漃Ā các phụ thuộc hàm:1 2 3 4 5 6
{A1, A } {A , A , A , A }: {A , A } là kh漃Āa chính2 3 4 5 6 1 2
A4 A2
A6 A1
o R là 2NF (không c漃Ā phụ thuộc hàm bộ phận) và 3NF (không c漃Ā phụ thuộc hàm bắc cầu tc kh漃Āa chính)
o R không là BCNF vì c漃Ā thuộc tính kh漃Āa phụ thuộc hàm vào thuộc tính không kh漃Āa
o Chuẩn h漃Āa v] BCNF:
Trang 10 Loại A ra khsi R và bp sung A vào kh漃Āa chính: R(A , A , A , A , A )2 4 1 4 3 5 6
Tạo quan hệ mới S1(A , A ) với A là kh漃Āa chính4 2 4
Loại A ra khsi R và bp sung A vào kh漃Āa chính: R(A , A , A3, A5)1 6 6 4
Tạo quan hệ mới S2(A6, A ) với A là kh漃Āa chính1 6
5 Dạng chuẩn 4 - 4NF (Fourth Normal Form)
a Phụ thuộc đa trị
Cho một lưbc đồ quan hệ Q(X,Y,Z) với X Q , Y Q , X Y= Ø và Z = Q \ {X,Y}+ + +
Ký hiệu X >> Y là một Phụ thuộc hàm đa trị đưbc định nghĩa trên Q nếu mỗi giá trị x c\a X xác định duy nhất một tập giá trị {y1, y2 } c\a Y, và tập giá trị này không phụ thuộc vào các giá trị c\a Z trong các bộ c漃Ā liên quan đến x, y1, y2
Nghĩa là: Với mọi bộ (x, z1), (x, z2) = Q[X,Z] thì
(Q: X=x và Z = z1)[Y] = (Q:X=x và Z = z2)[Y]
b Định nghĩa Dạng chuẩn 4
Mô [t lưbc đồ đạt chuẩn 4NF nếu lưbc đồ đ漃Ā:
o Là dạng chuẩn BCNF
o Không c漃Ā phụ thuộc đa trị không hidn nhiên X >> Y đưbc định nghĩa trên lưbc đồ Nghĩa là X >> Y thì (Q \ X Y) = +
Mục đích: Không cho phép xuất hiện phụ thuộc hàm đa trị không hidn nhiên trên một quan hệ Nếu c漃Ā cần tách nhs các quan hệ nhtm biến các phụ thuộc đa trị không hidn nhiên thành hidn nhiên trong các quan hệ mới đd không cần kidm tra nZa
c Ý nghĩa
Cho F là tập phụ thuộc hàm và phụ thuộc đa trị trên U Lưbc đồ quan hệ R thuộc U
ở dạng chuẩn 4 đ Āi với F nếu mọi phụ thuộc đa trị X >> Y đưbc bao hàm trong F áp dụng cho R thì phụ thuộc đa trị này là tầm thường hoặc X là một siêu kh漃Āa c\a R
d Chuẩn hoá 4NF
Đd chuẩn hoá lưbc đồ quan hệ v] 4NF ta phải loại bs các phụ thuộc đa giá trị
Ví dụ:
Trang 11Xét LICHTHI(Ngay, Gio, Phong, Mon)
C漃Ā F = { Ngay, Gio, Phong >> Mon; d1: Mon >> Phong}
o LICHTHI không đạt dạng chuẩn 4NF
o Tách LICHTHI thành 2 quan hệ:
LICHTHI1(Mon, Phong) , FLT1 = {Mon >> Phong}
LICHTHI2(Ngay, Gio, Mon) , FLT2 =
o Quan hệ LT1 c漃Ā khoá là {Mon, Phong} và chỉ c漃Ā phụ thuộc đa trị hidn nhiên
là Mon >> Phong nên LICHTHI đạt dạng chuẩn 4
IV.Kết luận
Đd đánh giá mqc độ trùng lắp thông tin người ta dra vào việc chuẩn h漃Āa dZ liệu Dạng chuẩn càng cao việc trùng lắp càng thấp Một lưbc đồ CSDL đạt dạng chuẩn 3 là chấp nhận đưbc
Dạng chuẩn 1: Mọi thuộc tính là thuộc tỉnh c漃Ā giá trị đơn, sr trùng lắp do vi phạm dạng chuẩn 1 là trùng lắp do không nhất quán bởi nhi]u giá trị khác nhau c\a một thuộc tính cho một quan hệ c漃Ā thd bidu diễn nhi]u cách khác nhau cho một quan hệ: Ví
dụ X:(a,b,c) hay X:(b, a, c) Hơn nZa kh漃Ā truy vấn và khai thác
Dạng chuẩn 2: Mọi thuộc tính không kh漃Āa phụ thuộc đầy đ\ vào kh漃Āa, trùng lắp do
vi phạm dạng chuẩn 2 xẩy ra khi phụ thuộc vào con c\a kh漃Āa
Dạng chuẩn 3: Mọi thuộc tính không kh漃Āa không phụ thuộc bắc cầu vào kh漃Āa, trùng lắp do vi phạm dạng chuẩn 3 xảy ra khi phụ thuộc bắc cầu vào kh漃Āa
Dạng chuẩn BC: Mọi phụ thuộc hàm không hidn nhiên đ]u c漃Ā vế trái chqa khoá Dạng chuẩn 4: Mọi phụ thuộc hàm đa trị đ]u hidn nhiên, trùng lắp do lặp lại đa trị
do không phụ thuộc vào ngZ cảnh Ứng dụng c\a đa trị cho ta phép kết không dra vào kh漃Āa nhưng không dư thca thông tin
Trang 12TÀI LIỆU THAM KHẢO
[1.] Sách giáo trình Cơ sở dZ liệu nâng cao (ThS Văn Như Bích, 2018)
[2.] https://viblo.asia/p/tong-hop-ve-chuan-hoa-co-so-du-lieu-ORNZqP33K0n
[3.] https://vi.m.wikipedia.org/wiki/Chuẩn_hoá_dZ_liệu
[4.] https://meeycrm.com/tin-tuc/chuan-hoa-du-lieu-la-gi