Phộp kết nối

Một phần của tài liệu Tài liệu học tập cơ sở dữ liệu (Trang 164)

b. Phộp tỏch lược đồ quan hệ thành 3NF

4.5.1Phộp kết nối

Giả sử .

Giả sử, chốn thờm vào R một tập IR . Nếu giỏ trị cũ của R được biểu thị bằng Rold , và giỏ trị mới của R bằng Rnew, thỡ Rnew= Rold∪ IR .

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

Khi đú, giỏ trị cũ của Voldđược biểu diễn bởi ,và giỏ trị mới Vnew được biểu diễn bởi .

Khi đú biểu diễn biểu thức tối ưu như sau:

Như vậy, khi thực hiện phộp chốn thờm, nếu sử dụng phương phỏp khung nhỡn cụ thể húa, thỡ việc thực hiện sẽ đơn giản hơn, chỉ cần thờm vào nội dung cũ. Tương tự, giả sử cần xúa một số bộ DRkhỏi quan hệ R, với khung nhỡn cụ thể húa, chỉ cần thực hiện: 4.5.2 Phộp chọn và phộp chiếu  Xem xột phộp chọn V = σF(R): • Chốn thờm tập cỏc bộ IRvào quan hệ R: • Xúa khỏi R một tập cỏc bộ DR:  Xem xột phộp chọn V = ΠA(R):

Giả sử quan hệ R cú dạng R=(A,B) và chứa hai bộ (a,2) và (a,3). Sau khi thực hiện phộp chiếu trờn thuộc tớnh A, quan hệ kết quả ΠA(R) chứa bộ đơn (a). Nếu xúa bộ (a,2) ra khỏi R:

• Xúa trực tiếp từ ΠA(R): khi đú quan hệ ΠA(R) là quan hệ rỗng.

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

Như vậy tựy từng trường hợp cụ thể sử dụng phương phỏp khung nhỡn. Trong trường hợp xúa sau phộp chiếu đỳng, nếu lực lượng của ΠA(R) lớn hơn 1. Ngược lại sẽ cho kết quả sai.

4.5.3 Cỏc phộp toỏn khối

Cỏc phộp toỏn khối, về nguyờn tắc cũng như cỏc phộp chiếu và chọn. Cỏc phộp khối trong SQL là cỏc phộp COUNT(), SUM() , AVG(), MIN() và MAX().

 COUNT(): Xem xột khung nhỡn cụ thể húa V= COUNT(GROUP BY A)), phõn hoạch theo thuộc tớnh A và đếm theo nú: Chốn

• Nếu khụng tồn tại, chốn thờm ( t.A.1) vào khung nhỡn cụ thể húa. • Nếu tồn tại ( t.A) , thờm 1 vào giỏ trị đếm của nhúm.

 SUM(): V = SUM(GROUP BY A)).  AVG()

 MIN(), MAX().

4.5.4 Cỏc phộp toỏn khỏc

 Phộp giao tập hợp: V = R ∩ S, : • Chốn một bộ vào R.

• Xúa khỏi tập giao nếu nú tồn tại trong đú.

 Cỏc phộp toỏn tập hợp khỏc: Hợp và hiệu được thực hiện theo kiểu tương tự .

4.5.5 Tối ưu húa cỏc cõu hỏi và cỏc khung nhỡn cụ thể húa

Tối ưu húa cỏc cõu hỏi cú thể được thực hiện bằng cỏch xem cỏc khung nhỡn cụ thể hoỏ nhưlà cỏc quan hệ . Tuy nhiờn, sử dụng phương phỏp cỏc khung nhỡn cụ thể húa tựy trong cỏc trường hợp cụ thể.

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

 Biến đổi cõu hỏi để sử dụng khung nhỡn cụ thể húa: Giả sử cú một khung nhỡn cụ thể và một cõu hỏi . Khi đú cõu hỏi cú thể biến đổi và được sử dụng khung nhỡn cụ thể như sau:

 Thay thế khung nhỡn cụ thể bằng khung nhỡn bỡnh thường. Giả sử cú một khung nhỡn cụ thể và một cõu hỏi của người sử dụng yờu cầu thực hiện: σA= 10(V). Giả sử S cú một chỉ số trờn thuộc tớnh B và R cú một chỉ số trờn thuộc tớnh A. Khi đú phương ỏn tốt nhất cho cõu hỏi này cú thể thay thế khung nhỡn cụ thể V bởi khung nhỡn bỡnh thường:

.

Phộp chọn và kết nối cú thểđược thực hiện một cỏch hiệu quả bằng cỏch sử dụng tương ứng cỏc chỉ số trong R.A và S.B . Ngược lại đỏnh giỏ phộp chọn một cỏch trực tiếp trờn V cú thể đũi hỏi sự quột toàn bộ V mà cú thể tốn kộm hơn nhiều.

4.5.6. Bài tập tối ưu hoỏ cỏc cõu hỏi.

Xột cỏc quan hệ sau: TUYEN (TC#, TC, DAI) CAP (MC#, MC, GIA, N#, NSX) L_DAT (TC#, MC#, SL) Trong đú: TC# : Mó tuyến cỏp; MC# : Mó cỏp TC :Tờn tuyến cỏp; MC :Tờn gọi cỏp

DAI :Độ dài tuyến cỏp; GIA :Đơn giỏ loại cỏp N# :Mó nước sản xuất cỏp;

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

NSX :Tờn nước sản xuất cỏp. SL :Số lượng cỏp lắp đặt

Ngữ nghĩa của dữ liệu như sau:

 Trờn một tuyến cỏp cú nhiều loại cỏp khỏc nhau đựục lắp đặt.

 Một loại cỏp cú thể được lắp đặt trờn nhiều tuyến.

 Thụng tin về tuyến cỏp: khụng tồn tại 2 mó tuyến trựng nhau.

 Khụng tồn tại mó 2 loại cỏp trựng nhau.

Vớ dụ: Hóy liệt kờ tất cả thụng tin về cỏc tuyến cỏp cú độ dài trờn 50 km và lắp đặt cỏc

loại cỏp do Việt nam sản xuất.

Hỡnh vẽ: a) Cõy đại số ban đầu chưa tối ưu húa

b) Cõy đại số đótối ưu húa

a) Biểu thức đại số quan hệ ban đầu như sau:

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

Kết nối tự nhiờn cỏc quan hệ TUYEN, CAP và L_DAT tạo thành một quan hệ trung gian với lực lượng bằng tớch của bậc của 3quan hệ và cỏc thuộc tớnh là thuộc tớnh của 3 quan hệ.

Tiếp theo thực hiện phộp chọn với điều kiện chỉ quan tõm đến cỏc lụại cỏp do Việt nam sản xuất được lắp đặt trờn cỏc tuyến cú chiều dài trờn 50 Km.

b) Biểu thức tối ưu

Đõy là biểu thức tương đương với biểu thức ban đầu. Quan hệ trung gian cú kớch thước nhỏ hơn cũng nhưvề lực lượng. Thời gian thực hiện nhanh hơn, chi phớ bộ nhớ ớt hơn.

Trước tiờn thực hiện phộp chọn trờn quan hệ TUYEN, tạo quan hệ trung gian bao gồm cỏc bộ thỏa chiều dài trờn 50 km.

Phộp chọn trờn cỏc quan hệ CAP, tạo ra quan hệ cú một bộ duy nhất, nước sản xuất là Việt Nam, và trờn quan hệ L_DAT, gồm cỏc bộ thỏa N# =’VNA’.

Khi thực hiện phộp kết nối cỏc quan hệ trung gian trờn, sẽ cú quan hệ kớch thước nhỏ hơn và lực lượng bộ hơn, chi phớ thấp hơn.

Vớ dụ: Hóy cho biết thụng tin về cỏc loại cỏp do Việt nam sản xuất được lắp đặt trờn

cỏc tuyến “T01” (Hà nội- Quảng ninh) và “T02” (Hà nội –Hải phũng) trong cỏc năm 1990 đến 1999 cú giỏ trị trờn 2 tỷ đồng Viờt nam.

Giả sử khung nhỡn cần phải tạo cú tờn là CAP_VN chứa cỏc thụng tin về M# mó cỏp, MC tờn cỏp, GIA giỏ cỏp, T_DAI tổng độ dài và giỏ trị của cựng loại cỏp GTR.

Để tạo khung CAP_VN cần kết nối cỏc quan hệ TUYEN, CAP và L_DAT: πS(σF (TUYEN x CAP x L_DAT).

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

Trong đú:

S là danh sỏch khung nhỡn: CAP_VN: S = M#, MC, GIA, T_DAI, GTR.

Điều kiện chọn F:

F = (T# = “T01” ∨ T# =”T02” ) ∧ (NSX=’Viẹt Nam’ ) ∧

(1990 ≤ NG ≤ 1999 ) ∧ (SUM(DAI*SL*GIA) ≥ 2) ∧

(TUYEN.T#= L_DAT.T# ) ∧ (CAP.M# = L_DAT.M#))

Cõy đại số chưa tối ưu húa

Tỏch biểu thức chọn F:

F1 = {1990 ≤ NG ≤ 1999} F2 = {NSX=’Việt Nam’ }

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP F3 = {T# = “T01” ∨ T# =”T02” } F4 = { TUYEN.T#= L_DAT.T# } F5 = {CAP.M# = L_DAT.M# } F6 = {SUM(DAI*SL*GIA) ≥ 2} T1 = πT#,DAI(σF3 (TUYEN )) = πT#,DAI (σ T# = “T01” ∨ T# =”T02” (TUYEN )) T2 = πT#,M#,SL(σ F1 (L_DAT)) = π T#,M#,SL(σ 1990 ≤ YEAR ≤ 1999 (L_DAT)) T3 = π M#,MC,GIA(σ F2 (CAP)

= π M#,MC,GIA(σ NSX=’Viẹt Nam’ (CAP)) T4 = σ F6 (( T1 F4 T2) F5 T3) T5 =π M#, MC (T4) .

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP Biểu diễn bằng ngụn ngữ SQL: CREATE VIEW T1 AS SELECT T#, DAI FROM TUYEN WHERE T#="T01" AND T#="T03" CREATE VIEW T2 AS SELECT T#, M#, SL FROM L_DAT

WHERE YEAR FROM NG ) BETWEEN 1990 AND 1999. CREAT VIEW T3

AS

SELECT M#, MC, GIA FROM CAP

WHERE NSX=’Viẹt Nam’ CREAT VIEW T4

AS

SELECT M#, MC#, DAI*SL*GIA GT FROM T1, T2, T3

WHERE (T1.T#=T2.T# and T3.M#=T2.M# ) and DAI*SL*GIA ≥ 2 //Kiểm tra

SELECT * FROM T4

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

BÀI TẬP CHƯƠNG 4 CÂU HỎI TRẮC NGHIỆM

Cõu 1. Quỏ trỡnh tối ưu hoỏ cỏc cõu hỏi truy vấn dữ liệu là quỏ trỡnh: a. Cần thiết phải biến đổi cỏc cõu hỏi hợp lý

b. Chi phớ thời gian thực hiện cỏc phộp toỏn là ớt nhất.

c. Cần thiết phải biến đổi cỏc cõu hỏi hợp lý sao cho chi phớ thời gian thực hiện cỏc phộp toỏn là ớt nhất.

d. Kết quả của cỏc phộp toỏn được biểu diễn duy nhất bằng một quan hệ. Cõu 2. í nghĩa của biểu thức πTTC ( σ MC# =’Việt nam’ (TUYEN X L_DAT) X CAP))

a. Liệt kờ tờn tất cả loại cỏp Việt nam.

b. Liệt kờ tờn tất cả cỏc loại cỏp Việt nam cú lắp đặt trờn cõc tuyến c. Liệt kờ tờn tất cả cỏc tuyến cú lắp đặt cỏc loại cỏp Việt nam. d. Liệt kờ tờn tất cả cỏc tuyến cỏp

Cõu 3. Hai biểu thức nàosau đõy tương đương với nhau

a. π TTC (σ MC# =’Việt nam’ (L_DAT) X (σ MC# =’Việt nam’( CAP ) X TUYEN))

b. π TTC ( σ MC# =’Việt nam’ (TUYEN X L_DAT) X CAP))

c. π TTC (σ MC# =’Việt nam’ (L_DAT) X σ MC# =’Việt nam’( CAP ) X TUYEN))

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

Cõu 4. Biểu thức nào dưới đõy biểu diễn cõu truy vấn: Tờn cỏc loại cỏp sử dụng trờn tuyến Hà nội- Hải phũng “T03” ?.

Cõu 5. Hóy chọn từ/cụm từ tương ứng để hoàn thiện khảng định sau: Tối ưu hoỏ cõu hỏi khụng những tối ưu về thời gian truy xuất thụng tin mà là nhõn tố quan trọng trong việc bảo đảm...với cỏc chiến lược tỡm kiếm, truy xuất dữ liệu.

a. Tớnh khả thi của dữ liệu b. Tớnh toàn vẹn dữ liệu c. Tớnh độc lập của dữliệu d. Tớnh nhất quỏn của dữ liệu

Cõu 6. Hóy chọn từ/cụm từ tương ứng để hoàn thiện khảng định sau: Cú nhiều kỹ thuật khỏc nhau để tối ưu hoỏ cỏc cõu hỏi, trong đú cú kỹ thuật phõn ró cõu hỏi dựa trờn...

a. Ngụn ngữcủa đại số quan hệ. b. Ngụn ngữ dữ liệu.

c. Biểu thức đại số quan hệ.

d. Suy dẫn logic từ cỏc tiờn đề Armstrong

Cõu 7. Hóy chọn từ/cụm từ tương ứng để hoàn thiện khảng định sau: Biến đổi một biểu thức đại số quan hệ về một biểu thức đại số quan hệ tương đương ... theo nghĩa sẽ cho cựng một kết quả nhưng với chi phớ thời gian thực hiện và sử dụng bộ nhớ ớt hơn rất nhiều

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

b. Tối ưu c. Thực hiện

d. Tiết kiệm bộ nhớ

Cõu 8. Hóy chọn từ/cụm từ tương ứng để hoàn thiện khảng định sau: Cỏch tiếp cận cơ bản để đỏnh giỏ tối ưu húa biểu thức quan hệ thường cõy kết nối trỏi theo chiều sõu, là phương ỏn ưu húa cõu hỏi R khụng quan tõm tới thứ tự kết nối khi cỏc toỏn hạng bờn phải của mỗi phộp kết nối . Cõy kết nối trỏi theo chiều sõu rất cú...

a. Chi phớ rất nhỏ.

b. Chi phớ bằng chi phớ biểu thức ban đầu. c. Cho phớ thời gian nhỏ.

d. Chớ phớ bộ nhớ nhỏ

Cõu 9. Hóy chọn từ/cụm từ tương ứng để hoàn thiện khảng định sau: Trong biểu thức quan hệ cỏc toỏn hạng là ...và cỏc phộp toỏn là cỏc phộp toỏn trong đại số quan hệ.

a. Cỏc quan hệ trong một CSDL b. Cỏc thuộc tớnh.

c. Cỏc phụ thuộc hàm. d. Cỏc phần tử

Cõu 10. Biểu thức E1 và E2 tương đương với nhau (E1 ≅ E2) , nếu chỳng biểu diễn cựng một ỏnh xạ, nghĩa là ... giống nhau trong biểu thức, thỡ kết quả cũng giống nhau.

a. Cỏc quan hệ. b. Cỏc thuộc tớnh. c. Cỏc bản ghi. d. Cỏc toỏn hạng

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP CÂU HỎI VÀ BÀI TẬP

Cõu hỏi: Hóy tối ưu hoỏ cỏc cõu hỏi sau:

1. Thụng tin về cỏc tuyến cú lắp đặt cỏc loại cỏp do Việt nam sản xuất cú giỏ trị trờn 10 tỷ đồng.

2. Thụng tin về cỏc tuyến cỏp cú lắp đặt cỏc loại cỏp sau năm 1999, hoặc cúcỏc loại cỏp do Việt nam sản xuất.

3. Thụng tin về cỏc tuyến cỏp xuất phỏt từ Hà nội, cú cỏc loại cỏp được lắp đặt sau năm 1999, tổng giỏ trị tuyến cỏp khụng lớn hơn 3 tỷ đồng.

4. Thụng tin về cỏc tuyến cỏp cú tổng giỏ trị lớn hơn tổng giỏ trị cỏctuyến cỏp xuất phỏt từ Hà nội.

5. Thụng tin về cỏc tuyến cỏp mà trong đú mỗi một loại chỉ cú một loại cỏp được lắp đặt , hoặc cú cú ớt nhất 5 loại cỏp được lắp đặt.

6. Thụng tin về cỏc tuyến cỏp mà trong đú lắp đặt tất cả cỏc loại cỏp cú trong danh mục.

7. Tổng giỏ trị cỏc loại cỏp lắp đặt trong cỏc tuyến.

8. Thụng tin về cỏc tuyến cỏp khụng sử dụng cỏc loại cỏp do Việt nam sản xuất. 9. Thụng tin về cỏc tuyến cỏp cú mó loại cỏp khụng đỳng với danh mục ( ngoài danh mục).

10. Tổng giỏ trịcỏc tuyến cỏp

11. Thụng tin về cỏc tuyến cỏp cú tổng giỏ trị nhỏ hơn giỏ trị của tuyến mang mó hiệu “T15”

12. Thụng tin về cỏc tuyến cỏp mà trong đú số loại cỏp lắp đặt nhiều hơn số loại cỏp lắp đặt trong tuyến “T01”.

13. Thụng tin về cỏc loại cỏp do Việt nam sản xuất cú giỏ trị trờn 10 tỷ đồng, được sử dụng trong năm 1999.

14. Thụng tin về cỏc loại cỏp do Việt nam sản xuất hoặc do cỏc liờn doanh Việt sản xuất.

15. Thụng tin về cỏc loại cỏp được lắp đặt trờn cỏc tuyến xuất phỏt từ Hà nội, cú giỏ trị cỏp khụng lớn nhỏ 5 triệu đồng.

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

16. Thụng tin về cỏc loại cỏp cú chiều dài sử dụng và giỏ trị của nú lớn hơn chiều dài và giỏ trị sử dụng của loại cỏp mang mó hiệu “M03”.

17. Thụng tin về cỏc loại cỏp được sử dụng trờn hơn 10 tuyến.

18. Thụng tin về cỏc loại cỏp được sử dụng duy nhất trờn một tuyến cỏp. 19. Thụng tin về cỏc loại cỏp được sử dụng trờn tất cả cỏc tuyến.

20. Thụng tin về cỏc loại cỏp chưa được sử dụng trờn cỏc tuyến. 21. Thụng tin về cỏc loại cỏp được sử dụng trờn2/3 tuyến cỏp.

22. Thụng tin về cỏc loại cỏp được lắp đặt trờn cỏc tuyến xuất phỏt từ Hà nội, hoặc đến Hà nội cú cỏc loại cỏp do Việt Nam sản xuất, cú giỏ trị cỏp lớn 5 triệu đồng.

BÀI TẬP

Bài 1. Giả sử cỏc quan hệ R1(A,B,C), R2(C,D,E) và R3 (E,F), và R1 cú 1000 bộ, R2 cú

1500 bộ và R3 cú 750 bộ. Đỏnh giỏ kớch cỡ của tớch Đề cỏc của R1, R2 và R3. Hóy đề xuất một chiến lược hiệu quả để tớnh toỏn phộp kết nối.

Bài 2. Giả sử cỏc quan hệ R1 (A,B,C), R2(A, D, F) và R3 (B, E, T, Z) và R1 cú 3500 bộ,

R2 cú 500 bộ và R3 cú 700 . Hóy tớnh chi phớ cho cỏc thao tỏc sau:

 Thờm 100 bộ vào R1 .

 Thờm 20 bộ vào R2.

 Thờm 20 bộ vào R3 .

 Biết chi phớ của R1 X R hóy tớnh chi phớ R1 X R2 X R3

Bài 3. Hóy tớnh chi phớ cho cỏc biểu thức quan hệ sau: Thụng tin về cỏc loại cỏp cú giỏ trị

trung bỡnh cao hơn giỏ trị trung bỡnh của cỏc loại cỏp do Việt nam sản xuất được lắp đặt trờn từng tuyến.

KHOA CNTT –TRƯỜNG ĐẠI HỌC KINH TẾ KỸ THUẬT CễNG NGHIỆP

CHƯƠNG 5

BẢO MẬT VÀ TOÀN VẸN DỮ LIỆU

Mục tiờu:Giới thiệu một cỏch tổng quỏt về khỏi niệm an toàn và toàn vẹn dữ liệu. và

một số biện phỏp cần thiết để bảo vệ cơ sở dữ liệu. “An toàn” dữ liệu nghĩa là cỏc hệ cơ sở dữ liệu cần phải được bảo vệ chống truy nhập trỏi phộp như sửa đổi hay phỏ hoại dữ liệu. Tớnh toàn vẹn dữ liệu theo nghĩa dữ liệu khụng mõu thuẫn, dị thường thụng tin

trong cỏc hệ thống khi thực hiện cỏc phộp lưu trữ, truy vấn, tỡm kiếm.

Nội dung của chương gồm cỏc phần sau:

Sự cần thiết phải bảo vệ an toàn cơ sở dữ liệu Tớnh toàn vẹn của dữ liệu

Ngụn ngữ vấn tin - ngụn ngữ ràng buộc toàn vẹn

An toàn cơ sở dữ liệu.

Cỏc mức độ bảo vệ an toàn cơ sở dữ liệu. Bảo mật cơ sở dữ liệu

5.1. Sự cần thiết phải bảo vệ an toàn CSDL

Hiện nay cựng với sự phỏt triển nhanh chúng của CNTT và sự bựng nổ của hệ thống mạng thỡ an toàn và bảo mật thụng tin luụn là vấn đề quan tõm lớn nhất của cỏc tổ chức, doanh nghiệp. Cơ sở dữ liệu của một cơ quan, một xớ nghiệp, của một ngành... thường được cài đặt tập trung hay phõn tỏn trờn cỏc mỏy chủ trờn mạng, là

Một phần của tài liệu Tài liệu học tập cơ sở dữ liệu (Trang 164)