3.2 Phương phỏp phõn mảnh ngang
3.2.2 Thụng tin cần thiết của phõn mảnh ngang
a) Thụng tin về CSDL cú liờn quan tới lược đồ khỏi niệm toàn cục. Trong mơ hỡnh quan hệ,
cỏc mối quan hệ giữa cỏc thực thể được mụ tả như là những quan hệ. Trong mơ hỡnh quan hệ thực thể (ER), cỏc mối liờn hệ giữa cỏc đối tượng CSDL được mụ tả rừ ràng. Nhỡn chung mối quan hệ giữa cỏc đối tượng trong CSDL thường mụ tả bằng cỏc mối quan hệ một - một, một - nhiều và mối quan hệ nhiều - nhiềụ Với mục đớch cho thiết kế ,đường nối (Link) cú hướng giữa cỏc quan hệ được sử dụng cho việc biểu diễn bởi thao tỏc nối bằng (Equijoin).
Vớ dụ 3.3: Trong hỡnh 3.4, mỗi một chức vụ (Title) cú nhiều nhiều nhõn viờn (Employee)
giữ chức vụ đú. Đõy là mối quan hệ mụt - nhiều được biểu diễn bằng một đường nối cú hướng L1 trỏ từ quan hệ PAY đến EMP. Mối quan hệ nhiều - nhiều được trỏ từ cỏc quan hệ EMP và PROJ đến quan hệ ASG.được biểu diễn bằng hai đuờng nối L2 và L3.
ASG PROJ L3 L2 EMP PAY TITLE, SAL
ENO, ENAME, TITLE PNO, PNAME, BUDGET, LOC
ENO, PNO, RESP, DUR L1
Quan hệ tại điểm cuối của đường nối được gọi là quan hệ chủ (quan hệ đớch ) và cỏc quan hệ tại điểm đầu được gọi là cỏc quan hệ thành viờn (quan hệ nguồn). Ánh xạ Owner và Member từ tập đường nối tới tập quan hệ. Khi cho trước một đường nối, hàm sẽ trả về quan hệ đớch hay quan hệ nguồn của đường nốị Vớ dụ trong hỡnh 3.4: owner(L1) = PAY và member(L1) = EMP
Ký hiệu lực lượng (cardinality) của mỗi quan hệ R là Card(R).
b) Thụng tin về ứng dụng: Để thực hiện phõn mảnh, cần phải cú thơng tin định tớnh và
thụng tin định lượng. Thụng tin định tớnh hướng dẫn cho hoạt động phõn mảnh, thụng tin định lượng chủ yếu sử dụng trong cỏc mơ hỡnh cấp phỏt.
Thụng tin định tớnh cơ bản gồm cỏc vị từ dựng trong cõu truy vấn. Sau đõy là cỏc định nghĩa về vị từ đơn giản (Simple Predicate) và vị từ hội sơ cấp (Minterm Predicate) như sau:
• Cho quan hệ R(A1, A2,..,An), trong đú Ai là thuộc tớnh được định nghĩa trờn một miền biến thiờn Di , một vị từ đơn giản Pj được định nghĩa trờn R cú dạng:
Pj: Ai θ Value
Trong đú θ thuộc {=, <, ≠, ≤, >, ≥} và Value được chọn từ miền Ai (Value thuộc Di). Chỳng ta sử dụng Pri để biểu thị tập tất cả cỏc vị từ đơn giản được định nghĩa trờn quan hệ Ri. Cỏc phần tử của Pri được ký hiệu là pij.
Vớ dụ 3.5. Cho quan hệ PROJ
PNAME = “Maintenance” BUDGET ≤ 200000
là cỏc vị từ đơn giản.
• Trong thực tế cỏc cõu truy vấn là tổ hợp của rất nhiều vị từ đơn giản. Mỗi tổ hợp được gọi là một vị từ hội sơ cấp. Cho tập Pri = {pi1, pi2, ...., pim} là cỏc vị từ đơn giản trờn quan hệ Ri, tập cỏc vị từ hội sơ cấp Mi = {mi1, mi2, ..., miz} được định nghĩa như sau: Cho tập Pri = {pi1, pi2, ...., pim} là cỏc vị từ đơn giản trờn quan hệ Ri, tập cỏc vị từ hội sơ cấp Mi = {mi1, mi2, ..., miz} được định nghĩa như sau:
⎭ ⎬ ⎫ ⎩ ⎨ ⎧ =∧ = ∈ i ik pr p ik ij ij i m m p M * , 1 ≤ k ≤ m , 1 ≤ j ≤ z .
Trong đú, pik* = pik hoặc pik* =ơpik. Vỡ thế mỗi vị từ đơn giản cú thể xuất hiện trong vị từ hội sơ cấp dưới dạng tự nhiờn hoặc dạng phủ định của nú.
Phủ định của một vị từ sẽ cú thể:
Attribute = Value khơng cú phủ định.
Attribute ≤ Value, phủ định là Attribute > Value
Cận_dưới ≤ Attribute_1, phủ định là ơ(Cận_dưới ≤ Attribute_1) Attribute_1 ≤ Cận_trờn, phủ định là ơ(Attribute_1 ≤ Cận_trờn) Cận_dưới ≤ Attribute_1 ≤ Cận_trờn, phủ định là
Vớ dụ 3.4: Xột một số vị từ đơn giản cú thể định nghĩa được trờn quan hệ PAỴ
p1: TITLE = “Elect.Eng” p2: TITLE = “Syst. Anal” p3: TITLE = “Mech. Eng” p4: TITLE = “Programmer” p5: SAL ≤ 30000
p6: SAL > 30000
Cỏc vị từ hội sơ cấp được định nghĩa dựa trờn cỏc vị từ đơn giản: m1: TITLE = “Elect.Eng” ^ SAL ≤ 30000
m2: TITLE = “Elect.Eng” ^ SAL > 30000 m3: ơ(TITLE = “Elect.Eng”) ^ SAL ≤ 30000 m4: ơ(TITLE = “Elect.Eng”) ^ SAL > 30000 m5: TITLE = “Programmer” ^ SAL ≤ 30000 m6: TITLE = “Programmer” ^ SAL > 30000
Thụng tin số lượng về ứng dụng cần phải cú hai tập dữ liệu:
1. Độ tuyển hội sơ cấp (Minterm Selectivity): số cỏc bộ của quan hệ sẽ được chọn theo vị
từ hội sơ cấp cho trước, ký hiệu chọn của hội sơ cấp m là sel(m).Vớ dụ, khơng cú bộ nào được chọn trong PAY thoả món vị từ hội sơ cấp m1. Cú 1 bộ thoả m2.
2. Tần số ứng dụng người dựng truy nhập dữ liệu. Nếu Q = {q1, q2, … , qq} là tập truy vấn,
ký hiệu acc(qi) là tần số truy nhập của truy vấn qi trong một khoảng thời gian đó chọ
3. Tần số truy nhập hội sơ cấp là tần số truy nhập của hội sơ cấp m, ký hiệu là acc(m).