Yêu cầu thông tin

Một phần của tài liệu Tiểu luận môn cơ sở dữ liệu nâng cao CƠ SỞ DỮ LIỆU PHÂN TÁN (Trang 25)

• Thông tin về CSDL

Thông tin này bao gồm lược đồ khái niệm toàn cục, các liên kết giữa các quan hệ, đặc biệt là phép nối. Trong mô hình quan hệ, các mối liên hệ được biểu thị bằng các quan hệ. Tuy nhiên trong các mô hình khác, như mô hình thực thể-quan hệ, các mối liên hệ được biểu diễn tường minh. Với mục đích thiết kế phân tán, các mối liên hệ cũng được mô hình hoá trong bộ khung quan hệ. Theo cách này chúng ta sẽ vẽ các đường nối (L) có hướng giữa các quan hệ (R, S) ràng buộc nhau qua phép đẳng nối dạng

R L S,

Trong đó R gọi là quan hệ chủ, S gọi là quan hệ thành viên. Người ta dùng hàm

ownermember để phân biệt các quan hệ này:

owner(L) = R và member(L) = S

Ví dụ:

PAY( TITLE, SAL)

EMP( ENO, ENAME, TITLE ) PROJ( PNO, PNAME, BUDGET )

ASG( ENO, PNO, RESP, DUR )

Hình sau trình bày một cách biểu diễn các đường nối giữa các quan hệ PAY, EMP, PROJ và ASG.

L1

L2

L3

Ở đây có ba đường nối L1, L2, L3. Ta có

owner(L1) = PAY và member(L1) = EMP owner(L2) = EMP và member(L2) = ASG owner(L3) = PROJ và member(L3) = ASG

Thông tin định lượng về CSDL, tức là lực lượng (cardinality) của mỗi quan hệ R, ký hiệu card(R).

• Thông tin về ứng dụng

Yêu cầu thông tin định tính lẫn định lượng về các ứng dụng Thông tin định tính định hướng cho hoạt động phân mảnh, còn thông tin định lượng sử dụng cho các mô hình cấp phát.

Những thông tin định tính cơ bản gồm các vị từ được dùng trong các câu vấn tin. Nếu không thể phân tích được hết tất cả các ứng dụng đê xác định những vị từ này thì ít nhất cũng phải nghiên cứu được các ứng dụng quan trọng nhất. Một hướng dẫn quan trọng, gọi là qui tắc 80/20, là “20% câu vấn tin sẽ chiếm đến 80% truy xuất dữ liệu”.

Cho quan hệ R(A1,..., An) , trong đó Ai là một thuộc tính được định nghĩa trên miền giá trị Di. Một vị từ đơn giản p được định nghĩa trên R có dạng:

p: Aiθ Value

Các câu vấn tin thường chứa nhiều vị từ phức tạp, là tổ hợp các vị từ đơn giản. Một tổ hợp cần đặc biệt chú ý được gọi là vị từ hội sơ cấp (minterm predicate),hội

(conjuction) của các vị từ đơn giản. Bởi vì ta luôn có thể biến đổi một biểu thức bool thành dạng chuẩn hội (conjuctive normal form), việc sử dụng vị từ hội sơ cấp trong thuật toán thiết kế không làm mất tính tổng quát.

Cho một tập các vị từ đơn giản Pr = {p1, ..., pm} trên quan hệ R. Tập các vị từ hội sơ cấp M={m1, ..., mz} gồm các vị từ dạng * Pr k p j p m k∧∈ = , với 1 ≤ k ≤ m, 1 ≤ j ≤ z

trong đó p*k = pk hoặc pk* = ¬pk , ∀k=1,...,m. Như vậy mỗi vị từ đơn giản có thể xuất hiện trong vị từ hội sơ cấp dạng khẳng định hoặc phủ định.

Theo những thông tin định tính về các ứng dụng, chúng ta cần biết hai tập dữ liệu. (1) Độ tuyển hội sơ cấp (minterm selectivity): Số lượng các bộ quan hệ sẽ được truy

xuất bởi câu vấn tin được đặc tả theo một vị từ hội sơ cấp đã cho. Ta ký hiệu độ tuyển của hội sơ cấp msel(m).

(2) Tần số truy xuất (access frequency): tần số ứng dụng truy xuất dữ liệu. Cho

Q = { q1, q2, ... , qk } là tập các câu vấn tin, ký hiệu acc(qi) biểu thị tần số truy xuất của qi trong một khoảng thời gian đã cho. Ta cũng ký hiệu tần số truy xuất của một hội sơ cấp macc(m).

Một phần của tài liệu Tiểu luận môn cơ sở dữ liệu nâng cao CƠ SỞ DỮ LIỆU PHÂN TÁN (Trang 25)

Tải bản đầy đủ (DOCX)

(59 trang)
w