3.3 Sự cấp phát các phân mảnh
3.3.1 Bài toán cấp phát
Giả sử đã có một tập các mảnh F={F1, F 2, ...,Fn} và một mạng bao gồm các vị trí S={S1, S2, ...,Sm} trên đó có một tập các ứng dụng Q={q1, q2, ...,qq} đang chạy.
Bài toán cấp phát là tìm một phân phối “tối ưu” của F cho S. Tính tối ưu có thể được định nghĩa ứng với hai số đo:
- Chi phí nhỏ nhất: Hàm chi phí có chi lưu mảnh Fi vào vị trí Sj, chi phí
vấn tin mảnh Fi vào vị trí Sj, chi phí cập nhật Fi tại tất cả mọi vị trí có
chứa nó và chi phí tryền dữ liệu. Vì thế bài tốn cấp phát cố gắng tìm một lược đồ cấp phát với hàm chi phí tổ hợp nhỏ nhất.
- Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệu quả lớn đó là hạ thấp thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tại mỗi vị trí. Nói chung bài tốn cấp phát tổng qt là một bài tốn phức tạp và có độ phức tạp là NP-đầy đủ (NP-complete). Vì thế các nghiên cứu đã được dành cho việc tìm ra các thuật giải heuristec tốt để có lời giải gần tối ưu.
3.3.2 Yêu cầu về thông tin
Ở giai đoạn cấp phát, chúng ta cần các thông tin định lượng về CSDL, về các ứng dụng chạy trên đó, về cấu trúc mạng, khả năng xử lý và giới hạn lưu trữ của mỗi vị trí trên mạng.
Thơng tin về CSDL
Độ tuyển của một mảnh Fj ứng với câu vấn tin q i. Đây là số lượng các bộ của Fj cần được truy xuất để xử lý qi. Giá trị này ký hiệu là seli(Fj)
Kích thước của một mảnh Fj được cho bởi
Cơ sở dữ liệu phân tán - 2010
http://slidepdf.com/reader/full/baigiang-csdl-phantan-final 68/193
Size (Fj) = card (Fj)* length(Fj)
Thông tin về ứng dụng
Hai số liệu quan trọng là số truy xuất đọc do câu vấn tin qi thực hiện trên mảnh Fj trong mỗi lần chạy của nó (ký hiệu là RRij ), và tương ứng là các truy xuất cập nhật (URij). ví dụ chúng có thể đếm số truy xuất khối cần phải thực hiện theo yêu cầu vấn tin.
Chúng ta định nghĩa hai ma trận UM và RM với các phần tử tương ứng uij và rij được đặc tả tương ứng như sau:
1 nếu vấn tin qi có cập nhật mảnh Fj uij= 0 trong trường hợp ngược lại
1 nếu vấn tin qi có cập nhật mảnh Fj rij = 0 trong trường hợp ngược lại
Một véctơ O gồm các giá trị o(i) cũng được định nghĩa, với o(i) đặc tả vị trí đưa ra câu vấn tin qi .
Thơng tin về vị trí
Với mỗi vị trí (trạm) chúng ta cần biết về khả năng lưu trữ và xử lý của nó. Hiển nhiên là những giá trị này có thể tính được bằng các hàm thích hợp hoặc bằng phương pháp
đánh giá đơn giản.
+ Chi phí đơn vị tính để lưu dữ liệu tại vị trí Sk sẽ được ký hiệu là USCk.
+ Đặc tả số đo chi phí LPCk, là chi phí xử lý một đơn vị cơng việc tại vị trí Sk. Đơn vị công việc cần phải giống với đơn vị của RR và UR.
Cơ sở dữ liệu phân tán - 2010
http://slidepdf.com/reader/full/baigiang-csdl-phantan-final 69/193
Thơng tin về mạng
hai vị trí Si và Sj. Để có thể tính được số lượng thơng báo, chúng ta dùng fsize làm kích thước (tính theo byte) của một bó dữ liệu.