Thông tin về CSDL

Một phần của tài liệu bài giảng cơ sở dữ liệu phân tán chuẩn (Trang 47 - 50)

- Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệu quả lớn đó

Thông tin về CSDL

Độ tuyển của một mảnh Fj ứng với câu vấn tin qi. Đây là số lượng các bộ của Fj cần được truy xuất để xử lý qi. Giá trị này ký hiệu là seli(Fj)

Kích thước của một mảnh Fj được cho bởi Size (Fj) = card (Fj)* length(Fj)

Trong đó: Length(Fj) là chiều dài (tính theo byte) của một bộ trong mảnh Fj.

Hai số liệu quan trọng là số truy xuất đọc do câu vấn tin qi thực hiện trên mảnh Fj trong mỗi lần chạy của nó (ký hiệu là RRij), và tương ứng là các truy xuất cập nhật (URij). Thí dụ chúng có thể đếm số truy xuất khối cần phải thực hiện theo yêu cầu vấn tin.

Chúng ta định nghĩa hai ma trận UM và RM với các phần tử tương ứng uij và rij được đặc tả tương ứng như sau:

1 nếu vấn tin qi có cập nhật mảnh Fj uij=

0 trong trường hợp ngược lại

1 nếu vấn tin qi có cập nhật mảnh Fj rij =

0 trong trường hợp ngược lại

Một véctơ O gồm các giá trị o(i) cũng được định nghĩa, với o(i) đặc tả vị trí đưa ra câu vấn tin qi .

Thông tin về vị trí

Với mỗi vị trí (trạm) chúng ta cần biết về khả năng lưu trữ và xử lý của nó. Hiển nhiên là những giá trị này có thể tính được bằng các hàm thích hợp hoặc bằng phương pháp đánh giá đơn giản.

+ Chi phí đơn vị tính để lưu dữ liệu tại vị trí Sk sẽ được ký hiệu là USCk.

+ Đặc tả số đo chi phí LPCk, là chi phí xử lý một đơn vị cơng việc tại vị trí Sk. Đơn vị cơng việc cần phải giống với đơn vị của RR và UR.

Thông tin về mạng

Chúng ta giả sử tồn tại một mạng đơn giản, gij biểu thị cho chi phí truyền mỗi bó giữa hai vị trí Si và Sj. Để có thể tính được số lượng thơng báo, chúng ta dùng fsize làm kích thước (tính theo byte) của một bó dữ liệu.

2.4.3 Mơ hình cấp phát

Mơ hình cấp phát có mục tiêu làm giảm thiểu tổng chi phí xử lý và lưu trữ dữ liệu trong khi vẫn cố gắng đáp ứng được các đòi hỏi về thời gian đáp ứng. Mơ hình của chúng ta có hình thái như sau:

ứng với ràng buộc thời gian đáp ứng, ràng buộc lưu trữ, ràng buộc xử lý. Biến quyết định xij được định nghĩa là

1 nếu mảnh Fi được lưu tại vị trí Sj xij=

0 trong trường hợp ngược lại

Tổng chi phí

Hàm tổng chi phí có hai thành phần: phần xử lý vấn tin và phần lưu trữ. Vì thế nó có thể được biểu diễn là:

TOC= ∑ QPCi + ∑ STCjk ∀ qi ∈ Q ∀Sk∈S ∀Fj∈F ∀ qi ∈ Q ∀Sk∈S ∀Fj∈F

với QPCi là chi phí xử lý câu vấn tin ứng dụng qi, và STCjk là chi phí lưu mảnh Fj tại vị trí Sk.

Chúng ta hãy xét chi phí lưu trữ trước. Nó được cho bởi

STCjk = USCk * size(Fj) *xjk

Chi phí xử lý vấn tin khó xác định hơn. Hầu hết các mơ hình cho bài tốn cấp phát tập tin FAP tách nó thành hai phần: Chi phí xử lý chỉ đọc và chi phí xử lý chỉ cập nhật. Ở đây chúng tỗi đã chọn một hướng tiếp cận khác trong mơ hình cho bài tốn DAP và xác định nó như là chi phí xử lý vấn tin bao gồm chi phí xử lý là PC và chi phí truyền là TC. Vì thế chi phí xử lý vấn tin QPC cho ứng dụng qi là

QPCi=PCi+TCi

Thành phần xử lý PC gồm có ba hệ số chi phí, chi phí truy xuất AC, chi phí duy trì tồn vẹn IE và chi phí điều khiển đồng thời CC:

PCi=ACi+IEi+CCi (adsbygoogle = window.adsbygoogle || []).push({});

Mô tả chi tiết cho mỗi hệ số chi phí phụ thuộc vào thuật tốn được dùng để hồn tất các tác vụ đó. Tuy nhiên để minh hoạ chúng tôi sẽ mô tả chi tiết về AC:

ACi= ∑ ∑(uij*URij+rij*RRij)* xjk*LPCk ∀SkS ∀FjF

Hai số hạng đầu trong cơng thức trên tính số truy xuất của vấn tin qi đến mảnh Fj. Chú ý rằng (URij+RRij) là tổng số các truy xuất đọc và cập nhật. Chúng ta giả thiết rằng các chi phí xử lý chúng là như nhau. Ký hiệu tổng cho biết tổng số các truy xuất

cho tất cả mọi mảnh được qi tham chiếu. Nhân với LPCk cho ra chi phí của truy xuất này tại vị trí Sk. Chúng ta lại dùng xjk để chỉ chọn các giá trị chi phí cho các vị trí có lưu các mảnh.

Một vấn đề rất quan trọng cần đề cập ở đây. Hàm chi phí truy xuất giả sử rằng việc xử lý một câu vấn tin có bao gồm cả việc phân rã nó thành một tập các vấn tin con hoạt tác trên một mảnh được lưu tại vị trí đó, theo sau là truyền kết quả trở lại về vị trí đã đưa ra vấn tin.

Hệ số chi phí duy trì tính tồn vẹn có thể được mơ tả rất giống thành phần xử lý ngoại trừ chi phí xử lý cục bộ một đơn vị cần thay đổi nhằm phản ánh chi phí thực sự để duy trì tính tồn vẹn.

Hàm chi phí truyền có thể được đưa ra giống như cách của hàm chi phí truy xuất. Tuy nhiên tổng chi phí truyền dữ liệu cho cập nhật và cho yêu cầu chỉ đọc sẽ khác nhau hoàn toàn. Trong các vấn tin cập nhật, chúng ta cần cho tất cả mọi vị trí biết nơi có các bản sao cịn trong vấn tin chỉ đọc thì chỉ cần truy xuất một trong các bản sao là đủ. Ngoài ra vào lúc kết thúc yêu cầu cập nhật thì khơng cần phải truyền dữ liệu và ngược lại, cho vị trí đưa ra vấn tin ngồi một thơng báo xác nhận, còn trong vấn tin chỉ đọc có thể phải có nhiều thơng báo tryền dữ liệu.

Một phần của tài liệu bài giảng cơ sở dữ liệu phân tán chuẩn (Trang 47 - 50)