- Đặc tính thứ hai của tậpcác vỊ tìr là tính cực tiểu Đây là một đặc tính cảm tính Vị từ đơn giản phải cĩ liên đới (relevant) trong việc xác định một mảnh M ột vị tìr khơng tham gia
b) Mơ hình cấp phát
Mơ hinh cấp phát cĩ mục tiêu làm giảm thiểu tổng chi phí xử lý và lưu trữ dữ liệu trong khi vẫn cố gắng đáp ứng được các địi hĩi về thời gian đáp ứng. Mơ hình của chúng ta cĩ hình thái như sau;
Min (Total Cost)
ứng với ràng buộc thời gian đáp ứng, ràng buộc lưu trữ, ràng buộc xử lý. Biến quyết định x,j được định nghĩa là:
I nếu mành F, được lưu tại vị trí Sị 0 trong trường hợp ngược lại Tổng chi phí
Hàm tổng chi phí cĩ hai thành phần: phần \ ử lý vấn tin và phần lưu trữ. Vì thế nĩ cĩ thề được biều diễn là;
TOC X ỌPC, I I I STC„
V 1|I e VSkeS
trong đĩ ỌPC, là chi phí xử lý câu vấn tin ứng dụng q, ; STCịk là chi phí lưu mảnh Fj tại vj trí S|,. Chúng ta hãy xét chi phí lưu trũ* trước. Nĩ được cho bĩi:
S T C , k - u s e , * s i z e ( F , )
Chi phí xử lý vấn tin khĩ xác định hơn. Hầu hết các mơ hình cho bài tốn cấp phát tập tin FAP tách nĩ thành hai phần: (?hi phí xứ lý chi đọc và chi phí xử lý chỉ cập nhật, o đây chúng tồi đã chọn một hướng tiếp cận khác trong mơ hình cho bài tốn DAP và xác định nĩ nhir là chi phí xứ lý vấn tin bao gồm chi phí xử lý là PC và chi phí truyền là TC. Vì thế chi phí xử lý vấn tin QPC cho ứng dụng qi là:
ỌPC, - PC, + TC,
Thành phần xử lý PC gồm cĩ ba hệ số chi phí: chi phí triiv xuất AC. chi phí duy trì tồn vẹn lE và chi phí điều khiên đồim thịi CC;
PC, - AC. f IE. ! c c .
MƠ tả chi tiết cho mỗi hệ số chi phí phụ thuộc vào ihuặt tốn đưọc dùng để hồn tất các tác vụ đĩ. Tuy nhiên, để minh hoạ ta sẽ mơ tà chi tiết về AC:
A C . - z Z(u,*UR,-,+ r„ * R R ,) * x ,,* L P Q VS|,eS VF,gF
Hai số hạng đầu trong cơng thức trên tính số truy xuất cùa vấn tin q, đến mảnh F|. Chú ý rằng (URy + RR,|) là tổng số các truy xuất đọc và cập nhật. Chủng ta giá thiết rằng các chi phí xử lý chúng là như nhau. Ký hiệu tổng cho biết tồng số các truy xuất cho tất ca mọi I i ì à n h đưọc qi tham chiếu. Nhân với LPCk cho ra chi phí của truy xuất này tại vị trí Sk- C húng ía lại dùng để chỉ chọn các giá trị chi phí cho các vị trí cĩ lưu các mánh.
M ột vấn đề rất quan trọng cần để cập ở đáy. Hàm chi p h í truy xu ấ t g ia s ư rang vịệc X I V
lý m ột cáv vârì tin cĩ hao gỏm cá việc phán rã nĩ thcữih m ội íập cúc vcm ùn con hoạt tác írên m ột mành được h w lại vỊ (ri đĩ, theo sau Ici íruyèn két qua trơ ìại vẻ vị Ịri íỉà ¿lira ra vần Ịiìh
Hệ sổ chi p h í duy írì íính íocm vẹn C( ) fhè cíược Ỉ1ỈƠ ỈCÍ rãí ịỉ^iơnịỉ, ĩhlm h phâ n x ư ìý ngoại trừ chi p h í x ư lý cục họ mộỉ cĩơn vị cún /hay cỉỏị nham phcm ánh ch i p h í thực s ự c1ơ dvy ỉr'i tinh tồn vẹn.
Hàm chi phí truyền cĩ thể được đưa ra giống như cách của hàm chi phí truy xuất. Tuy nhiên, tổng chỉ phí truyền dữ liệu cho cập nliậì và clio yêu cầu chỉ đọc sẽ khác nhau hồn tồn. Trong các vấn tin cập nhật, chúng ta cần cho tất cả mọi vị trí biết noi cĩ các bản sao cịn trong vấn tin chỉ đọc thì chỉ cần truy xuất một trong các bản sao là đủ. Ngồi ra vào lúc kết thúc vêu cầu cập nhật thì khơng cần phải truyền dữ liệu và ngược lại, cho vị trí đưa ra vấn tin ngồi một thơng báo xác nhận, cịn trong vấn tin chỉ đọc cĩ thể phải cĩ nhiều thịng báo truyền dữ liệu.
Thành phần cập nhật của hàm truyền dữ liệu là:
TCU,= I Zu,|*X|k.g„„i,k + I Zii,|*x,k.g k,„„|
S|,eS F-,eF SkfcS F,eF
SỐ hạng thứ nhất để gửi thơng báo cập nhặt từ vị trí gốc o(i) cua q, đến tất cả bản sao cập nhật. Số hạng thứ hai dành cho thơng báo xác nhận.
Thành phần chi phí chỉ đọc cĩ thế đặc tả là:
TCR, - I min (U ịj * Xjk * go(„.k+r,| * X|i,.(sel,(F|)* length (F,)/fsize) *
F| e F S ^ e S
SỐ hạng thứ nhất trong TCR biểu thị chi phí truyền yêu cầu chí đọc đến những vị trí cĩ bản sao của mảnh cần truy xuất, số hạng thứ hai để truyền các kết quả từ những vị Irí này đến những vị trí yêu cầu. Phương trinh này khẳng định rằng trong số các vị trí cĩ bản sao của cùng
một mảnh, chỉ vị trí sinh ra tồng chi phí truyền thấp nhất mĩi được chọn đế thực hiện thao tác này.
Bây giờ hàm chi phí tính cho vấn tin q, cỏ thế đưọc tính là: TC, TCU, TCR,
Rcỉĩìg buộc
Ràng buộc thời gian đáp ứng cần được đặc tả là thịi gian thực thi của qi< thời giãn đáp ứng lớn nhất của q, Vq, e Q .
Ngưịi ta thích đặc tả số đo chi phí của hàm theo thời gian bời vì nĩ đơn giản hố đặc tà về ràng buộc thịi gian thirc thi.
Ràng buộc lim trừ
z STCịk ^ khả năng lưu trữ tại vị trí Sk-, VSi^eS VFjeF
trong đĩ ràng buộc xử lý là:
z tải trọng xử lý của q, tại vị trí Sk < khá năng xử lý cua Si,, VSkC-S. Vqie Ọ
2 .3 .6 3 , C ách tiế p cận 2Xây dưnu bài tốn cấp phát Xây dưnu bài tốn cấp phát
Đầu vào: Tập các mảnh, tập các trạm, dunii lưọnu của trạm. Đ ầu ra: Các mảnh được định vị tại các trạm làm việc.
Với mục tiêu cúa bài tốn ià cực đại hố tính địa plurong và tối thiếu hố việc tham chiếu từ xa.
Phân tích
Giả sử đã cĩ một tập các mành f- - {F|, Fì...F,i} và một mạng bao gồm các vị trí s |S i , S2...s,„} trên đĩ cĩ một tập các ứng dụng ọ {qi, q)...q^j) đang chạy.
- Mục tiêu bài tốn cấp phát là lìm một phán phối “tối ưu" cúa F cho s.
- Tính “tối ưu” ở đây được [ Dowdy and F o s te r, 1982] định nghĩa ứng với hai số đo sau:
là:
(1). C hi phí nhỏ nhất: Hàm chi phí gồm cĩ;
+ Chi phí lưu mảnh F, vào vị trí s,: -ỉ- Chi phí vấn tin mánh F', vào vị trí s,;
í Chi phí cập nhật Fj tại tất cả mọi vị trí cố chửa nĩ; + Chi phí truyền dữ liệu.
(2). H iệu quả: Chiến lược Cấp phát được thiết kế nhằm duy tri một hiệu quả lớn đĩ
^ Hạ thấp thời gian đảp ứng;
+ Tăng tối đa lưu lượng hệ thống tại mỗi vị trí.
Bài tốn ph ụ thuộc vào các ràng buộc khác sau
+ Khả năng (dung lượng) của trạm cĩ hạn. + Tệp cĩ thể đặt ỏ' một trạm hay nhiều trạiĩi:
*- Nếu một trạm: giá thành đọc ^ giá thành cập nhật: - Nếu nhiều trạm: ^ỉá thành đọc « giá thành cặp nhặt. + Giá thành của việc tham chiếu địa plnronu nhĩ hơn nhiêu giá
thành của việc tham chiếu từ xa.
• ứng dụng vào cơ s ở dữ liệu phân tán
+ Coi mỗi đoạn là một tệp các đoạn độc lập với nhau tuỳ từng ứng dụng để chọn.
+ Coi mỗi quan hệ tống thể là một tệp.
• Các kỳ hiệu
+ Cĩ N trạm, đánh số trạm theo chỉ số j , dung lượng của trạm j là Cj Cĩ M tệp, đánh số tệp theo chi số i, kích thước của tệp i là Sị
+ Cỏ T giao dịch, chỉ số k, tần suất của giao dịch k phát ra tại trạm j là fkj + Số các truy nhập của giao dịch k đến tệp i là n^,.
• Giả thiết bài tốn
+ Khả năng ( đung lượng) cùa trạm cĩ hạn + 1 tệp chỉ định vị tại I trạm.
+ Giá tliành của thao tác đọc và cập nhật là như nhau,
i Các truy cập địa phương dễ một cách đáng kể so với truy cập từ xa.
• Quy định các hiến và một số điều kiện ràng huộc
Xj| : biến quyết định Ị nếu tệp i đặt tại trạm j Xij = 0 ngược lại r l ) . với V i K 2 ,. .. ,m ./ r2). < Cị với V j = 1,2,..., n J
-> Vịj “ ^ ( sổ các truy nhập đến tệp i địi hỏi tại trạm J )
k
B à i tốn : đi xác định các i, j sao cho đạt được Max{V,j. x,j) > trạm j là tơt nhât. Điều kiện ràng buộc bài tốn :
I J
( Tức là kĩch thưĩc dữ liệu < dung lượng cả mạng )
Q ui ước: fk| Ma trận F . Hk, ' Ma trận N
Thuật tốn
Gồm 5 bước sau:
Bước 1: Tính các j(i) ^ ^ Max(V,|) Ịvỏi V i Bưĩ’c 2 : Thủ
I nẻii j íluiộc j(i) 0 ngưọ-c lại
, 2...m
Bước 3: Kiểm tra ràng buộc r2)
Bưĩ’c 4: Nếu r2) vi phạm tại trạm J thì đặt lại X,J (tức là chọn J khác) > Ọuay về Bước 1: Làm lại từ đầu cho đến hết.
Nmrợc lại ; nếu r2) khơng vi phạm thi chuyển sang Bước 5 Bưĩ’c 5: Xố các cột i tương ứng với X,, 1 kết thúc.
ử ỉt s d ụ n s b à i tốn cấp p h á t
Bài tốn phát biếu nh ư sau:
Cho ma trận N thong kẻ các giao dịch truv nhập k tĩi các tệp i
N ' Q ' " K (1) (2) (3) (4) (5) (6) s, (30) T i 5).... (10) (30) J 21)_ 1 _ 30 30 1 L. ' | 5 ... 100... 3 ... .' 40 20 “ 20"7 ... 2 0 " „ ^ 5 ”.... .. ... . 10 10 ^ ío '^ 6 10 10
Ma trận F: Tần suất của các giao dịch k vĩi trạm j
F ‘ (1) (2) (3) (4) '^ỉ 50 J ‘ l oo f 7 ^ 2 20 10 3 20 10 4... ... '20 20 5 0 ... ... T o ' 5"... " 20 50 ... "10 ... . 6 50 10 C h o C , = 5 0 M B
Yêu câu: Hãy định vị vị trí của các tệp i trẽn các trạm j sao cho thời gian truy cập nhị nhất vĩi hiệu quả cao nhất.