Minh họa thuật toán xử lý phân loại và lưu trữ dữ liệu

Một phần của tài liệu Xây dựng mô hình quản lý chia sẻ dữ liệu trong mạng ngang hàng không dây (Trang 61 - 62)

/* Khi MH nguồn nhận đơn vị dữ liệu d và xử lý lưu trữ*/

1. Kiểm tra kích thước đơn vị dữ liệu d (S) có vượt tham số α 1.1. Nếu S > α thì khơng xử lý lưu trữ d

1.2. Ngược lại:

1.2.1. Tính x = số bản dữ liệu d trả về từ MH vùng. 1.2.2. Nếu x> β thì khơng xử lý lưu d.

1.2.3. Ngược lại gọi thủ tục “Xử lý lưu dữ liệu” ở bước 2

2. Xử lý lưu dữ liệu d

2.1. Kiểm tra d đến từ các MH cùng vùng hay khác vùng với MH nguồn.

2.2. Nếu tất cả các MH chứa d đều khác vùng với MH nguồn, thì lưu d vào MH nguồn với nhãn là PD.

2.3. Nếu có ít nhất một MH chứa d trả về cùng vùng với MH nguồn, kiểm tra:

2.3.1. Tất cả các MH vùng đều lưu d với nhãn là SD, thực hiện lưu d ở MH nguồn với nhãn là PD.

2.3.2. Nếu có tồn tại một MH vùng lưu d với nhãn là PD, thực hiện lưu d ở MH nguồn với nhãn là SD.

{Danh sách đơn vị dữ liệu D trả về}

Loại bỏ đơn vị dữ liệu D có kích thước S> α

Kiểm tra x > β Tính x= số bản của mỗi

đơn vị dữ liệu D

Kho dữ liệu lưu (Local Cache) Loại bỏ và khơng lưu đơn

vị dữ liệu d có

Đơn vị dữ liệu D không lưu

Lưu và sắp xếp theo từng đơn vị dữ liệu D(danh sách MH gởi, nhãn dữ liệu tương ứng) khơng

Kiểm tra tất cả MH gởi D đều ngồi vùng với MH

nguồn đúng

Gán nhãn cho D là PD và lưu vào kho dữ liệu

Gán nhãn cho D là SD và lưu vào kho dữ liệu Kiểm tra có MH gởi D nào

đang giữ D với nhãn là PD không

khơng

2.2.5 Mô-đun xử lý thay thế dữ liệu

2.2.5.1 Mơ tả bài tốn

Khi một MHi bất kỳ muốn lưu trữ một đơn vị dữ liệu mới nhưng khơng cịn khơng gian lưu trữ thì chúng sẽ thay thế dữ liệu dựa vào nguyên lý như sau:

Khi yêu cầu xóa dữ liệu được gọi thực hiện, mơ-đun xử lý thay thế dữ liệu đầu tiên sẽ lựa chọn đơn vị dữ liệu nào thời gian sống (TTL) khơng hợp cịn hợp lệ để xóa ra khỏi kho lưu trữ cục bộ. Trong trường hợp tất cả đơn vị dữ liệu đang lưu đều có thời gian sống cịn hợp lệ, thì xử lý thay thế dữ liệu sẽ dựa vào nhãn của đơn vị dữ liệu đang lưu. Việc phân loại hai loại dữ liệu chính và phụ trong quá trình thu nạp dữ liệu nhằm bảo đảm khả năng tồn tại ít nhất một bản sao hạng mục dữ liệu trong vùng. Những đơn vị dữ liệu có nhãn SD và có độ ưu tiên thấp nhất sẽ được chọn thay thế nếu kho lưu trữ bị đầy. Độ ưu tiên của đơn vị dữ liệu được dựa vào tần số truy cập f, nếu đơn vị dữ liệu nào có f càng nhỏ (nghĩa là dữ liệu đó ít được truy xuất) thì sẽ bị lựa chọn để xóa. Trong trường hợp nếu xảy ra tầng suất truy cập f của các đơn vị dữ liệu bằng nhau thì chúng tơi xây dựng độ ưu tiên của đơn vị dữ liệu dựa vào tham số . Cơng thức để tính độ ưu tiên của dữ liệu này là  = f/(t*S), trong đó f là tần suất truy cập của đơn vị dữ liệu; t là khoảng thời gian lưu trữ đơn vị dữ liệu và được tính theo cơng

thức t = tht-ts (tht là thời gian hiện tại, ts là thời gian ghi lúc ghi nhận đơn vị dữ liệu vào kho

lưu trữ cục bộ); S là kích thước của đơn vị dữ liệu. Như vậy qua cơng thức tính, chúng ta có thể nhận thấy nếu t càng lớn nghĩa là đơn vị dữ liệu lưu trữ càng lâu và S càng lớn thì khơng gian lưu trữ tốn càng nhiều. Cơng thức tính  theo ngữ nghĩa sẽ tìm ra đơn vị dữ liệu nào ít lưu trữ lâu, ít được truy cập và tốn nhiều không gian lưu trữ sẽ bị chọn để xóa ra khỏi kho lưu trữ cục bộ, lấy không gian để lưu trữ cho đơn vị dữ liệu mới cần lưu.

2.2.5.2 Lưu đồ xử lý và mã giả thuật toán thay thế dữ liệu

Lưu đồ xử lý của thuật toán thay thế dữ liệu được thể hiện ở Hình 2-10 và mã giả được trình bày ở Bảng 2-5.

Một phần của tài liệu Xây dựng mô hình quản lý chia sẻ dữ liệu trong mạng ngang hàng không dây (Trang 61 - 62)

Tải bản đầy đủ (PDF)

(109 trang)