Test thử nghiệm

Một phần của tài liệu Mô hình hóa dữ liệu đa chiều (Trang 34 - 37)

2. Ứng dụng kỹ thuật phân mảnh theo chiều dọc trong thiết kế logical của cở sở

2.4.Test thử nghiệm

Trong phần này chúng tơi hỗ trợ phương pháp phân mảnh dọc của các view trong cơ sở dữ liệu đa chiều. Kết quả thử nghiệm chúng tơi trình bày trong thừa nhận ích lợi của phương pháp trong các term của giảm chi phí cho việc thực thi khối lượng cơng việc mong đợi. Test thực thi dựa trên chuẩn TPC-D nổi tiếng[18], chúng đặc trưng hai khối LineItem và PartSupplier với các đề cử 6.000.000 và 8.000.000 riêng biệt; tổng số lượng của dữ liệu là khoảng 1 Gbyte.

Chúng ta test trên Informix DBMS với một khối lượng cơng việc dựa trên các truy vấn 17 TPC-D (tất cả tần số xuất hiện là giống nhau). Các view bị phân mảnh được lựa chọn bởi phương tiện tiếp cận heuristic của 2 GB( 1GB cho các view chính + 1 GB cho các view thứ cấp); cụ thể hổ trợ trong [3] bằng việc xem xét khơng gian

tốn sự phân mảnh xác định 14 mảnh(3 từ các view chính) và 9 miniterm mất. Các chỉ mục trên tất cả thuộc tính thuộc về các khĩa trong thực tế cả hai chiều và bản được tạo ra.

Hình 2.4 với mỗi truy vấn tỉ lệ giữa số của các trang đĩa khơng được đọc và với sự phân mảnh; trên mỗi cột số của các trang đĩa đọc khơng cĩ sự phân mảnh. Tồn bộ sự phân mảnh giảm chi phí khối lượng cơng việc từ 265.904 cịn 59.986 trang (hơn 4 lần).

Hình 2.4. Tỉ lệ giữa số trang đĩa đọc khơng cĩ với sự phân mảnh

Hình 2.5 sự phân mảnh ảnh hưởng như thế nào đến tổng khơng gian lưu trữ; trên mỗi cột, khơng gian lưu trữ khơng cĩ sự phân mảnh. Tất cả view khơng phân mảnh yêu cầu 368.840 trang; trong khi cụ thể chỉ các mảnh(khơng mất các miniterm) giảm yêu cầu khơng giam xuống 306.042 trang(-17%), cụ thể cũng mất minterm tăng yêu cầu khơng gian đến 442.097 trang(+19,8%).

Nên chú ý rằng view kế tiếp vượt trội 2 GB sẽ tốn 126.460 trang đĩa và giảm chi phí khối lượng cơng việc 1%; sự phân mảnh là thuận lợi hơn chỉ tốn 73.257 trang mở rộng và giảm chi phí 77%. Trong thực tế trong khi cụ thể hơn một view tiêu biểu ích lợi vài truy vấn. Vài truy vấn cĩ lẽ là thuận lợi từ việc sử dụng cùng khơng gian đĩa cho sự phân mảnh. Hơn thế trong khi phân mảnh khơng yêu cầu mở rộng khơng gian cho chiều các bảng, mỗi một view mới cĩ lẽ yêu cầu thêm các bộ vào các chiều các bảng được tham chiếu bởi kết tập các bộ trong view.

Hình 2.5 Tỉ lệ giữa khơng gian lưu trữ cĩ và khơng cĩ sự phân mảnh

Để mà đánh giá thuật tốn phức tạp, chúng tơi cĩ định nghĩa thêm bốn khối lượng cơng việc, mỗi tiến trình mở rộng TPC-D; kết quả hiển thị trong bảng I. Việc tính tốn thời gian khơng phụ thuộc chặt chẽ kích thước khối lượng cơng việc, tất nhiên nĩ cũng xác định mối quan hệ giữa các truy vấn.

Bảng I Các kết quả kiểm tra phức tạp n. truy vấn trong khối

lượng cơng việc n.subproblems generated(vấn đề con phát sinh) Thời gian tính tốn 17 2775 Khoảng 1 phút 25 4439 Khoảng 2 phút 30 348925 Khoảng 30 phút 35 51099 Khoảng 12 phút 40 403420 Khoảng 75 phút

Một phần của tài liệu Mô hình hóa dữ liệu đa chiều (Trang 34 - 37)