Các phân hoạch (Partitions)

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 51 - 53)

Chương I Khai thác dữ liệu và xử lý phân tích trực tuyến

3.3.5.Các phân hoạch (Partitions)

3.3. Kiến trúc khối của OLAP (OLAP Cube Architecture)

3.3.5.Các phân hoạch (Partitions)

Tất cả các khối đều có tối thiểu một phân hoạch để chứa dữ liệu của nó. Một phân hoạch đơn được tự động tạo ra khi khối được định nghĩa. Khi ta tạo một phân hoạch mới cho một khối, phân hoạch mới này được thêm vào trong tập hợp các phân hoạch đã tồn tại đối với khối. Khối phản ánh dữ liệu đã được

kết nối có trong tất cả các phân hoạch của nó. Một bảng phân hoạch của khối là vơ hình đối với người dùng.

Các phân hoạch tiêu biểu cho một công cụ mạnh, mềm dẻo cho việc quản trị các khối OLAP, đặc biệt các khối lớn. Ví dụ: một khối chứa thơng tin thương mại có thể chứa trong một hoặc nhiều phân hoạch cho dữ liệu của những năm trước và các phân hoạch cho mỗi quý của năm hiện tại. Cuối năm các bảng phân hoạch của bốn quý có thể được hợp nhất trong một phân hoạch

đơn cho năm đó. Các bảng phân hoạch có thể được lưu trữ với các sự lựa

chọn kết hợp khác nhau theo phương thức lưu trữ, định vị dữ liệu nguồn và thiết kế kết hợp. Tính mềm dẻo này cho phép ta thiết kế các chiến lược lưu trữ khối thích hợp với các yêu cầu.

Các bảng phân hoạch phải được thiết kế và quản lý phù hợp để tránh

các kết quả mâu thuẫn hay sai lệch. Tính tồn vẹn của dữ liệu khối dựa vào dữ liệu được phân bố giữa các phân hoạch của khối vì thế dữ liệu khơng bị lặp lại giữa các phân hoạch. Khi dữ liệu được tổng kết từ các bảng phân hoạch,

bất kỳ một thành phần dữ liệu nào có trong một phân hoạch sẽ được tổng kết như thể chúng là các thành phần dữ liệu khác nhau. Điều này có thể đưa ra

các bản tổng kết khơng chính xác và dữ liệu sai cho người dùng. Ví dụ, nếu cơng việc kinh doanh thương mại cho sản phẩm X được lặp lại trong các bảng Fact cho hai phân hoạch, các tổng kết của việc mua bán sản phẩm X có thể bao gồm việc tính tốn hai lần.

Các phân hoạch có thể được hợp nhất, ta có thể dùng tính năng này

trong toàn bộ chiến lược lưu trữ và cập nhật dữ liệu. Các phân hoạch chỉ được hợp nhất nếu chúng có cùng chế độ lưu trữ và các khối tập hợp. Để tạo các phân hoạch dành cho việc hợp nhất về sau, ta có thể lựa chọn chế độ lưu trữ và sao chép các khối kết hợp từ một phân hoạch khác khi ta tạo phân hoạch. Ta cũng có thể sửa đổi một phân hoạch sau khi nó được tạo ra và sao chép các

khối kết hợp từ phân hoạch khác. Việc hợp nhất các phân hoạch cũng phải

được thực hiện một cách cẩn thận để tránh sự lặp lại của dữ liệu trong phân

hoạch kết hợp, nó có thể làm cho dữ liệu khối bị lỗi.

Khi đang tạo hoặc hợp nhất các phân hoạch, cần thực hiện các thao tác bằng tay hoặc tạo các bộ lọc thích hợp để đảm bảo các phân hoạch của khối luôn luôn chứa dữ liệu chính xác.

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 51 - 53)