MOLAP (MULTIDIMENSIONAL OLAP)

Một phần của tài liệu Xử lý phân tích trực tuyến OLAP và ứng dụng trong khai thác kho dữ liệu (Trang 40)

MOLAP là dạng OLAP nguyên thuỷ, đôi khi còn được gọi tắt là OLAP. MOLAP kết hợp kho dữ liệu đa chiều và các dịch vụ của OLAP trên cùng một Server. MOLAP thường được coi là cơ sở dữ liệu đa chiều (MultiDimension

DB- MDDB). MDDB là một cấu trúc tối ưu cho việc lưu trữ các sự kiện đã phân loại và cùng với nó là các chiều. Dữ liệu được tổ chức theo khung nhìn dữ liệu và được lưu trữ trong một biểu mẫu được kết hợp và tổng hợp.

Các công cụ của MOLAP cho phép truy cập vào dữ liệu chi tiết trong hệ quản trị RDBMS như sau:

Hình 2.4 Kiến trúc của MOLAP

MOLAP là sự lựa chọn tốt nhất cho những ứng dụng có đặc điểm: - Yêu cầu tốc độ truy vấn cao

- Có khả năng phân tích dữ liệu phức hợp

- Dễ sử dụng: vì dữ liệu đã được tổng hợp từ trước và được lưu trong kho dữ liệu đa chiều. Người sử dụng chỉ cần xác định các chiều và các nhóm nằm trong các chiều đó.

Thiết kế MOLAP bao gồm những bƣớc cơ bản nhƣ sau:

 Chọn chức năng công việc

 Xác định những giá trị số, những đại lượng đo để lưu trữ

 Xác định các chiều và đơn vị của mỗi chiều như thời gian thì theo tháng và quý, vị trí địa lý thì theo quốc gia hay tỉnh, huyện.

SQL Máy chủ CSDL RDBM S M¸y chñ MOLAP Siêu dữ liệu, xử lý truy vấn Các công cụ người dùng cuối Tải về Kết quả Yêu cầu truy vấn Kết quả

 Định nghĩa mô hình logic và tải vào kho dữ liệu đa chiều hoặc trực tiếp từ các nguồn dữ liệu hoặc thông qua việc lọc và kết hợp những nội dung được lựa chọn của DW hoặc DM.

Quản trị và quản lí hệ thống với cách thức này đòi hỏi:

 Mô hình dữ liệu khởi tạo phải chọn đúng các chiều và đơn vị của chúng, thấy trước được dữ liệu sẽ được truy nhập như thế nào và việc lựa chọn những phép lọc thích đáng để tải dữ liệu vào từ DW là những vấn đề quan trọng đáng quan tâm.

 Truyền dữ liệu định kì và cập nhật nhiều dữ liệu cùng lúc bởi vì trong khi cơ sở dữ liệu đang được sử dụng thì số lần cập nhật cần phải hạn chế.

 Sự kết hợp, tổng kết và tính toán trước trong quá trình tải dữ liệu vào.

 Đào tạo một công nghệ khác và cách sử dụng những kĩ năng mới này.

 Viết những ứng dụng mới với một ngôn ngữ độc quyền để mở rộng và cải thiện chuẩn đầu cuối (giao diện với người sử dụng đầu cuối) của cơ sở dữ liệu.

Một số vấn đề cần quan tâm khi sử dụng cách tiếp cận này:

 Kích cỡ của cơ sở dữ liệu đa chiều được hỗ trợ nhỏ hơn so với một cơ sở dữ liệu quan hệ. Công nghệ sử dụng ma trận thưa được sử dụng để tiết kiệm không gian nhớ.

 Không thể khoan sâu dữ liệu tới mức chi tiết do ảnh hưởng phụ của việc lưu trữ dữ liệu ở mức thô (như những dữ liệu tổng, những dữ liệu được tính toán trước và những dữ liệu kết xuất từ những dữ liệu khác)

 Truy nhập và an toàn là có sẵn cho các mức cao; không có những ưu tiên dựa trên việc sử dụng hoặc những kiểm soát truy nhập ở các mức con.

 Những thay đổi trong cấu trúc đa chiều đòi hỏi cơ sở dữ liệu đa chiều được tổ chức lại; những phương tiện lưu trữ và sao lưu có sẵn bị hạn chế.

 Cần những ứng dụng đầu cuối đặc biệt hạn chế những khả năng lựa chọn. Các mở rộng ở những ứng dụng đầu cuối của một cơ sở dữ liệu đa chiều không thể được dùng cho một cơ sở dữ liệu đa chiều khác.

Một phần của tài liệu Xử lý phân tích trực tuyến OLAP và ứng dụng trong khai thác kho dữ liệu (Trang 40)