Giới thiệu OLAP

Một phần của tài liệu Xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế - xã hội (Trang 54)

OLAP (On-Line Analytical Processing) là một cơng nghệ xử lí phân tích trực tuyến các thơng tin mới đƣợc tạo ra từ những dữ liệu đang tồn tại, thơng qua một tập những chuyển đổi và các tính tốn số. Về bản chất, một hệ OLAP là hệ thống lƣu giữ những thơng tin tổng hợp và cho phép thể hiện thơng tin tổng hợp đĩ dƣới dạng bảng 2 chiều.

OLAP là một cơng nghệ phân tích dữ liệu thực hiện những cơng việc sau:  Đƣa ra một khung nhìn logic, nhiều chiều của dữ liệu trong DW. Khung

nhìn này hồn tồn khơng phụ thuộc vào việc dữ liệu đƣợc lƣu trữ nhƣ thế nào (cĩ thể đƣợc lƣu trữ trong một kho dữ liệu nhiều chiều hay một kho dữ liệu quan hệ).

 Thƣờng liên quan tới những truy vấn phân tích tƣơng tác dữ liệu. Sự tƣơng tác thƣờng là phức tạp, liên quan tới việc khoan sâu xuống tới những mức dữ liệu chi tiết hơn hoặc cuốn lên mức dữ liệu cao hơn ở mức tổng hợp hoặc kết hợp.

 Cung cấp khả năng thiết lập mơ hình phân tích bao gồm một mơ tơ tính tốn cho việc tính tỉ lệ, những biến đổi, ..., liên quan tới những đại lƣợng số hoặc dữ liệu là con số qua các chiều dữ liệu khác nhau.

 Tạo ra sự tổng hợp và kết hợp, phân cấp và dùng những mức tổng hợp, kết hợp đĩ cho mỗi phép giao của các bảng theo mỗi chiều.

 Hỗ trợ những mơ hình chức năng cho việc dự báo, phân tích các xu hƣớng và phân tích thống kê.

 Lấy và hiển thị dữ liệu theo những bảng 2 chiều hay 3 chiều, theo biểu đồ hay đồ thị, dễ dàng xoay đổi các trục cho nhau. Khả năng xoay là quan trọng bởi vì những ngƣời sử dụng cần phân tích dữ liệu từ những cách nhìn khác nhau và sự phân tích theo mỗi cách nhìn sẽ dẫn đến một câu hỏi khác, câu hỏi này sẽ đƣợc kiểm tra tính đúng đắn dựa trên một cách nhìn khác về dữ liệu đĩ.

 Đáp ứng những câu trả lời nhanh, vì vậy quá trình phân tích khơng bị cắt ngang và thơng tin khơng bị cũ.

 Sử dụng một mơ tơ kho dữ liệu đa chiều, lƣu trữ dữ liệu theo các mảng (lƣu ý là mảng lƣu trữ những phần tử cùng kiểu khác với bản ghi là các phần tử khác kiểu nhau). Những mảng này là sự biểu diễn logic của các chiều của cơng việc.

Thuật ngữ OLAP và cơ sở dữ liệu đa chiều hay đƣợc đồng nhất với nhau, gây nên sự mập mờ xung quanh hai khái niệm này. Bản chất của cơ sở dữ liệu đa chiều là một kiến trúc cơ sở dữ liệu lƣu giữ thơng tin tổng hợp bao gồm tất cả các mục dữ liệu chính (hay các chiều) tham chiếu lẫn nhau. Trong khi đĩ OLAP là một thể hiện mặt trƣớc cho phép ngƣời sử dụng đầu cuối lựa chọn các chiều và các sự kiện tham chiếu lẫn nhau. Các nguồn dữ liệu cho một ứng dụng OLAP bao gồm cơ sở dữ liệu đa chiều, cơ sở dữ liệu quan hệ và các dữ liệu bảng tính (lấy từ bất kỳ một kiến trúc CSDL nào).

Một phần của tài liệu Xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế - xã hội (Trang 54)

Tải bản đầy đủ (PDF)

(74 trang)