Giới thiệu về OLAP

Một phần của tài liệu Thiết kế data warehouse và ứng dụng trong hệ thống thông tin ngành điện (Trang 44)

Người dùng cần khả năng thực hiện phân tích đa chiều với những tính toán phức tạp nhưng với những công cụ truyền thống như lập báo cáo, truy vấn các sản phẩm trong cơ sở dữ liệu, bảng tính thì các ngôn ngữ thông thường là rất khó khả thi bởi các công cụ được sử dụng trong hệ thống OLTP và môi trường data warehouse là hoàn toàn khác nhau. Chúng ta cần một tập các công cụ đặc biệt phục vụ cho mục đích phân tích dữ liệu. Đó chính là môi trường OLAP (On-Line Analytical Processing ) trong data warehouse.

Thuật ngữ OLAP hay xử lý phân tích trực tuyến được giới thiệu E. F. Codd [9]- cha để của mô hình cơ sở dữ liệu quan hệ hướng dẫn cho một hệ thống OLAP.

Định nghĩa: OLAP là loại kỹ thuật phần mềm cung cấp khả năng phân tích, quản lý

và thực thi để lấy dữ liệu với phương thức truy cập nhanh, nhất quán, khả năng tương tác trong các hệ thống thông tin lớn phản ánh một cách nhìn đa chiều về doanh nghiệp. Như vậy, định nghĩa trên bao gồm tất cả các thành phần chính như: tấc độ, tính nhất quán, khă năng tương tác và khung nhìn đa chiều.

E. F. Codd [9] đề xuất ra 12 nguyên tắc hay hướng dẫn cho một hệ thống OLAP như sau:

Khung nhìn khái niệm đa chiều: Cung cấp mô hình dữ liệu đa chiều nhằm hướng

đến mục đích phân tích và tính dễ sử dụng. Thông thường cách nhìn của người dùng kinh doanh là đa chiều. Do đó, mô hình dữ liệu đa chiều thích hợp cho người dùng giải quyết các vấn đề liên quan đến nghiệp vụ.

Tính trong suốt: Các khía cạnh về công nghệ, data warehouse, kiến trúc tính toán...

tất cả đều trong suốt đến người sử dụng, giải quyết các vấn đề về nghiệp vụ của người dùng thông qua công cụ có giao diện đơn giản, dễ sử dụng.

Khả năng truy cập: Hệ thống OLAP phải ánh xạ được tới kênh logic của chính nó tới

data warehouse vật lý hỗn độn và thực hiện các chuyển đổi dữ liệu cần thiết để tạo ra một khung nhìn đơn giản, mạch lạc cho người sử dụng.

Khả năng tạo báo cáo thống nhất: Khi số lượng các chiều tăng thì năng suất tạo báo

cáo giảm đi.

Kiến trúc client/server: Thành phần server của các công cụ OLAP cần phải đủ thông

minh đến mức mà nhiều client có thể truy cập tới một cách dễ dàng và có thể lập trình tích hợp. Server thông minh phải có đủ khả năng để ánh xạ và xây dựng dữ liệu từ những cơ sở dữ liệu vật lý và logic khác hẳn nhau. Điều đó rất cần thiết để đảm bảo tính trong suốt và xây dựng một lược đồ mức khái niệm, logic, vật lý chung.

Mô hình chiều: Mỗi chiều của dữ liệu phải cân bằng giữa cấu trúc và khả năng thực

hiện của nó. Thường chỉ tồn tại một cấu trúc chung cho tất cả các chiều. Mọi chức năng được áp dụng cho một chiều cũng có thể áp dụng cho các chiều khác.

Xử lý ma trận động: Cấu trúc vật lý của server OLAP cần phải biến đổi cho phù hợp

với mô hình phân tích cụ thể được tạo ra và tải vào để việc quản lý các ma trận thưa là tối ưu nhất. Khi làm việc với các ma trận thưa thì server OLAP có khả năng suy luận ra và tìm ra cách lưu trữ dữ liệu hiệu quả nhất. Các phương pháp truy nhập vật lý cũng được thay đổi thường xuyên và cung cấp những kiểu cơ chế khác nhau ví dụ như tính toán trực tiếp, cây nhị phân, kỹ thuật băm hoặc sự kết hợp tốt nhất giữa những kỹ thuật như vậy.

Hỗ trợ nhiều người dùng: Những công cụ của OLAP phải cung cấp truy nhập đồng

thời (lấy dữ liệu ra và cập nhật), tính toàn vẹn và an toàn để hỗ trợ cho những người sử dụng làm việc đồng thời với cùng một mô hình phân tích hoặc tạo ra những mô hình khác nhau từ cùng một dữ liệu.

Những phép toán giữa các chiều không hạn chế: Trong phân tích dữ liệu đa chiều,

tất cả các chiều được tạo ra và có vai trò như nhau. Các công cụ OLAP quản lý những tính toán liên quan đến các chiều và không yêu cầu người sử dụng định nghĩa những phép toán đó. Việc tính toán đòi hỏi phải định nghĩa các công thức tuỳ thuộc vào một ngôn ngữ, ngôn ngữ này phải cho phép tính và thao tác với một số lượng chiều bất kỳ, mà không bị hạn chế bởi mối quan hệ giữa các phần tử, không liên quan tới số thuộc tính chung của dữ liệu mỗi phần tử.

Thao tác tập trung vào dữ liệu: Những thao tác như định hướng lại đường dẫn xây

dựng dữ liệu hoặc khoan sâu xuống theo các chiều hoặc các hàng được thực hiện bằng hành động trực tiếp trên những phần tử của mô hình phân tích mà không đòi hỏi phải sử dụng những menu hay ngắt cho giao diện với người sử dụng. Những chiều được định nghĩa trong mô hình phân tích chứa tất cả thông tin mà người sử dụng cần để thực hiện những hành động cố hữu.

Tạo báo cáo linh hoạt: Việc sử dụng OLAP server và các công cụ của nó, một người

sử dụng cuối có thể thao tác, phân tích, đồng bộ hoá và xem xét dữ liệu theo bất kỳ các nào mà ngườidùng đó mong muốn. Những phương tiện tạo báo cáo cũng phải cung cấp tính linh hoạt và đưa ra những thông tin đã được đồng bộ theo bất kỳ cách nào mà người sử dụng muốn hiển thị chúng.

Không hạn chế số chiều và các mức liên kết dữ liệu: Một server OLAP có thể chứa

được ít nhất là 15 chiều trong một mô hình phân tích thông thường nhất. Mỗi một trong số các chiều đó cho phép một số lượng không giới hạn các mức tổng kết và kết hợp dữ liệu do người sử dụng định nghĩa và đưa ra cách xây dựng các mức đó.

Một phần của tài liệu Thiết kế data warehouse và ứng dụng trong hệ thống thông tin ngành điện (Trang 44)

Tải bản đầy đủ (PDF)

(96 trang)