1.4. Tiếp cận và phân tích đa chiều trong xử lý phân tích trực tuyến
1.4.1 Tiếp cận đa chiều
OLAP là hoạt động xử lý tạo lập, quản lý dữ liệu đa chiều trong thực tế, giúp người sử dụng dễ dàng trong việc phân tích, tham khảo dữ liệu, nhằm hiểu được các thông tin tiềm ẩn mà dữ liệu đang chứa đựng. Các yêu cầu chính yếu của OLAP là [16]:
Truy xuất, tính toán nhanh. Có khả năng phân tích mạnh.
Linh hoạt (phân tích linh hoạt, giao diện linh hoạt, hiển thị dữ liệu linh hoạt). Hỗ trợ nhiều người sử dụng.
Vấn đề đặt ra là phải chọn tiếp cận tổ chức dữ liệu nào để đáp ứng được những yêu cầu chức năng này của OLAP và mô hình dữ liệu đa chiều thực tế. Người ta đã sử dụng bảng tính hay SQL để áp dụng OLAP. Nhưng điều này rất khó khăn, nhiều hạn chế và điều quan trọng là không đáp ứng được với những yêu cầu chức năng của OLAP và mô hình đa chiều. Cả hai tiếp cận này đều không làm cho chúng ta truy vấn dễ dàng khối lượng dữ liệu lớn được tổ chức một cách phức tạp. Tiếp cận tốt nhất để cung cấp xử lý hướng đến quyết định dựa trên phân tích và phù hợp với những yêu cầu của OLAP là tiếp cận đa chiều. Các mô hình doanh nghiệp yêu cầu khả năng gộp dữ liệu ở nhiều mức khác nhau trong các chiều. Người phân tích cần có khả năng lướt nhanh dữ liệu thông qua việc thay đổi cấu hình hiển thị của dữ liệu trên màn hình. Họ cần có khả năng phân tích dữ liệu, chủ yếu là dựa vào việc tổng hợp và so sánh dữ liệu trên các chiều. Sự tách riêng cấu trúc dữ liệu (được định nghĩa trong các chiều) ra khỏi biểu diễn của dữ liệu là một thuận lợi lớn của tiếp cận đa chiều. Nó làm tối thiểu sự cần thiết lập lại các thông tin về cấu trúc và cung cấp sự hỗ trợ trực tiếp cho việc làm thay đổi dễ dàng các yêu cầu hiển thị. Ngoài ra sự hỗ trợ trực tiếp của các chiều đa mức và khả năng gán các công thức trên trục (Axis-
based) thay vì các công thức trên ô (Cell-based) làm việc định nghĩa các phép gộp đa mức và các tính toán đa chiều dễ dàng.