Tiếp cận đa chiều

Một phần của tài liệu Phương pháp xử lý phân tích trực tuyến (Trang 39 - 40)

OLAP là hoạt động xử lý tạo lập, quản lý dữ liệu đa chiều trong thực tế, giúp người sử dụng dễ dàng trong việc phân tích, tham khảo dữ liệu, nhằm hiểu được các thông tin tiềm ẩn mà dữ liệu đang chứa đựng. Các yêu cầu chính yếu của OLAP là:

• Truy xuất, tính toán nhanh.

• Có khả năng phân tích mạnh.

• Linh hoạt (phân tích linh hoạt, giao diện linh hoạt, hiển thị dữ liệu linh hoạt).

• Hỗ trợ nhiều người sử dụng.

Vấn đềđặt ra là phải chọn tiếp cận tổ chức dữ liệu nào đểđáp ứng được những yêu cầu chức năng này của OLAP và mô hình dữ liệu đa chiều thực tế. Nhiều người đã cố tìm cách sử dụng bảng tính hay SQL để áp dụng OLAP vào nhưng điều này rất khó khăn, nhiều hạn chế và điều quan trọng là không thể hiện được những đặc trưng của OLAP, không đáp ứng được với những yêu cầu chức năng của OLAP và mô hình đa chiều. Lý do chủ yếu dẫn đến việc bảng tính bị hạn chế khi cố gắng tạo lập mô hình dữ liệu đa chiều đó là vì bảng tính không tách cấu trúc của mô hình ra khỏi những thể hiện của mô hình đó. Như vậy nó chỉ có thểđược áp dụng đối với một bài toán đơn giản, trên một số lượng nhỏ dữ liệu được tổ chức dưới dạng bảng hai chiều. SQL cho chúng ta phương tiện truy vấn dựa trên các cột của dữ liệu nhưng không áp dụng được cho tất cả các trường hợp phân tích và cho việc so sánh trên các dòng. Cả hai tiếp cận này đều không làm cho chúng ta truy vấn dễ dàng khối lượng dữ liệu lớn được tổ chức một cách phức tạp. Tiếp cận tốt nhất để cung cấp xử lý hướng đến quyết định dựa trên phân tích và phù hợp với những yêu

cầu của OLAP là tiếp cận đa chiều. Các mô hình doanh nghiệp yêu cầu khả

năng gộp dữ liệu ở nhiều mức khác nhau trong các chiều. Người phân tích cần có khả năng lướt nhanh dữ liệu thông qua việc thay đổi cấu hình hiển thị của dữ liệu trên màn hình. Họ cần có khả năng phân tích dữ liệu, chủ yếu là dựa vào việc tổng hợp và so sánh dữ liệu trên các chiều. Tiếp cận đa chiều có nhiều ưu điểm rõ ràng hơn tiếp cận bảng tính (Spreadsheet) hay SQL trên cả

hai công việc định nghĩa và sử dụng các mô hình như vậy.

Sự tách riêng cấu trúc dữ liệu (được định nghĩa trong các chiều) ra khỏi biểu diễn của dữ liệu là một thuận lợi lớn của tiếp cận đa chiều. Nó làm tối thiểu sự cần thiết lập lại các thông tin về cấu trúc và cung cấp sự hỗ trợ trực tiếp cho việc làm thay đổi dễ dàng các yêu cầu hiển thị. Ngoài ra sự hỗ trợ

trực tiếp của các chiều đa mức và khả năng gán các công thức trên trục (Axis- based) thay vì các công thức trên ô (Cell-based) làm việc định nghĩa các phép gộp đa mức và các tính toán đa chiều dễ dàng.

OLAP là công cụ phân tích trực tuyến. Bản chất cốt lõi của OLAP là dữ

liệu được lấy ra từ kho dữ liệu hoặc Datamart sau đó được chuyển thành mô hình đa chiều và được lưu trữ trong một kho dữ liệu đa chiều (dữ liệu được lưu trữ theo mảng thay vì bản ghi như mô hình quan hệ). Các dịch vụ (hay công cụ) OLAP lấy dữ liệu trong kho dữ liệu để thực hiện các công việc phân tích đặc biệt theo nhiều chiều, phức tạp hỗ trợ cho việc ra quyết định. Giản đồ

hình sao được dùng để thiết kế mô hình dữ liệu trong kho dữ liệu hoặc Datamart là mô hình dữ liệu quan hệ nhưng lại mang những thuộc tính nhiều chiều có rất nhiều thuận lợi cho việc cài đặt OLAP.

Một phần của tài liệu Phương pháp xử lý phân tích trực tuyến (Trang 39 - 40)

Tải bản đầy đủ (PDF)

(125 trang)