Tiếp cận đa chiều

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 39 - 40)

Chương I Khai thác dữ liệu và xử lý phân tích trực tuyến

3.1.Tiếp cận đa chiều

OLAP là hoạt động xử lý tạo lập, quản lý dữ liệu đa chiều trong thực tế, giúp người sử dụng dễ dàng trong việc phân tích, tham khảo dữ liệu, nhằm hiểu được các thông tin tiềm ẩn mà dữ liệu đang chứa đựng. Các yêu cầu

chính yếu của OLAP là:

• Truy xuất, tính tốn nhanh.

• Có khả năng phân tích mạnh.

• Linh hoạt (phân tích linh hoạt, giao diện linh hoạt, hiển thị dữ liệu linh hoạt).

• Hỗ trợ nhiều người sử dụng.

Vấn đề đặt ra là phải chọn tiếp cận tổ chức dữ liệu nào để đáp ứng được những yêu cầu chức năng này của OLAP và mơ hình dữ liệu đa chiều thực tế. Nhiều người đã cố tìm cách sử dụng bảng tính hay SQL để áp dụng OLAP

vào nhưng điều này rất khó khăn, nhiều hạn chế và điều quan trọng là không thể hiện được những đặc trưng của OLAP, không đáp ứng được với những

yêu cầu chức năng của OLAP và mơ hình đa chiều. Lý do chủ yếu dẫn đến

việc bảng tính bị hạn chế khi cố gắng tạo lập mơ hình dữ liệu đa chiều đó là vì bảng tính khơng tách cấu trúc của mơ hình ra khỏi những thể hiện của mơ hình đó. Như vậy nó chỉ có thể được áp dụng đối với một bài toán đơn giản, trên một số lượng nhỏ dữ liệu được tổ chức dưới dạng bảng hai chiều. SQL cho chúng ta phương tiện truy vấn dựa trên các cột của dữ liệu nhưng không áp dụng được cho tất cả các trường hợp phân tích và cho việc so sánh trên các dòng. Cả hai tiếp cận này đều không làm cho chúng ta truy vấn dễ dàng khối lượng dữ liệu lớn được tổ chức một cách phức tạp. Tiếp cận tốt nhất để cung cấp xử lý hướng đến quyết định dựa trên phân tích và phù hợp với những yêu

cầu của OLAP là tiếp cận đa chiều. Các mơ hình doanh nghiệp yêu cầu khả năng gộp dữ liệu ở nhiều mức khác nhau trong các chiều. Người phân tích cần có khả năng lướt nhanh dữ liệu thơng qua việc thay đổi cấu hình hiển thị của dữ liệu trên màn hình. Họ cần có khả năng phân tích dữ liệu, chủ yếu là dựa vào việc tổng hợp và so sánh dữ liệu trên các chiều. Tiếp cận đa chiều có

nhiều ưu điểm rõ ràng hơn tiếp cận bảng tính (Spreadsheet) hay SQL trên cả hai cơng việc định nghĩa và sử dụng các mơ hình như vậy.

Sự tách riêng cấu trúc dữ liệu (được định nghĩa trong các chiều) ra khỏi biểu diễn của dữ liệu là một thuận lợi lớn của tiếp cận đa chiều. Nó làm tối thiểu sự cần thiết lập lại các thông tin về cấu trúc và cung cấp sự hỗ trợ trực tiếp cho việc làm thay đổi dễ dàng các yêu cầu hiển thị. Ngoài ra sự hỗ trợ trực tiếp của các chiều đa mức và khả năng gán các cơng thức trên trục (Axis- based) thay vì các cơng thức trên ô (Cell-based) làm việc định nghĩa các phép gộp đa mức và các tính tốn đa chiều dễ dàng.

OLAP là cơng cụ phân tích trực tuyến. Bản chất cốt lõi của OLAP là dữ liệu được lấy ra từ kho dữ liệu hoặc Datamart sau đó được chuyển thành mơ hình đa chiều và được lưu trữ trong một kho dữ liệu đa chiều (dữ liệu được

lưu trữ theo mảng thay vì bản ghi như mơ hình quan hệ). Các dịch vụ (hay cơng cụ) OLAP lấy dữ liệu trong kho dữ liệu để thực hiện các cơng việc phân tích đặc biệt theo nhiều chiều, phức tạp hỗ trợ cho việc ra quyết định. Giản đồ hình sao được dùng để thiết kế mơ hình dữ liệu trong kho dữ liệu hoặc Datamart là mơ hình dữ liệu quan hệ nhưng lại mang những thuộc tính nhiều chiều có rất nhiều thuận lợi cho việc cài đặt OLAP.

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 39 - 40)