Tiếp cận kho dữ liệu và OLAP

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 71 - 73)

Hoạt động xử lý thông tin có thểđược phân thành hai loại: phân tích tác vụ (Operations Analysis) và phân tích hướng quyết định (Decision Oriented Analysis). Kho dữ liệu (Data Warehouse) và OLAP có thể được xem như là các thành phần của hoạt động xử lý thông tin hướng quyết định dựa trên phân tích (Analysis Based Decision Oriented Information Processing). Trong đó, kho dữ liệu đóng vai trò cung cấp dữ liệu và OLAP đóng vai trò phân tích, khai thác các dữ liệu này. Nói một cách khác, để có thể trợ giúp quyết định dựa vào dữ liệu cần xây dựng hai thành phần quan trọng là kho dữ liệu và OLAP.

Để có khả năng cung cấp những dữ liệu quyết định cho những người ra quyết định, cần sử dụng một cách lưu trữ dữ liệu cho phép họ quản lý, khai thác dữ liệu một cách dễ dàng. Cách lưu trữ dữ liệu kiểu này là kho dữ liệu. Một kho dữ liệu là một CSDL được thiết kế để trả lời các câu hỏi. Nó là nơi chứa nhiều loại dữ liệu từ các nguồn khác nhau (các hệ thống xử lý tác vụ). Dữ liệu từ những nguồn này được chuyển dịch vào trong kho dữ liệu, được

đánh chỉ mục và được kết nối lại để có thểđược truy xuất nhanh chóng và dễ

dàng hơn, phục vụ cho các ứng dụng trợ giúp ra quyết định. Về trực giác, kho dữ liệu được hiểu như là một kho dữ liệu ổn định, phản ánh hoạt động của một đơn vị trong quá khứ.

Một khi dữ liệu đã được thu thập, người sử dụng còn cần có một phương cách tốt để dễ dàng khai thác chúng nhằm truy xuất được các mẫu dữ

liệu mà họ quan tâm. Hệ thống OLAP giúp cho họ làm điều này. Có vài cách tiếp cận khác nhau tới việc biểu diễn OLAP, nhưng chung nhất là tiếp cận lưu trữ dữ liệu đa chiều. Biểu diễn này cho ta một ma trận được định chiều của các ô. Sẽ có các ô chứa dữ liệu nhập từ ngoài (các phần tử dữ liệu cơ sở) và

các ô còn lại sẽ được tính toán từ các tiến trình gộp và chuyển dịch dữ liệu. Hệ thống OLAP là một hệ thống quản lý dữ liệu giàu năng lực, nó cho phép người sử dụng cắt lát dữ liệu theo nhiều khía cạnh khác nhau. Nếu người sử

dụng cần thiết quan tâm chi tiết hơn về mẫu dữ liệu nào đó, họ có thể khoan sâu xuống (Drill_down) chi tiết của dữ liệu. Hệ thống OLAP cho phép người sử dụng “tiến sâu” vào dữ liệu và khám phá chúng ở nhiều mức. Người sử

dụng có thể truy xuất được những dữ liệu cần thiết một cách nhanh chóng và dễ dàng mà không cần thực hiện lại công việc lập trình. Các yêu cầu chức năng chính của một hệ thống OLAP là: truy xuất và tính toán nhanh, có khả

năng phân tích mạnh, linh hoạt (phân tích linh hoạt, giao diện linh hoạt, hiển thị dữ liệu linh hoạt) và hỗ trợ nhiều người sử dụng. Cũng như các hệ thống thông tin khác, các hệ thống OLAP vẫn yêu cầu phải có các chức năng như: sự chính xác và thích hợp với thời gian. Tuy nhiên chúng lại là các hệ thống duy nhất cố gắng cung cấp thêm các chức năng đặc biệt quan trọng đó là khả

năng truy xuất nhanh, linh hoạt, thuận tiện tới số lượng lớn các dữ liệu được phát sinh từ các nguồn dữ liệu nhập có thể thay đổi thường xuyên và hỗ trợ

nhiều người sử dụng.

OLAP nhắm tới việc đáp ứng xu hướng gia tăng số lượng và sự phức tạp của các dữ liệu cần thiết cho việc ra quyết định, tới việc gia tăng số người

đang sử dụng một nguồn dữ liệu góp chung, tới việc gia tăng số lượng công việc cần thiết ra các quyết định không theo kế hoạch và tới sự gia tăng việc phân phối dữ liệu và xử lý liên quan đến một truy vấn.

Tóm lại, muốn có khả năng cùng lúc nhìn vào nhiều CSDL khác nhau qua việc kết hợp dữ liệu của chúng để làm cho chúng có thểđược truy vấn dễ

dàng hơn thì kho dữ liệu là một lựa chọn tốt. Nếu chúng ta muốn cung cấp cho người sử dụng khả năng phân tích dữ liệu nhanh chóng và phong phú thì giải pháp OLAP là thích hợp.

Sau đây là sơ đồ về hệ thống kho dữ liệu và OLAP: Đầu tiên dữ liệu từ

các nguồn dữ liệu từ xa khác nhau (của các hệ thống xử lý tác vụ) được nạp vào. Trong quá trình nạp, dữ liệu cần được đổi sang dạng chung nhất, được làm sạch và được chuyển dịch thành những kết quả gộp tương đối có thể hữu dụng cho việc phân tích. Cuối cùng dữ liệu được đặt vào kho dữ liệu và được

đánh chỉ mục để có thể truy xuất nhanh chóng. Một khi dữ liệu đã ở trong kho dữ liệu, xử lý OLAP trở nên quan trọng cho việc trả lời các truy vấn. Các hệ

thống OLAP cho chúng ta khám phá dữ liệu trong những cách hướng tới việc ra quyết định. Các hệ thống OLAP cần có các giao diện đồ họa cho phép người sử dụng nhìn thấy dữ liệu trong dạng số (như bảng) và trong những dạng biểu diễn đồ họa (như biểu đồ). Người sử dụng có thể khoan sâu xuống bằng việc chọn vào các vùng trên màn hình để xem chi tiết hơn.

Hình 4.2. Kho dữ liệu và hệ thống OLAP

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 71 - 73)