Tiếp cận kho dữ liệu và OLAP

Một phần của tài liệu Tiểu luận môn Hệ hỗ trợ quyết định PHÂN TÍCH DỮ LIỆU TRỰC TUYẾN (OLAP) XÂY DỰNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰA VÀO DỮ LIỆU (Trang 27)

Hoạt động xử lý thông tin có thể được phân thành hai loại : phân tích tác vụ (Operations Analysis) và phân tích hướng quyết định (Decision Oriented Analysis). Kho dữ liệu (Data Warehouse) và OLAP có thể được xem như là các thành phần hoạt động xử lý thông tin hướng quyết định dựa trên phân tích. Trong đó, kho dữ liệu đóng vai trò cung cấp dữ liệu và OLAP đóng vai trò phân tích, khai thác các dữ liệu này. Nói một cách khác, để có thể hỗ trợ ra quyết định dựa vào dữ liệu cần xây dựng hai thành phần quan trọng là kho dữ liệu và OLAP.

Để có khả năng cung cấp những dữ liệu quyết địn cho những người ra quyết định, cần sử dụng một cách lưu trũ dữ liệu cho phép họ quản lý, khai thác dữ liệu một cách dễ dàng. Cách lưu trũ dữ liệu kiểu này là kho dữ liệu. Một kho dữ liệu là một CSDL được thiết kế để trả lời các câu hỏi. Nó là nơi chứa nhiều loại dữ liệu từ các nguồn khác nhau (các hệ thống xử lý tác vụ). Dữ liệu từ ngững nguồn này được chuyển dịch vào trong kho dữ liệu, được đánh chỉ mục và được kết nối lại để có thể được truy xuất nhanh chóng và dễ dàng hơn, phục vụ cho các ứng dụng trợ giúp ra quyết định. Về trực giác, kho dữ liệu được hiểu như là một kho dữ liệu ổn định, phản ánh hoạt động của một đơn vị trong quá khứ.

Một khi dữ liệu được thu thập, người sử dụng còn cần có nột phương cách tốt để dễ dàng khai thác chúng nằm truy xuất được các mẫu dữ liệu mà họ quan tâm. Hệ thống OLAP giúp cho họ làm điều này. Có vài cách tiếp cận khác nhau tới việc biểu diễn OLAP, nhưng thực chất là tiếp cận lưu trũ dữ liệu đa chiều. Biểu diễn này cho ta một ma trận được định chiều của các ô. Sẽ có các ô chứa dữ liệu nhập từ ngoài (các phần tử dữ liệu cơ sở) và các ô còn lại sẽ được tính toán từ các tiến trình gộp và chuyển dịch dữ liệu. Hệ thống OLAP là một hệ thống quản lý dữ liệu giàu năng lực, nó cho cho phép người sử dụng cắt lát dữ liệu theo nhiều khía cạnh khác nhau. Nếu người sử dụng cần thiết quan tâm chi tiết hơn về mẫu dữ liệu nào đó, họ có thể khoan sâu xuống (Drill_down) chi tiết

chúng ở nhiều mức. Người sử dụng có thể truy xuất được những dữ liệu cần thiết một cách nhanh chóng và dễ dàng và không cần thực hiện lại những công việc lập trình. Các yêu cầu chức năng chính của một hệ thống OLAP là : truy xuất và tính toán nhanh, có khả năng phân tích mạnh, linh hoạt (phân tích linh hoạt, hiển thị dữ liệu linh hoạt) và hỗ trợ nhiều người sử dụng. Cũng như các hệ thống thông tin khác, các hệ thống OLAP vẫn yêu cầu phải có các chức năng như : sự chính xác và thích hợp với thời gian. Tuy nhiên chúng lại là các hệ thống duy nhất cố gắng cung cấp thêm các chức năng đặc biệt quan trọng đó là khả năng truy xuất nhanh, linh hoạt, thuận tiện với số lượng lớn các dữ liệu được phát sinh từ các nguồn dữ liệu thu thập có thể thay đổi thường xuyên và hỗ trợ nhiều người sử dụng.

OLAP nhắm tới việc đáp ứng xu hướng gia tăng số lượng và sư phức tạp của các dữ liệu cần thiết cho việc ra quyết định, tới việc gia tăng số người đang sử dụng một nguồn dữ liệu góp chung, tới việc gia tăng số lượng công việc cần thiết ra các quyết định không theo kế hoạch và tới sự gia tăng việc phân phối dữ liệu và xử lý liên quan đến một truy vấn.

Tóm lại, muốn có khả năng cùng lúc nhìn vào chiều CSDL khác nhau qua việc kết hợp dữ liệu của chúng để làm cho chúng có thể được truy vấn dễ dàng hơn thì kho dữ liệu là một lựa chọn tốt. Nếu chúng ta muốn cung cấp cho người sử dụng khả năng phân tích dữ liệu nhanh chóng và phong phú thì giải pháp OLAP là thích hợp.

Sau đây là sơ đồ hệ thống kho dữ liệu và OLAP : Đầu tiên dữ liệu từ các nguồn dữ liệu từ xa khác nhau (của các hệ thống xử lý tác vụ) được nạp vào. Trong quá trình nạp, dữ liệu cần được đổi sang dạng chung nhất, được làm sạch và chuyển dịch thành những kết quả gộp tương đối có thể hữu dụng cho việc phân tích. Cuối cùng dữ liệu được đặt vào kho dữ liệu và được đánh chỉ mục để có thể truy xuất nhanh chóng. Một khi dữ liệu đã ở trong kho dữ liệu, xử lý OLAP trở nên quan trọng cho việc trả lời các truy vấn. Các hệ thống OLAP cho chúng ta khám phá dữ liệu trong những cách hướng tới việc ra quyết định. Các hệ thống OLAP cần có giao diện dồ họa và cho phép người sử dụng nhìn thấy dữ liệu trong dạng số (như bảng) và trong những dạng biểu diễn đồ họa (như biểu đồ). Người sử dụng có thể khoan sâu xuống bằng việc chọn vào các vùng trên màn hình để xem chi tiết hơn.

Hình 4.2 : Kho dữ liệu và hệ thống OLAP

Một phần của tài liệu Tiểu luận môn Hệ hỗ trợ quyết định PHÂN TÍCH DỮ LIỆU TRỰC TUYẾN (OLAP) XÂY DỰNG HỆ TRỢ GIÚP QUYẾT ĐỊNH DỰA VÀO DỮ LIỆU (Trang 27)