Tiếp cận kho dữ liệu và OLAP

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định TÌM HIỂU PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN VÀ ÁP DỤNG XÂY DỰNG HỆ HỖ TRỢ QUYẾT ĐỊNH (Trang 70 - 72)

Hoạt động xử lý thông tin có thểđượcphân thành hai loại: phân tích tác vụ(Operations Analysis) và phân tích hướng quyết định (Decision Oriented Analysis). Kho dữ liệu (Data Warehouse) và OLAP có thểđượcxem nhưlà các thành phần của hoạt động xử lý thông tin hướng quyết định dựa trên phân tích (Analysis Based Decision Oriented Information Processing). Trong đó, kho dữ liệu đóng vai trò cung cấp dữ liệu và OLAP đóng vai trò phân tích, khai thác các dữ liệu này. Nói một cách khác, đểcó thểTrợ giúp quyết định dựa vào dữ liệu cần xây dựng hai thành phần quan trọng là kho dữ liệu và OLAP.

Đểcó khả năng cung cấp những dữ liệu quyết định cho những người ra quyết định, cần sửdụng một cách lưu trữdữ liệu cho phép họquản lý, khai thác dữ liệu một cách dễdàng. Cách lưu trữdữ liệu kiểu này là kho dữ liệu. Một kho dữ liệu là một CSDL đượcthiếtkếđểtrảlời các câu hỏi. Nó là nơi chứa nhiều loạidữ liệu từcác nguồn khác nhau (các hệ thống xử lý tác vụ). Dữ liệu từnhững nguồn này đượcchuyển dịch vào trong kho dữ liệu, được đánh chỉmục và đượckết nối lạiđểcó thểđượctruy xuấtnhanh chóng và dễ dàng hơn, phục vụcho các ứng dụng Trợ giúp ra quyết định. Vềtrực giác, kho dữ liệu đượchiểu nhưlà một kho dữ liệu ổn định, phản ánh hoạt động của một đơnvịtrong quá khứ.

Một khi dữ liệu đã được thu thập, người sử dụng còn cần có một phương cách tốt đểdễdàng khai thác chúng nhằm truy xuấtđượccác mẫu dữ liệu mà họquan tâm. Hệ thống OLAP giúp cho họlàm điều này. Có vài cách tiếp cận khác nhau tới việc biểu diễn OLAP, nhưng chung nhấtlà tiếp cận lưu trữdữ liệu đa chiều. Biểu diễn này cho ta một ma trận đượcđịnh chiều của các ô. Sẽcó các ô chứa dữ liệu nhập từngoài (các phần tửdữ liệu cơsở) và

các ô còn lạisẽđượctính toán từcác tiến trình gộp và chuyển dịch dữ liệu. Hệ thống OLAP là một hệ thống quản lý dữ liệu giàu năng lực, nó cho phép người sử dụng cắtlát dữ liệu theo nhiều khía cạnh khác nhau. Nếu ngườisử dụng cần

thiếtquan tâm chi tiếthơn vềmẫu dữ liệu nào đó, họcó thểkhoan sâu xuống (Drill_down) chi tiếtcủa dữ liệu. Hệ thống OLAP cho phép người sửdụng “tiến sâu” vào dữ liệu và khám phá chúng ởnhiều mức. Ngườisử dụng có thểtruy xuấtđượcnhững dữ liệu cần thiếtmột cách nhanh chóng và dễdàng mà không cần thực hiện lạicông việc lập trình. Các yêu cầu chức năng chính của một hệ thống OLAP là: truy xuấtvà tính toán nhanh, có khả năng phân tích mạnh, linh

hoạt(phân tích linh hoạt, giao diện linh hoạt, hiển thị dữ liệu linh hoạt) và hỗ trợnhiều người sử dụng. Cũng như các hệ thống thông tin khác, các hệ thống OLAP vẫn yêu cầu phảicó các chức năng như: sựchính xác và thích hợp với thời gian. Tuy nhiên chúng lạilà các hệ thống duy nhấtcốgắng cung cấp thêm các chức năng đặcbiệtquan trọng đó là khả năng truy xuấtnhanh, linh hoạt, thuận tiện tới sốlượng lớn các dữ liệu được phát sinh từcác nguồn dữ liệu nhập có thểthay đổithường xuyên và hỗ trợ nhiều người sử dụng.

OLAP nhắm tới việc đáp ứng xu hướng gia tăng sốlượng và Sự phức tạp của các dữ liệu cần thiếtcho việc ra quyết định, tới việc gia tăng sốngười đang sửdụng một nguồn dữ liệu góp chung, tới việc gia tăng sốlượng công việc cần thiếtra các quyết định không theo kếhoạch và tới sựgia tăng việc phân phối dữ liệu và xử lý liên quan đếnmột truy vấn.

Tóm lại, muốn có khả năng cùng lúc nhìn vào nhiều CSDL khác nhau qua việc kết hợp dữ liệu của chúng đểlàm cho chúng có thểđượctruy vấn dễ dàng hơn thì kho dữ liệu là một lựa chọn tốt. Nếu chúng ta muốn cung cấp cho người sử dụng khả năng phân tích dữ liệu nhanh chóng và phong phú thì giảipháp OLAP là thích hợp.

Sau đây là sơđồvề hệ thống kho dữ liệu và OLAP: Đầutiên dữ liệu từ các nguồn dữ liệu từxa khác nhau (của các hệ thống xử lý tác vụ) đượcnạp vào. Trong quá trình nạp, dữ liệu cần đượcđổisang dạng chung nhất, được làm sạch và

đượcchuyển dịch thành những kếtquảgộp tương đốicó thểhữu dụng cho việc phân tích. Cuối cùng dữ liệu đượcđặtvào kho dữ liệu và được đánh chỉmục đểcó

thểtruy xuấtnhanh chóng. Một khi dữ liệu đã ởtrong kho dữ liệu, xử lý OLAP trởnên quan trọng cho việc trảlời các truy vấn. Các hệ thống OLAP cho chúng ta khám phá dữ liệu trong những cách hướng tới việc ra quyết định. Các hệ thống OLAP cần có các giao diện đồhọa cho phép người sử dụng nhìn thấy dữ liệu trong dạng số(nhưbảng) và trong những dạng biểu diễn đồhọa (nhưbiểu

đồ).Người sử dụng có thểkhoan sâu xuống bằng việc chọn vào các vùng trên màn hình đểxem chi tiếthơn.

Hình 4.2. Kho dữ liệu và hệ thống OLAP

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định TÌM HIỂU PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN VÀ ÁP DỤNG XÂY DỰNG HỆ HỖ TRỢ QUYẾT ĐỊNH (Trang 70 - 72)