Để có công cụ phân tích OLAP, bạn phải cài đặt SQL Server 2005 (2008) phiên bản Developer hoặc phiên bản Enterprise Edition đầy đủ và khi cài đặt nhớ chọn mục “SQL Server Database Services” và “Analysis Services”. Công cụ cho phép thực hiện OLAP là “SQL Server Business Intelligence Development Studio - BIDS”. Khi cài SQL Server các phiên bản trên thì BIDS sẻ được tự động cài đặt.
Khởi động SQL Server Business Intelligence Development Studio Tạo một Analysis Services Project mới có tên “OLAP Cube”
Trong của sổ Solution Explorer của Project OLAP cube, bấm phím phải chuột vào Data Source để tạo một bộ kết nối đến dữ liệu dùng cho phân tích.
Xác định các tham số kết nối đến kho dữ liệu có tên “DW” đã tạo ra trong SQL Server Management Studio.
Đặt tên cho Data Source vàm bấm Finish để hoàn thành việc kết nối đến cơ sở dữ liệu.
Tạo Data Source View để lấy các bảng dữ liệu cần thiêt cần cho phân tích. Bấm phím phải chuột vào Data Source View trong của sổ Solution Explorer chọn New Data Source View
Chọn Next và chọn các bảng cần cho phân tích
Chú ý: Nếu bạn muốn chọn bảng Fact và các bảng Dimension liên quan đến bảng Fact thì chỉ cần chọn Fact Table đưa qua khung bên phải và bấm nút "Add Related Tables" để tự động lấy các bảng Dimensions liên quan.
Sau khi tao Data Source và Data Source View ta tạo dữ liệu khối cho phân tích bằng cách bấm chuột phải lên Cube trong Solution Explorer và chọn New Cube.
Chọn Next và chọn nguồn dữ liệu cho Khối (DW), hệ thống sẽ tự động dò tìm fact và Dimension Tables
Sau khi tạo ra khối dữ liệu cho phân tích, để thực thi OLAP ta bấm phím phải chuột vào tên project trong Solution Explorer và chọn Deploy
Sau khi thực thi xong project, để thực hiện các phân tích OLAP phục vụ cho công tác quản lý, bấm phím phải chuột vào Cube trong Solution Explorer chọn Browse để xuất hiện mà hình phân tích:
Màn hình phân tích OLAP như sau:
Panel bên trái chứa các Measure và các Dimensions đã định nghĩa khi xây dựng khối. Panel bên phải chia làm 2 cửa sổ, cửa sổ phía trên dùng để xác định các điều kiện để phân tích, cửa sổ phía dưới chứa kết quả các measure khi ta kéo thả (drag and drop) các measure từ panel bên trái qua. Tùy theo mục đích phân tích mà chúng ta xác lập các biểu thức phân tích cho phù hợp.
Tùy theo nhu cầu phân tích dữ liệu, bạn có thể tạo ra các lát cắt (slice) dữ liệu trên nhiều chiều khác nhau để sinh ra các tổng hợp dữ liệu cần thiết cho nhu cầu phân tích dữ liệu trong kho rất nhanh chóng và tiện lợi.
Ngoài kỹ thuật phân tích OLAP, SQL Server Business Intelligence Development Studio còn cung cấp các kỹ thuật để khai phá dữ liệu như Regression, Association, Decision tree, Time Series, Clustering.. trong mục Mining Structure rất mạnh và tiện lợi để xây dựng các mô hình khai phá dữ liệu
KẾT LUẬN
Bài thu hoạch đã tìm hiểu các phương pháp khai phá dữ liệu, quá trình khai phá dữ liệu, giới thiệu về OLAP, một kỹ thuật sử dụng cách thể hiện dữ liệu đa chiều nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu. Định hình mô hình dữ liệu đa chiều.
Bài thu hoạch đã đề cập chi tiết về công cụ OLAP, giới thiệu dịch vụ OLAP của Microsoft SQL Server, kiến trúc khối của OLAP và các dạng mô hình OLAP. Những kĩ thuật khai phá dữ liệu, phát hiện tri thức có ý nghĩa đối với công tác quản lý và người quản lý, trong việc ra các quyết định về đào tạo và nghiên cứu khoa học. Để tăng cường
trợ giúp quyết định, đã giới thiệu tổng quan về hệ trợ giúp quyết định DSS, giới thiệu các thành phần cơ bản của DSS, phân tích những đặc tính và những khả năng của DSS.
Dựa trên các kĩ thuật, phương pháp luận xử lý dữ liệu trực tuyến, nhằm tăng cường công tác quản lý, bài thu hoạch đã thực hiện một demo nhỏ sử dụng hệ quản trị cơ sở dữ liệu SQL SERVER. Tuy demo còn đơn giản nhưng đã thể hiện được vai trò khai phá dữ liệu của kĩ thuật OLAP.