Công cụ Olap trong SQL Server 2005

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Xây dựng cơ sở dữ liệu bài báo điện tử liên quan tới gốm sứ Việt Nam phục vụ đào tạo tại Học viện Báo chí và Tuyên truyền (Trang 37 - 42)

3.3. Thiết kế chi tiết của cơ sở dữ liệu văn bản liên quan tới Gốm sứ cổ truyền

3.3.1. Công cụ Olap trong SQL Server 2005

OLAP: là một kỹ thuật sử dụng các thể hiện dữ liệu đa chiều gọi là các khối nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu trong kho dữ liệu, OLAP tạo khối cho dữ liệu bằng các bảng chiều và bảng sự kiện, cung cấp khả năng thực hiện các truy vấn và phân tích cho các ứng dụng máy khách.

Trong khi kho dữ liệu lƣu trữ dữ liệu cho phân tích, thì OLAP là kỹ thuật cho phép các ứng dụng máy khách truy xuất hiệu quả dữ liệu này, OLAP cung cấp nhiều lợi ích cho ngƣời phân tích nhƣ:

 Cung cấp mô hình dữ liệu đa chiều trực quan cho phép dễ dàng lựa chọn, định hƣớng và khám phá dữ liệu;

 Cung cấp một ngôn ngữ truy vấn, phân tích;

 Dữ liệu đƣợc tính toán trƣớc đối với các truy vấn thƣờng xuyên, nhằm làm cho thời gian trả lời nhanh đối với các truy vấn đặc biệt.

 Cung cấp các công cụ mạnh, giúp ngƣời dùng tạo các khung nhìn mới của dữ liệu dựa trên một tập các hàm tính toán đặc biệt.

Ứng dụng OLAP: OLAP đƣợc đặt ra để xử lý các truy vấn liên quan đến lƣợng dữ liệu rất lớn mà hệ thống OLTP sẽ không thể cho kết quả hoặc sẽ mất rất nhiều thời gian.

Dịch vụ OLAP: là một máy phục vụ tầng giữa, phục vụ cho phân tích xử lý trực tuyến, hệ thống dịch vụ OLAP là một công cụ mạnh trong việc xây dựng các khối đa chiều của dữ liệu cho phân tích và cung cấp khả năng truy xuất nhanh đến thông tin khối cho các máy khách.

Các đặc điểm của dịch vụ OLAP:

 Dễ sử dụng: Bằng cách cung cấp các giao diện ngƣời dùng và các trợ giúp

thực hiện.

 Linh động: Mô hình dữ liệu mạnh cho định nghĩa khối và lƣu trữ.  Các khối có thể ghi:.

 Kiến trúc có thể co dãn: Cung cấp một sự đa dạng các kịch bản lƣu trữ và giải pháp tự động đối với “hội chứng bùng nổ dữ liệu” mà gây khó chịu cho các kỹ thuật OLAP.

 Tích hợp các công cụ quản trị, bảo mật, nguồn dữ liệu

 Hỗ trợ rộng rãi các hàm API và kiến trúc mở để hỗ trợ các ứng dụng tuỳ ý.

Các mô hình lưu trữ hỗ trợ OLAP:

Mô hình Olap đa chiều

Mô hình OLAP đa chiều lƣu trữ dữ liệu cơ sở và thông tin tổng hợp (là các độ đo đƣợc tính toán từ các bảng) trong các cấu trúc đa chiều gọi là các khối. Các cấu trúc này đƣợc lƣu bên ngoài cơ sở dữ liệu data mart hoặc kho dữ liệu.

Lƣu trữ các khối trong cấu trúc OLAP đa chiều là tốt nhất cho các truy vấn tổng hợp dữ liệu thƣờng xuyên mà cần thời gian hồi đáp nhanh.

Mô hình OLAP đa chiều cho phép thực hiện các truy vấn phân tích dữ liệu tốt nhất vì các đặc điểm sau:

 Thông tin tổng hợp và dữ liệu cơ sở đƣợc lƣu trữ trong cấu trúc đa chiều.

 Các thao tác kết, là một trong những thao tác tốn chi phí nhất của mô hình quan hệ, thì không cần thiết.

 OLAP đa chiều sử dụng các thuật toán nén dữ liệu cho phép lƣu trữ với ít không gian hơn.

 OLAP đa chiều sử dụng chỉ mục bitmap cho hiệu quả thực thi tốt hơn.

 OLAP đa chiều lấy dữ liệu trong khối rất nhanh bằng cách sử dụng các xử lý truy vấn tốc độ cao và lƣu dữ liệu. Thông tin nhận đƣợc từ khối và các bảng OLAP cơ sở chỉ đƣợc truy xuất thông tin chi tiết.

 OLAP đa chiều không xử dụng cơ chế khoá vì dữ liệu là chỉ đọc.

 Dữ liệu có thể dễ dàng sao chép đến client cho phân tích không trực tuyến (off-line).

Mô hình OLAP quan hệ:

Mô hình OLAP quan hệ: lƣu trữ dữ liệu cơ sở và thông tin tổng hợp trong các bảng quan hệ. Các bảng này đƣợc lƣu trữ trong cùng cơ sở dữ liệu nhƣ là các bảng kho dữ liệu.

Lƣu trữ các khối trong cấu trúc OLAP quan hệ là tốt nhất cho các truy vấn dữ liệu không thƣờng xuyên. Lƣu trữ dữ liệu trong cấu trúc OLAP quan hệ cung cấp các lợi ích sau:

 OLAP quan hệ cho phép xây dựng khối tự động tạo chỉ mục.

 OLAP quan hệ ánh xạ các tổng hợp có sẵn từ kho dữ liệu. OLAP quản lý đƣợc phép xử dụng các tổng hợp có sẵn để tổng hợp mà không cần tính toán lại cho mỗi truy vấn.

 OLAP quan hệ tạo đòn bẩy cho hệ quản trị cơ sở dữ liệu quan hệ nhằm cho

các nhà quản trị hệ thống duy trì nó hiệu quả hơn.

 OLAP quan hệ hỗ trợ Microsoft SQL Server, Oracle, Access và Open Database Connectivity (ODBC).

Mô hình OLAP lai:

Mô hình OLAP lai là sự kết hợp giữa OLAP đa chiều và OLAP quan hệ. Lƣu trữ các khối trong cấu trúc OLAP đa chiều là tốt nhất cho các truy vấn tổng hợp dữ liệu thƣờng xuyên dựa trên một lƣợng lớn dữ liệu cơ sở. Lợi ích của việc lƣu trữ trong cấu trúc OLAP lai là:

 Lấy dữ liệu trong khối nhanh hơn bằng cách sử dụng xử lý truy vấn tốc độ cao của OLAP đa chiều.

 Tiêu thụ ít không gian lƣu trữ hơn OLAP đa chiều.

 Tránh trùng lắp dữ liệu.

Kiến trúc khối của OLAP:

Đối tƣợng chính của OLAP là khối, một thể hiện đa chiều của dữ liệu chi tiết và tổng hợp. Một khối bao gồm một nguồn dữ liệu, các chiều, các độ đo và các phần dành riêng, Các khối đƣợc thiết kế dựa trên yêu cầu phân tích của ngƣời dùng.

Một kho dữ liệu có thể hỗ trợ nhiều khối khác nhau nhƣ khối Bán hàng, khối Bảng kiểm kê,…

Dữ liệu nguồn của một khối chỉ ra nơi chứa kho dữ liệu cung cấp dữ liệu cho khối.

Các chiều đƣợc ánh xạ từ các thông tin của các bảng chiều trong kho dữ liệu vào các mức phân cấp, ví dụ nhƣ chiều Địa lý thì gồm các mức nhƣ Lục địa, Quốc gia, Tỉnh-Thành phố. Các chiều có thể đƣợc tạo một cách độc lập và có thể chia sẻ giữa các khối nhằm xây dựng các khối dễ dàng và để chắc chắn rằng thông tin tổng hợp cho phân tích luôn ổn định. Ví dụ, nếu một chiều chia sẻ một phân cấp sản phẩm và đƣợc sử dụng trong tất cả các khối thì cấu tạo của thông tin tổng hợp về sản phẩm sẽ ổn định giữa các khối sử dụng chiều đó.

Một chiều là một dạng đặc biệt của chiều mà ánh xạ các thuộc tính từ các thành viên của một chiều khác để sau đó có thể đƣợc sử dụng trong các khối. Ví dụ, một chiều ảo của thuộc tính kích thƣớc sản phẩm cho phép một khối) tổng hợp dữ liệu nhƣ số lƣợng sản phẩm bán đƣợc theo kích thƣớc, hoặc nhƣ số lƣợng áo bán đƣợc theo kiểu và theo kích thƣớc. Các chiều ảo và các thuộc tính thành viên đƣợc đánh giá là cần thiết cho các truy vấn và chúng không đòi hỏi phải có các khối lƣu trữ vật lý.

Các độ đo xác định các giá trị số từ bảng sự kiện mà đƣợc tổng hợp cho phân tích nhƣ giá bán, chi phí hoặc số lƣợng bán.

Các phần dành riêng là các vật chứa lƣu trữ đa chiều, giữ dữ liệu của khối. Mỗi khối chứa ít nhất một thành phần riêng, và dữ liệu của khối có thể kết hợp từ nhiều partition. Mỗi thành phần riêng có thể lấy dữ liệu một nguồn dữ liệu khác nhau và có thể lƣu trong một vị trí riêng biệt. Dữ liệu của một thành phần riêng có thể đƣợc cập nhật độc lập với các thành phần riêng khác trong một khối. Ví dụ, dữ liệu của một khối có thể đƣợc chia theo thời gian, với một partition chứa dữ liệu của năm hiện hành, một partition khác chứa dữ liệu của năm trƣớc, và một partition thứ ba chứa tất cả dữ liệu của các năm trƣớc nữa.

Các thành phần riêng của một khối có thể đƣợc lƣu trữ độc lập trong các cách thức khác nhau với các mức độ tổng kết khác nhau. Các partition không thể hiện đối với ngƣời dùng, đối với họ một khối là một đối tƣợng đơn, và chúng cung cấp các tuỳ chọn đa dạng để quản lý dữ liệu OLAP.

Một khối ảo là một khung nhìn luận lý của các phần chia của một hoặc nhiều khối. Một khối ảo có thể đƣợc sử dụng để kết các khối khác nhau để chia sẻ một chiều chung nào đó, ví dụ nhƣ có thể kết giữa khối Bán hàng và khối Kho nhằm các mục đích phân tích đặc biệt nào đó trong khi duy trì các khối tách biệt cho đơn giản. Các chiều và các độ đo có thể đƣợc chọn từ các khối đƣợc kết để thể hiện trong khối ảo.

Mô hình kiến trúc dịch vụ OLAP:

Kiến trúc dịch vụ OLAP gồm 2 thành phần: khách và chủ

Dịch vụ OLAP của SQL Server cung cấp thành phần chủ có khả năng tạo và quản lý dữ liệu OLAP đa chiều, đồng thời cung cấp dữ liệu cho máy khách qua dịch vụ PivotTable.

Các thao tác của thành phần máy chủ bao gồm việc tạo các khối dữ liệu đa chiều từ kho cơ sở dữ liệu quan hệ và lƣu trữ chúng trong các cấu trúc khối đa chiều, trong cơ sở dữ liệu quan hệ hoặc kết hợp cả hai. Siêu dữ liệu của các cấu trúc khối đa chiều đƣợc lƣu trữ trong một kho trong cơ sở dữ liệu quan hệ.

Các thao tác đƣợc thành phần chủ cung cấp gồm:

 Khả năng tạo và quản lý các khối của OLAP.

 Phục vụ lấy dữ liệu và làm cho nó có thể sử dụng đƣợc từ các ứng dụng khách

Dịch vụ OLAP của SQL Server cung cấp thành phần chủ có khả năng tạo và quản lý dữ liệu OLAP đa chiều, đồng thời cung cấp dữ liệu cho khách qua dịch vụ PivotTable.

Các thao tác của thành phần Server bao gồm việc tạo các khối dữ liệu đa chiều từ kho cơ sở dữ liệu quan hệ và lƣu trữ chúng trong các cấu trúc khối đa chiều, trong cơ sở dữ liệu quan hệ hoặc kết hợp cả hai. Siêu dữ liệu của các cấu trúc khối đa chiều đƣợc lƣu trữ trong một kho trong cơ sở dữ liệu quan hệ.

Các thao tác đƣợc thành phần máy chủ cung cấp gồm:

 Khả năng tạo và quản lý các khối của OLAP.

 Phục vụ lấy dữ liệu và làm cho nó có thể sử dụng đƣợc từ các ứng dụng client.

Thành phần khách là dịch vụ PivotTable giao tiếp với OLAP chủ và cung cấp giao diện cho các ứng dụng khách sử dụng truy cập dữ liệu OLAP trên máy chủ. Các ứng dụng máy khách kết nối đến dịch vụ PivotTable bằng cách sử dụng giao diện OLE DB hoặc mô hình ADO.

Các ứng dụng máy khách có thể sử dụng dịch vụ PivotTable để lấy dữ liệu từ cơ sở dữ liệu OLAP.

Dịch vụ PivotTable có thể tạo các khối cục bộ mà đó là các tập con của các khối cƣ trú trên server. Các khối cục bộ có thể đƣợc sử dụng để làm tăng hiệu quả thực hiện và sử dụng để thực hiện các phân tích không trực tuyến.

Dịch vụ PivotTable là một công cụ lƣu trữ, duyệt và phân tích khối. PivotTable là một OLAP chủ xử lý tại chỗ với cả các đặc tính phân tích trực tuyến và không trực tuyến mà:

 Cung cấp truy cập trực tuyến đến dữ liệu OLAP nhƣ một máy khách của dịch vụ OLAP.

 Bao gồm các đặc tính phân tích dữ liệu, xây dựng khối và quản lý cache. Cho phép các khối lƣu trữ cục bộ để phân tích không trực tuyến nhƣ là kết nối đến dữ liệu dịch vụ OLAP trực tuyến.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Xây dựng cơ sở dữ liệu bài báo điện tử liên quan tới gốm sứ Việt Nam phục vụ đào tạo tại Học viện Báo chí và Tuyên truyền (Trang 37 - 42)