Dịch vụ phân tích

Một phần của tài liệu Nghiên cứu giải pháp kho dữ liệu trong SQL server 2008 và áp dụng trong thương mại (Trang 33)

SSAS trong là một trong những dịch vụ chính của SQL Server 2008 dùng để xây dựng các chiều và các khối dữ liệu cho kho dữ liệu, trong phiên bản mới này còn hỗ trợ một số thuật toán khai phá dữ liệu, điều này cung cấp cho người quản lý có cái nhìn sâu hơn về dữ liệu của họ. Ngoài ra, SSAS cũng là một phần nền tảng của BI.

SSAS trong SQL Server 2008 đã được tái kiến trúc nhằm nâng cao khả năng mở rộng và tính tin cậy, trong môi trường doanh nghiệp, và khả năng bảo mật dữ liệu. SSAS cung cấp khả năng tích hợp nhiều đối tượng của SSAS nhằm tăng khả năng mở rộng. Ngoài ra dịch vụ này còn cung cấp các thuật toán để quản lý hiệu quả các khối kích thước lớn. SSAS cung cấp đa dạng các công cụ để tạo lập OLAP một cách hiệu quả và quản lý một cách dễ dàng.

SSAS hỗ trợ chuẩn XML, có nghĩa việc trao đổi dữ liệu giữa SSAS với các máy khách là XML, sự thay đổi này nâng cao khả năng tương tác giữa các máy khách và máy chủ. Việc lưu trữ siêu dữ liệu trong cũng được thực hiện dưới dạng XML. Ngoài

ra, trong phiên bản 2008 còn cho phép người dùng tùy chọn việc lưu trữ dữ liệu và dữ liệu tổng hợp dưới dạng đối tượng của SSAS hay dạng CSDL quan hệ. Việc lưu trữ dữ liệu theo định dạng đối tượng của SSAS có thể xử lý tốt hơn và truy vấn nhanh hơn dạng cơ sở dữ liệu quan hệ. Có 3 cách lưu trữ dữ liệu chính trong SSAS:

MOLAP: đây là mô hình lưu trữ mà dữ liệu theo định dạng của SSAS. Cách lưu trữ này cho hiệu quả truy vấn tốt nhất và có thể xử lý các tính toán phức tạp. Điểm yếu của cách lưu trữ này là tốn dung lượng và không thể xem được dữ liệu mới cho đến khi làm mới lại khối dữ liệu.

ROLAP: đây là cách lưu trữ mà dữ liệu chính được lưu trữ trong CSDL quan hệ. Cách truy vấn trên SSAS được thay đổi sang kiểu truy vấn trên CSDL quan hệ mỗi khi thực thi điều này làm giảm hiệu năng của truy vấn, các truy vấn thường rất chậm so với mô hình trên. Điểm mạnh của cách lưu trữ này là dung lượng khối dữ liệu chỉ giới hạn bởi dung lượng của cơ sở dữ liệu quan hệ.

HOLAP: đây là mô hình tích hợp của cả hai mô hình trên, dữ liệu thông thường được lưu trữ dưới dạng CSDL quan hệ trong khi các dữ liệu tổng hợp được lưu trữ dưới dạng đối tượng SSAS. Nếu dữ liệu yêu cầu là dạng tổng hợp thì sẽ thực hiện truy vấn tại SSAS còn nếu dữ liệu yêu cầu là dạng chi tiết truy vấn sẽ được dịch và truy vấn tại CSDL quan hệ. Điều này làm tăng tốc độ xử lý của mô hình ROLAP và tận dụng được khả năng lưu trữ của mô hình ROLAP.

Kiến trúc của dịch vụ phân tích trong SQL Server 2008 như Hình 2.5 bên dưới.

Hình 2.5. Kiến trúc dịch vụ phân tích SSAS

Thành phần chính của dịch vụ phân tích là mô hình chiều thống nhất (UDM). Đây là mô hình chiều đại diện cho kho dữ liệu quan hệ và kho dữ liệu đa chiều. UDM cung cấp một cầu nối, hay có thể hiểu là một giao diện chuẩn để nối các đầu cuối khác

nhau như Excel hay dịch vụ báo cáo với các ngồn dữ liệu hỗn tạp. Thay vì sử dụng các ngôn ngữ gốc để truy cập các nguồn dữ liệu thì UDM cho phép người dùng sử dụng các lệnh của UDM.

Một số lượng lớn các tính năng của dịch vụ phân tích xây dựng trong UDM. Những tính năng này bao gồm các hệ thống phân cấp, sự phân loại, biểu diễn thời gian, biên dịch ngôn ngữ… thậm chí cả các chức năng cao cấp như bộ đệm chủ động và phân tích cũng là một phần của UDM và coi như có sẵn trong dịch vụ báo cáo.

Ngày nay, XML và dịch vụ web đã trở nên phổ biến và quan trọng, nên dịch vụ phân tích cũng theo xu hướng kỹ thuật này. Máy chủ dịch vụ phân tích hoạt động giống như một dịch vụ web và không có gì ngạc nhiên khi thấy ngôn ngữ để quản lý máy chủ dịch vụ phân tích cũng dựa trên XML. Tất cả các giao tiếp giữa máy khách và máy chủ phân tích đều qua chuẩn XML/A.

Dịch vụ phân tích trong SQL Server 2008 không lưu trữ tất cả các chiều vào bộ nhớ. Giống như một hệ điều hành chỉ giữ một số trang trong bộ nhớ còn lại một số trang hoán đổi sang đĩa cứng, dịch vụ phân tích cũng sử dụng cả bộ nhớ vật lý và không gian đĩa. Lợi ích của phương pháp này là dịch vụ phân tích hỗ trợ kích thước các chiều gần như không có giới hạn. Ví dụ, dịch vụ phân tích trong SQL Server 2000 sẽ bị hạn chế bởi dung lượng bộ nhớ trong còn dịch vụ phân tích trong SQL Server 2008 có thể tận dụng lợi thế của bộ nhớ đệm trên đĩa nên không bị giới hạn bởi dung lượng bộ nhớ trong.

Một phần của tài liệu Nghiên cứu giải pháp kho dữ liệu trong SQL server 2008 và áp dụng trong thương mại (Trang 33)