Dịch vụ phân tích dữ liệu

Một phần của tài liệu Ứng dụng kỹ thuật OLAP trong khai phá dữ liệu sinh viên tại Học viện Ngân hàng (Trang 50)

SSAS trong là một trong những dịch vụ chính của SQL Server 2008 dùng để xây dựng các chiều và các khối dữ liệu cho kho dữ liệu, trong phiên bản mới này còn hỗ trợ một số thuật toán khai phá dữ liệu, điều này cung cấp cho người quản lý có cái nhìn sâu hơn về dữ liệu của họ. Ngoài ra, SSAS cũng là một phần nền tảng của BI.

SSAS trong SQL Server 2008 đã được tái kiến trúc nhằm nâng cao khả năng mở rộng và tính tin cậy, trong môi trường doanh nghiệp, và khả năng bảo mật dữ liệu. SSAS cung cấp khả năng tích hợp nhiều đối tượng của SSAS nhằm tăng khả năng mở rộng. Ngoài ra dịch vụ này còn cung cấp các thuật toán để quản lý hiệu quả các khối kích thước lớn. SSAS cung cấp đa dạng các công cụ để tạo lập OLAP một cách hiệu quả và quản lý một cách dễ dàng.

SSAS hỗ trợ chuẩn XML, có nghĩa việc trao đổi dữ liệu giữa SSAS với các máy khách là XML, sự thay đổi này nâng cao khả năng tương tác giữa các máy khách và máy chủ. Việc lưu trữ siêu dữ liệu trong cũng đư ợc thực hiện dưới dạng XML. Ngoài ra, trong phiên bản 2008 còn cho phép người dùng tùy chọn việc lưu trữ dữ liệu và dữ liệu tổng hợp dưới dạng đối tượng của SSAS hay dạng CSDL quan hệ. Việc lưu trữ dữ liệu theo định dạng đối tượng của SSAS có thể xử lý tốt hơn và truy vấn nhanh hơn dạng cơ sở dữ liệu quan hệ. Có 3 cách lưu trữ dữ liệu chính trong SSAS là MOLAP, ROLAP, HOLAP. Kiến trúc của dịch vụ phân tích trong SQL Server 2008 như Hình 2.11 bên dưới.

Hình 2.11. Kiến trúc dịch vụ phân tích SSAS

Đây là mô hình chiều đại diện cho kho dữ liệu quan hệ và kho dữ liệu đa chiều. UDM cung cấp một cầu nối, hay có thể hiểu là một giao diện chuẩn để nối các đầu cuối khác nhau như Excel hay dịch vụ báo cáo với các ngồn dữ liệu hỗn tạp. Thay vì sử dụng các ngôn ngữ gốc để truy cập các nguồn dữ liệu thì UDM cho phép người dùng sử dụng các lệnh của UDM.

Một số lượng lớn các tính năng của dịch vụ phân tích xây dựng trong UDM. Những tính năng này bao gồm các hệ thống phân cấp, sự phân loại, biểu diễn thời gian, biên dịch ngôn ngữ… thậm chí cả các chức năng cao cấp như bộ đệm chủ động và phân tích cũng là một phần của UDM và coi như có sẵn trong dịch vụ báo cáo.

Ngày nay, XML và dịch vụ web đã trở nên phổ biến và quan trọng, nên dịch vụ phân tích cũng theo xu hướng kỹ thuật này. Máy chủ dịch vụ phân tích hoạt động giống như một dịch vụ web và không có gì ngạc nhiên khi thấy ngôn ngữ để quản lý máy chủ dịch vụ phân tích cũng dựa trên XML. Tất cả các giao tiếp giữa máy khách và máy chủ phân tích đều qua chuẩn XML/A.

Dịch vụ phân tích trong SQL Server 2008 không lưu trữ tất cả các chiều vào bộ nhớ. Giống như một hệ điều hành chỉ giữ một số trang trong bộ nhớ còn lại một số trang hoán đổi sang đĩa cứng, dịch vụ phân tích cũng sử dụng cả bộ nhớ vật lý và không gian đĩa. Lợi ích của phương pháp này là dịch vụ phân tích hỗ trợ kích thước các chiều gần như không có giới hạn. Ví dụ, dịch vụ phân tích trong SQL Server 2000 sẽ bị hạn chế bởi dung lượng bộ nhớ trong còn dịch vụ phân tích trong SQL Server 2008 có thể tận dụng lợi thế của bộ nhớ đệm trên đĩa nên không bị giới hạn bởi dung lượng bộ nhớ trong.

Một phần của tài liệu Ứng dụng kỹ thuật OLAP trong khai phá dữ liệu sinh viên tại Học viện Ngân hàng (Trang 50)

Tải bản đầy đủ (PDF)

(75 trang)