Khả năng của các công cụ OLAP

Microsoft nhận thấy OLAP chính là sựmởrộng tựnhiên của công nghệ cơ sở dữ liệu và đã đưaDSS vào SQL Server. SQL Server bao gồm rấtnhiều đặctính bổxung khác hỗ trợtiến trình kho dữ liệu bao gồm:

• Data Transformation Services: dùng đểtrích xuấtvà chuyển dữ liệu tác nghiệp vào kho dữ liệu.

• Microsoft Repository: cung cấp tính năng lưu trữsiêu dữ liệu thống nhấttrong SQL Server.

Trong phiên bản sắp tới của Microsoft Office, Microsoft sẽđưa ra nhiều năng lực OLAP tương thích với DSS. Xây dựng OLE DB cho giao diện OLAP, năng lực mới này sẽhỗ trợtruy nhập trực tiếp vào DSS Server, khả năng sửdụng khi đã ngắtmạng và tính năng truy nhập qua giao diện Web. Đầutiên, trong MS Excel, tính năng PivotTable mới có thểkết nối bảng tính MS Excel với OLE DB cho việc cung cấp dữ liệu OLAP. Trong trường hợp này, nó sẽcó thêm các năng lực nhưkhả năng tạo khối cục bộtừmột phần của khối trên Server.

Công cụPivotTable hiện tạitrên MS Excel đượcthay thếvới công cụ PivotTable Service từMicrosoft DSS cho phép ngườidùng máy đểbàn nhiều khả năng mềm dẻo hơn khi tạo các cấu trúc đa chiều mà không phảigiới hạn bộnhớ.

Một sốtính năng mới đượcgọi là Web Components trong phiên bản sắp tới của Office sẽcung cấp việc truy xuấtOLAP cơ bản và tính năng lập bảng qua ActiveX đểdễdàng thêm vào các trang Web. Xây dựng OLE DB cho OLAP có thểđược sử dụng với bấtkỳcung cấp OLAP tương thích trong Microsoft DSS. Với việc cảitiến và đưa ra các tính năng phân tích và hiển thị OLAP cơ bản, Microsoft đang cốgắng tạo ra một bướcchuyển của xu thếkho dữ liệu đểnhằm giảm giá công cụra quyết định.

Sựkết hợp OLE DB và OLAP cũng tạo ra sựđa dạng của các sản phẩm từcác nhà cung cấp phần mềm cho việc sửdụng DSS. Do vậy nhiều công vụ Client mới được xây dựng đểtruy nhập thông tin trong DSS, người sử dụng có nhiều lựa chọn cho ứng dụng.

4.4.Hướng nghiên cứu phát triển: Hệ trợ giúp quyết định phân tán

Khi xây dựng các Hệ trợ giúp quyết định, nói chung ngườita cũng đã quan tâm đếncác công nghệphân tán nhưng việc tính toán phân tán thường bị hạn chếởcác tác vụphụtrợ. Các tính toán phân tán có khả năng tích hợp hệ Trợ giúp quyết định với các hệ thống E-mail, nhiều nghiên cứu về Hệ trợ giúp quyết định đã tận dụng các lợi thếcủa công nghệmạng và phân tán đểmở rộng với nhiều công cụnhưVideo tương tác hai chiều, Chat, Bulletin Board...

Nói chung, công nghệphân tán đượcứng dụng trong các Hệ trợ giúp quyết định thường đượcxem nhưmột cách thuận tiện đểtruy cập vào các cơ sở dữ liệu bên ngoài hay truy cập vào hệ thống Client/Server. Các Hệ trợ giúp quyết định dựa trên Web đượccung cấp như các thành phần Client đểkết nối với Server có Hosting ứng dụng Trợ giúp quyết định.

Tuy nhiên, tiềm năng to lớn của các công nghệphân tán không chỉ được sử dụng bởi các nhà thiếtkếtrong việc mởrộng các Hệ trợ giúp quyết định truyền thống với các công cụbổtrợ, nó còn có thểthay thếcác chiến lượchỗ trợ quyết định kiểu hợp tác hay cộng tác phân tán mới có ảnh hưởng tới cấu trúc lõi của các Hệ trợ giúp quyết định. “Vềcơ bản, nhiều hệ thống đượcliệt vào loại Hệ trợ giúp quyết định phân tán đa phần vẫn là các ứng dụng tập trung cho ra các kếtquảtrong mô hình Client/Server. Tuy nhiên, hệ Trợ giúp quyết định phân tán gần gũi hơn với các quá trình có nhiều người tham gia nếu nó có thểtránh đượccấu trúc tập trung và thực hiện các chức năng hỗ trợvà ra quyết định cho người sử dụng”[4].

Hệ thống cần phảihỗ trợcàng nhiều càng tốt cho các quá trình quyết định mà không áp đặtbấtkỳsựép buộc nào đối với những người ra quyết định. Vềcơ bản, hai yêu cầu cần thiếtđểcoi Hệ trợ giúp quyết định là sựmở rộng tựnhiên của các năng lực ra quyết định là:

người ra quyết định,

• Hệ trợ giúp quyết định phảiluôn gần gũi với người ra quyết định, sẵn sàng được sử dụng bấtkỳđâu, bấtkỳlúc nào.

Bắtchướccác hành vi ra quyết định vềcơ bản là nhiệm vụchính của bất kỳHệ trợ giúp quyết định nào. Tuy nhiên, đểhoàn thành nhiệm vụnày tốt nhất điều quan trọng là cần hiểu rằng những người ra quyết định hiện nay hiếm khi ra quyết định một mình. Vì vậy Hệ trợ giúp quyết định cần bắtchước các hành động ra quyết định với nhiều ngườitham gia. Việc chuyển từhệtrợ giúp quyết định với một người sử dụng sang Hệ trợ giúp quyết định nhiều người sử dụng cần đượcchia thành hai hướng riêng:

• Thiếtkếkiến trúc phân tán mới cho Hệ trợ giúp quyết định,

• Hỗtrợkết hợp các tính năng khác nhau của Hệ trợ giúp quyết định phân tán.

Đểbắtchướchành động ra quyết định, điều vô cùng quan trọng là phải giảiphóng người ra quyết định khỏi các thúc ép vềkỹthuật, nói cách khác người ra quyết định cần tránh các nhiệm vụkỹthuậtkiểu cấu hình hoặc sửa lỗi. Các tình huống vềy tếlà các ví dụtốt cho yêu cầu này: các hệ thống có thểkết nối với bấtkỳloạithiếtbịy tếnào mà không đòi hỏi các thầy thuốc phảibận tâm vềcấu hình dữ liệu hay phần mềm. Đểđạtđượcmục tiêu này việc sửdụng Hệ trợ giúp quyết định phân tán là giảipháp linh hoạtnhất.

Đểđảm bảo rằng Hệ trợ giúp quyết định luôn gần gũi với người ra quyết định và những ngườihỗ trợ, sẵn sàng được sử dụng bấtkỳlúc nào, bất kỳđâu, trên bấtkỳthiếtbịnào, người ra quyết định và những ngườihỗ trợcó thểlàm việc với hệ thống từbấtkỳđâu thì việc truy cập thẳng vào Hệ trợ giúp quyết định là luôn cần thiết đểtạo sựlinh hoạt. Mô hình mạng tập trung không phù hợp cho việc hỗ trợquá trình ra quyết định với đông ngườitham gia. Hơn nữa, khi Hệ trợ giúp quyết định phân tán chạy ởmọi nơi thì nó không

đượcphụthuộc vào vịtrí. Thêm vào đó trong một sốmôi trường làm việc, những người ra quyết định và những ngườihỗ trợsẽlàm việc độcnên hệtrợ giúp quyết định phân tán cần có tính năng chạy cảởchếđộOffline. Nói cách khác, Hệ trợ giúp quyết định phân tán không phụthuộc vào bấtkỳmáy chủ trung tâm nào.

Mô hình liên kết

Các kiến trúc phân tán truyền thống được sử dụng trong quá trình thiết kếHệ trợ giúp quyết định phân tán thường là kiểu mô hình mạng tập trung. Mặc dù lợi thếcủa các hệ thống tập trung là sựđơngiản nhưng hạn chếchính của chúng là tập trung một chỗ. Do vậy hệ thống không có khả năng chịu lỗi, không có sựđộc lập vềvịtrí, khó mởrộng và cân bằng. Sựphụthuộc vào các nguồn tập trung là không thểchấp nhận đượcđối với cách tiếp cận của chúng ta. Nói cách khác, kiến trúc không tập trung là mô hình thích hợp đểáp ứng các yêu cầu. Ta có thểđưa ra một mô hình liên kếttận dụng lợi thếcủa mô hình mạng không tập trung. Trong mô hình này, mỗi người sử dụng hệtrợ giúp quyết định nhận đượcmôi trường làm việc phù hợp với vai trò và có thể liên tục thay đổi.Môi trường làm việc này chứa cảthông tin của ngườisử dụng Hệ trợ giúp quyết định và các dịch vụcung cấp cho người sử dụng trong việc liên kếtvới các thành viên khác trong quá trình hỗ trợ quyết định. Môi trường làm việc là Node hay Peer có thểgiao tiếp với các Node khác khá linh hoạt. Mỗi môi trường làm việc chứa tối thiểu các dịch vụhạtầng cần đểchạy Hệ trợ giúp quyết định. Các dịch vụnày đềucung cấp các tính năng cơ bản nhưtra cứu (Lookup), quản lý giao dịch, liên kếtcác quá trình…

Khi người sử dụng đượcquyền tham gia vào Hệ trợ giúp quyết định, môi trường làm việc của họsẽthông báo sựhiện diện của họtrên mạng. Môi trường làm việc của những người sử dụng đã tồn tạisẽthông báo và hỏi môi trường làm việc mới đểchia sẻcác chính sách. Thông tin trao đổiđượchiển

thịtrong thời gian thậttrên màn hình của thiếtbị.Mỗi người sử dụng hệtrợ giúp quyết định biếtvềsựhiện diện của người sử dụng khác và có thểtruy cập vào thông tin chung. Theo nghĩanày, cộng đồng sửdụng vừa linh hoạt vừa tựhình thành. Môi trường làm việc không chỉchứa dữ liệu mà còn chứa các dịch vụmà tất cả các thành viên đềucó thểsửdụng. Trong khi mỗi môi trường làm việc chứa một bộtối thiểu các dịch vụhạtầng cần đểchạy hệtrợ giúp quyết định thì các dịch vụmởrộng chỉđượccung cấp cho các Roles đặc trưng.

Hệ thống còn có thểtựquản trị.Tính mềm dẻo cho phép các môi trường làm việc phát hiện một cách tựđộng sựbiến mấtcủa môi trường làm việc khác và cập nhậtthông tin tới người sử dụng. Các môi trường làm việc còn lạisẽloạibỏcác thông tin liên quan đếncác môi trường vừa biến mấtvà người sử dụng

sẽđượcbiếtvềsựvắng mặtcủa người sử dụng khác. Thông tin này sẽđượchiển thịtrởlạingay khi người sử dụng quay lạimạng. Môi trường làm việc bịbiến mấtcho thấy một ví dụvềdịch vụhạtầng cần để chạy Hệ trợ giúp quyết định, điều này cho thấy cộng đồng sửdụng có tính tự sửa lỗi.

Trong mô hình liên kết, người sử dụng Hệ trợ giúp quyết định có thể làm việc cục bộ,đơnlẻvới môi trường làm việc của ngườiđó. Tuy nhiên, cơ sởthông tin của toàn bộhệ thống tăng tỉlệtrực tiếp với sốngười sử dụng chia sẻcác môi trường làm việc. Mỗi người sử dụng đượctrang bịcác năng lực cần đểsửdụng trong chếđộcục bộvà phân tán (các năng lực mạng và dịch vụhạtầng). Thông tin của mỗi người sử dụng đượcquản lý theo cách mà những ngườitham gia kết nối có thểchia sẻ,nếu họđượccho phép. Sự khác biệtquan trọng nhấtgiữa kiến trúc này và kiến trúc tập trung là sựvắng mặt của các máy chủtrung tâm và/hoặc các hệ thống quản trịcơ sở dữ liệu.

Chương V. Xây dựng OLAP CUBES trong EXCEL 5.1 Giới thiệu Olap Cube trong Excel

Excel cung cấp một tập hợp các trình điều khiển có thể được sử dụng để kết nối với một loạt các nguồn dữ liệu và tạo ra các hình khối OLAP của riêng bạn. (Chúng tôi sẽ tìm hiểu về việc tạo ra một khối OLAP một chút sau đó.) Trong việc chuẩn bị một khối OLAP, Excel sẽ kết nối với một nguồn dữ liệu và sau đó đọc dữ liệu từ nó. Một khi khối lập phương đã cho ăn riêng của mình với các điểm dữ liệu mà nó cần, nó có thể hoạt động như một nguồn dữ liệu độc lập. Các dữ liệu nằm trong các khối OLAP sau đó có thể được trình bày trong một bảng tính Excel bằng cách sử dụng một trục bảng. Trong ý nghĩa đó, các hành vi khối OLAP là nguồn dữ liệu cho bảng pivot (bảng pivot bình thường thường sẽ có nguồn dữ liệu của họ cư trú trong một bảng tính excel). Khối lập phương xử lý tất cả các yêu cầu vì đã đốn & dicing các dữ liệu được gửi bởi trục bảng. Bất cứ khi nào một bản sao mới của các dữ liệu được yêu cầu của bảng pivot, khối OLAP nạp thông tin mới nhất từ nguồn dữ liệu, làm mới bản thân và sau đó tiếp tục phục vụ tất cả các yêu cầu.

Một điểm quan trọng cần lưu ý ở đây là kích thước bảng pivot được giảm xuống còn một phần nhỏ của những gì một trục bảng bình thường sẽ có được. Đối với tất cả khả năng xử lý dữ liệu của nó, là trục bảng dựa vào các khối OLAP. Việc tách vật lý của Pivot Table từ nguồn dữ liệu, thực hiện thông qua một khối OLAP, cho phép các nguồn dữ liệu được đặt bất cứ nơi nào trong mạng và được cập nhật theo thời gian thực độc lập của bảng pivot. Nếu kết nối mạng là đủ nhanh, người dùng sẽ không bao giờ biết sự khác biệt nhưng chắc chắn sẽ đánh giá cao sự chặt.

5.2 Thiết kế Olap Cube trong Excel

Hãy đầu tiên bắt đầu bằng cách nhìn vào các nguồn dữ liệu. Một lợi thế lớn mà một khối OLAP cung cấp các thợ mỏ dữ liệu là nó có thể đóng gói dữ liệu nhiều

hơn một bảng tính excel bình thường sẽ. Một thuận lợi khác là bạn có thể sử dụng nhiều nguồn dữ liệu bao gồm txt, csv, tăng dần và những người khác. Vì vậy, hãy bắt đầu với một dấu phẩy tách tập tin với các điểm dữ liệu sau đây - sản phẩm, khu vực, ngày và bán hàng.

Tạo một thư mục mới và đặt các tập tin với các dữ liệu thô trong đó. Trong trường hợp của chúng tôi, các tập tin có tên source_data.txt trong một thư mục có tên CUBE.

Bây giờ mở một bảng tính mới sử dụng Excel 2003. Bấm vào nút "dữ liệu" từ trình đơn và sau đó chọn "Nhập dữ liệu bên ngoài" tiếp theo là "New Database Query".

Chọn một nguồn dữ liệu mới. Nhấn Ok.

Cung cấp một tên nguồn dữ liệu và chọn loại trình điều khiển mà bạn muốn sử dụng cho mục đích này. Trong trường hợp của chúng tôi, vì chúng ta đang sử dụng một tập tin txt. Như các dữ liệu thô, chúng tôi sẽ sử dụng Văn bản điều khiển Microsoft. Nhấn Ok.

Bỏ chọn hộp kiểm "Sử dụng thư mục hiện tại" và chọn thư mục mà tập tin dữ liệu thô đã được đặt.

Ba lần nhấp chuột vào nút Ok đưa bạn trở lại và mở ra Query Wizard.

Hộp bên trái có một danh sách các nguồn dữ liệu trong thư mục đã chọn trong bước trước. Bạn có thể sử dụng nhiều hơn một nguồn dữ liệu tại một thời điểm, mặc dù trong trường hợp của chúng tôi, chúng tôi sẽ gắn bó với chỉ một. Di chuyển tất cả các mặt hàng (hoặc những người mà bạn muốn) vào hộp bên phải và nhấn tiếp theo. Bạn có thể cung cấp lọc và phân loại tùy chọn trong hai hình thức tiếp theo nhưng chúng tôi sẽ chỉ cung cấp cho họ một bỏ lỡ bây giờ và chỉ cần nhấp "Next" mà chúng tôi mang đến màn hình cuối cùng.

Đây là nơi mà sự khác biệt giữa Excel 2003 và Excel 2007 nằm trong việc tạo ra khối OLAP. Trong khi trong Excel 2003, bạn sẽ thấy ba tùy chọn (hình dưới đây), trong Excel 2007, bạn chỉ được trình bày với hai lựa chọn với các tùy chọn để "Tạo một khối OLAP từ truy vấn này" đã được lấy đi.

May mắn cho chúng tôi, chúng tôi vẫn có quyền truy cập vào Excel 2003 và chúng tôi chọn lựa chọn thứ ba - một trong những để tạo ra các hình khối OLAP. Trên nhấn Ok, wizard OLAP Cube mở ra.

Nhấn ok và chuyển sang bước tiếp theo mà chúng tôi xác định các lĩnh vực mà chúng tôi muốn tóm tắt. Hãy suy nghĩ về điều này như các trường

dữ liệu trong một bảng pivot. Trong trường hợp của chúng tôi, đó là doanh số bán hàng kể từ khi chúng tôi muốn phân tích doanh số bán hàng trên sản phẩm, khu vực và phạm vi ngày.

Nhấn "Next". Xác định các lĩnh vực mà chúng tôi muốn sử dụng để làm cho các khối OLAP. Chỉ chọn những người mà bạn chắc chắn rằng bạn muốn sử dụng - lựa chọn tất cả mọi thứ, đặc biệt là nếu bạn có một số lượng lớn các lĩnh vực, có thể làm chậm thời gian phản ứng của khối lập phương.

Nhấn Next, nơi chúng tôi cung cấp các địa điểm mà chúng ta có thể lưu trữ các khối lập phương.

Nhấn Ok và các ứng dụng sẽ cung cấp một hình thức mới yêu cầu đường dẫn nơi để lưu trữ các truy vấn OLAP. Thời điểm bạn nhấn OK, quá trình tạo khối OLAP bắt đầu và có thể mất một vài giây. Đây là những điểm mà Excel gói khối lập phương với thông tin từ các tập tin dữ liệu thô. Thời điểm quá trình hoàn tất, ứng dụng sẽ mở ra các hình thức thuật sĩ Pivot Table tạo quen thuộc. Tại thời điểm này, nếu mục đích duy nhất là làm cho một khối OLAP, chúng ta có thể hủy bỏ (nhấn phím esc). Nếu bạn muốn tiếp tục, bạn có thể sử dụng chỉ định cách bố trí bảng pivot và lưu các tập tin. Trong trường hợp của chúng tôi, vì chúng tôi muốn Excel để tạo ra các khối lập phương cho chúng tôi, chúng tôi nhấn Cancel. Chúng ta hãy chuyển sang Excel 2007 để xem làm thế nào chúng ta có thể sử dụng khối này để tạo ra một bảng Pivot. Nếu chúng ta quay trở lại thư mục chỉ định, chúng ta sẽ thấy một tập tin mới với một phần mở rộng cub. Đã được tạo ra bởi Excel. Đó là khối lập phương!

5.3 Sử dụng Olap Cube trong Excel để làm một Pivot Table

Mở ra một bảng tính Excel và click vào tab Pivot Table từ ribbon.

Chọn "Sử dụng một nguồn dữ liệu bên ngoài" và sau đó sử dụng nút "Browse để biết thêm" để xác định vị trí các tập tin cub. Mà chúng ta đã tạo ở bước trước đó.

Nhấn ok và viola! Chúng tôi đang trình bày với một bảng Pivot đó là dựa ra khỏi OLAP Cube.

Lưu bảng tính. Bây giờ đến phần tốt. Chỉ cần quay trở lại và nhìn vào kích thước của tập tin - trong trường hợp của chúng tôi, chúng tôi đóng gói hơn 65.000 dòng dữ liệu và kích thước tập tin là một nhỏ 11 KB! OLAP cube đã được lưu trữ tất cả các sử dụng cho các Pivot Table giảm dấu chân của mình cho một phần nhỏ của một Pivot Table thông thường. Bạn thực tế có thể làm mọi điều mà bạn làm với một trục bảng bình thường ở

Giới thiệu kiến trúc khối

Giới thiệu kiến trúc khối