dụng
Đây cũng là thành phần rất quan trọng cho hệ thống Kho dữ liệu vì nếu thiếu chúng thì dữ liệu trong Kho không thể 'tiếp cận' người cần nó, hay nói cách khác nếu dữ liệu 'tràn đầy' nhưng lại thiếu 'phương tiện' để 'vận chuyển' chúng đến 'người thụ
hưởng' thì Kho dữ liệu cũng chỉ là 'nguồn tài nguyên bị ngủ quên'. Bên cạnh đó với sự
phát triển của Internet, sựđa dạng của các thiết bị hiển thị kỹ thuật số (mobile, PDA...) cũng như sựđa dạng trong đối tượng khai thác Kho dữ liệu khiến cho các ứng dụng và công cụ khai thác phân tích dữ liệu từ Kho dữ liệu ngày càng đóng vai trò quan trọng. Với các quốc gia và tổ chức ở trong giai đoạn đầu của sự nghiệp phát triển các Kho dữ
liệu thì các ứng dụng, công cụ khai thác dữ liệu sẽ tạo sức hút rất lớn để các tầng lớp người sử dụng tin dùng Kho dữ liệu.
Về cơ bản, giao diện ứng dụng của các ứng dụng và công cụ khai thác dữ liệu từ
Kho dữ liệu phải là các Web Browser. Bên cạnh đó với sự đa dạng về chủng loại các
ứng dụng, công cụ khai thác (phát triển theo yêu cầu, có sẵn trên thị trường, thậm chí thông qua ứng dụng Excel của Microsoft Office...) khiến cho nhu cầu tập hợp các ứng dụng, công cụ trong một kiến trúc Cổng thông tin (Portal) ngày càng phổ biến và là yêu cầu gần như bắt buộc cho nhiều tổ chức trên thế giới.
Bên cạnh đó các ứng dụng, công cụ khai thác dữ liệu từ Kho phải đáp ứng các yêu cầu sau:
1. Tuân thủ mô hình ứng dụng phân tích dữ liệu theo kiểu OLAP, MOLAP hoặc ROLAP.
2. Cung cấp các khả năng khai thác dữ liệu, báo cáo tùy biến theo yêu cầu thực tế
phát sinh (Adhoc Query, Adhoc Reports).
3.4.9. Kho dữ liệu từđiển
Với đặc điểm kết hợp nhiều nguồn dữ liệu, tích hợp nhiều loại và hạ tầng công nghệ, sựđa dạng về công cụ khai thác và đối tượng sử dụng, Kho dữ liệu tạo nên một sự phức tạp cực lớn không chỉ cho các chuyên gia tin học mà cả người sử dụng cuối. Chỉ bản thân tác vụ chuyển đổi, làm sạch dữ liệu cũng khiến cho các chuyên gia phụ
trách phải mất nhiều công sức và cần có những hướng dẫn, mô tả chi tiết trong một khung khuôn khổ thống nhất. Tất cả vấn đề này sẽđược giải quyết ổn thỏa nếu Kho dữ
liệu gìn gữ và bảo toàn được một ‘từđiển dữ liệu’ minh bạch của nó. Từđiển dữ liệu này cho tất cả các đối tượng tham gia quản lý, sử dụng, bảo hành... nó biết được rằng ai làm gì, cần làm như thế nào, lấy dữ liệu từđâu, làm sạch theo nguyên tắc nào....Điều
đó thể hiện tầm quan trọng cực kỳ của kho từđiển dữ liệu trong kiến trúc Kho dữ liệu. Trong thực tế, kho dữ liệu từ điển ‘nằm’ rải rác ở khắp các thành phần tham gia xây dựng và vận hành nó, trong bản thân từng công cụ của Kho, và gần như mong muốn có một Kho từ điển tập trung thống nhất trên một vị trí vật lý (ví dụ một máy chủ, một cơ sở dữ liệu) là một điều không tưởng. Do vậy người ta càng cần phải quan tâm, thiết kế, quản lý nó khoa học và theo một phương pháp luận có hiệu quả thực tế.