Các ứng dụng và công cụ khai thác, phân tích dữ liệu phục vụ người sử dụng

Một phần của tài liệu Nghiên cứu giải pháp kho dữ liệu trong Oracle data warehouse 10g và áp dụng trong bài toán xây dựng kho dữ liệu khách hàng, ngân hàng TMCP Tiên Phong (Trang 58 - 59)

dụng

Đây cũng là thành phần rất quan trọng cho hệ thống Kho dữ liệu vì nếu thiếu chúng thì dữ liệu trong Kho không thể 'tiếp cận' người cần nó, hay nói cách khác nếu dữ liệu 'tràn đầy' nhưng lại thiếu 'phương tiện' để 'vận chuyển' chúng đến 'người thụ

hưởng' thì Kho dữ liệu cũng chỉ là 'nguồn tài nguyên bị ngủ quên'. Bên cạnh đó với sự

phát triển của Internet, sựđa dạng của các thiết bị hiển thị kỹ thuật số (mobile, PDA...) cũng như sựđa dạng trong đối tượng khai thác Kho dữ liệu khiến cho các ứng dụng và công cụ khai thác phân tích dữ liệu từ Kho dữ liệu ngày càng đóng vai trò quan trọng. Với các quốc gia và tổ chức ở trong giai đoạn đầu của sự nghiệp phát triển các Kho dữ

liệu thì các ứng dụng, công cụ khai thác dữ liệu sẽ tạo sức hút rất lớn để các tầng lớp người sử dụng tin dùng Kho dữ liệu.

Về cơ bản, giao diện ứng dụng của các ứng dụng và công cụ khai thác dữ liệu từ

Kho dữ liệu phải là các Web Browser. Bên cạnh đó với sự đa dạng về chủng loại các

ứng dụng, công cụ khai thác (phát triển theo yêu cầu, có sẵn trên thị trường, thậm chí thông qua ứng dụng Excel của Microsoft Office...) khiến cho nhu cầu tập hợp các ứng dụng, công cụ trong một kiến trúc Cổng thông tin (Portal) ngày càng phổ biến và là yêu cầu gần như bắt buộc cho nhiều tổ chức trên thế giới.

Bên cạnh đó các ứng dụng, công cụ khai thác dữ liệu từ Kho phải đáp ứng các yêu cầu sau:

1. Tuân thủ mô hình ứng dụng phân tích dữ liệu theo kiểu OLAP, MOLAP hoặc ROLAP.

2. Cung cấp các khả năng khai thác dữ liệu, báo cáo tùy biến theo yêu cầu thực tế

phát sinh (Adhoc Query, Adhoc Reports).

3.4.9. Kho dữ liệu từđiển

Với đặc điểm kết hợp nhiều nguồn dữ liệu, tích hợp nhiều loại và hạ tầng công nghệ, sựđa dạng về công cụ khai thác và đối tượng sử dụng, Kho dữ liệu tạo nên một sự phức tạp cực lớn không chỉ cho các chuyên gia tin học mà cả người sử dụng cuối. Chỉ bản thân tác vụ chuyển đổi, làm sạch dữ liệu cũng khiến cho các chuyên gia phụ

trách phải mất nhiều công sức và cần có những hướng dẫn, mô tả chi tiết trong một khung khuôn khổ thống nhất. Tất cả vấn đề này sẽđược giải quyết ổn thỏa nếu Kho dữ

liệu gìn gữ và bảo toàn được một ‘từđiển dữ liệu’ minh bạch của nó. Từđiển dữ liệu này cho tất cả các đối tượng tham gia quản lý, sử dụng, bảo hành... nó biết được rằng ai làm gì, cần làm như thế nào, lấy dữ liệu từđâu, làm sạch theo nguyên tắc nào....Điều

đó thể hiện tầm quan trọng cực kỳ của kho từđiển dữ liệu trong kiến trúc Kho dữ liệu. Trong thực tế, kho dữ liệu từ điển ‘nằm’ rải rác ở khắp các thành phần tham gia xây dựng và vận hành nó, trong bản thân từng công cụ của Kho, và gần như mong muốn có một Kho từ điển tập trung thống nhất trên một vị trí vật lý (ví dụ một máy chủ, một cơ sở dữ liệu) là một điều không tưởng. Do vậy người ta càng cần phải quan tâm, thiết kế, quản lý nó khoa học và theo một phương pháp luận có hiệu quả thực tế.

Một phần của tài liệu Nghiên cứu giải pháp kho dữ liệu trong Oracle data warehouse 10g và áp dụng trong bài toán xây dựng kho dữ liệu khách hàng, ngân hàng TMCP Tiên Phong (Trang 58 - 59)