Kho dữ liệu tích hợp từ các CSDL chủ đề

Một phần của tài liệu Nghiên cứu giải pháp kho dữ liệu trong Oracle data warehouse 10g và áp dụng trong bài toán xây dựng kho dữ liệu khách hàng, ngân hàng TMCP Tiên Phong (Trang 56 - 58)

Thành phần trung tâm của kiến trúc Kho dữ liệu chính là nơi mọi dữ liệu sau khi

được làm sạch và đổ vào một Kho dữ liệu tích hợp chung. Nơi đây dữ liệu sẽ được người sử dụng khai thác, khai phá để lấy thông tin, phân tích đưa ra các dự báo chiến lược....thông qua các phần mềm ứng dụng được phát triển theo yêu cầu hoặc các công cụ sẵn có trên thị trường (ví dụ Business Objects, Oracle Discoverer...).

Về cơ bản, Kho dữ liệu tích hợp chung có thể bao gồm hai thành phần chính: 1. Kho dữ liệu Tổng hợp cho toàn bộ tổ chức: Đây là một Kho dữ liệu lý tưởng,

nơi mà mọi dữ liệu của toàn bộ một tổ chức sẽđược lưu trữđể phục vụ các nhu cầu khai thác, phân tích dữ liệu của tất cả các đối tượng thuộc mọi phòng,ban của tổ chức. Tuy nhiên việc xây dựng một Kho dữ liệu Tổng hợp lý tưởng như

thế này trong thực tế cần phải qua nhiều giai đoạn với nhiều dự án theo phương pháp 'lũy tiến', không nên thực hiện ngay trong một dự án vì rất dễ thất bại do qui mô quá lớn của nó.

2. Các CSDL phục vụ nhu cầu ở cấp độ phòng, ban của tổ chức: Đây là các CSDL phục vụ nhu cầu khai thác ở cấp độ thấp hơn (tức là các phòng, ban) của tổ

chức, do đó nó có tính khả thi hơn trong thực tế và các tổ chức thường dựa vào

đánh giá mức độ ưu tiên (quan trọng) về nghiệp vụ và dữ liệu ảnh hưởng đến công tác điều hành, ra quyết định và phân tích dự báo để xem xét triển khai CSDL Chủđề nào trước, CSDL Chủđề nào sau.

Đặc trưng chú ý của dữ liệu trong Kho dữ liệu (Tổng hợp hay theo chủđề) là dữ

liệu có nó tuân thủ Mô hình theo Chiều và phổ biến ở dạng Mô hình Hình Sao. Bản chất của Mô hình theo Chiều là sự phân tách làm hai loại Bảng dữ liệu duy nhất là Fact Tables và Dimension Tables, trong đó một Fact table có quan hệ Nhiều-Nhiều với các Dimension tables tương tự như một mô hình ngôi sao trong đó Fact tables là trung tâm của ngôi sao, còn Dimension tables là các cánh của ngôi sao.

Đặc trưng này là định hướng rất quan trọng trong việc thiết kế dữ liệu cho Kho tích hợp vì nó đã được chứng minh tính hiệu quả đặc biệt cho các Kho dữ liệu thông qua rất nhiều dự án Kho dữ liệu đã được triển khai trên thế giới. Theo các chuyên gia của tập đoàn Metaphors nói chung và Raph Kimball nói riêng thì việc thiết kế dữ liệu cho Kho theo mô hình chiều dữ liệu quyết định các đặc tính sau cho dữ liệu của Kho:

1. Sự thân thiện và dễ hiểu về dữ liệu cho người sử dụng: với mô hình hình sao của dữ liệu, người sử dụng rất dễ dàng hình dung mối liên hệ của các dữ liệu trong Kho vì nó rất gần với thực tế nghiệp vụ của họ, và do đó họ dễ dàng truy cập và khai thác dữ liệu thông qua các công cụ hỗ trợ người dùng cuối (ví dụ

2. Khả năng đảm bảo tốc độ khai thác: vì đặc điểm qui mô dữ liệu rất lớn (các Kho dữ liệu thông thường có kích thứớc trung bình từ vài chục GB đến hàng TB dữ liệu) và hầu hết các hoạt động trên dữ liệu là chỉ đọc nên việc thiết kế

theo mô hình hình sao cho phép dư thừa dữ liệu và do đó tăng tốc độ truy vấn lên rất nhiều so với thiết kế kiểu Mô hình quan hệ.

3. Khả năng đáp ứng thay đổi: với thiết kế hình sao và kết hợp với việc lưu trữ dữ

liệu ở mức chi tiết nhất có thể thì dữ liệu trong Kho luôn sẵn sàng cho phép thay đổi mà ảnh hưởng tối thiểu tới việc thiết kế lại hay điều chỉnh lại các bảng dữ liệu trong Kho cũng như thay đổi mã nguồn của các phần mềm ứng dụng

được phát triển theo nhu cầu.

Một phần của tài liệu Nghiên cứu giải pháp kho dữ liệu trong Oracle data warehouse 10g và áp dụng trong bài toán xây dựng kho dữ liệu khách hàng, ngân hàng TMCP Tiên Phong (Trang 56 - 58)