Dữ liệuDữ liệu
4.2.2.3 Dữ liệu lịch sử
Nhu cầu phải truy nhập đến các dữ liệu lịch sử là một trong các lý do chính khi sử dụng kho dữ liệu. Quả vậy, dữ liệu lịch sử có vai trò rất quan trọng trong kho dữ liệu, hay đợc sử dụng trong các phân tích, thờng là trong các lĩnh vực cụ thể của dữ liệu nghiệp vụ. Dữ liệu lịch sử là phần rất quan trọng trong dữ liệu xí nghiệp, nhằm cung cấp diễn biến hoạt động nghiệp vụ.
Sự cần thiết của dữ liệu lịch sử
Các đòi hỏi sử dụng dữ liệu lịch sử thờng bao gồm nh sau:
1. Tạo ra khung nhìn về nghiệp vụ tại một thời điểm bất kỳ Nói chung, ngời sử dụng cần phải xem xét nghiệp vụ tại các thời điểm khác nhau. Tại
một vài thời điểm, dữ liệu đặc biệt quan trọng, ví dụ nh kết thúc của một tài khoản hoặc chu kỳ thuế và các sự kiện nghiệp vụ quan trọng. Những các truy vấn này phải có tính ổn định, nghĩa là cùng một câu hỏi ở các thời điểm khác nhau phải cho cùng một kết quả. Điều này khó đạt đợc ở các hệ thống tác nghiệp hàng ngày. Yêu cầu nh vậy đợc thoả mãn bởi các dữ liệu bản sao.
2. Phân tích xu hớng nghiệp vụ
Phân tích xu hớng nghiệp vụ dựa trên hàng loạt các khung nhìn dữ liệu tại các thời điểm khác nhau. Chẳng hạn, các báo cáo doanh thu hàng tháng có thể đợc dùng để phân tích xu hớng kinh doanh trong các tháng tiếp theo.
Để phân tích xu hớng nghiệp vụ, ta phải chọn chu kỳ thời gian và thiết lập các dữ liệu tại các thời điểm tơng ng. Dữ liệu định kỳ rất thích hợp trong trờng hợp này.
Vai trò của dữ liệu lịch sử trong kiến trúc kho dữ liệu
Trong ngữ cảnh kiến trúc dữ liệu ba lớp, dữ liệu lịch sử là tổ hợp của các kiểu dữ liệu khác nhau, xuất hiện và đợc sử dụng trong cả ba lớp.
Dữ liệu nghiệp vụ lịch sử tồn tại trong cả ba lớp, nhng lại khác nhau trong mỗi lớp. Nguồn của dữ liệu lịch sử là lớp dữ liệu thời gian thực. Trong hầu hết các trờng hợp, dữ liệu lịch sử đợc lu trữ và sử dụng với vài sự mở rộng trong lớp này. Dữ liệu lịch sử đợc lu trữ theo các thời điểm khác nhau và do vậy, thờng xuất hiện trong lớp dữ liệu dẫn xuất. Tuy nhiên, vai trò của dữ liệu lịch sử trong lớp điều hoà là rất quan trọng, bởi vì xuất phát từ đó, tất cả các dữ liệu dẫn xuất đợc hình thành.
Dung l ợng của dữ liệu lịch sử
Đặc trng quan trọng của dữ liệu lịch sử là dung lợng tiềm năng lớn và chi phí cao trong lu trữ. Do vậy, dung lợng của dữ liệu lịch sử cần đợc lu giữ phải đợc xem xét trên cơ sở yêu cầu khai thác, sử dụng.
Rõ ràng nếu tất cả dữ liệu đợc lu trữ ở mức cao nhất và không bao giờ bị xoá, tất cả các truy vấn tơng lai và các phân tích tơng lai đều có thể thực hiện đợc. Tuy nhiên, cách tiếp cận này khó đợc thoả mãn khi phân tích lợi ích-chi phí. Một số điểm cần lu ý nh sau:
+ Dữ liệu tổng hợp đợc sử dụng trong khoảng thời gian lâu hơn dữ liệu chi tiết.
+ Các nghiệp vụ quản lý và điều hành dựa chủ yếu vào dữ liệu tổng hợp phục vụ cho việc đa ra các quyết định, trong khi đó, dữ liệu tác nghiệp thờng tồn tại trong khoảng thời gian ngắn hiện tại và xuất hiện ở mức chi tiết.