Trước khi xem xét việc triển khai hệ thống OLAP trong môi trường data warehouse, cần xem xét và cân nhắc kỹ 2 vấn đề liên quan đến hệ thống MOLAP trong hệ quản trị MDDBs. Vấn đề đầu tiên là không có sự chuẩn hoá dữ liệu. Với cách này, OLAP sẽ xử lý dữ liệu tổng hợp tốt hơn nhưng hạn chế bởi kích thước lưu dữ liệu chi tiết là rất lớn. Vấn đề thứ 2 là sự đối lập lại là dữ liệu trong hệ thống data warehouse có tính chuẩn hóa cao khi đó việc xử lý có thể bị treo khi xử lý những câu truy vấn phức tạp. Để triển khai hệ thống OLAP trong data warehouse, ta xem xét 4 cách triển khai như hình vẽ sau:
Data warehouse cung cấp dữ liệu cho hệ thống OLAP. Trong mô hình MOLAP, cơ sở dữ liệu đa chiều riêng biệt được đăng ký trước để lưu trữ dữ liệu từ hệ thống data warehouse dưới dạng các lược đồ dữ liệu đa chiều. Một cách đối lập lại, mô hình ROLAP không lưu trữ dữ liệu tĩnh trung gian mà dữ liệu được đẩy vào trong hệ thống OLAP thông quan những lược đồ dữ liệu được tạo ra động khi có yêu cầu. Vì vậy, thứ tự của luồng dữ liệu là từ hệ thống dữ liệu tác nghiệp vào data warehouse và từ đó được đưa vào hệ thống OLAP.
Như vậy sẽ có một số câu hỏi nảy sinh như: tại sao không xây dựng hệ thống OLAP ngay trên hệ thống tác nghiệp, hay tại sao dữ liệu không được trích lọc và chuyển trực tiếp vào OLAP, tại sao lại phải di chuyển dữ liệu vào data warehouse rồi sau đó mới truyền đến hệ thống OLAP?. Có một vài lý do để giải thích điều này như sau:
Hệ thống OLAP cần dữ liệu đã được thay đổi và hợp nhất. Giả xử nếu dữ liệu không được sửa chữa và làm sạch trước khi đưa vào hệ thống OLAP thì dữ liệu không có đặc tính hợp nhất
Hệ tác nghiệp chỉ lưu dữ liệu lịch xử theo quy trình nghiệp vụ quy định trong khi đó, hệ thống OLAP cần thông tin dữ liệu có tính lịch xử. Dữ liệu lịch xử từ hệ thống tác nghiệp phải được kết hợp với các dữ liệu lịch xử đã được lưu trữ riêng biệt trước đấy trước khi đưa vào hệ thống OLAP
Hệ thống OLAP cần dữ liệu ở dạng đa chiều nhằm mục đích đưa ra dữ liệu tổng hợp theo nhiều cách khác nhau. Việc trích lọc và tổng hợp dữ liệu từ các hệ thống tác nghiệp khác nhau tại một thời điểm là không thể thực hiện được. Dữ liệu phải được củng cố trước khi được tổng hợp theo cách cấp độ khác nhau với những cách kết hợp khác nhau
Giả xử trong hệ thống có một vài OLAP với sự hỗ trợ các nghiệp vụ khác nhau như: phòng kinh doanh, phòng kiểm kê, phòng tài chính, …vv. Để thực hiện hệ thống như vậy là rất khó khăn bởi cần phải xây dựng một hệ thống riêng biệt nhằm trích chọn dữ liệu vào các hệ thống OLAP từ dữ liệu của hệ thống tác nghiệp.
CHƯƠNG 4: THIẾT KẾ VẬT LÝ DATA WAREHOUSE