trên OLAP
Việc chuyển đổi dữ liệu OLTP sang dữ liệu OLAP trong kho lưu trữ được thực hiện thông qua các quy trình sau:
Hợp nhất dữ liệu: tất cả các dữ liệu liên quan tới các mục đặc trưng (sản phẩm, khách hàng, hay nhân viên) phải có khả năng hợp nhất từ nhiều hệ thống OLTP tới một hệ thống OLAP
đơn. Quy trình hợp nhất phải giải quyết được sự khác nhau về mã hoá giữa các hệ thống OLAP, phù hợp với các dữ liệu chung được sử dụng ở cả hai hệ thống có thể bằng cách so sánh các trường tương tự, có thể biến đổi dữ liệu lưu trữ từ nhiều loại dữ liệu khác nhau trong mỗi hệ thống OLTP thành một loại dữ liệu duy nhất được sử dụng trong hệ thống OLAP. Các hệ thống cung cấp các dữ liệu đầu vào cho một hệ thống OLAP không nhất thiết phải là các hệ thống OLTP truyền thống mà có thể được lưu trữ ở nhiều dạng hợp lệ, chẳng hạn như
các bản ghi Microsoft Excel trong một tệp được chia sẻ.
Quét dữ liệu: Việc hợp nhất dữ liệu OLTP vào một kho dữ liệu (data warehouse) tạo điều kiện quét dữ liệu. Một số hệ thống OLTP đánh vần các đề mục khác nhau, hoặc quá trình hợp nhất có thể gây ra các lỗi chính tả. Sự không thống nhất này phải được chỉnh sửa trước khi dữ liệu có thể được nhập vào kho lưu trữ phục vụ cho hệ thống OLAP.
Tập hợp dữ liệu: Trong khi dữ liệu OLTP ghi nhận tất cả các chi tiết của các giao tác thì OLAP chỉ truy vấn những dữ liệu tổng kết cần thiết, hoặc các dữ liệu được tập hợp bằng một số quy tắc nhất định. Ví dụ, một truy vấn lấy tổng doanh thu hàng tháng cho mỗi sản phẩm trong năm trước sẽ chạy nhanh hơn nếu cơ sở dữ liệu chỉ có các dòng tổng kết doanh thu hàng ngày (hoặc từng giờ) của mỗi sản phẩm, so với truy vấn phải quét tất cả các bản ghi chi tiết trong vòng 1 năm. Mức độ tập hợp dữ liệu trong kho lưu trữ phụ thuộc vào số lượng các yếu tố thiết kế (giống như lập trình hướng đối tượng).
Sắp xếp dữ liệu: Khi dữ liệu OLTP được chuyển vào kho lưu trữ, chúng sẽ phải được biến đổi theo cách sắp xếp hợp lý hơn đối với nhu cầu phân tích nhằm đưa ra quyết định và hạn chế tiêu phí thời gian. Quá trình thiết lập kho lưu trữ bao gồm cả việc sắp xếp lại dữ liệu OLTP, lưu trong các bảng biểu liên kết, thành dữ liệu OLAP được lưu trong các khối đa
chiều. Dữ liệu sau đó được tải vào kho lưu trữ.
Truy cập và phân tích dữ liệu: Khi dữ liệu đã được tải vào kho lưu trữ, OLAP cung cấp khả năng truy cập, xem, và phân tích dữ liệu với độ linh hoạt và hiệu quả cao. OLAP trình bày dữ liệu thông qua mô hình dữ liệu tự nhiên và trực quan, giúp cho người sử dụng xem và hiểu một cách tốt nhất những thông tin trong kho lưu trữ. Từ đó cho phép người sử dụng nhận biết được giá trị của dữ liệu.
OLAP sau đó tăng tốc độ chuyển giao thông tin tới người sử dụng các cấu trúc dữ liệu đa chiều này bằng cách tính toán các giá trị trong dữ liệu trước khi thực hiện lệnh. Sự kết hợp giữa khả năng duyệt dữ liệu dễ dàng và kết qủa nhanh chóng cho phép người sử dụng xem và phân tích dữ liệu nhanh và hiệu quả hơn so với các công nghệ chỉ liên kết trong cơ sở dữ liệu. Từ đó, người sử dụng sẽ có nhiều thời gian hơn trong việc phân tích dữ liệu và tiết kiệm được thời gian hơn trong việc phân tích cơ sở dữ liệu.
CHƢƠNG VI: DWH VỚI ỨNG DỤNG QUAN HỆ KHÁCH HÀNG
Phần này NLLV không đi sâu vào mô tả thực thi công nghệ Data warehouse như thế nào mà đưa ra những phân tích sau đó chỉ rõ sự thích hợp của công nghệ này đối với bài toán Quản lý quan hệ khách hàng.