CHƯƠNG 3. XÂY DỰNG KHO DỮ LIỆU VÀ GIẢI PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN
3.2. Xây dựng các khối và các chiều cho giải pháp OLAP
Trước khi thiết kế mô hình kho dữ liệu và OLAP cho bài toán, chúng ta cần xác định rõ các vấn đề có khả năng gặp phải trong các tình huống xem xét.
Chẳng hạn như sự thiếu khả thi, kém hiệu quả, khả năng trùng lắp,…Các vấn đề được đặt ra cần phải căn cứ vào việc tìm hiểu tình huống thực tế một cách khách quan và toàn diện. Trên cơ sở các nhận định này, chúng ta sẽ đặt ra những mục tiêu cần đạt tới. Ví dụ như: khắc phục hoặc giảm thiểu sự kém hiệu quả, loại bỏ những nhiệm vụ trùng lặp, tránh lãng phí kinh phí, ưu tiên đầu tư cho những nhiệm vụ có tính khả thi, mang tính định hướng, tính chiến lược, …
Để ứng dụng OLAP, chúng ta cần xây dựng một mô hình phục vụ cho việc phân tích OLAP dựa trên tình huống của bài toán, các vấn đề, các mục tiêu đã xem xét. Đó là quá trình xác định các khối dữ liệu định tổ chức, định nghĩa cấu trúc các chiều cũng như các công thức/luật cần thiết cho tính toán. Trên cơ sở mô hình OLAP, cơ sở dữ liệu OLAP đã được thiết lập, người khai thác hệ thống sẽ uốn nắn việc tìm kiếm thông tin của mình bằng cách liên tục đặt ra những yêu cầu truy vấn, thực hiện, đánh giá kết quả thu được để nắm được những vấn đề quan tâm, tiến tới thu thập đầy đủ những cơ sở nhận định cần thiết để ra được những quyết định cần thiết, xác đáng và kịp thời.
Dưới đây là tiến trình trợ giúp ra quyết định cho một bài toán cụ thể:
Hình 3.2.1. Tiến trình trợ giúp
Khối là phần tử chính của OLAP, là một công nghệ cung cấp khả năng truy nhập nhanh tới dữ liệu trong kho. Các khối cũng cung cấp cơ chế truy vấn dữ liệu với thời gian trả lời nhanh không phụ thuộc vào số lượng dữ liệu trong khối hay độ phức tạp của truy vấn.
Một khối bao gồm một bảng sự kiện, một hoặc nhiều bảng chiều, các đơn vị đo và các phân hoạch. Chúng ta có thể thiết kế các khối dựa trên cơ sở các yêu cầu của người dùng.
Xác định khối là bước đầu tiên cần phải thực hiện. Để xác định một khối cần chọn một bảng sự kiện và các đơn vị đo lường đồng nhất (các cột theo yêu cầu của người dùng) trong bảng sự kiện. Sau đó chọn các chiều, mỗi chiều gồm một
hoặc nhiều bảng liên quan khác. Các chiều cung cấp mô tả rõ ràng bởi các đơn vị đo lường được chia ra của người dùng khối.
Quá trình xử lý khối bao gồm việc đọc các bảng chiều để xác định các cấp độ dữ liệu hiện tại, đọc bảng sự kiện, tính toán các liên kết đặc biệt và lưu trữ các kết quả trong khối. Sau khi một khối được xử lý, nó được cung cấp cho yêu cầu của người dùng.
Xử lý thực chất là thuật ngữ được dùng để chỉ sự tải trọn vẹn dữ liệu của khối. Tất cả các chiều, dữ liệu bảng sự kiện được đọc và tất cả các khối liên kết đặc biệt được tính toán.
Các chiều là cách mô tả chung loại mà theo đó các dữ liệu trong khối được phân chia để phân tích.
Một chiều có thể được dùng bởi nhiều khối khác nhau và gọi là một chiều dùng chung.
Khi xác định một chiều, chọn một hoặc nhiều cột của một trong các bảng liên kết (bảng chiều). Nếu chọn cột phức tạp thì cần phải bao gồm các quan hệ, có thể tổ chức giá trị của chúng theo hệ thống phân cấp đơn. Mỗi cột trong chiều góp phần vào một cấp độ cho chiều. Các cấp độ được sắp đặt theo đặc trưng riêng và được tổ chức trong hệ thống cấp bậc mà nó thừa nhận các con đường logic cho việc đào sâu.
Chiều có phân cấp là trụ cột cho việc gộp dữ liệu trong trường hợp cần thiết.
3.2.2. Xây dựng các khối và các chiều cho OLAP
.
Hay nói cách khác, báo cáo cuối cùng của việc phân tích dữ liệu được kết xuất từ các bảng dữ liệu cùng với việc ứng dụng một số hàm tính toán sum, max,…
Hình 3.2.2 Mô hình dữ liệu đa chiều
Để mô tả dữ liệu hình khối, có thể biểu diễn dữ liệu trong bảng sự kiện được phân bố như sau:
Hình 3.2.3 Mô hình dữ liệu khối
.
,...