4 5 Những nhân tô thiết kế cần phải đước cân nhắc

Một phần của tài liệu Khai thác dữ liệu và xử lý phân tích trực tuyến (Trang 34)

Thiết k ế câu trúc KDL có thể làm ảnh hưởng đến tính dễ dàng trong việc thiết kế và xây dựng các khối (cube).

Microsoft SQL Server OLAP Services dựa vào dữ liệu được cung cấp bởi KDL có tính chính xác, ổn định và toàn vẹn. Khi tạo ra một KDL sử dụng với OLAP, những nhân tố thiết kế cần phải được cân nhắc:

■ Sử d ụ n g sơ dồ hình sao hoặc bảng phẳng chính (Flat) nếu có thể.

Nếu một sơ đồ dạng hình tuyết rơi là cán thiết thi giảm thiểu số báng Dimension vượt ra ngoài mức thứ nhất từ bảng chính.

■ Thiết kế các bảng Dimension cho người dùng.

Các bảng Dimension cần có thông tin ý nghĩa về thực lế mà người dùng sẽ muốn tìm hiểu, chẳng hạn màu sắc, kích cỡ của sản phẩm.

* Á p dụng việc chuẩn hoá thông thường vào Ihiếi kế bảng Dimension.

Không nên kết hợp dữ liệu không quan hệ vào báng Dimension clưii và không nên lặp lại dữ liệu trong các bảng Dimension. Ví dụ: tạo Dimension khách hàng riêng biệt thay vì lặp lại thông tin khách hàng trong nhiều bảng Dimension.

■ Không tổng hợp thừa trong bảng chính.

Giữ lại mức tinh tế cần thiết cho người dùng truy cập và giữ lại tái cả các bản ghi của bảng chính Irong cùng một mức dổ chi tiếl. OLAP Services được Ihiếl kế dổ tạo ra và quản lý dữ liệu tổng hợp từ các kho lưu trữ dữ liệu hạt nhân mức cao đế không làm tăng thời gian trả lời yêu cầu.

■ Sử d ụ n g cấu trúc chung cho bảng chính (Fact) cho dữ liệu cùng loại.

Dữ liêu sử dụng trong một cube có thể được lưu trữ trong các bảng chính đa chiểu, nhưng những bảng này phải có cùng cấu trúc.

* Không tạo các bảng phụ cho dữ liệu tổng.

O L A P Services tính toán trước các tổng theo cấu trúc mà được thiết kế cho việc truy vấn có hiệu quả. Các bảng tổng phụ không dược sứ đụng.

■ Tạo chỉ số cho các trường klioá.

Với mỗi bảng Dimension, tạo ra mộl chỉ số trên cột khoá của I1Ó. Với mỗi bảng Fact, tạo ra một chỉ số đơn trên tổ hợp các cột mà nó chứa các khoá ngoại của bảng Dimension được kết hợp với bảng Fact. OLAP Services sử dụng những chí số này khi chúng load các cấu trúc dữ liệu da chiều và các tính toán dữ liệu tổng. Những chỉ số này cải tiến đáng kể quá trình xử lý.

■ Bảo đảm tính toàn vẹn.

Đây là điều quan trọng vì các bảng Fact dược biểu diễn theo các bảng Dimension. Các bảng Fact mà không có klioá tương ứng trong bảng Dimension có thể gây lỗi hoặc các hàng trong báng Fact bị bỏ đi nếu các bảng Fact và bảng Dimension được dùng trong cùng một cube. Các bảng Dimension chứa thông tin không được biểu diễn trong bảng Fact, chẳng hạn các khách hàng khổng mua một thứ gì, có thể gây ra các ô trống được tạo ra trong các cube. Những ỏ trổng này có thế gây trở ngại cho một số kết quả tính toán phân tích.

■ Thiết k ế một chiến lược cập nhật dữ liệu.

Khi dữ liệu được ihêm vào hoặc thay đổi trong kho lưu trữ dữ liệu, các cube được xây dựng từ dữ liêu trước phải duợc cập nhạt trước khi dữ kiêu mới được cung cấp cho người dùng. Việc sát nhập dữ liệu bổ sung trong các cube đòi hỏi thời gian ít hơn việc xây dựng các cube khi dữ liệu tồn tại thay dổi.

Một phần của tài liệu Khai thác dữ liệu và xử lý phân tích trực tuyến (Trang 34)

Tải bản đầy đủ (PDF)

(86 trang)