Những nhân tố thiết kế cần phải được cân nhắ c

Một phần của tài liệu Phương pháp xử lý phân tích trực tuyến (Trang 35 - 37)

Thiết kế cấu trúc kho dữ liệu có thể làm ảnh hưởng đến tính dễ dàng trong việc thiết kế và xây dựng các khối (Cube). Microsoft SQL Server OLAP

Services dựa vào dữ liệu được cung cấp bởi kho dữ liệu có tính chính xác, ổn

định và toàn vẹn. Khi tạo ra một kho dữ liệu sử dụng với OLAP, những nhân tố thiết kế cần phải được cân nhắc là:

• Sử dụng sơ đồ hình sao hoặc bảng phẳng chính (Flat) nếu có thể. Nếu một sơ đồ dạng hình tuyết rơi là cần thiết thì giảm thiểu số bảng Dimension vượt ra ngoài mức thứ nhất từ bảng chính.

• Thiết kế các bảng Dimension cho người dùng. Các bảng Dimension cần có thông tin ý nghĩa về thực tế mà người dùng muốn tìm hiểu.

• Áp dụng việc chuẩn hoá thông thường vào thiết kế bảng Dimension. Không nên kết hợp dữ liệu không quan hệ vào bảng Dimension đơn và không nên lặp lại dữ liệu trong các bảng Dimension. Ví dụ: tạo Dimension khách hàng riêng biệt thay vì lặp lại thông tin khách hàng trong nhiều bảng Dimension.

• Không tổng hợp thừa trong bảng chính. Giữ lại mức tinh tế cần thiết cho người dùng truy cập và giữ lại tất cả các bản ghi của bảng chính trong cùng một mức độ chi tiết. OLAP Services được thiết kế để tạo ra và quản lý dữ liệu tổng hợp từ các kho lưu trữ dữ liệu hạt nhân mức cao

để không làm tăng thời gian trả lời yêu cầu.

• Sử dụng cấu trúc chung cho bảng chính (Fact) cho dữ liệu cùng loại. Dữ liệu sử dụng trong một khối có thể được lưu trữ trong các bảng chính đa chiều nhưng những bảng này phải có cùng cấu trúc.

• Không tạo các bảng phụ cho dữ liệu tổng. OLAP Services tính toán trước các tổng theo cấu trúc mà được thiết kế cho việc truy vấn có hiệu quả. Các bảng tổng phụ không được sử dụng.

• Tạo chỉ số cho các trường khoá. Với mỗi bảng Dimension tạo ra một chỉ số trên cột khoá của nó, với mỗi bảng Fact tạo ra một chỉ số đơn trên tổ hợp các cột mà nó chứa các khoá ngoại của bảng Dimension

được kết hợp với bảng Fact. OLAP Services sử dụng những chỉ số này khi chúng Load các cấu trúc dữ liệu đa chiều và các tính toán dữ liệu tổng. Những chỉ số này cải tiến đáng kể quá trình xử lý.

• Bảo đảm tính toàn vẹn. Đây là điều quan trọng vì các bảng Fact được biểu diễn theo các bảng Dimension. Các bảng Fact mà không có khoá tương ứng trong bảng Dimension có thể gây lỗi hoặc các hàng trong bảng Fact bị bỏ đi nếu các bảng Fact và bảng Dimension được dùng trong cùng một khối. Các bảng Dimension chứa thông tin không được biểu diễn trong bảng Fact có thể gây ra các ô trống trong các khối. Những ô trống này có thể gây trở ngại cho một số kết quả tính toán phân tích.

• Thiết kế một chiến lược cập nhật dữ liệu. Khi dữ liệu được thêm vào hoặc thay đổi trong kho lưu trữ dữ liệu, các khối được xây dựng từ dữ

liệu trước phải được cập nhật trước khi dữ kiệu mới được cung cấp cho người dùng. Việc sát nhập dữ liệu bổ sung trong các khối đòi hỏi thời gian ít hơn việc xây dựng các khối khi dữ liệu tồn tại thay đổi.

Một phần của tài liệu Phương pháp xử lý phân tích trực tuyến (Trang 35 - 37)

Tải bản đầy đủ (PDF)

(125 trang)