Những nhân tố thiết kế cần phải được cân nhắc

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 35 - 37)

Chương I Khai thác dữ liệu và xử lý phân tích trực tuyến

2.4.5.Những nhân tố thiết kế cần phải được cân nhắc

2.4. Thiết kế CSDL cho kho dữ liệu

2.4.5.Những nhân tố thiết kế cần phải được cân nhắc

Thiết kế cấu trúc kho dữ liệu có thể làm ảnh hưởng đến tính dễ dàng trong việc thiết kế và xây dựng các khối (Cube). Microsoft SQL Server OLAP

Services dựa vào dữ liệu được cung cấp bởi kho dữ liệu có tính chính xác, ổn

định và tồn vẹn. Khi tạo ra một kho dữ liệu sử dụng với OLAP, những nhân

tố thiết kế cần phải được cân nhắc là:

• Sử dụng sơ đồ hình sao hoặc bảng phẳng chính (Flat) nếu có thể. Nếu một sơ đồ dạng hình tuyết rơi là cần thiết thì giảm thiểu số bảng

Dimension vượt ra ngồi mức thứ nhất từ bảng chính.

• Thiết kế các bảng Dimension cho người dùng. Các bảng Dimension cần có thơng tin ý nghĩa về thực tế mà người dùng muốn tìm hiểu.

• Áp dụng việc chuẩn hố thơng thường vào thiết kế bảng Dimension. Không nên kết hợp dữ liệu không quan hệ vào bảng Dimension đơn và không nên lặp lại dữ liệu trong các bảng Dimension. Ví dụ: tạo Dimension khách hàng riêng biệt thay vì lặp lại thơng tin khách hàng trong nhiều bảng Dimension.

• Khơng tổng hợp thừa trong bảng chính. Giữ lại mức tinh tế cần thiết cho người dùng truy cập và giữ lại tất cả các bản ghi của bảng chính trong cùng một mức độ chi tiết. OLAP Services được thiết kế để tạo ra và quản lý dữ liệu tổng hợp từ các kho lưu trữ dữ liệu hạt nhân mức cao

để không làm tăng thời gian trả lời yêu cầu.

• Sử dụng cấu trúc chung cho bảng chính (Fact) cho dữ liệu cùng loại. Dữ liệu sử dụng trong một khối có thể được lưu trữ trong các bảng

chính đa chiều nhưng những bảng này phải có cùng cấu trúc.

• Khơng tạo các bảng phụ cho dữ liệu tổng. OLAP Services tính tốn trước các tổng theo cấu trúc mà được thiết kế cho việc truy vấn có hiệu quả. Các bảng tổng phụ khơng được sử dụng.

• Tạo chỉ số cho các trường khoá. Với mỗi bảng Dimension tạo ra một chỉ số trên cột khố của nó, với mỗi bảng Fact tạo ra một chỉ số đơn

được kết hợp với bảng Fact. OLAP Services sử dụng những chỉ số này

khi chúng Load các cấu trúc dữ liệu đa chiều và các tính tốn dữ liệu tổng. Những chỉ số này cải tiến đáng kể quá trình xử lý.

• Bảo đảm tính tồn vẹn. Đây là điều quan trọng vì các bảng Fact được biểu diễn theo các bảng Dimension. Các bảng Fact mà khơng có khố tương ứng trong bảng Dimension có thể gây lỗi hoặc các hàng trong

bảng Fact bị bỏ đi nếu các bảng Fact và bảng Dimension được dùng

trong cùng một khối. Các bảng Dimension chứa thông tin khơng được biểu diễn trong bảng Fact có thể gây ra các ô trống trong các khối. Những ô trống này có thể gây trở ngại cho một số kết quả tính tốn phân tích.

• Thiết kế một chiến lược cập nhật dữ liệu. Khi dữ liệu được thêm vào

hoặc thay đổi trong kho lưu trữ dữ liệu, các khối được xây dựng từ dữ

liệu trước phải được cập nhật trước khi dữ kiệu mới được cung cấp cho người dùng. Việc sát nhập dữ liệu bổ sung trong các khối đòi hỏi thời

gian ít hơn việc xây dựng các khối khi dữ liệu tồn tại thay đổi.

Một phần của tài liệu Luận văn: Phương pháp xử lý phân tích trực tuyến áp dụng trong xây dựng hệ trợ giúp quyết định dựa vào dữ liệu docx (Trang 35 - 37)