Chương I Khai thác dữ liệu và xử lý phân tích trực tuyến
2.4. Thiết kế CSDL cho kho dữ liệu
2.4.4.1. Đánh chỉ số
Sử dụng việc đánh chỉ số có thể đảm bảo sự duy nhất của các khóa và có thể cải thiện năng suất đọc. Vì các bảng trong thiết kế hình sao điển hình chứa sự phân cấp tổng thể của các thuộc tính, cách thức này được chấp nhận cho những thiết kế bình thường nhưng nó cũng thể hiện một vài vấn đề trong mơ hình giản đồ hình sao đó là:
• Nó địi hỏi sự định nghĩa Metadata phức tạp (một cho mỗi thành phần khóa) để xác định một mối quan hệ đơn (một bảng). Điều này làm cho
thiết kế thêm phức tạp và hiệu suất kém đi nhiều.
• Vì bảng Fact phải chứa tất cả các khóa thành phần như một phần của khóa chính nên việc thêm vào hay xóa bỏ một mức trong sơ đồ phân
cấp sẽ đòi hỏi sự thay đổi vật lý ở các bảng liên quan mất nhiều thời
gian và hạn chế tính linh hoạt.
• Việc chứa tất cả các đoạn khóa của mỗi Dimension trong bảng Fact làm tăng kích thước của bảng chỉ số và tác động mạnh tới hiệu suất và sự ổn
định.
Một phương pháp đối với khóa ghép như trên là cắt khóa ra thành các khóa đơn. Cách này giải quyết được 2 vấn đề đầu nhưng kích thước của bảng chỉ số vẫn là một vấn đề. Cách tốt nhất là thay những khóa có ý nghĩa bằng
việc sử dụng một khóa do mình tạo ra là một khóa nhỏ nhất có thể mà vẫn bảo
nói ở trên khơng cần thiết phải hủy bỏ, đơn giản chúng có thể được chuyển đến một thuộc tính khơng phải là khóa. Kết quả thiết kế theo mơ hình hình
sao bao gồm một bảng Fact với một khóa chính có đúng một cột khóa cho mỗi chiều, tại đó mỗi khóa là khóa được tạo ra. Phương pháp này cho khả
năng linh hoạt ở mức cao nhất, việc bảo trì là ít nhất và cho hiệu suất cao nhất có thể.