- Một số cách tiếp cậnsau để thiết kế kho dữ liệu: Cách tiếp cận từ trên xuống (Top-down), từ dƣới lên (bottom-up) hoặc sự kết hợp của 2 phƣơng pháp đó
o Từ trên xuống: Bắt đầu với thiết kế tổng thể và lập kế hoạch, thƣờng thì đƣợc áp dụng đối với các đội dự án có kinh nghiệm
o Từ dƣới lên: Bắt đầu với các thử nghiệm và nguyên mẫu, thƣờng áp dụng đối với những dự án cần tốc độ xây dựng nhanh
- Trên quan điểm của công nghệ phần mềm, xây dựng kho dữ liệu có thể tuân thủ theo một trong các mô hình sau đây:
o Mô hình thác nƣớc (Waterfall): trong đó việc phân tích cấu trúc và hệ thống đƣợc thực hiện từng bƣớc một trƣớc khi tiến hành bƣớc kế tiếp.
o Mô hình xoắn ốc (Spiral): xây dựng thêm các chức năng một cách nhanh chóng,
sửa đổi nhanh,thích ứng kịp thời với thiết kế và công nghệ mới. - Tiến trình thiết kế kho dữ liệu điển hình
o Chọn một tiến trình kinh doanh (business process) hoặc một công việc nào đó để
mô hình, ví dụ:quản lý đặt hàng,hóa đơn….
o Chọn dữ liệu ở mức độ nhỏ nhất (grain) của quá trình kinh doanhcần lƣu trữ
o Chọn các chiềumà sẽ áp dụng cho mỗi bản ghi của bảng Fact
o Chọnđộ đo đƣợc sinh ra cho mỗi bản ghi của bảng Fact
92
Ba loại mô hình kho dữ liệu
- Kho dữ liệu doanh nghiệp (Enterprise warehouse): Thu thập tất cả thông tin về chủ thể
bao trùm toàn bộ tổ chức.
- Kho dữ liệu con theo chủđề (Data mart): Một tập hợp con dữ liệu của toàn doanh nghiệp có giá trị cho một nhóm ngƣời sử dụng cụ thể. Phạm vi của nó có giới hạn cho một nhóm
ngƣời sử dụng đƣợc lựa chọn trƣớc, ví dụnhƣ quảng cáo doanh nghiệp o Có hai loại kho dữ liệu chủđề: Độc lập và phụ thuộc với kho dữ liệu - Kho dữ liệu ảo:
o Bao gồm một tập hợp các khung nhìn của cơ sở dữ liệu tác nghiệp o Chỉ một số khung nhìn có khảnăng tổng hợp dữ liệu lên mức cao.
Các kiến trúc của máy chủ cho việc xử lý phân tích trực tuyến (OLAP)
- OLAP quan hệ (Relational OLAP) hay còn gọi là ROLAP
o Dùng hệ quản trị cơ sở dữliệu quan hệ hoặc quản hệ mở rộng để lƣu trữ và quản lý kho dữ liệu
o Bao gồm sự tối ƣu hóa các công việc nền tảng của cơ sở dữ liệu cũng nhƣ các công cụ phụ trợ bổ sung và các dịch vụ
o Có khả năng mở rộng lớnhơn
93
o Có mô tơ lƣu trữ mảng dữ liệu đa chiều dựa trên cấu trúc mảng (sử dụng các kỹ thuật với các ma trận thƣa)
o Lập chỉ mục nhanh để tính toán trƣớc khi tổng hợp dữ liệu - OLAP lai (Hybrid OLAP) hay còn gọi là HOLAP
o Ngƣời dùng sử dụng ROLAP và MOLAP một cách linh hoạt (thƣờng truy vấn mức thấpthì sử dụng ROLAP, còn mức cao dùng mảng hay MOLAP).
- Các máy chủ SQL chuyên dụng
o Chuyên hỗ trợ cho các truy vấn SQL trên lƣợc đồ hình sao hay lƣợc đồ bông tuyết