. Do đó trước khi đưa vào kho dữ liệu cần có sự phân loại, chuẩn hóa và làm sạch. Kho dữ liệu được thực thi trên SQL Server 2005, chạy trên nền tảng Windows 2003 Advanced Server. Kho dữ liệu đặt tập trung sẽ dễ dàng được bảo trì, bảo mật và tiện lợi cho việc vận hành. Xây dựng kho dữ liệu sử dụng phương pháp phân tích hệ thống có cấu trúc làm phương pháp luận để tiếp cận tới quá trình phân tích và thiết kế. Quá trình phân tích thiết kế có kết hợp với bản mẫu. Kho dữ liệu được xây dựng trên hệ quản trị cơ sở dữ liệu SQL Server với các công cụ trợ giúp trong quá trình phân tích, thiết kế là Enterprise Manager và Analysis Manager.
2.2.2. Phân tích có cấu trúc
Phân tích có cấu trúc là cách tiếp cận hiện đại tới các giai đoạn phân tích và thiết kế của chu trình phát triển của hệ thống, được chấp nhận để khắc phục những điểm yếu của các tiếp cận truyền thống.
Đặc điểm của phương pháp này:
- Hệ thống được hoàn thiện theo phương pháp từ trên xuống.
- Quá trình phân tích, thiết kế sử dụng một nhóm các công cụ, kỹ thuật và mô hình để ghi nhận phân tích hệ thống hiện tại cũng như các yêu cầu mới của người sử dụng đồng thời xác định khuôn dạng cho hệ thống tương lai.
Những công cụ gắn liền với phân tích có cấu trúc là:
- Mô hình quan hệ thực thể - Mô hình quan hệ
- Sơ đồ dòng dữ liệu - Từ điển dữ liệu
- Ngôn ngữ có cấu trúc.
2.2.3. Hai mô hình phân tích hệ thống có cấu trúc
Trong một số trường hợp nhà phân tích hệ thống có thể chọn một trong hai mô hình sau:
- Mô hình thác đổ (Waterfall)
Mô hình nền tảng cho phần lớn các phương phân tích hệ thống từ những năm 70. Mô hình này bao gồm một số giai đoạn được tiến hành một cách tuần tự.
Mỗi giai đoạnh có thể do một nhóm các chuyên gia thực hiện.
- Mô hình xoắn ốc (Spiral)
Việc phân tích dựa trên mô hình xoắn ốc gồm những giai đoạn kế tiếp nhau như mô hình thác đổ nhưng các giai đoạn này được chia nhỏ thành nhiều bước và được thực hiện lặp lại để hoàn chỉnh dần. Đặc điểm của mô hình này là người phát triển hệ thống có thể bàn giao kết quả lại cho người sử dụng cuối theo từng giai đoạn mà không cần phải chờ đợi cho đến cuối giai đoạn phát triển. Có thể nói, mô hình xoắn ốc là sự kết hợp chặt chẽ giữa cách tiếp cận có cấu trúc và phương pháp tạo bản mẫu làm cho tiến trình phát triển của hệ thống có hiệu quả hơn.
2.2.4. Phương pháp luận xây dựng kho dữ liệu
Quá trình xây dựng kho dữ liệu bao gồm nhiều pha. Chúng ta sẽ xem xét chi tiết của từng pha cụ thể trong quá trình xây dựng bằng công cụ SQL Server.
Việc xây dựng kho dữ liệu sử dụng SQL Server được chia thành các giai đoạn, bao gồm:
a, Xác định các yêu cầu
- Thu thập dữ liệu, xác định nhu cầu khai thác thông tin của lãnh đạo - Xác định các nguồn dữ liệu
- Xây dựng các tiêu chí quản lý dữ liệu, biểu mẫu theo các tiêu chí - Thể hiện dữ liệu dưới các khung nhìn khác nhau
b, Giai đoạn mô tả
- Xác định, thiết kế các chiều (Dimension Table).
- Xác định, thiết kế các bảng Sự kiện (Fact Table).
- Xác định, thiết kế các bảng tổng hợp (Summary Table).
- Xác định, thiết kế các bảng trung gian.
- Xác định lược đồ hình sao.
- Ánh xạ việc trích lọc, chuyển đổi dữ liệu.
c, Giai đoạn xây dựng
nh sau:
- .
- .
- (index).
- (Partition).
- ...).
- .
d,
Services
2.2.5. Công cụ thực hiện
Hiện nay trên thế giới hệ quản trị cơ sở dữ liệu cung cấp giải pháp cho lưu trữ, quản trị và xử lý dữ liệu thuộc về Microsoft SQL Server. Đây là hệ quản trị cơ sở dữ liệu được đánh giá là một trong các hệ quản trị cơ sở dữ liệu mạnh nhất hiện nay. Hệ thống hoạt động trên kiến trúc máy khách/chủ (client/server), có ưu điểm là cho phép chia sẻ công việc một cách hợp lý giữa hai máy.
Trong quá trình phát triển hãng Microsoft thường xuyên có sự nâng cấp các phiên bản SQL Server, hiện phiên bản mới nhất là SQL Server 2005. Các đặc trưng của SQL Server 2005:
- Cung cấp cung cấp một nền tảng dữ liệu toàn diện và khả năng mở rộng kho cho phép các tổ chức để tích hợp dữ liệu vào kho dữ liệu nhanh hơn, quy mô và quản lý một lượng ngày càng tăng của dữ liệu và người sử dụng, trong khi cung cấp những hiểu biết để tất cả người dùng.
- Cung cấp một nền tảng cơ sở dữ liệu tiết kiệm chi phí, mang lại hiệu quả cho các giải pháp lưu trữ, cho phép khách hàng chỉ trả tiền cho các tính năng và khả năng mở rộng mà họ cần, trong khi cung cấp một đường dẫn nâng cấp liền mạch cho phép khách hàng xây dựng vào đầu tư ban đầu của họ là những yêu cầu dữ liệu của họ phát triển.
- Giảm chi phí thông qua ảo hóa phần cứng.
- Nâng cao hiệu suất truy vấn, cung cấp các công cụ tối ưu hóa để thiết kế cấu trúc tối ưu cho cơ sở dữ liệu và lập chỉ mục.
Các dịch vụ và tính năng tối ưu của SQL Server 2005:
- Dịch vụ phân tích: cải thiện và nâng cao hiệu suất phân tích
- Cho phép đưa ra những quyết định trên cơ sở các phân tích tiên đoán thông qua việc khai thác dữ liệu đầy đủ và trực quan, hoàn toàn phù hợp trong suốt nền tảng Microsoft BI, và có thể mở rộng trong bất kỳ ứng dụng.
- Cho phép các nhà phát triển xây dựng các công cụ mạnh, các ứng dụng cơ sở dữ liệu thế hệ tiếp theo với .NET Framework, Visual Studio Team System.
- Cung cấp một nền tảng hoàn chỉnh được thiết kế để hỗ trợ xây dựng một loạt các báo cáo theo nhu cầu để cung cấp thông tin có liên quan khi cần thiết.
- Cung cấp tính năng bảo mật cải tiến, công cụ quản lý hiệu quả tính năng bảo mật, xác thực mạnh và kiểm soát truy cập, mã hóa mạnh, kiểm toán nâng cao.
2.2.6. Bộ công cụ Microsoft SQL Server 2005
Bộ công cụ SQL Server 2005 trợ giúp cho việc xây dựng, quản trị và khai thác các hệ thống thông tin, kho dữ liệu. Trong đó có một số các công cụ cơ bản sau:
- Enterprise Manager: dùng để xây dựng và quản trị cơ sở dữ liệu.
- Analysis Services: cung cấp công cụ phân tích dữ liệu thông qua khai thác dữ liệu trực quan.
- SQL Server 2005 Reporting Services: hỗ trợ xây dựng báo cáo.