Jan. Feb March ... Thời gian
Đia phương Thanh Hoá
N am Đ ịnh H à nam H à tây H à nội Item 1 Item2 Sản phẩm 205 407 43 570 698 106 679
Như vậy , khi cần người quản lý có thể biết được mức tiêu thụ của một hoặc một số loại sản phẩm ở một hoặc một số người bán hay địa điểm. Kiểu dữ liệu này thích hợp cho các hệ thống sử dụng thông tin tổng hợp và chi tiết, các hệ dự báo và phân tích lượng.
1.5.2. Kho dữ liệu tác nghiệp
Kho dữ liệu tác nghiệp (Operational Dataabase Store - ODS) là dữ liệu được sử dụng trong môi trường tác nghiệp phục vụ cho các ứng dụng tác nghiệp.
Kho dữ liệu tác nghiệp lưu trữ dữ liệu với mục đích hỗ trợ quyết định đối với các dữ liệu tác nghiệp hoặc là nơi thu thập dữ liệu từ các nguồn để cung cấp data warehouse. ODS cũng có hướng chủ đề như data warehouse, được tích hợp vào data warehouse nhưng ODS dễ biến động, ODS lưu trữ dữ liệu hiện thời và chỉ lưu trữ dữ liệu chi tiết chứ khơng có tính tốn hay tổng hợp như data warehouse.
Data warehouse có thể lấy dữ liệu từ ODS hoặc trực tiếp từ các nguồn bên ngoài.
Data warehouse Kho dữ liệu tác nghiệp Mục đích Hỗ trợ nhà quản lý nhằm
đưa ra những quyết định chiến lược
Hỗ trợ các nhà quản lý kiểm soát các hoạt động của hệ thống tác nghiệp
Giống nhau Tính tích hợp Tính tích hợp
Hướng chủ đề Hướng chủ đề
Khác nhau Dữ liệu tĩnh, không thay đổi Dữ liệu thay đổi
Dữ liệu mang tính lịch xử Dữ liệu chỉ phản ánh hiện trạng doanh nghiệp
Chứa dữ liệu tổng kết, khái
quát Chứa nhiều dữ liệu chi tiết
Bảng 1: Data warehouse và kho dữ liệu tác nghiệp
1.5.3. Kho dữ liệu hướng chủ đề
Trung tâm của hệ thống là data warehouse. Nó lưu trữ tồn bộ dữ liệu lấy từ nguồn dữ liệu bên ngồi. Thực chất nó là một hệ quản trị cơ sở dữ liệu đã được điều chỉnh cho phù hợp với mục đích của người thiết kế.
Về mặt logic, data warehouse có cấu trúc được tổ chức theo từng chủ đề. Do vậy, việc đánh giá chất lượng dữ liệu phải dựa trên các tiêu chí khác nhau.
Với lý luận như vậy, có thể phân data warehouse ra thành các kho dữ liệu hướng chủ đề (Datamart viết tắt là DM). Mỗi DM có một chủ đề rõ ràng hơn. Data warehouse và các DM có thể để trên các server khác nhau. Mỗi DM mang lại cho những nhóm người
sử dụng cụ thể các giải pháp họ quan tâm và được thiết kế một cách đặc biệt để sử dụng dễ dàng và nhanh hơn.
Như vậy, DM là một data warehouse tương tự như data warehouse nhưng với quy mô nhỏ hơn và lưu trữ dữ liệu về một lĩnh vực. Dữ liệu trong DM cho thông tin về một chủ đề xác định, khơng phải là về tồn bộ hoạt động của doanh nghiệp.
DM thường được xuất hiện trong các doanh nghiệp như là một bước đầu tiên để xây dựng data warehouse. Việc xây dựng thành công với DM sẽ giúp doanh nghiệp tiếp cận dễ dàng hơn khi xây dựng data warehouse.
DM có thể là một phần dữ liệu được lấy từ data warehouse hoặc có thể được xây dựng độc lập, sau đó kết hợp với các DM khác để hình thành data warehouse. Bởi vậy, có 2 loại DM:
- DM phụ thuộc: lấy dữ liệu từ data warehouse và những dữ liệu được lấy ra, tinh lọc, tích hợp mức cao, phục vụ cho chủ để của DM. Như vậy, DM theo cách này được hình thành sau khi đã xây dựng xong data warehouse.
- DM độc lập: là loại DM mà khi người ta xây dựng ra trước và sau đó tập hợp các DM này mới hình thành nên data warehouse, dữ liệu của DM này được lấy trực tiếp từ các nguồn. Phương pháp xây dựng data warehouse này là đơn giản hơn, chi phí thấp nhưng do các DM độc lập nên dữ liệu từ nhiều DM này là khó đồng nhất.
Data warehouse Kho dữ liệu hướng chủ đề
Sử dụng ở mức tập đoàn/doanh nghiệp Sử dụng mức phòng ban/đơn vị Là tập hợp các kho dữ liệu hướng chủ
đề
Là một quy trình nghiệp vụ đơn giản Dữ liệu lấy từ vùng thu thập Thường sử dụng lược đồ dữ liệu hình
sao khi thiết kế data warehouse Cấu trúc dữ liệu với khung nhìn mức
doanh nghiệp
Sử dụng các công nghệ nhằm tối ưu cho việc truy cập và phân tích dữ liệu Được tổ chức trên mơ hình E-R Cấu trúc phù hợp cho các khung nhìn
mức phịng ban, chủ đề
Bảng 2: Data warehouse và kho dữ liệu hướng chủ đề
1.6. Hệ thống xử lý giao dịch trực tuyến và data warehouse
Hầu hết chúng ta đều đã quen với sản phẩm thương mại là hệ cơ sở dữ liệu quan hệ. Sản phẩm này có đặc điểm là dễ hiểu. Cơng việc chính trên kho dữ liệu tác nghiệp này là xử lý các giao dịch và truy vấn trực tuyến. Các hệ thống này có tên gọi là hệ thống xử lý giao dịch trực tuyến (Online Transaction Processing – OLTP). Hệ thống này bao phủ lên hầu hết các hoạt động hàng ngày của doanh nghiệp. So với mơi trường data warehouse, nó có những điểm khác biệt chính được mơ tả qua hình vẽ bên dưới: