1 6 Kho dữ liệu chú đề D atam art

Một phần của tài liệu Khai thác dữ liệu và xử lý phân tích trực tuyến (Trang 25)

Kho dữ liệu chủ dề (Dalamarl - DM) là CSDL có những đặc điểm giống với KDL nhưng với quy mô nhỏ hơn và hru trữ dữ liệu vể một lĩnh vực, mộl chuyên ngành. Các DM có thể được hình thành từ một tập con dữ liệu của KDL hoặc cũng có thể được xây dựng độc lập và sau khi xây dựng xong, các DM có thể được kết nối, tích hợp lại với nhau tạo thành KDL.

DM là một khơ dữ liệu thứ cấp gồm các dữ liệu lích hợp của KDL. DM được hướng tới một phần của dữ liệu thường được gọi là một vùng chủ đề (SA) được tạo ra dành cho một nhóm người sử dụng. Dữ liệu trong DM cho thông tin về một chủ đề xác định, không phải về toàn bộ các hoạt động nghiệp vụ đang diễn ra trong một tổ chức. Thể hiện thường xuyên nhất của DM là một kho dữ liệu liêng rẽ theo phương diện vật lý, thường được lưu trữ trên một server riêng, trong một mạng cục bộ phục vụ cho một nhóm người nhất định. Đôi khi DM một cách đơn giản với công nghệ OLAP tạo ra các quan hệ theo dạng hình sao đặc biệt hoặc những siêu khối (hypercube) dữ liệu cho việc phân tích của một nhóm người có cùng mối quan tâm trên một phạm vi dữ liệu.

Có thể chia ra làm 2 loại: DM độc lập và DM phụ thuộc.

D M phụ thuộc: chứa những dữ liệu đưực lấy từ KDL và những dữ liệu này sẽ được trích lọc và tinh chế, tích hợp lại ỏ mức cao hơn đổ phục vụ một chủ đề nhất định của DM.

D M độc lập: không giỏng như DM phụ lliuộc, DM loại này được xây dựng trước KDL và dữ liệu dược lấy lừ các nguồn dữ liệu tác nghiệp. Phương pháp này đơn giản hơn và chi phí thấp hơn nhưng đổi lụi có những điểm yếu. Mỗi DM độc lập có cách tích hợp riêng, do đó dữ liệu từ nhiều DM khó đổng nhái với nhau. DM thế hiện hai vấn đề: thứ nhất là tính ổn định trong các tình huống từ một DM nhỏ ban đầu lớn lên nhanh chóng theo nhiều chiểu và thứ hai là sự tích hợp dữ liệu. Vì vậy khi Ihiết kế DM phải chú ý kỹ tới tính ổn định của hệ thống, sự dồng nhất của dữ liệu và vấn đề về khả năng quản lý.

Một phần của tài liệu Khai thác dữ liệu và xử lý phân tích trực tuyến (Trang 25)

Tải bản đầy đủ (PDF)

(86 trang)