Kho dữ liệu chuyên đề

Một phần của tài liệu bài giảng về cơ sở dữ liệu nâng cao (Trang 42 - 43)

Các kho dữ liệu nhằm cung cấp nguồn đơn chất của các dữ liệu dùng cho các hoạt động trợ giúp ra quyết đinh. Tuy nhiên, khi các kho dữ liệu trở nên thông dụng, người ta thấy người sử dụng

thường thực hiện các thao tác phân tích dữ liệu và ra báo cáo trên một phần nhỏ của kho dữ liệu.

Hơn nữa người sử dụng hay lặp lại cùng một thao tác trên các phần nhỏ của kho dữ liệu. Việc thực

hiện nhiều lần một thao tác trên toàn bộ kho dữ liệu là không hiệu quả, cho nên người ta cần đến

loại kho dữ liệu chuyên dụng, được người sử dụng xây dựng theo yêu cầu xử lý riêng. Có như vậy

thì việc truy cập các dữ liệu đồng bộ với kho dữ liệu mới nhanh.

Đ/N. Kho dữ liệu chuyên đề (data mart). Kho dữ liệu chuyên đề có vai trò như kho dữ liệu,

nhưng các dữ liệu trong đó cho phép cập nhật và dùng cho trợ giúp quyết định với mục đíchđặc

biệt hơn.

Kho dữ liệu chuyênđề là kho dữ liệu hạn chế, gồm các dữ liệu được tuyển chọn và tổng hợp từ

kho dữ liệu của xí nghiệp.

Để tạo ra được một kho dữ liệu chuyênđề, người ta thường theo ba cách tiếp cận sau:

1. Trích dữ liệu từ kho dữ liệu. Các dữ liệu được trích từ kho dữ liệu để đạt được hiện suất phục

lược đồ vật lý gần giống với phần ứng dụng của kho dữ liệu. Do tínhđặc biệt hơn của kho dữ

liệu chuyênđề so với kho dữ liệu, lược đồ vật lý của dữ liệu có thể đơn giản hơn.

2. Tạo ra kho dữ liệu chuyênđề riêng biệt. Tiếp cận này xuất phát từ tính đơn thể của kho dữ

liệu, không trích dữ liệu từ kho dữ liệu và không truy cập kho dữ liệu do một vài nguyên nhân. 3. Coi kho dữ liệu chuyênđề là nền tảng của kho dữ liệu. Một vài phát triển hệ thống trợ giúp ra quyết định đã xây dựng các kho dữ liệu chuyênđề trước tiên, mỗi khi cần thiết. Kho dữ liệu sẽ được

tao ra bằng cách tập hợp các kho dữ liệu chuyênđề.

Đ/N. Tính chia hạt. Tính chia hạt trong cơ ở dữ liệu đề cập khả năng lưu trữ được phần tử nhỏ

nhất cảu dữ liệu gộp trong CSDL.

Liên quanđến việc thiết kế kho dữ liệu chuyênđề, người ta nhận thấy một yếu tố quan trọng đối

với bất kì CSDL trợ giúp ra quyết định nào là tính chia nhỏ thành hạt của CSDL. Sớm hay muôn thì các kho dữ liệu dùng để ra quyết định đều yêu cầu truy cập dữ liệu chi tiết nhất, nên yêu cầu chi

thành hạt đối với kho dữ liệu không gây ra vấn đề lớn như đối với kho dữ liệu chuyênđề. Nếu kho

dữ liệu chuyênđề được xây dựng bằng cách trích các dữ liệu từ kho dữ liệu mà không biết cácứng

dụng có nhu cầu thường xuyên về các dữ liệu ở mức hạt hay không, thì việc trích dữ liệu và cập

nhật các dữ liệu ở mức hạt sẽ tốn kém nhiều.

Một phần của tài liệu bài giảng về cơ sở dữ liệu nâng cao (Trang 42 - 43)