Đặc điểm kho dữ liệu

Một phần của tài liệu Xây dựng kho dữ liệu quản lý giá hàng hóa, dịch vụ thị trường và phân tích diễn biến chỉ số giá tiêu dùng,khoá luận tốt nghiệp (Trang 30 - 31)

a. Hướng chủ đề

Dữ liệu trong Data warehouse được tổ chức theo các chủ đề phục vụ cho những tổ chức dễ dàng xác định được những thông tin cần thiết trong từng hoạt động của mình. Điều này dẫn đến nội dung dữ liệu được lưu trữ trong Data warehouse không được lưu trữ chi tiết, chỉ cần lưu trữ nhũng dữ liệu có tính tổng hợp phục vụ chủ yếu cho quá trình phân tích để hỗ trợ ra quyết định. Loại bỏ những dữ liệu không hữu ích cho quá trình ra quyết định, cung cấp một cái nhìn đơn giản và súc tích xung quanh các sự kiện của các chủ đề.

b. Tính tích hợp

Dữ liệu trong Data warehouse được tổ chức theo nhiều cách khác nhau sao cho phù

hợp với các quy tắc đặt tên, thống nhất về số đo, cơ cấu mã hóa và cấu trúc vật lý của dữ

liệu. Một Data warehose là một khung nhìn thông tin mức toàn doanh nghiệp, thống nhất

các khung nhìn khác nhau thành một khung nhìn theo một số chỉ điểm nào đó.

Tích hợp thể hiện như trường hợp: Dữ liệu tập hợp trong kho dữ liệu được thu thập từ nhiều nguồn khác nhau như: files, web... Các kỹ thuật làm sạch, sắp xếp, rút gọn được áp dụng trong quá trình tập hợp dữ liệu: Đảm bảo sự thống nhất trong các quy ước đặt tên, cấu trúc mã hóa giữa các nguồn.

c. Tính bền vững

Data warehouse tách rời với môi trường tác nghiệp nên dữ liệu trong Data warehouse là dữ liệu chỉ đọc, không chỉnh sửa hoặc thêm mới. Dữ liệu trong Data warehouse là dữ liệu chỉ đọc và chỉ có thể được kiểm tra, không được sửa đổi bởi người sử dụng đầu cuối. Nó chỉ cho phép thực hiện hai thao tác cơ bản: Nạp dữ liệu vào kho và truy cập vào các vùng trong Data warehouse.

d. Dữ liệu không biến động

Thông tin trong Data warehouse được tải vào sau khi dữ liệu trong hệ thống điều hành được cho là quá cũ. Tính không biến động được thể hiện ở chỗ: Dữ liệu được lưu

P

K date-key khoảng thời gian dài, cung cấp đủ số liệu cần thiết cho các mô hình nghiệp vụ phân

tích, dự báo, từ đó có được những quyết định hợp lý, phù hợp với các quy luật tiến hóa của tự nhiên.

e. Tính thời gian

Một kho dữ liệu bao hàm một khối lượng lớn dữ liệu lịch sử. Dữ liệu được lưu trữ thành một loạt các snapshot (ảnh chụp dữ liệu), mỗi bản ghi phản ánh những giá trị của dữ liệu tại một thời điểm nhất định thể hiện một khung nhìn của một chủ điểm trong một giai đoạn. Do vậy cho phép khôi phục lại lịch sử và so sánh chính xác các giai đoạn khác nhau. Yếu tố thời gian đóng vai trò như một phần của khóa để đảm bảo tính đơn nhất của mỗi hàng và cung cấp đặc trưng về thời gian cho dữ liệu.

Dữ liệu của CSDL tác nghiệp thường sau một khoảng thời gian nhất định thì sẽ trở thành dữ liệu lịch sử và chúng sẽ được chuyển thành kho dữ liệu. Đó chính là những dữ liệu hợp lý về những chủ điểm cần lưu trữ.

f. Dữ liệu tổng hợp

Dữ liệu thuần túy không được lưu trữ trong Data warehouse. Dữ liệu tổng hợp được tích lại qua nhiều giai đoạn khác nhau theo các chủ điểm đã nêu trên.

Một phần của tài liệu Xây dựng kho dữ liệu quản lý giá hàng hóa, dịch vụ thị trường và phân tích diễn biến chỉ số giá tiêu dùng,khoá luận tốt nghiệp (Trang 30 - 31)

Tải bản đầy đủ (DOCX)

(92 trang)
w