Các nguồn dữ liệu

Một phần của tài liệu giải pháp kho dữ liệu thời gian thực cho hệ thống siêu thị (Trang 34)

Bao gồm các hệ thống trong và ngoài của một tổ chức, rất phong phú về chủng loại. Các hệ thống nằm trong được coi như các hệ thống nguồn hoặc các hệ thống đã có sẵn.

• Hệ thống đã có sẵn (Legacy System - LS): là một hệ thống tác nghiệp. Hệ thống này đã từng được phát triển, sử dụng các công nghệ có sẵn và vẫn phù hợp với các nhu cầu. Các hệ thống này có thể được thực hiện trong nhiều năm và có lẽ không có hoặc có rất ít minh chứng bằng tài liệu.

• Dữ liệu ngoài: là dữ liệu không nằm trong các hệ thống tác nghiệp của một tổ chức, là những dữ liệu do người sử dụng đầu cuối yêu cầu.

Các LS được phát triển để phục vụ cho các dự án. Các ứng dụng được phát triển cùng với dữ liệu mà các dữ liệu này lại đáp ứng nhiều nhu cầu khác nhau. Cùng là một dữ liệu nhưng lại có tên khác nhau hoặc thuộc các hệ thống

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

đo lường khác nhau. Kết quả cuối cùng là các nguồn dữ liệu cần được đánh giá và các định nghĩa cần được đưa vào Metadata để nhắm tới các vấn đề sau:

• Xác định các nguồn khác nhau, các cấu trúc file khác nhau, các nền (Platform) khác nhau.

• Hiểu được dữ liệu nào có trong các hệ thống nguồn đang tồn tại, các định nghĩa của dữ liệu và bất kỳ các luật nào cho dữ liệu.

• Phát hiện sự giao nhau về thông tin của các hệ thống khác nhau.

• Quyết định dữ liệu tốt nhất trong các hệ thống. Mỗi hệ thống cần được đánh giá để quyết định hệ thống nào có dữ liệu rõ ràng và chính xác hơn.

Một phần của tài liệu giải pháp kho dữ liệu thời gian thực cho hệ thống siêu thị (Trang 34)