Kỹ thuật trích xuất dữliệu

Một phần của tài liệu Xây dựng kho dữ liệu và báo cáo quản trị BI cho tập đoàn VINGROUP với hệ thống SAP BOBI (Trang 28)

2.3.2.1Các kỹ thuật trích xuất dữ liệu thời gian thực

Nắm bắt dữ liệu qua bản ghi giao dịch : Tùy chọn này sử dụng bản ghi giao dịch của hệquản trị cơ sở dữ liệu được duy trì cho việc khôi phục khi có lỗi xảy ra. Mỗi giao dịch thêm,cập nhật hay xóa một bản ghi trong bảng cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu ngay lậptức sinh ra một bản ghi log.

Nắm bắt thông qua trigger cơ sở dữ liệu: Tùy chọn này cũng được áp dụng cho các hệthống nguồn dữ liệu sử dụng ứng dụng cơ sở dữ liệu. Ta có thể tạo các trigger cho tất cả cácsự kiện mà ta cần nắm bắt. Đầu ra của trigger được ghi vào một tệp độc lập và sẽ được sửdụng để trích xuất dữ liệu cho kho dữ liệu. việc tạo và duy trì trigger trong suốt các quátrình của hệ thống nguồn sẽ tăng thêm các chi phí tài nguyên và thời gian của hệ thống nguồn.

Nắm bắt trong các ứng dụng nguồn: Kỹ thuật này được xem như nắm bắt dữ liệu ứng dụnghỗ trợ. Nói cách khác, các ứng dụng nguồn được thực hiện để hỗ trợ cho việc nắm bắt dữliệu cho kho dữ liệu. Ta phải chỉnh sửa các chương trình ứng dụng liên quan được viết chocác têp và cơ sở dữ liệu nguồn.

2.3.2.2Các kỹ thuật trích xuất dữ liệu chậm

Nắm bắt dựa trên ngày tháng và nhãn thời gian: Mỗi khi một bản ghi được tạo ra hoặc cậpnhật nó có thẻ được đánh dấu bởi một nhãn biểu diễn bởi ngày và thời gian. Nhãn thời giancung cấp cơ sở cho việc chọn ra các bản ghi cho việc trích xuất.

Trích xuất bằng cách so sánh tập tin: Nếu các kỹ thuật trên không khả thi cho tập tin nguồncụ thể, khi đó kỹ thuật này được xem như biện pháp cuối cùng. Kỹ thuật này cũng được gọivới tên khác là kỹ thuật so sánh sự khác nhau giữa ảnh chụp bởi vì nó so sánh 2 ảnh chụp của nguồn dữ liệu.

Một phần của tài liệu Xây dựng kho dữ liệu và báo cáo quản trị BI cho tập đoàn VINGROUP với hệ thống SAP BOBI (Trang 28)

Tải bản đầy đủ (PDF)

(53 trang)