Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 40 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
40
Dung lượng
479,41 KB
Nội dung
Kho liệu Hệ hỗ trợ định Nguyễn Thanh Bình Đề cương Phần 1: Tổng quan • Chương 1: Giới thiệu • Chương 2: Đại cương • Chương 3: Kiến trúc kho liệu Đề cương (tt) Phần 2: Mơ hình hóa • Chương 4: Dữ liệu mơ hình • Chương 5: Mơ hình hóa • Chương 6: Siêu Dữ liệu • Chương 7: Phương thức kho liệu • Chương 8: Tương lai tổng kết môn học Chương 1: Giới thiệu Vấn đề: Các nguồn thơng tin đa tạp • Cách mạng thơng tin va bùng nổ thơng tin • Nhiều hệ thống thông tin xây dựng: – Những giao diện khác – Những dạng biểu liệu khác – Thông tin trùng lặp không quán Vấn đề: Quản lý liệu xí nghiệp lớn • Sự phân mảnh theo chiều dọc hệ thống thông tin – Thành nhiều hệ thống tác nghiệp hệ thống xử lý toàn tác trực tuyến (OLTP) đa tạp Mục tiêu: Truy cập liệu cách thống • Thu thập kết hợp thơng tin • Cung cấp khung nhìn tích hợp, giao diện người sử dụng khơng biến đổi • Hỗ trợ khả chia sẻ Kho liệu • Dữ liệu tích hợp tổ chức cho mục đích: – Làm cho hệ thống trở nên dễ hiểu – Rõ ràng – Dễ phân tích • Dữ liệu thu thập từ nhiều nguồn – – – – Làm Tích hợp Chuyển dịch Tổng hợp Hệ hỗ trợ định • Được biết đến phần kho liệu • Cung cấp báo cáo, phân tích tiền tính tốn, đồ thị, biểu đồ • Cho phép phân tích trực tuyến liệu • Thăm dị tương tác liệu • Cung cấp giao diện đa dạng cho người dùng • Cung cấp khả phân tích liệu phức tạp phương thức đơn giản Yêu cầu hệ hỗ trợ định • Khung nhìn liệu đa chiều • Hỗ trợ phân cấp liệu, khả sâu vào chi tiết • Trả lời nhanh câu hỏi Integrated Data • Dữ liệu tổng hợp từ nguồn khác • Là tập hợp thơng tin xác, chất lượng qn • Chuẩn hóa – Các qui ước tên – Các thuộc tính – Các đơn vị đo lường • Q trình làm tích hợp Time Variant Data is stored as a series of snapshots, each representing a period of time Time Data 01/97 Data for January 02/97 Data for February 03/97 Data for March Data Warehouse Time Variant • Yêu cầu quan cho kho liệu phạm vi thời gian dài so với hệ thống tác nghiệp – Cơ sở liệu tác nghiệp: liệu có giá trị thời – Dữ liệu kho liệu: cung cấp thơng tin lịch sử (ví dụ như, 5-10 năm trước) • Yếu tố thời gian lưu trữ CSDL Time Data 01/97 Data for January 02/97 Data for February 03/97 Data for March Non Volatile Typically data in the data warehouse is not updated or deleted Load Operational Databases INSERT UPDATE DELETE Read Warehouse Database Read Non Volatile First time load Operational Databases Warehouse Database Refresh Refresh Purge or Archive Refresh Non-Volatile • Là lưu trữ vật lý liệu chuyển đổi từ mơi trường tác nghiệp • Cập nhật tác nghiệp liệu không xuất môi trường kho liệu – Không yêu cầu chế xử lý toàn tác, phục hồi điều khiển tương tranh – Chỉ yêu cầu hai thao tác truy cập liệu: • Nạp liệu truy cập liệu Kho liệu-Các định nghĩa (tt) • Pandora, Swinburn University – Là phương thức cho việc kết nối liệu từ nhiều hệ thống khác – Là điểm truy cập tập trung liệu tổ chức – Được trình bày khng dạng thích hợp – Là hệ thống đọc – Cho phép thiết lập báo cáo tổng hợp ứng dụng Kho liệu-Các định nghĩa (tt) • Paul Lucas, IBM: – Là nơi lưu trữ liệu đầy đủ quán consistent – tổng hợp từ nhiều nguồn – làm sẵn cho người sử dụng cuối – Dễ hiểu Kho liệu CSDL • Việc tích hợp csdl hỗn tạp truyền thống: – Xây dựng wrappers/mediators csdl hỗn tạp – Xử lý câu hỏi: • Khi câu hỏi đặt máy khách, siêu từ điển sử dụng để dịch câu truy vấn thành câu truy vấn tương ứng cho csdl riêng biệt, kết tích hợp tập kết tồn cục • Ở có lọc phức tạp • Kho liệu: nâng cao tốc độ thực – Thông tin từ nguồn đa tạp tích hợp trước lưu trữ kho liệu cho việc trả lời trực tiếp câu hỏi tác vụ phân tích Kho liệu CSDL • Xử lý tồn tác trực tuyến OLTP (on-line transaction processing) – Tác vụ hệ qtcsdl quan hệ truyền thống – Các thao tác hàng ngày: mua, kiểm kê, kế toán,… • Xử lý phân tích trực tuyến OLAP (on-line analytical processing) – Là tác vụ hệ thống kho liệu – Phân tích liệu đưa định • Các đặc tiểm khác (OLTP vs OLAP): – Theo quan điểm người dùng: khách hàng so với thị trường – Các nội dung liệu: Hiện tại, chi tiết so với lịch sử tóm lược – Thiết kế csdl: ER + ứng dụng so với hình hướng chủ thể – Khung nhìn: tại, cục so với lịch sử tích hợp – Các mẫu truy cập: cập nhật so với truy vấn đọc phức hợp OLTP vs OLAP OLTP OLAP users Chuyên viên Các chuyên gia function Thao tác hàng ngày Hỗ trợ định DB design Hướng ứng dụng Hướng chủ thể data access Hiện thời, cập nhật, chi Lịch sử, tóm tắt, tích hợp đa tiết, csdl độc lập chiều, tổng hợp Đọc/ ghi/ lập mục Duyệt nhiều lần unit of work Toàn tác ngắn, đơn giản Câu hỏi phức # records accessed #users Vài chục Vài triệu Vài ngàn Vài trăm DB size 100MB-GB 100GB-TB Các kiến thức, môn học liên quan • • • • • • • • • CSDL Xử lý song song Thiết kế giao diện Công nghệ phần mềm Khai phá liệu Bảo mật Công nghệ mạng, intranet, internet Công nghệ xử lý kinh doanh Marketing, kế tốn, quản lý Tóm tắt chương • • • • • • • • Kho liệu hệ hỗ trợ định Lịch sử phát triển Tại nghiên cứu kho liệu Các đặt điểm KDL Các ví dụ ứng dụng KDL Các định nghĩa Các môn học liên quan Câu hỏi cho chương 1??? Uff ... cương Phần 1: Tổng quan • Chương 1: Giới thiệu • Chương 2: Đại cương • Chương 3: Kiến trúc kho liệu Đề cương (tt) Phần 2: Mô hình hóa • Chương 4: Dữ liệu mơ hình • Chương 5: Mơ hình hóa • Chương. .. mật Công nghệ mạng, intranet, internet Công nghệ xử lý kinh doanh Marketing, kế tốn, quản lý Tóm tắt chương • • • • • • • • Kho liệu hệ hỗ trợ định Lịch sử phát triển Tại nghiên cứu kho liệu Các... tuyến liệu • Thăm dị tương tác liệu • Cung cấp giao diện đa dạng cho người dùng • Cung cấp khả phân tích liệu phức tạp phương thức đơn giản Yêu cầu hệ hỗ trợ định • Khung nhìn liệu đa chiều • Hỗ trợ