Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 15 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
15
Dung lượng
244,99 KB
Nội dung
Chương Chương 2: 2: Đ Đ ạ ạ i i cương cương C C á á c c th th à à nh nh ph ph ầ ầ n n ETT Data Management Data Access and Analysis Design and Modeling Methodology Methodology Methodology - - Phương Phương ph ph á á p p lu lu ậ ậ n n • Đảm bảo sự thành công của KDL • Thúc đẩy việc phỏt triển • Cung cấp một hướng ổn định cho KDL lớn – An toàn – Quản lí được – Kiểm chứng được – ấn tượng tốt Modeling Modeling - - Mô h Mô h ì ì nh h nh h ó ó a a • Các điểm khác của KDL so với các hệ thống OLTP – Thiết kế các thành phần phục vụ các yêu cầu phân tích – Định hướng chủ thể • Dữ liệu được ánh xạ vào thông tin hướng chủ thể: – Nhận dạng các chủ thể kinh doanh – Định nghĩa quan hệ giữa các chủ thể • Mô hình hóa là một quá trình lặp ETT ETT • Extraction: chọn lựa dữ liệu bằng nhiều phương thức • Transformation: xác nhận hợp lệ, làm sạch, tích hợp, và dữ liệu nhãn thời gian • Transportation: chuyển đổi dữ liệu vào KDL OLTP Databases OLTP Databases Staging File Staging File Warehouse Database Warehouse Database Data Management Data Management • Các công cụ phục vụ cho việc quản lý dữ liệu một cách hiệu quả • Các yêu cầu – Mềm dẻo – Tự động – Hiệu quả • Quản lí phần cứng, hệ điều hành và mạng Truy c Truy c ậ ậ p d p d ữ ữ li li ệ ệ u v u v à à t t ạ ạ o b o b á á o c o c á á o o • Các công cụ dùng để truy tìm dữ liệu cho việc phân tích kinh doanh • Các yêu cầu – Dễ dùng – Trực quan – Siêu dữ liệu – Dễ huấn luyện Warehouse Warehouse Database Database Simple Queries Simple Queries Forecasting Forecasting Drill Drill - - down down C C á á c c t t ừ ừ kh kh ó ó a a quan quan tr tr ọ ọ ng ng • DWH: (Data Warehouse) Kho dữ liệu • EIS:(Executive Information System) Hệ thống thông tin điều hành • OLTP: (Online Transaction Processing): Xử lý toàn tác trực tuyến • OLAP: (Online Analytical Processing) Xử lý phân tích trực tuyến • MOLAP: (Multi dimensional Online Analytical Processing) Xử lý phân tích trực tuyến đa chiều C C á á c t c t ừ ừ kh kh ó ó a quan tr a quan tr ọ ọ ng ng • ROLAP: (Relational Online Analytical Processing) Xử lý phân tích trực tuyến quan hệ • HOLAP: (Hybric Online Analytical Processing) Xử lý phân tích trực tuyến kết hợp • DOLAP: (Database Online Analytical Processing) Xử lý phân tích trực tuyến CSDL • Client/server OLAP: (client/server Online Analytical Processing) Xử lý phân tích trực tuyến khách chủ C C á á c c t t ừ ừ kh kh ó ó a a quan quan tr tr ọ ọ ng ng • VLDB: (Very large DB) CSDL rất lớn • Dimensions: các chiều • Dimension Data: chiều dữ liệu • Fact Data: dữ liệu sự kiện • Cube: khối dữ liệu • Start-schema: lược đồ hình sao • Snowflake-schema: lược đồ tuyết rơI [...]... toàn tác Kho dữ liệu, xử lý phân tích trực tuyến (OLAP) • CSDL quan hệ, CSDL đa chiều • Chấp nhận dư thừa • Tiền tính toán tổng hợp • Dữ liệu lịch sử • Phân tích rất phức tạp • Tích hợp dữ liệu từ đa nguồn • Dữ liệu rất lớn • Các câu hỏi phức tạp Tóm tắt chương 2 • Các thành phần chính – Phương pháp luận – Mô hình hóa – Quản lí dữ liệu – ETT – Truy cập và tạo báo cáo • Các từ kho • So sánh OLTP và OLAP... thuộc tính Granularity: độ thô Metadata: siêu dữ liệu Reporting: báo cáo Legacy system :hệ thống di sản Extraction: chiết Transformation: chuyển đổi Các từ khóa quan trọng • Clean-Up: làm sạch • DWH update: cập nhật KDL So sánh OLTP và kho dữ liệu Xử lý toàn tác trực tuyến (OLTP) • Công nghệ: CSDL quan hệ • Hướng toàn tác • Chuẩn hóa, không dư thừa • Tập trung vào dl hiện tại • Trả lời các truy vấn đơn... lớn • Các câu hỏi phức tạp Tóm tắt chương 2 • Các thành phần chính – Phương pháp luận – Mô hình hóa – Quản lí dữ liệu – ETT – Truy cập và tạo báo cáo • Các từ kho • So sánh OLTP và OLAP Câu hỏi cho chương 2 ??? Uff . Queries Forecasting Forecasting Drill Drill - - down down C C á á c c t t ừ ừ kh kh ó ó a a quan quan tr tr ọ ọ ng ng • DWH: (Data Warehouse) Kho dữ liệu • EIS:(Executive Information System) Hệ thống thông tin điều hành • OLTP: (Online. VLDB: (Very large DB) CSDL rất lớn • Dimensions: các chiều • Dimension Data: chiều dữ liệu • Fact Data: dữ liệu sự kiện • Cube: khối dữ liệu • Start-schema: lược đồ hình sao • Snowflake-schema:. tác Kho dữ liệu, xử lý phân tích trực tuyến (OLAP) • CSDL quan hệ, CSDL đa chiều • Chấp nhận dư thừa • Tiền tính toán tổng hợp • Dữ liệu lịch sử • Phân tích rất phức tạp • Tích hợp dữ liệu