1. Trang chủ
  2. » Giáo Dục - Đào Tạo

CÁC KIẾN TRÚC của DATA WAREHOUSE và mô HÌNH dữ LIỆU đa CHIỀU (DATA WARE HOUSE SLIDE)

43 153 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • PowerPoint Presentation

  • Khái niệm

  • Slide 3

  • CÁC KHỐI THÀNH PHẦN KIẾN TRÚC TRONG 3 VÙNG CHÍNH CỦA DW

  • Slide 5

  • Slide 6

  • Slide 7

  • Slide 8

  • KHÁI NiỆM MÔ HÌNH CHIỀU

  • ER Drawbacks for DW / Need of Dimensional Modeling

  • KHÁI NiỆM Mô hình dữ liệu chiều

  • Ví dụ về mô hình dữ liệu chiều

  • CÁC THUỘC TÍNH CỦA CÁC CHIỀU CÓ THỂ PHÂN CẤP

  • khối dữ liệu (cube)

  • Ví dụ về KHỐI DỮ LiỆU

  • Cube: Một lưới các Cuboid

  • Slide 17

  • Slide 18

  • LƯỢC ĐỒ HÌNH SAO (STAR SCHEMA)

  • Example

  • Các khoá

  • Slide 22

  • Ưu điểm của lược đồ hình sao

  • Lược đồ bông tuyết (Snowflake schema)

  • Ví dụ về Snowflake schema

  • Lược đồ bông tuyết

  • Mô hình Fact Constellation

  • Bài tập: Thiết kế mô hình dữ liệu đa chiều cho việc phân tích số lượng tn của sv

  • Denormalization

  • 5 kỹ thuật để phi chuẩn hóa

  • Collapsing tables (one-to-one) [1]

  • Pre-joining [1]

  • Splitting tables [1]

  • Redundant columns [1]

  • Thao tác OLAP điển hình (10/6)

  • Slide 36

  • Ví dụ (SQL)

  • Mô hình truy vấn mạng ngôi sao

  • Bốn bước thiết kế mô hình đa chiều

  • B1 - Xác định tiên trình nghiệp vụ

  • B2 – Xác định Grain

  • B3 – Xác định các chiều

  • B4 – Xác định Facts

Nội dung

Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác

Bài KHÁI NIỆM Kiến trúc Data warehouse: Bao gồm tất thành phần phân biệt với Kho liệu tích hợp trọng tâm o Mục đích kiến trúc Data warehouse - Cung cấp framework cho việc phát triển triển khai DW - Định nghĩa: tiêu chuẩn, độ đo, thiết kế tổng quát, kỹ thuật hỗ trợ  3 Thành vùng data warehouse Thu nhận liệu (Data acquisition) Lưu trữ liệu (Data storage) Phân phối thông tin (Information delivery) CÁC KHỐI THÀNH PHẦN KIẾN TRÚC TRONG VÙNG CHÍNH CỦA DW Generic two-level architecture L T One, companywide warehouse E Periodic extraction  data is not completely current in warehouse Independent Data Mart Data marts: Mini-warehouses, limited in scope L T E Separate ETL for each independent data mart Data access complexity due to multiple data marts Dependent data mart with operational data store ODS provides option for obtaining current data L T E Single ETL for enterprise data warehouse (EDW) Simpler data access Dependent data marts loaded from EDW ODS and data warehouse Logical data mart and @ctive data warehouse are one and the same L T E Near real-time ETL for @active Data Warehouse Data marts are NOT separate databases, but logical views of the data warehouse  Easier to create new data marts KHÁI NIỆM MƠ HÌNH CHIỀU  Với mơ hình ER:  Entities: Thu thập từ môi trường thực tiễn  Mỗi Entity Table  Chuẩn hóa Giảm dư thừa thơng tin (tránh dị thường xảy update/delete)  Tăng số lượng Table  Hữu ích: Truy cập nhanh khối lượng nhỏ liệu từ CSDL  ER DRAWBACKS FOR DW / NEED OF DIMENSIONAL MODELING  ER: Số lượng Table nhiều :  Khó nhớ  Truy vấn phức tạp (kết nối tables)  RDBMS: tối ưu cho truy cập số lượng nhỏ table (trong DW yêu cầu tập hợp từ số lượng lớn Table)  DW không yêu cầu update liệu OLTP  Trong DW, sử dụng mơ hình chiều, khơng cần chuẩn hóa DENORMALIZATION  “Denormanlization”:  Là tiến trình chuyển số quan hệ chuẩn hóa thành quan hệ phi chuẩn khóa  Mục đích giảm số lượng table  giảm kết nối bảng truy vấn 29 KỸ THUẬT ĐỂ PHI CHUẨN HÓA Collapsing tables  Pre-joining  Splitting tables (horizontal, vertical)  Adding redundant columns  Derived attributes  30 COLLAPSING TABLES (ONE-TO-ONE) [1] Kết hợp thực thể quan hệ 1-1 31 PRE-JOINING [1] 32 SPLITTING TABLES [1] 33 REDUNDANT COLUMNS [1] 34 THAO TÁC OLAP ĐIỂN HÌNH (10/6)  Roll up (Cuộn lên/drill-up): tóm tắt liệu (summarize data)   Drill down (khoan xuống/roll down): ngược với cuộn lên   Chiếu chọn (project and select ) Xoay Trục (quay) / Pivot (rotate):   Từ tóm tắt mức cao tới tóm tắt mức thấp liệu chi tiết, or mở đầu chiều Thái vạch ô (Slice and dice):   Nhờ leo theo phân cấp theo rút gọn chiều Xoay chiều khối DL, trực quan hóa (ex: 3D thành dãy mặt hai chiều) Thao tác khác   Khoan chéo (drill across): hút nhiều bẳng kiện Khoan thẳng (drill through): xuyên quan mức đáy KDL tới bảng quan hệ đáy (dùng SQL) 36 VÍ DỤ (SQL) 03/22/21 37 select mamh,manh,sum(slban) as soluong from factDulieuBan group by mamh,manh with rollup select mamh,manh,sum(slban) as soluong from factDulieuBan group by mamh,manh with cube MƠ HÌNH TRUY VẤN MẠNG NGÔI SAO Customer Orders Shipping Method Customer CONTRACTS AIR-EXPRESS ORDER TRUCK Time PRODUCT LINE ANNUALY QTRLY DAILY CITY PRODUCT ITEM Product PRODUCT GROUP SALES PERSON COUNTRY DISTRICT REGION Location Mỗi chu trình gọi vết DIVISION Promotion Organization BỐN BƯỚC THIẾT KẾ MƠ HÌNH ĐA CHIỀU Xác định tiên trình nghiệp vụ  Xác định Grain  What does row in the fact table represent or mean? Identify the Dimensions  “measurements” Descriptive context, true to the grain Identify the Facts  Numeric additive measurements, true to the grain B1 - XÁC ĐỊNH TIÊN TRÌNH NGHIỆP VỤ    Tiên trình nghiệp vụ hoạt động mức thấp tổ chức  Orders, invoicing, receiving payments, registering student,… Các tiến trình nghiệp vụ hỗ trợ hệ tác nghiệp Phát sinh trực tiếp hay gián tiếp sư đo lường thực B2 – XÁC ĐỊNH GRAIN   Mơ tả chi tiết dòng Fact Table Mức chi tiết kết hợp với độ đo fact table  Ý nghĩa dịng Fact table Ví dụ: o o o o  One row per line item on a bill from a doctor One row per individual boarding pass scanned at an airport gate One row per daily snapshot of the inventory levels for each item in a warehouse One row per bank account each month Bước cần thiết trước bước bước B3 – XÁC ĐỊNH CÁC CHIỀU  Liệt kê tất thuộc tính (chuỗi) rời rạc từ fact table  Tập trung vào câu hỏi: “Người KD mô tả liệu từ kiến trình kinh doanh?”  Nếu bước xác định rõ, chiều thể dẽ dàng xác định: B4 – XÁC ĐỊNH FACTS  Đúng với với Grain định nghĩa bước  Facts that belong to a different grain belong in a separate fact table  Facts xác định việc trả lời câu hỏi, “Đo lường gì?”  Tỷ lệ phần trăm hay hệ số (nếu khơng tính được) ... Simpler data access Dependent data marts loaded from EDW ODS and data warehouse Logical data mart and @ctive data warehouse are one and the same L T E Near real-time ETL for @active Data Warehouse Data. .. Acct_Week_key Sales Data KHỐI DỮ LIỆU (CUBE)  Một DW dựa mơ hình liệu đa chiều với khung nhìn liệu dạng khối liệu  Một khối liệu, cho phép liệu mơ hình hóa nhìn theo đa chiều  Bảng chiều, Product... Thành vùng data warehouse Thu nhận liệu (Data acquisition) Lưu trữ liệu (Data storage) Phân phối thông tin (Information delivery) CÁC KHỐI THÀNH PHẦN KIẾN TRÚC TRONG VÙNG CHÍNH CỦA DW Generic

Ngày đăng: 22/03/2021, 20:28

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w