Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác
1 Kiến trúc tầng hệ hỗ trợ định Information Sources Data Warehouse OLAP Servers Clients Server (Tier 1) (Tier 2) (Tier 3) e.g., MOLAP Semistructured Sources Data Warehouse extract transform load refresh etc OLAP serve Query/Reporting serve e.g., ROLAP Operational DB’s serve Data Marts Data Mining OLAP: Online Analytical Processing Mục tiêu OLAP: Hỗ trợ truy vấn đặc biệt cho phân tích kinh doanh ◦ Tổng hợp, phân tích thực khối lượng lớn liệu (đa chiều) → hỗ trợ định: Các công cụ phục vụ người dùng (Frontend) Data Warehouse Khung nhìn đa chiều (Multidimensional view ) tảng cho OLAP On-Line Transaction Processing (OLTP): – Công nghệ dùng để thực cập nhật hệ thống giao dịch hay tác nghiệp On-Line Analytical Processing (OLAP): – Kỹ thuật dùng để thực phân tích phức tạp liệu data warehouse 03/22/21 03/22/21 Finance: Lập ngân sách, dự tốn kinh phí, phân tích hoạt động tài… Sales: Phân tích bán hàng dự báo doanh số bán Marketing: Phân tích thị trường, khách hàng, khuyến mãi… Manufacturing: Hỗ trợ lập kế hoạch sản xuất, phân tích lỗi … 03/22/21 03/22/21 Khung nhìn đa chiều tảng cho OLAP Các độ đo (Measures): Dữ liệu số cần theo dõi, tinh toán Các chiều (Dimensions): Các tham số định nghĩa giao dịch (xác định giá trị độ đo) Mơ hình hóa chiều kỹ thuật cho việc cấu trúc liệu quanh khái niệm kinh doanh Các mơ hình chiều: mơ tả độ đo chiều Chiều có thuộc tính Các chiều tổ chức phân cấp ◦ Ví dụ: Chiều Time: days → weeks → quarters ◦ Chiều Product: product → product line → brand CS 336 Store Dimension Product Dimension Total Total Region Manufacturer District Brand Stores Products CS 336 10 Slice (cắt lát) Dice (vạch ô) Drill Down: Lấy thông tin chi tiết Rollup: Tổng hợp, giảm chiều Pivote (Rolate): Slice rolate 03/22/21 21 03/22/21 22 Example: computing sums day day p1 p2 s1 p1 12 p2 11 p1 p2 s1 56 11 s1 44 s2 s2 s3 s3 50 s2 rollup drill-down s3 50 sum s1 67 s2 12 s3 50 129 p1 p2 sum 110 19 CS 336 23 day day p1 p2 s1 p1 12 p2 11 p1 p2 s1 56 11 s1 44 s2 s2 s3 s3 50 sale(s1,*,*) s2 sale(s2,p2,*) s3 50 sum s1 67 s2 12 s3 50 129 p1 p2 sum 110 19 sale(*,*,*) * day day p1 p2 * p1 p2 s1 * 12 11 23 p1 p2 * s1 s1 56 11 67 s2 44 s2 44 s3 50 8 50 s2 12 s3 * 62 19 81 s3 50 *50 48 * 110 19 129 sale(*,p2,*) 48 CS 336 25 day day p1 p2 s1 p1 12 p2 11 s1 44 s2 s2 s3 s3 50 store region country p1 p2 region A region B 56 54 11 (store s1 in Region A; stores s2, s3 in Region B) CS 336 26 day day p1 p2 s1 p1 12 p2 11 s1 44 s2 s2 s3 s3 50 TIME = day p1 p2 s1 12 11 s2 s3 50 CS 336 27 Slicing & Pivoting Products Store s1 Store s2 Electronics Toys Clothing Cosmetics Electronics Toys Clothing Cosmetics Products Store s1 Store s2 Electronics Toys Clothing Cosmetics Electronics Toys Clothing Sales ($ millions) Time d1 d2 $5.2 $1.9 $2.3 $1.1 $8.9 $0.75 $4.6 $1.5 Sales ($ millions) d1 Store s1 Store s2 $5.2 $8.9 $1.9 $0.75 $2.3 $4.6 $1.1 $1.5 CS 336 28 Slicing & Pivoting 29 Ưu điểm SQL: ◦ Chuẩn quốc tế ◦ Độc lập với DBMS ◦ Dễ học, dễ hiểu, phi thủ tục ◦… Để cải tiến khả tổng hợp liệu, chuẩn SQL cmở rộng chức GROUP BY với ROLLUP CUBE (chuẩn 99) 03/22/21 30 Tính tốn khơi hợp tập thuộc tính Ví dụ: select item-name, color, size, sum(number) from sales group by cube(item-name, color, size) Hợp nhóm khác quan hệ sales: { (item-name, color, size), (item-name, color), (item-name, size), (color, size), (item-name), (color), (size), ( ) } Trong đó: ( ): Nhóm rỗng Với nhóm, kết chứa giá trị null thuộc tính khơng diện nhóm Hàm grouping() áp dụng thuộc tính ◦ Trả giá trị null (cho all), ◦ Trả 0: Các trường hợp khác select item-name, color, size, sum(number), grouping(item-name) as item-name-flag, grouping(color) as color-flag, grouping(size) as size-flag, from sales group by cube(item-name, color, size) Có thể sử dụng hàm decode() mệnh đề select để thay giá trị null All ◦ Ví dụ: decode( grouping(item-name), 1, ‘all’, item-name) Rollup: Phát sinh hợp tiền tố danh sách thuộc tính Ví dụ: select item-name, color, size, sum(number) from sales group by rollup(item-name, color, size) Phát sinh hợp nhóm { (item-name, color, size), (item-name, color), (item-name), ( ) } Rollup dùng để phát sinh tổng hợp đa mức phân cấp Ví dụ: Giả sử table itemcategory(item-name, category) : Loại mặt hàng: select category, item-name, sum(number) from sales, itemcategory where sales.item-name = itemcategory.item-name group by rollup(category, item-name) Cho kết tổng hợp phân cấp theo item-name category 03/22/21 34 03/22/21 35 ... Warehouse OLAP Servers Clients Server (Tier 1) (Tier 2) (Tier 3) e.g., MOLAP Semistructured Sources Data Warehouse extract transform load refresh etc OLAP serve Query/Reporting serve e.g., ROLAP... để lưu trữ xử lý liệu đa chiều Các loại chính: Multi-dimensional OLAP (MOLAP) Relational OLAP (ROLAP) Hybrid OLAP (HOLAP) 16 Sử dụng MDDBMS để lưu trữ phân tích Data structures:... Warehouse Khung nhìn đa chiều (Multidimensional view ) tảng cho OLAP On-Line Transaction Processing (OLTP): – Công nghệ dùng để thực cập nhật hệ thống giao dịch hay tác nghiệp On-Line Analytical