1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐẠI CƯƠNG DATA WARE HOUSE (DATA WARE HOUSE SLIDE)

27 29 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 1,24 MB

Nội dung

Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác

Đánh giá kết quả: - Chuyên cần: 10% (Cấm thi vắng 20% số buổi học) - Chuyên cầnThực hành+ BT nhà+TH: 20% - Thuyết trình báo cáo chuyên đề: 20% - Kiểm ta cuối kỳ: 50% - Điểm cộng CHAPTER 1: GIỚI THIỆU  Data warehouse gì?  Kiến trúc Data warehouse  BI (business intelligence) gì?  Data warehouse data mining CHAPTER 1: GIỚI THIỆU  Data warehouse gì?  Kiến trúc Data warehouse  BI (business intelligence) gì?  Data warehouse data mining DATA WAREHOUSE LÀ GÌ? Cơng nghệ thơng tin áp dụng hầu hết lĩnh vực  Một lượng liệu tích lũy   Nhiều dạng lưu trữ  Khác cấu trúc  Phân mảnh  Khác giao diện  Không quán, trùng lắp MộT NHÀ SảN XUấT MUÔN BIếT… Khách Kháchhàng hàngnào mang manglại lạilợi lợinhuận nhuận cao/thấp cao/thấpnhất nhất?? Những Nhữngmặt mặthàng hàngnào khách kháchhàng hàngcần cầnmua? mua? Kênh Kênhphân phânphối phối nàohiệu hiệuquả quảnhất? nhất? Những Nhữngkhuyến khuyếnmãi nàotạo tạonên nênlợi lợi nhuận nhuậncao caonhất Khách Kháchhàng hàngnào làứng ứngviên viêntốt tốtnhất Những Nhữngtác tácđộng độngnào khicó cósp/dv sp/dvmới? mới? VấN Đề:  Khơng tìm thấy liệu cần thiết DL nằm rải rác mạng  Nhiều phiên bản, nhiệu dạng thức khác  o Khó hiểu thơng tin tìm được, khơng dể dàng sử dụng cho việc định  Dữ liệu có nhiều, khơng phục vụ tốt cho người định chiến lược mục tiêu kinh doanh  Phải cần đến chuyên gia  Phải chuyển sang dạng khác DATA WAREHOUSE LÀ GÌ? Một lưu trữ liệu thống nhất, đầy đủ, riêng lẻ từ nhiều nguồn khác nhau, khả dụng cho người dùng cuối, theo cách mà hiểu, dùng cho ngữ cảnh cụ thể [Barry Devlin] DATA WAREHOUSE LÀ GÌ? W H Inmon Một data warehouse tập liệu hỗ việc định quản lý:  Hướng chủ thể (subject-oriented)  Tích hợp (integrated)  Biến thời gian (time-variant)  Bền vững (non-volatile) CÁC ĐặC ĐIểM CủA DW  Thiết kế cho cơng việc phân tích  Thiết kế cho nhóm nhỏ người dùng (decision makers)  Chỉ đọc  Cập nhập theo giai đoạn: thêm liệu  Dữ liệu lịch sử theo chiều thời gian  Các câu hỏi trả tập kết lớn, đa kết nối  Toàn cục Hệ Hỗ TRợ QUYếT ĐịNH  Được biết đến phần kho liệu  Cung cấp báo cáo, phân tích tiền tính tốn, đồ thị, biểu đồ  Cho phép phân tích trực tuyến liệu  Thăm dị tương tác liệu  Cung cấp giao diện đa dạng cho người dùng  Cung cấp khả phân tích liệu phức tạp phương thức đơn giản TÍCH HợP (INTEGRATED)  Được xây dựng việc tích hợp liệu từ nguồn liệu hỗn tạp, đa  Cơ sở liệu quan hệ (relational databases), flat files, bảng ghi toàn tác trực tuyến  Các kỹ thuật làm tích hợp liệu áp dụng  Đảm bảo đồng quy ước tên, cấu trúc mã hóa, đơn vị đo thuộc tính, … nguồn khác  Ví dụ như: Hotel price: currency, tax, breakfast covered,  Khi liệu chuyển đến kho liệu, chuyển đổi TIME VARIANT   Yêu cầu quan trọng cho kho liệu phạm vi thời gian dài so với hệ thống tác nghiệp  Cơ sở liệu tác nghiệp: liệu có giá trị thời  Dữ liệu kho liệu: cung cấp thông tin lịch sử (ví dụ như, 5-10 năm trước) Yếu tố thời gian lưu trữ CSDL Time Data 01/97 Data for January 02/97 Data for February 03/97 Data for March NON-VOLATILE  Là lưu trữ vật lý liệu chuyển đổi từ môi trường tác nghiệp  DW khơng có DELETE, UPDATE (như torng hệ tác nghiệp) mà có thao tác INSERT  Không yêu cầu chế xử lý giao dịch, phục hồi điều khiển tương tranh  Chỉ yêu cầu hai thao tác truy cập liệu:  Nạp liệu truy cập liệu 16 Three-Tier Decision Support Systems Information Sources Semistructured Sources Operational DB’s Data Warehouse Server (Tier 1) OLAP Servers (Tier 2) e.g., MOLAP Data Warehouse extract transform load refresh etc Clients (Tier 3) OLAP serve Query/Reporting serve e.g., ROLAP serve Data Marts Data Mining MƠ HÌNH Dữ LIệU ĐA CHIềU (MULTIDEMENSIONAL DATA MODEL) Được đề xuất cho mơ hình phân tích (khơng sử dụng cho hệ thống CSDL tác nghiệp)  Sử dụng cho cơng cụ xử lý phân tích trực tuyến (OLAP: on-line analytical processing)  18 MƠ HÌNH Dữ LIệU ĐA CHIềU (MULTIDEMENSIONAL DATA MODEL) Store Info Key columns joining fact table Numerical Measures to dimension tables Prod Code Time Code Store Code Sales Product Info Qty Fact table for measures 19 Time Info Dimension tables KHO Dữ LIệU VÀ CÁC CSDL    Xử lý giao dịch trực tuyến OLTP (on-line transaction processing)  Tác vụ hệ RDBMS truyền thống  Các thao tác hàng ngày: mua, kiểm kê, kế toán,… Xử lý phân tích trực tuyến OLAP (on-line analytical processing)  Là tác vụ hệ thống data warehouse  Phân tích liệu đưa định Các đặc tiểm khác (OLTP vs OLAP): CÁC PHÉP TOÁN OLAP TIÊU BIỂU  Roll up (drill-up): summarize data   Drill down (roll down): reverse of roll-up   project and select Pivot (rotate):   from higher level summary to lower level summary or detailed data, or introducing new dimensions Slice and dice:   by climbing up hierarchy or by dimension reduction reorient the cube, visualization, 3D to series of 2D planes Other operations  drill across: involving (across) more than one fact table  … Han : Dat a Cub es 21 THREE DATA WAREHOUSE MODELS Enterprise warehouse  Tập hợp tất cac thông tin chủ đề bao trùm toàn tổ chức  Data Mart  Có đặc điểm Data Warehouse quy mơ nhỏ hơn, phục vụ cho nhóm nhỏ người dùng  Virtual warehouse  Một tập khung nhìn CSDL tác nghiệp  Mar ch 22, 2220 THREE DATA WAREHOUSE MODELS Enterprise warehouse  Tập hợp tất cac thơng tin chủ đề bao trùm tồn tổ chức  Data Mart  Có đặc điểm Data Warehouse quy mô nhỏ hơn, phục vụ cho nhóm nhỏ người dùng   Virtual warehouse  Tập Views operational database Mar ch 22, 2320 DEPENDENT DATA MART & INDEPENDENT DATA MARTS  • o Dependent Data Mart: Chứa liệu lấy từ Data Warehouse, liệu trích lọc tinh chế, tích hợp lại mức cao để phục vụ chủ đề định Datamart Independent Data Marts: Data mart độc lập xây dựng trước DW, liệu trực tiếp lấy từ nguồn khác 24 DATA WAREHOUSE BACK-END TOOLS AND UTILITIES Data extraction  Data cleaning  Data transformation  Load  Refresh  Mar ch 22, 20 CÁC KIểU ỨNG DụNG CủA DATA WAREHOUSE  kiểu ứng dụng Data Warehouse  Information processing    Truy vấn, phân tích thống kê bản, tạo báo cáo sử dụng crosstabs, tables, charts graphs Analytical processing  Phân tích đa chiều (multidimensional analysis)  Hỗ trợ thao tác xử lý phân tích liệu trực tuyến (OLAP operations),… Data mining  Khai thác tri thức từ mẫu ẩn Mar ch 22, 2620 Một số câu hỏi So sánh hệ thống tác nghiệp hệ hỗ trợ định Các định nghĩa DW 27 ... GIỚI THIỆU  Data warehouse gì?  Kiến trúc Data warehouse  BI (business intelligence) gì?  Data warehouse data mining CHAPTER 1: GIỚI THIỆU  Data warehouse gì?  Kiến trúc Data warehouse  BI... 24 DATA WAREHOUSE BACK-END TOOLS AND UTILITIES Data extraction  Data cleaning  Data transformation  Load  Refresh  Mar ch 22, 20 CÁC KIểU ỨNG DụNG CủA DATA WAREHOUSE  kiểu ứng dụng Data Warehouse... Han : Dat a Cub es 21 THREE DATA WAREHOUSE MODELS Enterprise warehouse  Tập hợp tất cac thông tin chủ đề bao trùm toàn tổ chức  Data Mart  Có đặc điểm Data Warehouse quy mơ nhỏ hơn, phục vụ

Ngày đăng: 22/03/2021, 20:28

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w