Tiếp tục chương 2, chương 3 của Bài giảng Kho dữ liệu và khai phá dữ liệu gồm các nội dung về khái niệm kho dữ liệu, mô hình dữ liệu đa chiều, kiến trúc của kho dữ liệu, cài đặt kho dữ liệu và xử lí phân tích trực tuyến, kho dữ liệu hỗ trợ quyết định.Mời các bạn tham khảo.
KHÁI NIỆM CHUNG VỀ KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU 1 Nội dung Khái niệm kho liệu Mơ hình liệu đa chiều Kiến trúc kho liệu Cài đặt kho liệu Xử lý phân tích trực tuyến Liên hệ công nghệ kho liệu với khai pha liệu Xây dựng kho liệu với mục đích hỗ trợ định Khái niệm kho liệu Kho liệu (data warehouse) nơi lưu trữ liệu Dữ liệu tích hợp Dữ liệu thu thập từ nhiều nguồn: Khác không gian, Khác thời gian, Khác thể cấu trúc Lưu trữ liệu, thông tin, tri thức siêu liệu phục vụ cho phân tích Các tổ chức chết đuối liệu đói thơng tin Khái niệm kho liệu Kho liệu dung cho mục đích riêng biệt, lĩnh vực hẹp gọi Data Mart Một Data warehouse hình thành nhiều Data Mart Thuật ngữ Data Warehousing: Quá trình xây dựng sử dụng kho liệu Khái niệm kho liệu Công cụ ETL (Extract – Transform – Load): Rút trích (Extract): Rút trích thơng tin từ nguồn có, Những phiên phụ thuộc thời gian liệu, Chọn lựa liệu Chuyển đổi (Transform): Chuyển đổi định dạng khác định dạng cho trước Tải (Load) Sắp xếp, hợp nhất, lập mục, … phân hoạch Các đặc tính kho liệu Dữ liệu hướng chủ thể: Dữ liệu hướng theo nhóm đối tượng: khách hang, bệnh nhân, sản phẩm, … Tập trung vào việc mơ hình hóa phân tích liệu cho nhà sản xuất định Chuyển từ hướng ứng dụng sang hướng hỗ trợ định Không dùng cho hoạt động hang ngày xử lý giao dịch Các đặc tính kho liệu Tính tích hợp: Dữ liệu tập hợp từ nhiều nguồn: khác kiểu, khác cấu trúc, … Các nguồn: sở liệu quan hệ, tập tin có cấu trúc, tập tin phẳng, … Cần chuẩn hóa để đảm bảo tính quán quy ước đặt tên, … Việc chuẩn hóa cần thực trước tích hợp Các đặc tính kho liệu Dữ liệu biến thời gian Thông tin khứ, tại, So sánh liệu theo chiều thời gian, Hỗ trợ định cho tương lai Thành phần thời gian tường minh ngầm định Dữ liệu mang tính bền vững, đọc (non volatile): Có thể thêm vào, không thay thế, Phục vụ việc nghiên cứu, phân tích Sự cần thiết kho liệu Phục vụ phân tích liệu phức tạp: Phân tích định hướng, Phân tích chuỗi thời gian, Phân tích rủi ro Hỗ trợ khám phá thông tin, tri thức ẩn Hỗ trợ định Mơ hình liệu đa chiều Kho liệu dựa mơ hình liệu đa chiều cho phép nhìn liệu hình thức khối liệu Một khối liệu cho phép liệu mơ hình nhìn nhiều chiều bởi: Các chiều (Dimension Tables) Item (item_name, brand, type); time(day, week, month) Một khối liệu dựa n-D (n chiều) gọi cuboid sở 10 ...Nội dung Khái niệm kho liệu Mơ hình liệu đa chiều Kiến trúc kho liệu Cài đặt kho liệu Xử lý phân tích trực tuyến Liên hệ cơng nghệ kho liệu với khai pha liệu Xây dựng kho liệu với mục đích hỗ... time) liệu giao dịch, Ứng dụng dị tìm lỗi 23 Kiến trúc kho liệu Kiến trúc liệu lớp: 24 Kiến trúc kho liệu Kiến trúc liệu lớp: Dữ liệu hòa hợp (Reconcile data): Dữ liệu có tính chi tiết Dữ. .. Khái niệm kho liệu Kho liệu (data warehouse) nơi lưu trữ liệu Dữ liệu tích hợp Dữ liệu thu thập từ nhiều nguồn: Khác không gian, Khác thời gian, Khác thể cấu trúc Lưu trữ liệu, thông