1. Trang chủ
  2. » Thể loại khác

KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU

129 16 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 129
Dung lượng 2,15 MB

Nội dung

DM&DW 2010 April 20, 2022 Kho dữ liệu và khai phá dữ liệu Chương 3 1 KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU Chương 3 Giới thiệu chung về Kho dữ liệu Tài liệu này sử dụng một phần Bài giảng ”Data Mining Conce[.]

KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU Chương 3: Giới thiệu chung Kho liệu Tài liệu sử dụng phần Bài giảng ”Data Mining: Concepts and Techniques” — Slides for Textbook — ©Jiawei Han and Micheline Kamber Department of Computer Science University of Illinois at Urbana-Champaign www.cs.uiuc.edu/~hanj April 20, 2022 Kho liệu khai phá liệu: Chương Nội dung  Khái niệm kho liệu  Mơ hình liệu đa chiều  Kiến trúc kho liệu  Thi hành kho liệu  Từ xây dựng kho liệu tới KPDL  Sự phát triển công nghệ khối liệu April 20, 2022 Kho liệu khai phá liệu: Chương Khái niệm kho liệu  Kho liệu (KDL) định nghĩa theo nhiều cách song khơng nghiêm ngặt (chính xác)  CSDL hỗ trợ định trì tách biệt với CSDL tác nghiệp tổ chức  Hỗ trợ xử lý thông tin nhờ cung cấp tảng vững liệu hợp nhất, lịch sử để phân tích  “KDL tập hợp liệu hướng chủ đề, tích hợp, có tính thời gian khơng thay đổi để hỗ trợ trình tạo định quản lý.”—W H Inmon [Inm02]  Bốn “đặc trưng”: hướng chủ đề, tích hợp, có tính thời gian khơng thay đổi [Inm02] W H Inmon (2002) Building the Data Warehouse (Third Edition) John Wiley & Sons, Inc April 20, 2022 Kho liệu khai phá liệu: Chương Kho liệu: khái niệm  Kho liệu môi trường thông tin [Pon01]:  Cung cấp khung nhìn tích hợp tổng thể doanh nghiệp  Tạo sẵn có thơng tin lịch sử doanh nghiệp để thuận lợi định  Tạo khả giao dịch hỗ trợ định mà không cản trở hệ thống tác nghiệp  Cung cấp tính qn thơng tin doanh nghiệp  Trình diễn nguồn thơng tin chiến lược linh hoạt tương tác Bổ sung đặc trưng thứ năm “kết hạt liệu - Data Granularity” [Pon01] Paulraj Ponniah, Data warehousing fundamentals, John Wiley & Sons Inc., 2001 Kho liệu khai phá liệu: Chương April 20, 2022 Kiến trúc kho liệu: sơ [Ora02] Oracle9 i Data Warehousing Guide, Release (9.2), March 2002, Part No A96520-01 Kho liệu khai phá liệu: Chương April 20, 2022 Tạo kho liệu – Data warehousing Xây dựng KDL (“KDL hóa”): Q trình xây dựng sử dụng KDL April 20, 2022 Kho liệu khai phá liệu: Chương KDL — đặc trưng hướng chủ đề  Được tổ chức xung quanh chủ đề chính, chẳng hạn khách hàng, sản phẩm, bán hàng  Tập trung vào xây dựng mơ hình phân tích liệu để tạo định; khơng phái q trình tác nghiệp giao dịch hàng  Cung cấp khung nhìn đơn giản ngắn gọn đề tài thuộc chủ đề cụ thể nhờ loại bỏ liệu vơ dụng q trình định Kho liệu khai phá liệu: Chương April 20, 2022 KDL — đặc trưng hướng chủ đề Ứng dụng tác nghiệp KDL chủ đề Kho liệu khai phá liệu: Chương April 20, 2022 KDL - đặc trưng tích hợp   KDL đươc xây dựng từ việc tích hợp nguồn liệu phức, không đồng  CSDL quan hệ, CSDL file phẳng (flat files: mã hóa CSDL sang dạng đặc biệt txt ini), ghi giao dịch trực tuyến Sử dụng kỹ thuật làm liệu tích hợp liệu  Đảm bảo tính quán quy ước đặt tên, cấu trúc mã hóa, đo lường thuộc tính, … nguồn liệu khác   VD, giá khách sạn: tiền tệ, thuế, bao gói ăn sáng… Dữ liệu chuyển tới KDL chuyển đổi Kho liệu khai phá liệu: Chương April 20, 2022 KDL - đặc trưng tích hợp Kho liệu khai phá liệu: Chương April 20, 2022 10

Ngày đăng: 20/04/2022, 14:49

HÌNH ẢNH LIÊN QUAN

 Mô hình dữ liệu đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình dữ liệu đa chiều (Trang 24)
 Mô hình KDL: chiều và giá trị đo - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình KDL: chiều và giá trị đo (Trang 25)
Ví dụ về sơ đồ hình sao    time_key day day_of_the_week month quarter yeartime location_key street city state_or_province countrylocationSales Fact Table - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
d ụ về sơ đồ hình sao time_key day day_of_the_week month quarter yeartime location_key street city state_or_province countrylocationSales Fact Table (Trang 26)
 Định nghĩa khố i- Cube Definition (Bảng sự kiện) - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
nh nghĩa khố i- Cube Definition (Bảng sự kiện) (Trang 29)
Xác định sơ đồ hình sao trong DMQL - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
c định sơ đồ hình sao trong DMQL (Trang 30)
Mô hình truy vấn mạng ngôi sao Shipping Method AIR-EXPRESS TRUCKORDERCustomer OrdersCONTRACTS Customer Product PRODUCT GROUPPRODUCT LINEPRODUCT ITEM SALES PERSON DISTRICT DIVISIONCITYCOUNTRYREGION LocationDAILYQTRLYANNUALYTime - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình truy vấn mạng ngôi sao Shipping Method AIR-EXPRESS TRUCKORDERCustomer OrdersCONTRACTS Customer Product PRODUCT GROUPPRODUCT LINEPRODUCT ITEM SALES PERSON DISTRICT DIVISIONCITYCOUNTRYREGION LocationDAILYQTRLYANNUALYTime (Trang 41)
 Mô hình dữ liệu đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình dữ liệu đa chiều (Trang 43)
 Chứa các bảng sự kiện và các bảng chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ứa các bảng sự kiện và các bảng chiều (Trang 44)
Ba mô hình KDL - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
a mô hình KDL (Trang 48)
Định nghĩa một mô hình dữ liệu hãng mức cao - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
nh nghĩa một mô hình dữ liệu hãng mức cao (Trang 49)
Mô hình dữ liệu đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình dữ liệu đa chiều (Trang 51)
 dữ liệu được chuyển thành mô hình đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
d ữ liệu được chuyển thành mô hình đa chiều (Trang 53)
 Nhắc lại: Khối bao gồm một bảng sự kiện (Fact), một/nhiều bảng chiều (Dimensions), các đơn vị đo (Measures) và các  phân hoạch (Partitions).bảng chiều (Dimensions), các đơn vị đo (Measures) và các  - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ắc lại: Khối bao gồm một bảng sự kiện (Fact), một/nhiều bảng chiều (Dimensions), các đơn vị đo (Measures) và các phân hoạch (Partitions).bảng chiều (Dimensions), các đơn vị đo (Measures) và các (Trang 54)
XỬ LÝ PHÂN TÍCH TRỰC TUYẾN - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
XỬ LÝ PHÂN TÍCH TRỰC TUYẾN (Trang 54)
các mô hình dữ liệu đa chiều và các ngôn ngữ truy vấn của OLAP phải đáp ứng. - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
c ác mô hình dữ liệu đa chiều và các ngôn ngữ truy vấn của OLAP phải đáp ứng (Trang 55)
 Hình thức thực hiện độc lập: Một mô hình chuẩn phải trong suốt về quan niệm. - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
Hình th ức thực hiện độc lập: Một mô hình chuẩn phải trong suốt về quan niệm (Trang 56)
Hình vẽ: đồ thị thành viên là một cấu trúc cây. Trường hợp  đặc  biệt:  các  tầng  có  thứ  tự  thẳng  hàng  nhau  do  quan hệ với bên trên. - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
Hình v ẽ: đồ thị thành viên là một cấu trúc cây. Trường hợp đặc biệt: các tầng có thứ tự thẳng hàng nhau do quan hệ với bên trên (Trang 59)
TRUY VẤN ĐIỂN HÌNH - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
TRUY VẤN ĐIỂN HÌNH (Trang 62)
TRUY VẤN ĐIỂN HÌNH (3) - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
3 (Trang 64)
 Bảng fn chiều: - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
Bảng fn chiều: (Trang 69)
 hiển thị rõ ràng trong mô hình của chúng. - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
hi ển thị rõ ràng trong mô hình của chúng (Trang 74)
 Mô hình dữ liệu đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình dữ liệu đa chiều (Trang 76)
 Mô hình dữ liệu đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình dữ liệu đa chiều (Trang 90)
 Mô hình dữ liệu đa chiều - KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU
h ình dữ liệu đa chiều (Trang 109)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w