1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài Tập Lớn Kho Dữ Liệu và Khai Phá Dữ Liệu Cô Nguyễn Quỳnh Chi PTIT Data Warehouse

15 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG -🙞🙞🙞🙞🙞 - BÁO CÁO BÀI TẬP LỚN MÔN HỌC: KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU Đề tài: DATA WAREHOUSE Giảng Viên: NGUYỄN QUỲNH CHI Thành viên : Hà Nội, tháng 05 năm 2022 Mục lục Nội dung Mục lục NHẬN XÉT CỦA GIẢNG VIÊN Giới thiệu Yêu cầu nghiệp vụ Đặc tả chức Thiết kế kho liệu – phương pháp luận cho bước thiết kế bao gồm lược đồ hình 5 Cài đặt khối liệu tải liệu vào khối 11 Sinh báo cáo phân tích xử lí trực tuyến 14 Kết luận 15 Giới thiệu 1.1 Mục tiêu Mục tiêu toán xây dựng kho liệu tích hợp liệu doanh nghiệp để tạo lập báo cáo kinh doanh nhằm hỗ trợ người quản lý đưa định, chiến lược phát triển Ngoài ra, tương lai áp dụng thêm kỹ thuật mining để khai phá liệu 1.2 Phạm vi ‒ Quản lý việc kinh doanh doanh nghiệp gồm nhiều cửa hàng nằm rải rác nhiều thành phố bang khác nhằm đáp ứng nhu cầu khách hàng ‒ Nguồn liệu: từ hệ thống sở liệu quan hệ doanh nghiệp ‒ Xây dựng khối OLAP để lưu trữ liệu đa chiều sản phẩm kinh doanh doanh nghiệp, cụ thể sản phẩm bán sản phẩm lưu trữ Yêu cầu nghiệp vụ Các đặc tả ứng dụng kho liệu cho người dùng: ● Tìm tất cửa hàng với thành phố, bang, số điện thoại, mơ tả, kích cỡ, trọng lượng đơn giá tất mặt hàng bán kho ● Tìm tất đơn đặt hàng với tên khách hàng ngày đặt hàng thực khách hàng ● Tìm tất cửa hàng với tên thành phố số điện thoại mà có bán mặt hàng đặt khách hàng ● Tìm địa văn phịng đại diện với tên thành phố, bang tất cửa hàng lưu kho mặt hàng với số lượng mức cụ thể ● Với đơn đặt hàng khách, liệt kê mặt hàng đặt với mô tả, mã cửa hàng, tên thành phố cửa hàng có bán mặt hàng ● Tìm thành phố bang mà khách hàng sinh sống ● Tìm mức độ tồn kho mặt hàng cụ thể tất cửa hàng thành phố cụ thể ● Tìm mặt hàng, số lượng đặt, khách hàng, cửa hàng thành phố đơn đặt hàng ● Tìm khách hàng du lịch, khách hàng đặt theo đường bưu điện khách hàng thuộc hai loại 3 Đặc tả chức Công cụ sử dụng cho tập lớn SQL Server Đầu vào kho liệu: - Lược đồ quan hệ hệ thống sở liệu quan hệ doanh nghiệp sau: ● Cơ sở liệu Văn phòng đại diện bao gồm quan hệ với lược đồ sau: ▪ Khách hàng (Mã KH, Tên KH, Ngày đặt hàng đầu tiên) ▪ Khách hàng du lịch (* Mã KH, Hướng dẫn viên du lịch, Thời gian) ▪ Khách hàng bưu điện (* Mã KH, Địa bưu điện, Thời gian) ● Cơ sở liệu Bán hàng gồm quan hệ với lược đồ sau: ▪ Văn phòng đại diện (Mã Thành phố, Tên Thành phố, Địa VP, Bang, Thời gian) ▪ Cửa hàng (Mã cửa hàng, * Mã Thành phố, Số điện thoại, Thời gian) ▪ Mặt hàng (Mã MH, Mô tả, Kích cỡ, Trọng lượng, Giá, Thời gian) ▪ Mặt hàng lưu trữ (* Mã cửa hàng, * Mã mặt hàng, Số lượng kho, Thời gian) ▪ Đơn đặt hàng (Mã đơn, Ngày đặt hàng, Mã Khách hàng) ▪ Mặt hàng đặt (* Mã đơn, * Mã mặt hàng, Số lượng đặt, Giá đặt, Thời gian) Đầu kho liệu: báo cáo (bảng liệu động) cho phép người dùng thực thao tác roll up, drill down, slice, dice … cung cấp thông tin để hỗ trợ người quản lý định 4 Thiết kế kho liệu – phương pháp luận cho bước thiết kế bao gồm lược đồ hình 4.1 Xây dựng mơ hình thực thể liên kết Bước Chuyển đổi ngược DB1, DB2 → EER1, EER2 DB1: Văn phòng đại diện ▪ Khách hàng (Mã KH, Tên KH, Ngày đặt hàng đầu tiên) ▪ Khách hàng du lịch (* Mã KH, Hướng dẫn viên du lịch, Thời gian) ▪ Khách hàng bưu điện (* Mã KH, Địa bưu điện, Thời gian) PR1: Khách hàng -> Thực thể Khách hàng PR2: Khách hàng du lịch, Khách hàng bưu điện tập Khách hàng Ta có EER1: DB2: Bán hàng ▪ Văn phịng đại diện (Mã Thành phố, Tên Thành phố, Địa VP, Bang, Thời gian) ▪ Cửa hàng (Mã cửa hàng, * Mã Thành phố, Số điện thoại, Thời gian) ▪ Mặt hàng (Mã MH, Mơ tả, Kích cỡ, Trọng lượng, Giá, Thời gian) ▪ Mặt hàng lưu trữ (* Mã cửa hàng, * Mã mặt hàng, Số lượng kho, Thời gian) ▪ Đơn đặt hàng (Mã đơn, Ngày đặt hàng, Mã Khách hàng) ▪ Mặt hàng đặt (* Mã đơn, * Mã mặt hàng, Số lượng đặt, Giá đặt, Thời gian) PR1: Văn phòng đại diện, Cửa hàng, Mặt hàng, Đơn đặt hàng -> Các thực thể tương ứng Mapping SR1 FKA: Mặt hàng lưu trữ Mặt hàng đặt Ta có EER2: Bước Tích hợp EER1, EER2 thành IEER Giải xung đột ngữ nghĩa: Trường Thời gian thực thể đồng âm (homonyms): Thực đổi tên thuộc tính: - Văn phịng đại diện: Thời gian -> Ngày thành lập văn phòng - Cửa hàng: Thời gian -> Ngày thành lập cửa hàng - Mặt hàng: Thời gian -> Ngày bắt đầu bán - Mặt hàng lưu trữ: Thời gian -> Ngày nhập hàng Trường Thời gian thực thể đồng nghĩa (synonyms): Thực xóa bỏ: - Khách hàng bưu điện: Thời gian -> Xoá bỏ - Khách hàng du lịch: Thời gian -> Xoá bỏ - Mặt hàng đặt: Thời gian -> Xoá bỏ KHÁCH HÀNG chứa Mã TP ĐƠN HÀNG chứa Mã KH, ta tích hợp lược đồ EER1 EER2 IEER: 4.2 Thiết kế mơ hình cho data warehouse 4.2.1 Lược đồ hình 4.2.2 Đặc tả chi tiết Sale_Fact: Các ghi chứa thông tin tổng số lượng (quantity_sell), tổng số tiền (total_price) mà khách hàng chi cho sản phẩm thành phố theo ngày Customer_Dim: Các ghi chứa thông tin khách hàng customer type mang giá trị (“1”, “2”, “3”) tương ứng với 1: Khách hàng bưu điện, khách hàng du lịch, khách hàng thuộc Time_Dim: Các ghi chứa thông tin thời gian, với cấp bậc Year, Month, Date Mỗi hàng bảng Time thể ngày Office_Dim: Các ghi chứa thông tin văn phòng đại diện Store_Dim: Các ghi chứa thông tin cửa hàng store_key, city_key mã, tên thành phố tương ứng cửa hàng Item_Dim: Các ghi chứa thông tin sản phẩm 4.2.3 Ánh xạ lược đồ quan hệ sang mơ hình data warehouse Các bảng Dim: Office_Dim Item_Dim Time_Dim Store_Dim Customer_Dim Bảng Sale_Fact: 10 Cài đặt khối liệu, tải liệu vào khối Công cụ sử dụng: SQL Server Analysis Service SQL Server Data Tools Bước 1: Tạo bảng fact, dimension đổ liệu vào bảng Bước 2: Mở SQL Server Data Tools, tạo Project Analysis Service New Data Source để kết nối với database 11 Bước 3: Tạo New Data Source Views Bước 4: Tạo khối liệu Cube New Cube từ bảng Fact Chọn Measure Dimension tương ứng 12 Bước 5: Thiết lập, lựa chọn thuộc tính, phân cấp liệu cho bảng Dimension 13 Sinh báo cáo phân tích trực tuyến Thực Deploy, sau Process để chạy xem báo cáo phân tích OLAP trực tuyến: Chuột phải vào khối Cube liệu sau chọn Browser để xem báo cáo phân tích Kéo thuộc tính độ đo vào để truy vấn lọc theo yêu cầu 14 Kết luận Cơng việc mà nhóm hồn thành: ● Tích hợp lược đồ thành mơ hình liên kết mở rộng ● Thiết kế lược đồ hình ● Thử sinh báo cáo xử lý phân tích trực tuyến Cảm ơn cô tận tâm giúp đỡ chúng em học kì qua để hồn thành báo cáo Nếu có sai sót q trình thực báo cáo, mong góp ý để nhóm rút kinh nghiệm Kho khai phá liệu thực môn học hay có ý nghĩa với chúng em Chúc cô mạnh khoẻ, vui vẻ thành công nghiệp mình! 15 ... dựng kho liệu tích hợp liệu doanh nghiệp để tạo lập báo cáo kinh doanh nhằm hỗ trợ người quản lý đưa định, chi? ??n lược phát triển Ngồi ra, tương lai áp dụng thêm kỹ thuật mining để khai phá liệu. .. hàng thuộc hai loại 3 Đặc tả chức Công cụ sử dụng cho tập lớn SQL Server Đầu vào kho liệu: - Lược đồ quan hệ hệ thống sở liệu quan hệ doanh nghiệp sau: ● Cơ sở liệu Văn phòng đại diện bao gồm quan... Server Data Tools Bước 1: Tạo bảng fact, dimension đổ liệu vào bảng Bước 2: Mở SQL Server Data Tools, tạo Project Analysis Service New Data Source để kết nối với database 11 Bước 3: Tạo New Data

Ngày đăng: 10/08/2022, 11:59

Xem thêm:

TỪ KHÓA LIÊN QUAN

w