Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,94 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Lương Thái Đức Áp dụngDataWarehousetrongphântíchthôngtinvềcácdịchvụgiátrịgiatăngtrênđiệnthoại KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công Nghệ ThôngTin HÀ NỘI - 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Lương Thái Đức Áp dụngDataWarehousetrongphântíchthôngtinvềcácdịchvụgiátrịgiatăngtrênđiệnthoại KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công Nghệ ThôngTin Cán bộ hướng dẫn: ThS. Lê Hồng Hải HÀ NỘI - 2010 1 LỜI CẢM ƠN Trước tiên, em muốn gửi lời cảm ơn sâu sắc nhất đến thầy giáo ThS. Lê Hồng Hải, người đã tận tình hướng dẫn em trong suốt quá trình nghiên cứu và hoàn thành khóa luận tốt nghiệp. Em xin bày tỏ lời cảm ơn sâu sắc đến những thầy cô giáo đã giảng dạy em trong bốn năm qua, những kiến thức mà em nhận được trên giảng đường đại học sẽ là hành trang giúp em vững bước trong tương lai. Cuối cùng, em muốn gửi lời cảm ơn sâu sắc đến gia đình và bạn bè, những người luôn kịp thời động viên và giúp đỡ em vượt qua những khó khăn trong cuộc sống. Hà nội, ngày 21/05/2010 Nguyễn Lương Thái Đức 2 DANH SÁCH HÌNH VẼ 5 THUẬT NGỮ VÀ VIẾT TẮT 7 TÓM TẮT NỘI DUNG 8 MỞ ĐẦU 9 Chương 1: Tổng quan 8 1.1 Tổng quan về hệ thống và lý do lựa chọn đề tài 11 1.2 Dữ liệu của hệ thống 12 1.3 Mục tiêu và phạm vi của đề tài. 12 1.3.1 Mục tiêu. 12 1.3.2 Phạm vi của đề tài 13 1.4. Công cụ thực hiện 13 1.4.2 Hệ quản trị cơ sở dữ liệu cho kho dữ liệu . 13 1.4.2 Công cụ xây dựng kho dữ liệu 13 1.4.3 Công cụ xây dựng báo cáo. 13 CHƯƠNG 2: TỔNG QUAN VỀDATAWAREHOUSE 14 2.1 Định nghĩa kho dữ liệu. 14 2.2 Các đặc trưng của kho dữ liệu 14 2.2.1 Hướng chủ đề . 14 2.2.2 Tính tích hợp 14 2.2.3 Tính bền vững: 14 2.2.4 Gắn với thời gian . 15 2.2.5 Dữ liệu tổng hợp : 15 2.3 Kiến trúc của kho dữ liệu 15 2.3.1 Nguồn dữ liệu . 15 2.3.2 Khu vực xử lý . 16 2.3.2.1 Nhiệm vụ : 16 2.3.2.2 Các bước : 16 2.3.2.3 Các kiểu kiến trúc ETL 17 2.3.3 Kho dữ liệu 19 2.4 Mô hình logic của kho dữ liệu 20 2.4.1 Lược đồ hình sao 20 2.4.2 Lược đồ hình bông tuyết. 20 2.4.3 Mô hình dữ liệu nhiều chiều 21 2.5 Kho dữ liệu ngày nay 22 2.5.1 Quản trị doanh nghiệp thông minh (Busines Intelligence). 22 2.5.2 Quản lý mối quan hệ khách hàng. 22 3 2.5.3 Khai phá dữ liệu 22 2.5.4 Quản lý dữ liệu chủ 23 2.5.5 Tích hợp dữ liệu khách hàng 23 2.6 Xu hướng tương lai của kho dữ liệu 23 2.6.1 Dữ liệu phi cấu trúc 24 2.6.2 Tìm kiếm. 24 2.6.3 Kiến trúc hướng dịchvụ 24 2.6.4 Kho dữ liệu thời gian thực 24 CHƯƠNG 3:TỔNG QUAN VỀ MICROSOFT SQL SERVER 2005 25 3.1 Tổng quan về hệ quản trị cơ sở dữ liệu Microsoft SQL Server. 25 3.2 Tổng quan về SQL Server Integration Service(SSIS) 27 3.3 Tổng quan về SQL Server Analysis Service 28 3.4 Tổng quan về ngôn ngữ truy vấn MDX 30 3.5 Tổng quan về SQL Server Reporting Services. 33 3.6 Phương pháp xây dựng kho dữ liệu bằng các công cụ của Microsoft SQL Server 2005 34 CHƯƠNG 4: PHÂNTÍCH THIẾT KẾ 36 4.1 Phântích hệ thống nguồn 36 4.1.1 Chức năng thống kê báo cáo và theo dõi lịch sử hoạt động của khách hàng 36 4.1.2 Quản lý quảng cáo của cácdịchvụ 37 4.2 Thiết kế kho dữ liệu 37 4.2.1 Kho dữ liệu chủ đề tổng hợp sản lượng dịchvụ 37 4.2.2 Hệ thống quản lý quảng cáo . 42 4.2.3 Kho dữ liệu chủ đề chi tiết sử dụngdịchvụ của khách hàng 46 4.3 Sử dụng SSIS để xây dựng tiến trình ETL 48 4.3.1 Mô tả chung 48 4.3.2 Ánh xạ dữ liệu cho các chiều. 48 4.3.2.1 Chiều mã dịch vụ. 48 4.3.2.2 Chiều mạng viễn thông 49 4.3.2.3 Chiều đầu số 49 4.3.2.4 Chiều nhóm dịch vụ. 50 4.3.2.5 Chiều thời gian 50 4.3.2.6 Bảng sự kiện tổng hợp sản lượng 50 4.3.2.7 Chiều Quảng cáo 51 4.3.2.8 Chiều khách hàng 51 4.3.2.9 Ánh xạ dữ liệu cho bảng sự kiện quảng cáo 52 4.3.2.10 Ánh xạ dữ liệu cho bảng sự kiện chi tiết dịchvụ 52 4.4 Sử dụngdịchvụ SSAS để xây dựngcác cơ sở dữ liệu nhiều chiều 52 4 4.4.1 Xây dựng cube cho kho dữ liệu chủ đề tổng hợp sản lượng. 52 4.4.2 Xây dựng cube cho kho dữ liệu chủ đề quảng cáo và chi phí 57 4.4.3 Xây dựng cube cho kho dữ liệu chủ đề chi tiết sử dụngdịchvụ 58 4.4.4 Sử dụng truy vấn MDX để lấy dữ liệu trên cube 58 4.4 Sử dụngdịchvụ SSRS để xây dựngcác báo cáo 59 4.4.1 Báo cáo sản lượng đầu số 59 4.4.1.1 Yêu cầu: 59 4.4.1.2 Cách xây dựng . 59 4.4.2 Báo cáo sản lượng theo các mạng viễn thông. 63 4.4.3 Báo cáo sản lượng theo đầu số và nhóm dịchvụ 64 KẾT LUẬN 66 5.1 Những điều đã làm được 66 5.2 Những điều chưa làm được và hướng phát triển 66 TÀI LIỆU THAM KHẢO 67 PHỤ LỤC 1 68 PHỤ LỤC 2 69 5 DANH SÁCH HÌNH VẺ Hình 1.1 Kiến trúc kho dữ liệu 12 Hình 2.2 tiến trình ETL nằm ở nguồn dữ liệu 15 Hình 2.3 Tiến trình ETL nằm ở server chứa kho dữ liệu 15 Hình 2.3 Tiến trình ETL nằm ở server trung gian 16 Hình 2.4 Lược đồ hình sao 17 Hình 2.5 lược đồ hình bông tuyết 18 Hình 2.6 Mô hình dữ liệu nhiều chiều 18 Hình 3.1 Cácdịchvụ của SQL Server 2005 22 Hình 3.2 Công cụ phát triển SSIS 24 Hình 3.3 Kiến trúc của SSAS 26 Hình 3.4 Kết quả truy vấn 29 Hình 3.5 Kiến trúc của Reporting Service 31 Hình 3.5 Mô hình xây dựng kho dữ liệu 32 Hình 4.1 sơ đồ kho dữ liệu tổng hợp sản lượng dịchvụ 35 Hình 4.2 Sơ đồ kho dữ liệu chủ đề quảng cáo và doanh thu 40 Hình 4.3Mô hình dữ liệu nguồn của chiều quảng cáo 42 Hình 4.4 Mô hình kho dữ liệu chủ đề chi tiết sử dụngdịchvụ 43 Hình 4.5 Mô hình ETL 45 Hình 4.6 Ánh xạ chiều mã dịchvụ 46 Hình 4.7 Ánh xạ chiều mạng viễn thông 46 Hình 4.8 Ánh xạ chiều đầu số 47 Hình 4.9 Ánh xạ nhóm dịchvụ 47 Hình 4.10 Ánh xạ chiều quảng cáo 48 Hình 4.11 Ánh xạ cho chiều khách hàng. 49 Hình 4.12 Lược đồ kho dữ liệu tổng hợp sản lượng 50 6 Hình 4.13 Chọn các bảng cho data soures views 51 Hình 4.14 Đặt các quan hệ cho các bảng 52 Hình 4.15 Quyết định các bảng chiều và sự kiện 53 Hình 4.17 Chọn các Measures. Các thành phần tính toán. 53 Hình 4.18 Định nghĩa các hàm tính toán 54 Hình 4.19 Kết quả hiển thị truy vấn 55 Hình 4.20 Xây dựng truy vấn 57 Hình 4.21 Thiết kế báo cáo 58 Hình 4.22 Màn hình xây dựng báo cáo 58 Hình 4.22 Kết quả hiển thị. 59 Hình 4.24 Báo cáo theo mạng viễn thông 60 Hình 4.25 Báo cáo theo nhóm dịchvụ 61 7 THUẬT NGỮ VÀ VIẾT TẮT SSIS (SQL Server Intergration Services): Dịchvụtích hợp dữ liệu của SQL Server 2005 SSAS(SQL Server Analysis Services): Dịchvụphântích dữ liệu của SQL Server 2005 SSRS(SQL Server Reporting Services): Dịchvụ quản lý báo cáo của SQL Server 2005 MSSQL(Microsoft SQL Server ): Hệ quản trị cơ sở dữ liệu của Microsoft. OLAP (Online Transaction Processing): xử lý giao dịch trực tuyến. ETL (Extract Transform Load ): Tiến trình trích xuất, chuyển đổi và nạp dữ liệu. MDX(Multidimensional eXpressions) : Ngôn ngữ truy vấn đa chiều. BIDS(Business Intelligence Deverlopment Studio) : công cụ phát triển của SQL Server 2005. 8 TÓM TẮT NỘI DUNG Nội dung chính của đề tài là xây dựng kho dữ liệu cho việc quản lý kinh doanh cácdịchvụgiátrịgiatăngtrênđiệnthoại tại Công Ty Cổ Phần Truyền Thông VMG Việt Nam. Đề tài sẽ sử dụngcác công cụ của Microsoft SQL Server 2005 để xây dựng kho dữ liệu từ hệ thống hiện tại của công ty, quản lý kho dữ liệu và xây dựngcác báo cáo cho người dùng có thể xem qua web. [...]... giữ lại trong cơ sở dữ liệu, nó bao gồm thông tinvềdịchvụ sử dụng, yêu cầu, thời gian, trạng thái của các yêu cầu Thông thường những dữ liệu này chỉ dùng để đối soát và thanh toán với các mạng viễn thông , không được ứng dụng vào các công cụ phântích theo dõi Cấu trúc dữ liệu các bảng bao gồm - Dữ liệu kế toán : đây là dữ liệu vềcácthôngtin kế toán bao gồm giátrị của cácdịch vụ, giá thanh... Tổng quan về hệ thống và lý do lựa chọn đề tài Công Ty Cổ Phần Truyền Thông VMG là một trong những đơn vị đi đầu về kinh doanh dịchvụgiátrịgiatăngtrênđiệnthoại di động Công ty có một hệ thống theo dõi và báo cáo sản lượng nhằm phục vụ cho báo cáo thống kê và phântích hoạt động của dịchvụ phục vụ cho việc quản lý Hệ thống này hoạt động dựa trên số liệu về quá trình sử dụngdịchvụ của khách... - Phântích khách hàng: kho dữ liệu cung cấp đầy đủ thôngtin cho các ứng dụngphântích khách hàng 2.5.3 Khai phá dữ liệu Khai phá dữ liệu là quá trình đi tìm kiếm cácthôngtin tiềm ẩn có giátrịtrongcác khối dữ liệu lớn Công cụ khai phá dữ liệu có thể phát hiện cácthôngtin mang tính dự đoán, hay cácthôngtin hỗ trợ cho việc ra quyết định của người quản lý doanh nghiệp Kho dữ liệu được sử dụng. .. toán với các mạng viễn thông, thôngtinvềcác quảng cáo của cácdịchvụ Dữ liệu này kết hợp với dữ liệu lịch sử hoạt động khách hàng để thanh toán tiền với các đối tác thuê sử dụngdịchvụ và các mạng viễn thông Dữ liệu này cùng với dữ liệu tổng hợp của lịch sử hoạt động khách hàng còn dùng cho phântích , thống kê và báo cáo định kỳ - Dữ liệu chăm sóc khách hàng: Đây là dữ liệu vềthôngtinvề khách... Phần Truyền Thông VMG , khóa luận sẽ thực hiện “Áp dụng kho dữ liệu trongphântích số liệu về cácdịchvụgiátrịgiatăngtrênđiệnthoại bằng công cụ của Microsoft SQL Server 2005 với mong muốn xây dựng được kho dữ liệu hoàn chỉnh hỗ trợ cho việc quản lý tại Công Ty Cổ Phần Truyển Thông VMG Nội dung của khóa luận bao gồm những phần chính như sau: Mở đầu Đây là phần giới thiệu chung về lý do chọn... Reporting Service để xây dựngcác báo cáo Kết luận Đây là phần kết kuận của khóa luận đưa ra những điều đã làm được và chưa làm được của khóa luận và hướng phát triển của khóa luậnCác tài liệu tham khảo Các phụ lục 10 CHƯƠNG 1: TỔNG QUAN Tóm lược nội dung : Mục tiêu của chương này nhằm trình bày lý do lựa chọn đề tài, tổng quan về dữ liệu của hệ thống cung cấp các dịchvụgiátrịgiatăngtrênđiện thoại, ... tài, cũng như bố cục chung của khóa luận 9 Chương 1: Tổng quan Nội dung chính của chương này là nêu lên tổng quan về dữ liệu của hệ thống cung cấp các dịchvụgiátrịgiatăngtrênđiện thoại, mục tiêu , phạm vi của đồ án , công cụ và phương pháp xây dựng kho dữ liệu Chương 2: Tổng quan vềDataWareHouse Nội dung chính của chương này là trình bày tổng quan vềdatawarehouse gồm: định nghĩa, đặc tính,mô... hợp, các kỹ thuật phântích dữ liệu từ kho dữ liệu người quản lý có thể đưa ra các quyết định một cách nhanh chóng và hợp lý Ngày càng nhiều các doanh nghiệp xây dựng hệ thống quản trị doanh nghiệp thông minh để giúp cho họ xử lý cácthôngtin nhằm hiểu rõ hơn về công việc kinh doanh, hỗ trợ việc ra các quyết định chính xác hơn, nâng cao chất lượng kinh doanh và dịchvụ Kho dữ có thể trích xuất thông tin. .. sử dụngdịchvụ SQL Server Analysis Service để xây dựng lên các khối dữ liệu đa chiều(cubes) phục vụphântích 1.4.3 Công cụ xây dựng báo cáo Sử dụngdịchvụ SQL Server reporting Services và công cụ cụ SQL Server Business Intelligent để xây dựng và quản lý các báo cáo, đưa báo cáo lên web server sử dụng IIS(Internet Information System) để người dùng có thể tra cứu qua web 13 CHƯƠNG 2 TỔNG QUAN VỀ DATA. .. thời gian…), các bảng sự kiện biểu diễncác sự kiện xảy ra và cácthôngtin chi tiết vềcác sự kiện đó Ưu điểm của mô hình này bao gồm - Trực quan , đơn giản phù hợp với cách nhìn nhận về dữ liệu của người sử dụng - Dễ dàng truy vấn, hỗ trợ đa dạng các loại truy vấn - Sự phi chuẩn hóa đã tránh được việc phải nối nhiều bảng lại trong quá trình xử lý điều này làm tăng tốc độ truy vấn và việc lưu trữ các . Áp dụng Data Warehouse trong phân tích thông tin về các dịch vụ giá trị gia tăng trên điện thoại KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công Nghệ Thông Tin . ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Lương Thái Đức Áp dụng Data Warehouse trong phân tích thông tin về các dịch vụ giá trị gia tăng trên điện thoại . tại Công Ty Cổ Phần Truyền Thông VMG , khóa luận sẽ thực hiện “Áp dụng kho dữ liệu trong phân tích số liệu về các dịch vụ giá trị gia tăng trên điện thoại bằng công cụ của Microsoft SQL Server