1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Công nghệ thông tin: Nghiên cứu xây dựng kho dữ liệu hỗ trợ ra quyết định trong kinh doanh viễn thông

103 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu xây dựng kho dữ liệu hỗ trợ ra quyết định trong kinh doanh viễn thông
Tác giả Nguyễn Thị Thuý Lan
Người hướng dẫn PSG.TS. Đỗ Phúc
Trường học Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành Công nghệ thông tin
Thể loại Luận văn thạc sĩ
Năm xuất bản 2013
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 103
Dung lượng 51,88 MB

Nội dung

DWH: Data WareHouse - Kho dữ liệuKDVT: Kinh doanh viễn thông MDB: Multi— Dimensional Database — Cơ sở dữ liệu đa chiều MDX: MultiDimensional eXpressions — Ngôn ngữ truy vấn đa chiều OLAP

Trang 1

TRUONG DAI HQC CONG NGHE THONG TIN

NGUYEN THI THUY LAN

NGHIÊN CUU XÂY DUNG KHO DU LIEU HỖ TRỢ RA QUYET ĐỊNH TRONG KINH DOANH VIỄN THONG

LUẬN VĂN THAC SĨ CÔNG NGHỆ THONG TIN

Chuyên ngành: KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PSG.TS DO PHÚC

TPHCM THANG 4/2013

Trang 2

Trước hết tôi xin gửi lời cảm ơn sâu sắc đến Thầy PGS TS Đỗ Phúc, người đãtrực tiếp hướng dẫn tôi hoàn thành luận văn này Nếu không có những lời chỉ dẫn tậntình và những tài liệu tham khảo của Thây thì luận văn này chưa hoàn thành đúng thời

hạn được.

Tôi cũng xin gửi lời cảm ơn đến tập thé các Thay Cô ở Trường Đại học Côngnghệ thông tin, Đại học Quốc gia TP Hỗ Chí Minh đã quan tâm tổ chức chỉ đạo vàtrực tiếp giảng dạy khóa cao học của chúng tôi, giúp chúng tôi hoàn tắt thành côngkhóa học này.

Cuối cùng, tôi xin cảm ơn tất cả bạn bè và gia đình tôi, những người đã cùng tôichia sẽ những khó khăn trong suốt hon hai năm qua Đã luôn ủng hộ, động viên dé tôihoàn thành tốt các môn học cũng như hoàn thành tốt luận văn này

TP.HCM, tháng 04 năm 2013

Nguyễn Thị Thuý Lan

Trang 3

Chương 1:TÔNG QUAN

1.1 Hiện trạng ứng dụng CNTT trong quản lý kinh doanh của VNPT - Tiên Giang 11

1.2 Những khó khăn trong quản ly

1.3 Giải quyết vấn đề

1.4Mô hình bài toán cần nghiên cứu

1.5 Phuong pháp nghiên cứu

1.6 Những đề tài nghiên cứu trước đây

1.7 Tính mới của đề tài

1.8 Nội dung luận văn

Chương 2:CƠ SỞ LÝ THUYÉT

2.1 Tổng quan về kho dữ liệu

2.1.1 Khái niệm

2.1.2Đặc tính của kho dữ liệu

2.1.3 Siêu dit liệu

2.1.4Kiến trúc kho dữ liệu

2.1.5Hệ hỗ trợ ra quyết định (DSS — Decision Support System)

2.1.6Lược dé hình sao

2.1.7Luge dé hình bông tuyết

2.1.8Cơ sở dữ liệu đa chiều

2.2 Kỹ thuật OLAP

2.2.1Giới thiệu về OLAP

2.2.2 Kiến trúc khối của OLAP

2.2.3 Các mô hình lưu trữ hỗ trợ OLAP

Trang 4

2.2.4 Thao tác trên cơ sở dữ liệu nhiều chiều 31

2.3 Giai phap OLAP trén SQL Server 2008 132

2.3.1Céng cụ tích hợp dữ liệu trong SQL Server_ SSIS (SQL Server Integration

232

2.3.2Kiến trúc tổng quát của SSIS trong SQL Server 2008 133

2.3.3Công cụ công cụ phân tích cua SQL Server SSAS (SQL Server Analysis

3.1.1 Vai trò nhiệm vụ của VNPT 0

3.1.2Sơ dé tổng quan VNPT Tiền Giang - 3Ó

3.2 Công tác quản lý kinh doanh tại VNPT Tiên Giang 38

3.3 Phuong pháp phân tích và thiết kế hệ thống 239

3.3.1 Xác định các yêu cầu 30

3.3.2 Giai đoạn mô ta 139

3.3.3Giai đoạn xây dựng kho 39

3.3.4Phân tích yêu cầu của hệ théng 403.3.5 Yêu cầu chức năng của hệ thông 403.3.6 Các thành phan trong hệ théng -.413.4Phân tích thiết và xây dựng kho dữ liệu kinh doanh viễn thông 423.4.1 Phuong pháp thiết kế kho dữ liệu 423.4.2 Thiết kế kho dit liệu mức ý niệm 443.4.3Mô hình ý niệm của kho dit liệu theo chủ dé Chi Tiét Khách Hàng 44

3.4.4M6 hình ý niệm của kho dữ liệu theo chủ dé Tổng Hợp Doanh Thu 463.4.5Mô hình phân cấp của từng chiều -Ö 473.5 Lược đồ ánh xạ từ hệ thống nguồn đến kho dữ liệu AT3.5.1Lược dé ánh xa mức 1 của quá trình xây dựng kho chủ dé Chi Tiết Khách

Hàng

3.5.2Lược đồ ánh xạ mức 2 của quá trình xây dựng Kho Chỉ Tiết Khách Hàng 48

Trang 5

3.5.4Lược đô ánh xạ mức 2 của quá trình xây dựng Kho Tông Hợp Doanh Thu 54

3.5.5 Thiết kế kho dữ liệu mức luận lý

3.6 Thiết kế kho dữ liệu mức vật lý

3.6.1 Luge đồ vật lý kho đữ liệu — Lược đồ thành phần

3.6.2 Lược đồ vật lý kho dữ liệu - Lược đồ triển khai

3.6.3Kiến trúc tổng thể kho dữ liệu của hệ thống

3.7 Kết luận _n

Chương 4:HIỆN THỰC ỨNG DỤNG

thông (kho trung tâm)

4.2 Tạo các gói chuyền dit liệu từ kho nguồn sang kho kinh doanh viễn thông dé tạokho chủ đề Chỉ tiết khách hàng

4.2.1 Gói tích hợp đữ liệu DimDSKhachHang

4.2.2 Gói tích hợp dữ liệu DimHuyen

4.2.3 Gói tích hợp dữ liệu DimXaPhuong

4.2.4Gói tích hợp đữ liệu DimTramVienThong

4.2.5 Gói tích hợp dữ liệu DimLoaiThueBao

4.2.6Gói tích hợp dữ liệu DimNganhThueBao

4.2.7Gói tích hợp dit liệu DimDoiTuongThueBao

4.2.8Gói tích hợp dữ liệu DimGoiCuoc

4.2.9Gói tích hợp dit liệu DimGoiCuoHinhThucSuDung

4.2.10Gói tích hợp dữ liệu DimThoiGianThietLapDichVu

4.2.11Gói tích hợp dữ liệu DimTime

4.2.12Gói tích hợp đữ liệu DanhSachThueBao

4.2.13Gói tích hợp dữ liệu FactChiTietKhachHang

4.3 Tạo các gói chuyền dit liệu từ kho nguồn sang kho kinh doanh viễn thông dé tạokho chủ đề Tổng hợp doanh thu

4.3.1 Gói tích hợp dit liệu DimCSKH_MucDoanhThu

4.3.2 Gói tích hợp dữ liệu Cuoc_PS

4.3.3 Gói tích hợp dữ liệu FactTongHopDoanhThu

Trang 6

4.4.1 Khối dữ liệu Chỉ tiết khách hàng (CTKHCube)

4.4.2 Khối dit liệu Tổng hợp doanh thu (THDTCube)

4.5 Khai thác khối dữ liệu OLAP dùng công cụ Browser của SSAS đê thực hiện cáctruy vấn đa chiều

4.6Giao diện kết nối OLAP hỗ trợ ra quyết định kinh doanh viễn thông

4.6.1 Giới thiệu giao diện kết nối OLAP hỗ trợ ra quyết định

Trang 7

DWH: Data WareHouse - Kho dữ liệu

KDVT: Kinh doanh viễn thông

MDB: Multi— Dimensional Database — Cơ sở dữ liệu đa chiều

MDX: MultiDimensional eXpressions — Ngôn ngữ truy vấn đa chiều

OLAP: On-Line Analytical Processing — Xử lý phân tích trực tuyến

OLTP: On-Line Transaction Processing — Xử lý giao dịch trực tuyến

RDB: Relational Database — Co sở dit liệu quan hệ

SSAS: SQL Server Analysis Services — Dịch vụ phân tích dữ liệu

SSIS: SQL Server Integration Services — Dịch vụ tích hợp dữ liệu

THDT: Tổng hợp doanh thu

UML: Unified Modeling Language — Ngôn ngữ mô hình hóa

'VNPT: Vietnam Posts and Telecommunications Group — Tập đoàn Bưu chính Viễn

thông Việt Nam

Trang 8

Danh Mục Bảng Biểu

Bảng 2.1: Bảng dữ liệu mẫu

Bảng 2.2: Bảng so sánh các mô hình trong OLAP

Trang 9

Danh Muc Hinh Vé

Os

Hình 1.1: Mô hình triển khai Web Report của VNPT Tiền Giang

Hình 1.2: Qui trình tạo báo cáo trên Web Report của VNPT Tiền Giang

Hình 1.3: Mô hình bài toán cần nghiên cứu

Hình 2.1: Mô hình kho tông quan

Hình 2.2: Hệ hỗ trợ ra quyết dinh

Hình 2.3: Mô hình lược đồ hình sao

Hình 2.4: Lược dé hình sao biéu diễn CSDL đa chiều

Hình 2.5: Mô hình lược đồ hình bông tuyết

Hình 2.6: Biểu diễn đữ liệu trên khối lập phương

Hình 2.7: Kỹ thuật OLAP trên cơ sở dit liệu đa chiêu

Hình 2.8: Minh họa vị trí của SSIS trong hệ thống SQL

Hình 2.9: Kiến trúc tổng quan SSIS >

Hình 3.1: Sơ đồ cơ cấu tổ chức VNPT Tiền Giang

Hình 3.2: Trình tự xây dựng và khai thác kho dit liệu.

Hình 3.3: Sơ đồ theo phương pháp thiết kế từ dưới lên

Hình 3.4: Sơ đồ theo phương pháp thiết kế trên xuống

Hình 3.5: Mô hình ý niệm kho Chỉ tiết khách hàng

Hình 3.6: Mô hình ý niệm kho Tổng hợp doanh thu

Hình 3.7: Mô hình phân cấp của DimXaPhuong, DimTramVienThong, DimTime,

Hình 3.11: Mô hình chuyên đữ liệu từ KhoNguon vào KhoChiTietKhachHang

chiều DimXaPhuong

Trang 10

Hình 3.12: Mô hình chuyển đổi dữ liệu từ KhoNguon vào KhoChiTietKhachHangchiều DimTramVienThong

Hình 3.13: Mô hình chuyển đổi dữ liệu từ KhoNguon vào KhoChiTietKhachHangchiều DimLoaiThueBao

Hình 3.14: Mô hình chuyên đôi dữ liệu từ KhoNguon vào KhoChiTietKhachHang

Hình 3.26: Mô hình luận lý kho ChiTietKhachHang lược đồ sao

Hình 3.27: Mô hình luận lý kho TongHopDoanhThu lược đồ sao

Hình 3.28: Lược đồ thành phần kho dữ liệu

Hình 3.29: Lược đồ triển khai kho dữ liệu

Trang 11

Hình 3.30: Kiến trúc tổng thé kho dữ liệu

Hình 4.1: Kết quả thực hiện các gói chuyền đổi chiều DimDSKhachHang

Hình 4.2: Kết quả thực hiện các gói chuyền đổi chiều DimHuyen

Hình 4.3: Kết quả thực hiện các gói chuyển đôi chiều DimXaPhuong

Hình 4.4: Kết quả thực hiện các gói chuyển đồi chiều DimTramVienThong

Hình 4.5: Kết quả thực hiện các gói chuyển đổi chiều DimLoaiThueBao

Hình 4.6: Kết quả thực hiện chuyển đổi chiều DimNganhThueBao

Hình 4.7: Kết quả thực hiện chuyển đổi chiều DimDoiTuongThueBao

Hình 4.8: Kết quả thực hiện chuyển đổi chiều DimGoiCuoc

Hình 4.9: Kết quả thực hiện chuyền đổi chiều DimGoiCuocHinhThucSuDung 70Hình 4.10: Kết quả thực hiện chuyển đổi chiều DimThoiGianThietLapDichVu 71Hình 4.11: Kết quả thực hiện chuyển đổi chiều DimTime

Hình 4.12: Kết quả thực hiện chuyển đổi Table DanhSachThueBao

Hình 4.13: Giao diện thực hiện gói tích hợp dữ liệu tạo bảng sự kiện

FactChiTietKhachHang

Hinh 4.14: Két qua thực hiện gói tích hợp dữ liệu tạo bang sự kiện

FactChiTietKhachHang

Hình 4.15: Kết quả thực hiện chuyên đôi chiêu DimCSKH_MucDoanhThu

Hình 4.16: Kết quả thực hiện chuyên đổi Table Cuoc _PS

Hình 4.17: Giao diện thực hiện gói tích hợp dữ liệu tạo bảng sự kiện

FactTongHopDoanhThu

Hình 4.18: Kết quả thực hiện gói tích hợp dữ liệu tạo bảng sự kiện

FactTongHopDoanhThu

Hình 4.19: Kết quả thực hiện tạo khôi Chi tiét khách hàng

Hình 4.20: Thời gian thực hiện việc tạo khối Chỉ tiết khách hàng

Hình 4.21: Kết quả thực hiện việc tạo khối Tổng hợp doanh thu

Hình 4.22: Thời gian thực hiện việc tạo khối Tổng hợp doanh thu

Hình 4.23: Kết quả phân tích khối THDT theo thời gian, loại thuê bao, mức doanh

Trang 12

Hình 4.26: Kêt quả phân tích khôi CTKH theo thời gian, loại thuê bao, gói cước

Hình 4.27: Kết quả phân tích khối CTKH theo thời gian, gói cước, loại thuê bao, đối

= §5

Hình 4.28: Kết quả phân tích khối CTKH theo thời gian, loại thuê bao, gói cước,

tượng thuê bao

ngành thuê bao

Hình 4.29: Kết quả phân tích tổng hợp khối CTKH theo thời gian, huyện, trạm viễn

thông, loại thuê bao

loại thuê bao

Hình 4.31: Giao diện kết nôi dữ liệu khôi Tông hợp doanh thu

Hình 4.32: Giao diện xử lý khai thác khối Tông hợp doanh thu

Hình 4.33: Báo cáo doanh thu theo trạm viễn thông và loại thuê bao trong quý 1/2012

Trang 13

Chương 1: TỎNG QUAN

Chương này trình bày hiện trạng ứng dụng công nghệ thông tin trong quản lý

kinh doanh của VNPT Tiền Giang, những khó khăn trong quản lý, giải pháp xây dựng

kho dữ liệu Giới thiệu tông thê nội dung luận văn.

1.1 Hiện trạng ứng dụng CNTT trong quản lý kinh doanh của VNPT

-Tiền Giang

VNPT Tiền Giang đã xây dựng và triển khai rất nhiều hệ thống phần mềm phục

vụ cho công tác điều hành sản xuất kinh doanh của đơn vị:

- Phần mềm Quản lý bán hàng (CSM)

- Phần mềm Tài chính kế toán (ACC)

- Phần mềm Quản lý khách hàng (CSS)

- Hệ thống Quản lý báo hỏng 119 (119)

- Phần mềm Nhân sự tiền lương (HRM)

- Hệ thống tính cước tập trung (BILLING)

— Vinaphone.DATA (VINA_DATA)

- Hệ thống điều hành giám sát hệ thống mạng viễn thông tự động - AOMC

(Automatic Operator and Management Center)

- Hệ thống Quản lý Văn bản - Báo cáo điều hành tác nghiệp (WEB_REPORT)Các hệ thống phần mềm trên đều chạy trên môi trường mạng theo mô hìnhClient/Server, phần giao diện người dùng được viết bằng nhiều ngôn ngữ khác nhau:

Visual Fox 2005, Visual Basic, C#, NET, và sử dụng hệ quản trị cơ sở dữ liệu:

MS.SQL 2005, MS.SQL 2008, Oracle 10G chạy trên nhiều Server với nhiều hệ điều

hành khác nhau: Redhat Linux, Window Server.

Dé phục vu cho công tác thống kê báo cáo số liệu và điều hành sản xuất kinhdoanh của đơn vị, ngoài các chức năng báo cáo riêng của từng hệ thống phần mềm,VNPT Tiền Giang xây dựng Hệ thống Quản lý Văn bản- Báo cáo điều hành tác nghiệpnhư là một công thông tin, ngoài chức năng quản lý văn phòng điện tử không giấy,cổng thông tin còn có vai trò tập hợp tất cả các báo cáo phục vụ điều hành sản xuất

kinh doanh của đơn vị.

Trang 14

Nhìn chung với cổng thông tin giao diện web này, cơ bản đã phục vụ tốt cho việcđiều hành sản xuất kinh doanh của VNPT Tiền Giang.

1.2 Những khó khăn trong quan lý

Hiện tại VNPT Tiền Giang vẫn chưa có công cụ hiệu quả nào giúp phân tích khối

di liệu lớn, nhất là việc khai phá dữ liệu cước, dit liệu quan hệ khách hàng, dữ liệu kếtoán và doanh thu, một cách nhanh chóng (mà không phải lập trình kết xuất các báocáo thủ công như hiện nay) và cho phép xem xét các số liệu ở nhiều khía cạnh khácnhau, nhằm hỗ trợ Ban lãnh đạo ra quyết định mang tính khoa học

Như đã phân tích hiện trạng ứng dụng CNTT trên cho thấy việc xây dựng mộtWeb Report trên để phục vụ các báo cáo cho mọi cấp người dùng từ các Đài trưởng,Ban giám đốc trung tâm đến Ban giám đốc Viễn Thông Tiền Giang là rất tốt, nhưngđây mới dừng lại ở giai đoạn đầu của một trang web phục vụ các báo cáo bình thường;

vì vẫn còn một số khuyết điểm như: qui trình xử lý dữ liệu đạt hiệu quả chưa cao,

thông tin dữ liệu của hệ thống thể hiện chưa được linh động và xử lý chưa nhanh, chưacung cấp số liệu báo cáo được kịp thời, khó thích ứng với những thay đổi về cấu trúc

cơ sở dit liệu.

Các báo cáo và việc sử dụng phần mềm còn thiếu tính liên thông, thiếu nhấtquán: nhiều phần mềm, nhiều người dùng, nhiều báo cáo có nội dung rời rạc, hoặcchồng chéo,

Hơn nữa trong việc cạnh tranh gay gắt với các nhà mạng, mà VNPT là doanhnghiệp Viễn thông lớn, lâu đời và chiếm thi phần rất lớn, có CSDL khách hàng lớn.Nghĩa là VNPT Tiền Giang đang đứng trên một tài sản là thông tin khách hàng khổng

lồ, cần phải rút trích dữ liệu, khai phá số liệu và nhất là phải đáp ứng cho những cáinhìn tổng quan tức thời và nhanh chóng hỗ trợ lãnh đạo ra các quyết định trong điềuhành sản xuất kinh doanh có tính dự đoán trên cơ sở khoa học cao Do đó các báo cáo.hiện tại làm chậm quá trình ra quyết định, giảm năng lực cạnh tranh của đơn vị

Mặt khác, lực lượng cán bộ làm tin học của VNPT Tiền Giang phải thường xuyênlập trình thay đổi biểu mẫu, báo cáo, thay đổi các module làm mất rất nhiều thời gian,công sức dẫn đến việc chậm trễ trong báo cáo, chưa kể đến việc số liệu báo cáo còn rờirạc chưa nhất quán nhằm phục vụ cho lãnh đạo ra quyết định có cơ sở khoa học

Mô hình triển khai Web báo cáo giai đoạn 1 của VNPT Tiền Giang:

Trang 15

Qui trình xử lý dữ liệu, tạo báo cáo hiện tại trên Web Report như sau:

CSDL 1

Hệ thống Xây dựng

CSDL 2 >| các thủ >| Form, >| Kếtxuất

tục, hàm Report báo cáo

: vế xuấ báo cáo.

h kết xuât

: báo cáo

CSDLn

Hình 1.2: Qui trình tạo báo cáo trên Web Report của VNPT Tiền Giang

Khi cần tạo một báo cáo nhanh, trước tiên Bộ phận Tin học phải lập trình xâydựng các Form, Report báo cáo, gọi các hàm - thủ tục cũng được xây dựng mới dùngtruy xuất số liệu trực tiếp hay gián tiếp với các CSDL hiện có, công việc này xảy rathường xuyên, liên tục và gây mat nhiều công sức và thời gian

Hơn nữa với cách tạo các báo cáo “cứng” như thế sẽ không linh động, và khôngcho cái nhìn nhiều góc độ khác nhau của số liệu, nghĩa là bức tranh số liệu bị rời rạc,

Trang 16

không có tính tổng quan, bao quát Từ đó làm khó khăn cho lãnh đạo nhìn nhận sốliệu, khó khăn cho việc kích thích tính sáng tạo của lãnh đạo khi xem xét số liệu.

143 Giai quyết vấn đề

Cùng với sự phát triển nhanh chóng của các hệ thống thông tin, khối lượng thôngtin, dữ liệu được lưu trữ trong các hệ cơ sở dữ liệu ngày càng nhiều Cụ thể là số liệucủa các hệ thống riêng lẻ là rất lớn như: số liệu cước chỉ tiết, số liệu khách hàng, doanhthu của đơn vị Nên việc truy xuất trực tiếp từ các thủ tục xây dựng trên moduleWeb Report (hoặc trên các module riêng lẻ cung cấp cho module Web Report) sẽchậm, hao tốn tài nguyên máy, và có thể sẽ không thể có số liệu qua nhiều năm liêntục (do dữ liệu chỉ tiết sẽ được Backup lưu trữ, không dé lâu ở các CSDL riêng lẻ)

Mặt khác ngày nay các hệ thống thông tin không chỉ giải quyết, xử lý công việchàng ngày mà đã tiến tới đáp ứng được những yêu cầu ở mức độ cao hơn Ban lãnhđạo không những biết được công việc đang diễn ra như thế nào mà còn muốn biếtnhững gì sẽ xảy ra trong tương lai, như thế chúng ta cần phân tích thông tin hỗ trợ tiếntrình ra quyết định

Để có được số liệu hỗ trợ ra quyết định tốt, chúng ta cần có được những phươngpháp khai phá dữ liệu hiệu quả, xây dựng các báo cáo trực tuyến, đa góc nhìn làm giúptạo các dự đoán, kết luận có tính khoa học, mang nhiều ý nghĩa thực tiễn

Mục tiêu của luận văn là xây dựng kho dữ liệu thống nhất từ nhiều nguồn dữ liệunhư dữ liệu quản lý khách hàng, dữ liệu quản lý cước để xây dựng hệ thống hỗ trợphân tích, hỗ trợ ra quyết định mang tính: tong hợp, tập trung, duy nhất phục vụ congtác quản lý điều hành của lãnh đạo các cấp với nhiều góc nhìn dữ liệu khác nhau giúptạo các dự đoán, kết luận có tính khoa học để phục vụ cho công tác quản lý kinh doanh

viễn thông.

Vấn đề đặt ra là:

— Lam sao thống kê được số lượng khách hàng theo gói cước, hình thức sử dung

gói cước, thời gian thiết lập dịch vụ, đối tượng thuê bao, ngành thuê bao, loại thuê

bao, trạm viễn thông, xã phường nơi thuê bao thường trú, số liệu này phải được thống

kê hàng tháng, hàng quý, hàng năm.

Trang 17

- Lam sao thống kê doanh thu của đơn vị theo mức doanh thu, ngành thuê bao,loại thuê bao, trạm viễn thông, xã phường, số liệu này phải được thống kê hàng

cạnh tranh cao phục vụ cho công tác quản lý kinh doanh viễn thông.

1.4 Mô hình bài toán cần nghiên cứu

Để giải quyết bài toán đề ra ở trên, luận văn sử dụng tiếp cận được đề xướngbởi B.Inmon vào những năm 90 của thế kỷ trước nhằm kết hợp xây dựng các kho dữ

liệu Kho dữ liệu được định nghĩa như một tập hợp các phương tiện cho phép hình

dung dữ liệu một cách tổng thể, hướng đối tượng dé giúp cho việc phân tích và raquyết định [1] [17]

Ý nghĩa các giai đoạn trong mô hình bài toán cần nghiên cứu:

Giai đoạn 1: Thu nhận dữ liệu từ chương trình quản lý khách hàng và quản lý

cước.

Trang 18

Giai đoạn 2: Xây dựng kho dữ liệu trung tâm Quản Lý Kinh Doanh Viễn Thông,

các kho chủ đề

2.a: Chọn lọc thông tin quan trọng từ kho nguồn chuyền đổi dạng thích hợp

lưu vào kho trung tâm.

2.b: Nạp dữ liệu từ chương trình Quản lý khách hàng, Quản lý cước vào kho

nguồn, lọc lấy các thông tin hợp lệ, chuyền vào kho trung tâm

2.c: Chuyên đổi các giá trị hợp lệ vào kho chính, xây dựng hai kho chủ đề ChiTiết Khách Hàng, Tổng Hợp Doanh Thu

Giai đoạn 3: Tạo và khai thác khói dữ liệu đa chiều

3.a: Thiết kế các báo cáo động bằng khói đa chiều

3.b: Giao diện quản lý kết nối dữ liệu với các khối vừa xây dựng và khai thác

1.5 Phuong pháp nghiên cứu

Dé giải quyết bài toán đặt ra ở trên, luận văn tiến hành các bước chính sau đây:

- Dựa vào dữ liệu có sẵn được lưu trữ từ chương trình Quản lý khách hàng,Quản lý cước, chuyển đổi thành dạng thích hợp dé lưu trữ vào kho nguồn theo định

kỳ.

~ Dữ liệu từ kho nguồn sẽ chuyên vào kho chính sau đó trích lưu vào kho trungtâm Trong kho trung tâm, tạo hai kho dữ liệu tương ứng với hai chủ đề Chỉ tiết kháchhàng, Tổng hợp doanh thu

- Xây dựng các chương trình ứng dụng khai thác chức năng các khối đã tạophục vụ cho việc thống kê, hỗ trợ ra quyết định

- Xây dựng khối dữ liệu đa chiều hỗ trợ việc thống kê số lượng khách hàng vàdoanh thu của đơn vị.

- Tạo các mẫu báo cáo tông hợp dé Ban lãnh đạo có cái nhìn tổng quan từ mọi

góc nhìn.

- Kho dữ liệu sẽ được triển khai và xây dựng trên Microsoft SQL Server 2008

và bộ công cụ NET, sở di luận văn chọn giải pháp này là vì Microsoft:

Trang 19

+ Cung cấp cho người dùng giao diện dé sử dụng.

+ Cung cấp một giải pháp kỹ thuật hoàn chỉnh dé xây dựng ứng dụng kho dữ

liệu và ứng dụng kỹ thuật OLAP.

+ Dễ dang tương thích với phần mềm tác vụ đang được sử dụng tại đơn vị

Ngoài ra cơ sở dữ liệu hiện tại cũng đang được lưu trữ trên Microsoft SQL 2008,

việc này sẽ tiện lợi hơn cho luận văn trong việc xây dựng kho dữ liệu.

1.6 _ Những đề tài nghiên cứu trước đây

Đề tài nghiên cứu về kho dữ liệu, kỹ thuật OLAP đã được nghiên cứu và cũng đãđược áp dụng trong một số lĩnh vực, nhưng đa phan các đề tài thường tập trung xâydựng, triên khai, phân tích đữ liệu hỗ trợ ra quyết định trong các lãnh vực như kinhdoanh, trường học, bệnh viện, thương mại điện tử Một số đề tài nghiên cứu trước đây:

- Ứng dụng kỹ thuật OLAP trong việc triển khai các hệ thống thông tin EIS(Executive Information System — Hệ thống thông tin chỉ đạo), tác giả PGS TS Đồng

Thị Bích Thuy — Khoa Công nghệ thông tin — Dai học Khoa học Tự nhiên - ĐHQG

HCM Đề tài được triển khai tại hệ thống siêu thị Sàigòn CO.OP

- Xây dựng nhà kho dữ liệu và công cụ xử ly phân tích trực tuyến giúp hỗ trợ raquyết định, tác giả ThS Vũ Quốc Thông Đề tài được triển khai tại công ty ZUELLIG

PHARMA VIỆT NAM LTD.

— Nghiên cứu, ứng dụng kho dé liệu vào bài toán hỗ trợ ra quyết định trong hệthống đào tạo theo học chế tín chỉ, tác giả Hồ Trung Thành Đề tài được triển khai tạikhoa kinh tế trường đại học quốc gia TPHCM

1.7 _ Tính mới của đề tài

Không nằm ngoài phạm vi xây dựng kho dữ liệu và công cụ OLAP hỗ trợ raquyết định, đề tài hướng đến xây dựng, ứng dụng kho dữ liệu và kỹ thuật OLAP tronglĩnh vực kinh doanh viễn thông, mà cụ thể là triển khai đề tai trong quan lý kinh doanhviễn thông tại VNPT Tiền Giang

Trang 20

1.8 Nội dung luận văn

Chương 1: Tổng quan

Chương này trình bày hiện trạng ứng dụng công nghệ thông tin trong quản lý

kinh doanh của VNPT Tiền Giang, những khó khăn trong quản lý, giải pháp xây dựngkho dữ liệu Giới thiệu tong thể nội dung luận văn

Chương 2: Cơ sở lý thuyết

Chương này trình bày khái quát về kho dữ liệu như: khái niệm, mục đích xâydựng, những đặc tính cũng như các thành phần của kho dữ liệu Đồng thời, luận văncũng trình bày cơ bản về các loại dữ liệu trong kho, kiến trúc của kho và một số môhình kho dữ liệu Kiến trúc tong quan công nghệ SSIS, SSAS, kỹ thuật OLAP

Chương 3: Phân tích thiết và tạo kho quản lý kinh doanh viễn thong

Chương này trình bày tổng quan về Tập đoàn Bưu chính Viễn thông Việt NamVNPT, những nét chính trong công tác quản lý kinh doanh tại VNPT Tiền Giang, đềxuất giải pháp xây dựng kho Thiết kế mô hình tông quan các kho dữ liệu sẽ tạo Xây

dựng các module chức năng.

Chương 4: Hiện thực ứng dụng

Chương này trình bày kết quả đạt được trong quá trình thiết kế xây dựng kho.Tiến trình cài đặt sẽ trình bày theo lược đồ ánh xạ thiết kế mức 2 đã được trình bày ởchương 3 Giao diện kết nối khai thác khối dữ liệu Các mẫu báo cáo tạo được từ khối.Chương 5: Kết luận và hướng phát triển

Kết luận và đề xuất các hướng phát triển tiếp theo

Trang 21

Chương 2: CO SO LY THUYET

Chương này trình bay khái quát về kho dữ liệu như: khái niệm, mục đích xâydựng, những đặc tính cũng như các thành phần của kho dữ liệu Đồng thời, luận văncũng trình bày cơ bản về các loại dữ liệu trong kho, kiến trúc của kho và một số môhình kho dữ liệu Kiến trúc tổng quan công nghệ SSIS, SSAS, kỹ thuật OLAP

2.1 Tổng quan về kho dữ liệu

2.1.1 Khái niệm

Kho đữ liệu là nơi lưu trữ dữ liệu hướng chủ đề, tích hợp, biến đổi theo thời gian

và 6n định Kho dữ liệu dùng dé hỗ trợ ra quyết định trong quản lý [1][4][12]

Thông thường dữ liệu phát sinh từ các hoạt động hàng ngày và được thu thập xử

lý để phục vụ công việc nghiệp vụ cụ thể của một t6 chức vi vậy thường được gọi là

đữ liệu tác vụ và hoạt động thu thập xử lý loại đữ liệu này được gọi là xử lý giao dịch

trực tuyến (OLTP) Kho dữ liệu trái lại phục vụ cho việc phân tích với kết quả mang

tính khái quát cao, loại xử lý dữ liệu này được gọi là xử lý phân tích trực tuyến

(OLAP) [1][12][17].

2.1.2 Đặc tính của kho dữ liệu

Đặc tính của kho dữ liệu được mô tả bằng bốn cụm từ: hướng chủ đề, tính tíchhợp, tính ồn định và biến đổi theo thời gian Bốn cụm từ trên nhằm nêu bật những đặctrưng cơ bản của kho dữ liệu để phân biệt với các hệ thống xử lý dữ liệu khác nhưCSDL quan hệ, các hệ thống xử lý giao dịch, các hệ thống file Đặc tính của kho dữliệu bao gồm [1][4][17]:

- Hướng chủ dé (Subject oriented): Kho dữ liệu được thiết kế để hỗ trợ phântích di liệu Tập trung vào việc mô hình hóa và phân tích dữ liệu cho các nhà ra quyếtđịnh, không tập trung vào các hoạt động xử lý hàng ngày Kho dữ liệu được tổ chứcquanh các chủ đề chính như: khách hang, sản phẩm, bán hang, những dit liệu có íchcho tiến trình ra quyết định Việc này giúp cho người dùng xác định được những thôngtin cần thiết trong hoạt động của mình

Trang 22

- Tinh tích hợp (Integrated): Day là đặc điểm quan trong nhất của kho dữ liệu.

Dữ liệu được tập hợp từ nhiều nguồn khác nhau Điều này sẽ dẫn đến việc quá trình

tập hợp dữ liệu phải thực hiện việc làm sạch, sắp xếp, rút gọn đữ liệu.

-_ Tínhỗn định (Non-volatile): Được lấy từ nhiều nguồn dữ liệu của hệ thống tác

nghiệp có sẵn, kho dit liệu tách rời vật lý với môi trường tác nghiệp, nên dữ liệu trong

kho dữ liệu là dữ liệu chỉ đọc, không chỉnh sửa hoặc thêm mới được.

- Biển đổi theo thời gian (Time variant): Dữ liệu quá khứ và hiện tại, mỗi dữliệu trong kho dữ liệu đều được gắn với thời gian và có tính lịch sử

Dữ liệu trong kho dit liệu rất lớn và chỉ đọc, không được thêm, xóa, sửa dữ liệu

- _ Những ánh xạ tương ứng giữa tác vụ và các thao tác trong kho dữ liệu: Khi

dữ liệu được đưa vào kho dữ liệu, dữ liệu phải ở dạng chuẩn và phải theo những quyước của kho dữ liệu Nghia là, phải làm sạch dit liệu Các hướng dẫn này cung cấp các

chỉ dẫn chuyển dang moi tap dit ligu cu thé dé dir liệu ở dang đúng (dang chuân của

kho đữ liệu).

- Những nguyên tắc để tổng hợp dữ liệu: Đối với người sử dụng kho dữ liệu,siêu dữ liệu gồm:

+ Những thuật ngữ dùng đê mô tả dữ liệu.

+ Những kỹ thuật tương ứng sử dung dé truy xuất dữ liệu

+ Nguồn đữ liệu, những qui luật dùng để suy dẫn và tạo ra nguồn dữ liệu

2.1.4 Kiến trúc kho dữ liệu

Với kiến trúc ba lớp, dữ liệu được làm sạch, xử lý để đưa vào kho dữ liệu Từ kho

đữ liệu phân ra thành những kho dữ liệu theo chủ đề, đây là việc cần thiết cho những

Trang 23

ứng dụng hỗ trợ tiến trình ra quyết định theo từng nhóm người sử dụng Ví dụ dướiđây kho dữ liệu được phân rã thành 2 trung tâm dữ liệu theo từng chủ dé riêng

Hình 2.2: Hệ hỗ trợ ra quyết định

Trang 24

Hệ hỗ trợ ra quyết định mức tông quát gồm 3 tang:

- Tang 1: Kho dé liệu

~_ Tầng 2: Hệ quan trị OLAP có thé là ROLAP, MOLAP, HOLAP

- Tầng 3: Tầng người dùng hỗ trợ các công cụ truy van, báo cáo, phân tích, khai

phá dữ liệu.

2.1.6 Lược đồ hình sao

a Khái niệm: Lược đồ hình sao là một tập bao gồm các bảng trong một cơ sở

dữ liệu mà nó đã được thiết kế theo những nguyên lý của mô hình đa chiều Về cơ bảnlược đồ hình sao gồm 4 thành phần [6][7][15]:

- Bảng sự kiện (Fact): Bảng sự kiện chứa dữ liệu định lượng hoặc sự kiện (là

những dit liệu có độ đo số học) Bảng sự kiện đóng vai trò của một thực thể kết hợp,kết nối các thể hiện của các chiều khác nhau

- Bảng chiều (Dimension): Bảng chiều chứa dữ liệu mô tả về một công việc, đối

Hình 2.3: Mô hình lược đồ hình sao

Trang 25

Các bảng sự kiện trong lược đồ hình sao thường có nhiều dòng, chứa số lượnglớn dòng dữ liệu, cột FK liên kết mỗi dòng của bảng sự kiện liên kết với bảng chiều.Đây còn được gọi là bảng chỉ tiết [6].

Các bảng chiều trong lược đồ hình sao thường nhiều cột, chứa đựng nhiều thuộctính giúp cung cấp dữ liệu đa dạng hỗ trợ cho việc báo cáo và phân tích đữ liệu Mỗibảng chiều có một PK và được gán cho kho dữ liệu được gọi là khoá đại diện Khoáđại diện này giúp cho việc tìm ra những thay đồi của đữ liệu trong quá khứ Day còngọi là bảng đặc điểm của sự kiện [6]

PK của bảng sự kiện là tập hợp khoá, là sự kết hợp nhiều FK như là các chiềutrong lược đồ Mỗi thành phần PK của bảng sự kiện là FK tham chiếu đến PK củabảng chiều [6][9][10]

b Lược đồ hình sao khi nạp dữ liệu vào khối OLAP:

T] DimCSKH_MucDoanhThu

'Ÿ MucDesnhThukey

TuSoTien DenSotien

bảng DimLoaiThueBao, DimNganhThueBao, DimXaPhuong, DimTramVienThong,

DimCSKH_MucDoanhThu, DimTime là bang chiéu

Trang 26

¢ Ưu điểm chính của lược đồ hình sao:

Ưu điểm lược đồ hình sao bao gồm [1][6][7][15]:

- Các sự kiện và chiều được mô tả rõ ràng, dé hiểu

- Các bảng chiều là dữ liệu tĩnh, tương đối, dữ liệu được nạp vào bảng sự

kiện.

- Lược đồ hình sao còn giúp cai tiến hiệu suất cho các câu truy vấn kho dit

liệu Theo thuật ngữ quan hệ, bảng sự kiện có mối quan hệ FK với mỗi bảng chiều,

nghĩa là, mỗi hàng đưa vào bảng sự kiện sẽ có những giá trị trong cột FK khác nhau

tương ứng với dữ liệu PK trong các bảng chiều

Bang Fact và các bảng Dimension đều không nhất thiết được chuẩn hóa, tức là có

sự dư thừa dữ liệu Nhưng đổi lại khả năng truy nhập nhanh hơn, phù hợp những câuhỏi phân tích nhiều chiều, phức tạp

Lược đồ hình sao giúp phân đoạn dữ liệu Các bảng dữ liệu không cần chuẩn hóa.Một bảng dữ kiện và các chiều bao quanh Các câu hỏi nhằm vào bảng dữ kiện vàđược cầu trúc bởi các bảng chiều

Tóm lại, sơ đồ hình sao là cơ sở đữ liệu chỉ đọc và không cho phép cập nhật dữ

liệu.

2.1.7 Lược đồ hình bông tuyết

Được tạo thành từ việc căn cứ vào lược đồ hình sao Bảng dữ kiện giống nhưlược đồ hình sao Các chiều được chuẩn hoá (dạng chuẩn 3) và được cấu trúc rõ ràng

Sơ dé hình tuyết rơi là một sự mở rộng của sơ đồ hình sao, tại mỗi cánh sao không

phải là một bảng mà là nhiều bảng Dimension

Trong sơ đồ hình sao, nếu bảng Dimension bắt đầu có sự tương đồng với cácbảng Fact thì có thể cần được chia ra thành các bảng Dimension Nếu một bảngDimension được chia ra thành Dimension chính và Dimension phụ thì cấu trúc thuđược của kết quả là một sơ đồ hình tuyết rơi hoặc một cấu trúc sao mở rong

Trang 27

TimeKey DimLoaiThueBao Neay

LoaiThueBaoKey Tae

LoaiThueBao in 1 NhomThueBao * Ea

+ FactTongHopDoanhThu TenThang

TH | BeaiThueBaoKey FenQu

Tớ #[ LoaThueBaoKoy |, „9Ÿ | rnouy

Mini eKey TenNam

Xa —0 MaHuyenKey lì MaXaKey DimCSKHMucDoanhThu 5 ¬ a

DimHuyen © MucDoanhThuKey „ gw app] MucDoanhiThuKey

MaHuyenKey DimNganhThueBao MaNganhKey DenSoTien.

Huyện ‘TenMucDoanhThu

MaNganhKey i MaTramKey NganhThueBao l DimTramVienThong

Ưu điểm của mô hình tuyết rơi là cải thiện năng suất truy vấn nhờ việc chỉ phảikết hợp những bảng có kích thước nhỏ hơn, tối thiểu không gian đĩa cần thiết để lưutrữ dữ liệu, làm tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa và ít mang bảnchất theo chiều hơn, làm tăng số lượng các bảng và tăng tính phức tạp của một vài câutruy vấn có sự tham gia của nhiều bảng

2.1.8 Co sở dữ liệu đa chiều

a Khái niệm

Phù hợp và gần gũi hơn giúp trực quan hon cho những người làm việc với dữliệu, cơ sở dữ liệu đa chiều đã phát triển kèm theo việc phân tích dữ liệu trực tuyến(OLAP) va đi vào công nghệ cơ sở dữ liệu như là một sự lựa chọn cho những ứng

dụng phân tích dữ liệu.

Có rất nhiều định nghĩa về cơ sở dit liệu đa chiều:

—_ Theo Oracle [4][5][14]: “Co sở đữ liệu đa chiều là một dang của cơ sở dữ liệuđược tối ưu hoá nhằm cho kho dữ liệu và những ứng dụng xử lý phân tích trực tuyến

Cơ sở dữ liệu đa chiều thường xuyên được tạo ra bằng cách sử dụng đữ liệu đầu vào từnhững cơ sở dữ liệu quan hệ đã tồn tai”

Trang 28

- Theo W.H Inmon [17]: “Cơ sở dữ liệu đa chiều là hệ thống phần mềm máytính được thiết kế cho phép có khả năng và phù hợp với việc lưu trữ và truy xuất một

khối lượng lớn đữ liệu:

+ Có quan hệ với nhau.

+ Lưu trữ, phân tích từ nhiều khía cạnh khác nhau Những khía cạnh đó đượcgọi là “các chiều”

Trang 29

Với cơ sở dữ liệu dạng quan hệ (Bang 1) khi được biểu diễn ở dang dit liệu đachiều trên khối lập phương ta được kết quả như sau:

Phan tử khối Ø

Doanh thu của thuê bao cho

Thời gian từng loại địch vụ theo thời gian

Doanh thu

Hình 2.6: Biểu diễn dữ liệu trên khói lập phương

So sánh hai cách thé hiện trên, chúng ta thay cách thể hiện đa chiều mang tinhtrực quan hơn vì trong cấu trúc đa chiều có chứa mối quan hệ ngữ nghĩa giữa các phần

tử dữ liệu.

Cấu trúc của một mô hình chiều cũng có thể được biểu diễn bởi lược đồ hìnhsao Trung tâm của lược đồ sao là bảng sự kiện, và bảng sự kiện này là bảng có nhiềukết nói đến các bảng khác Bang sự kiện là nơi mà các sự kiện của giao dịch được lưutrữ, còn các bảng khác là bảng chiêu Một CSDL đa chiều có thể có nhiều lược dé saovới các bảng chiều chồng lắp nhau

c Những đặc điểm của cơ sở dữ liệu đa chiều (MDB):

Một MDB thường quan tâm đến hai mức: tổng hợp và chỉ tiết (dữ liệu nguồn)nên kích thước thường rat lớn [12][13][17]

Một MDB cũng cần quan tâm rất nhiều đến yếu tố thời gian, dùng dé theo dõibiến động của thực tế theo thời gian Do đó chiều thời gian được dùng làm bản lề cho

mọi phép phân tích [17].

Trên MDB, người dùng có thẻ phân cấp dữ liệu trên các chiều của chúng [3] Ví

dụ, ta có thể thống kê tiền cước của khách hàng cho từng loại thuê bao theo chiều thờigian theo nhiều mức ngày, tuần, tháng, quý, năm

Trang 30

2.2 Kỹ thuậtOLAP

2.2.1 Giới thiệu về OLAP

OLAP (On-Line Analytical Processing) là một kỹ thuật nhằm đáp ứng nhu cầuphân tích đữ liệu trực tuyến và theo các góc độ khác nhau dựa trên cách tổ chức cơ sở

dữ liệu đa chiều Mọi dit liệu đều được hiển thị tức thời, và hoạt động dựa trên cơ sở

dữ liệu đa chiều rất gần gũi với cách nhìn của người dùng [12][13]

OLAP còn là một kỹ thuật sử dụng các thể hiện dữ liệu đa chiều gọi là các khốinhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu Tạo khối cho dữliệu trong các bảng chiều, bảng sự kiện trong kho dit liệu và cung cấp khả năng thựchiện các truy vấn phức tạp

Trong khi kho dit liệu và kho dữ liệu theo chủ đề lưu trữ dữ liệu cho phân tích,thì OLAP là kỹ thuật cho phép các ứng dụng người dùng truy xuất hiệu qua đữ liệutrong kho OLAP cung cấp nhiều lợi ích cho người phân tích, ví dụ như:

- Cung cấp mô hình đữ liệu đa chiều trực quan cho phép dễ dang lựa chọn, địnhhướng và khai phá dữ liệu.

- Cung cấp một ngôn ngữ truy van, phân tích và cung cấp sức mạnh dé khám phácác mối quan hệ trong dữ liệu kinh doanh phức tạp

— Dữ liệu được tính toán trước đối với các truy vấn thường xuyên nhằm làm cho

thời gian trả lời rất nhanh đối với các truy van đặc biệt

- Cung cấp các công cụ mạnh giúp người dùng tạo các khung nhìn mới của dữ

liệu dựa trên một tập các hàm tính toán đặc biệt.

- OLAP được đặt ra để xử lý các truy vấn liên quan đến lượng dữ liệu rất lớn mànếu cho thực thi các truy vấn này trong hệ thông OLTP sẽ không thể cho kếtquả hoặc sẽ mắt rất nhiều thời gian

Hệ quản trị OLAP (OLAP Server) là loại phần mềm hỗ trợ kỹ thuật OLAP chocác ứng dụng và gồm có hai phần chính: Hệ quản trị cơ sở dữ liệu đa chiều và các

công cụ phân tích dữ liệu [12][13].

Trang 31

2.2.2 Kiến trúc khối của OLAP

Đối tượng chính của OLAP là khối, một thể hiện đa chiều của dữ liệu chỉ tiết và

tổng hợp [12][13][17] Một khối bao gồm nguồn dữ liệu, các chiều, các độ đo và cácphần dành riêng Các khối được thiết kế dựa trên yêu cầu phân tích của người dùng

Một kho dữ liệu có thể hỗ trợ nhiều khối khác nhau như khối bán hàng, khối bảng

Các độ đo xác định các giá trị số từ bảng sự kiện mà được tổng hợp cho phântích như giá bán, chỉ phí hoặc số lượng bán

Các partition của một khối có thể được lưu trữ độc lập trong các cách thức khácnhau với các mức độ tổng hợp khác nhau Các partition không thẻ hiện đối với ngườidùng, đối với họ một khối là một đối tượng đơn và chúng cung cấp những tuỳ chọn đadạng để quản lý đữ liệu OLAP

2.2.3 Các mô hình lưu trữ hỗ trợ OLAP

Dịch vụ OLAP hỗ trợ nhiều mô hình lưu trữ dữ liệu khác nhau, mỗi mô hình cócác ưu và khuyết điểm riêng, chúng được sử dụng tùy theo mục đích khai thác

Hệ quản trị cơ sở dữ liệu đa chiều đảm nhận chức năng quản lý các khung nhìn

đa chiều, tổ chức thực hiện và lưu trữ của các khung nhìn đa chiều Hiện nay có bacách lưu trữ cho Hệ quản trị OLAP [12][13]:

- Mô hình Multi - Dimensional OLAP (MOLAP)

Mô hình MOLAP lưu trữ dit liệu cơ sở (là đữ liệu từ các bang của kho dữ liệu

hoặc trung tâm dữ liệu theo chủ đề) va thông tin tổng hợp (là các độ đo được tính toán

từ các bảng) trong các cấu trúc đa chiều gọi là các khối Các cầu trúc này được lưu bênngoài cơ sở dữ liệu theo chủ đề hoặc kho dữ liệu

Trang 32

Lưu trữ các khối trong cầu trúc MOLAP là tốt nhất cho các truy vấn tổng hợp dữliệu thường xuyên mà cần thời gian hồi đáp nhanh Vi dụ tổng doanh thu của tat cả cácloại thuê bao theo từng tháng.

— Mô hình Relational OLAP (ROLAP)

Mô hình ROLAP lưu trữ đữ liệu cơ sở và thông tin tổng hợp trong các bảng quan

hệ Các bảng này được lưu trữ trong cùng cơ sở dữ liệu như là các bảng của kho dữ

liệu hoặc kho đữ liệu theo chủ đề

Tuy nhiên với cách lưu trữ này hệ quản trị OLAP cần phải có những cơ chế

chuyển đổi giữa hai mô hình dữ liệu quan hệ và dit liệu da chiều, chuyền đổi các truy

van đa chiều thành các câu hỏi truy van SQL trên dit liệu quan hệ [2]

- Mô hình Hybird OLAP (HOLAP)

Mô hình HOLAP là sự kết hợp giữa MOLAP và ROLAP

Cách lưu trữ này giúp người sử dụng nhanh chóng thực hiện các thao tác phân

tích đa chiều trên dữ liệu tổng hợp đồng thời có thé truy xuất cấp chỉ tiết có khối lượng

dữ liệu lớn khi cần thiết [2][12][13]

- So sách các mô hình:

Bảng sau so sánh tổng hợp ba mô hình lưu trữ hỗ trợ OLAP:

MOLAP ROLAP HOLAP

Lưu trữ dit liệu cơ sở Khối Bảng quan hệ | Bảng quan hệ

Lưu trữ thông tin tổng hợp Khối Bảng quan hệ Khối

Hiệu suất thực hiện truy vấn Nhanh nhất Chậm nhất Nhanh

Tiêu thụ không gian lưu trữ Nhiều Thấp Trung bìnhChi phí bao trì Cao Thấp Trung bình

Bảng 2.2: Bảng so sánh các mô hình trong OLAP

Trang 33

2.2.4 Thao tác trên cơ sở dữ liệu nhiều chiều

Thao tác và phân tích trên cơ sở dữ liệu nhiều chiều được OLAP cung cấp một

số công cụ phân tích từ đơn giản đến phức tạp [12][13][17] Sau đây là kỹ thuật OLAP

sử dụng các công cụ thao tác trên cơ sở dữ liệu đa chiêu.

Cuộn lên (Roll - up): dựa vào quan hệ cấp bậc của chiều ta có thé cuộn lênmức độ tổng quát hơn đê xem dit liệu ở mức tông hợp Ví dụ ta cuộn lên đểxem dữ liệu ở mức tong hợp doanh thu theo quan hệ cấp bậc thời gian: Tháng

> Quý > Năm.

Khoang xuống (Drill - down): ngược lại với cuộn lên, từ mức độ tổng quátcủa quan hệ cấp bậc của chiều ta có thể khoang xuống để xem được chỉ tiết của

đữ liệu Ví dụ ta khoang xuống để xem dữ liệu ở mức tổng hợp doanh thu theo

quan hệ cấp bậc thời gian: Năm-> Quý > Tháng

Chọn và chiếu (Slice and Dice):

+ Chọn: thực hiện một phép chọn trên một chiều của khối trung tâm để cóđược một khối con

+ Chiếu: là thao tác thực hiện chọn trên hai hay nhiều chiều hơn đề tìm ra mộtkhối con

Xoay chiều (Pivot): thực hiện việc xoay khối dữ liệu để có thể xem dit liệu ởnhiều chiều khác nhau

Trang 34

Cuoc PS (Mak)

roll up on DimTime DoanhThu

(from DimTime to drill down on

“Thangnam) Cuoe_PS (from

alinnd Ạ a, ty ded :À Cuoc PS

Hình 2.7: Kỹ thuật OLAP trên cơ sở dữ liệu đa chiêu (MaKH)

2.3 Giải pháp OLAP trên SQL Server 2008

2.3.1 Công cụ tích hợp dữ liệu trong SQL Server_ SSIS (SQL Server Integration

Services)

SSIS là một cải tiến từ dịch vụ biến đổi dit liệu (Data Transformation) Nhữngkhác biệt chính bao gồm việc giới thiệu các công cụ thê hiện dạng đồ họa như SSIS

Designer thông qua BIDS và SQL Server Import and Export Wizard Tăng khả năng

mở rộng bằng cách sử dụng các tác vụ tùy chỉnh, nguồn di liệu, nơi lưu giữ dữ liệu tới

và những biến đồi dữ liệu, những thay đồi về kiến trúc

Trang 35

Dòng dữ liệu và dòng điều khiển được tách biệt thành 2 máy riêng: Máy điềukhiển ở thời gian chạy cho Integration Services và máy dong dữ liệu cho IntegrationServices Sự tách biệt này giúp cho sự kiểm soát việc thực thi gói dit liệu tốt hơn, tăngtính trực quan của việc biến đổi dữ liệu và nâng cao khả năng mở rộng của IntegrationServices bằng cách đơn giản hóa việc tạo và thực thi các tác vụ tùy chỉnh và biến đổi

đữ liệu.

Áp dụng kỹ thuật SSIS cho việc thiết lập xây dựng kho là rất tối ưu vì các hệthống đang sử dụng không bị ảnh hưởng, và các nguồn dữ liệu đầu vào của kho rất đa

dang.

2.3.2 Kiến trúc tổng quát của SSIS trong SQL Server 2008

SSIS có vị trí quan trọng, có mối quan hệ cộng sinh chặt chẽ với thành phần SQL

Server 2008, chúng ta tham khảo vị trí của nó trong hệ thống [11]

Hình 2.8: Minh họa vị trí của SSIS trong hệ thống SQL [11]

Trang 36

- WMI Event Watcher: Lang nghe các sự kiện WMI.

- Hệ thống tập tin: Thực hiện các hoạt động trên tập tin và thư mục trong hệthống tập tin

- Web Service: Truy xuất Web Service

- XML: Làm việc với các tài liệu XML.

- Analysis Services Execute DDL: Thực thi các tập lệnh DDL.

- Data Mining Query: Truy vấn dữ liệu cho các mô hình khai thác dữ liệu

2.3.3 Công cụ công cụ phân tích của SQL Server_ SSAS (SQL Server Analysis

Services)

Có nhiều thay đổi được thực hiện đối với công cụ Analysis Service, thỉnh thoảngđược xem như là công cụ phân tích kinh doanh (Business Analytics) Được xây dựng

Trang 37

từ nền tảng SQL Server 2000 Analysis Services, Microsoft SQL Server 2008Analysis Service (SSAS) hỗ trợ thêm cho chức năng khai thác thông tin (Business

Intelligent), khả năng mở rộng gia tăng, tính sẵn có và bảo mật cho các giải pháp

Business Intelligent trong khi làm cho chúng dé tao, dé triển khai và dễ quản ly

Các trình thiết kế trong SSAS:

- Cube Designer: Hỗ trợ cho việc sử dụng thông tin phân tích, giao dịch, kịchbản tập lệnh MDX và các hàm chỉ số hoạt động chính KPI

- Data Mining Model Designer: Được dùng dé dinh nghia, xem va kiểm tra cáccầu trúc khai phá, các mô hình khai pha trong BIDS

—_ Data Source View Designer: Cung cấp môi trường dựa trên kiểu biéu đồ, đơngiản để định nghĩa các bảng và các quan hệ trong Data Source View tới các đối

tượng Analysis Service.

- Dimension Designer: Nâng cao dé cung cấp cho những định nghĩa mã phântích dựa trên thuộc tính, các cấu trúc phân cấp thuộc tính và do người dùng định

nghĩa, giao dịch và ghi trả mã phân tích.

- Nhiing thay đổi khác đối với khói dữ liệu, chiều dữ liệu và khai thác dit liệu baogồm:

+ Dữ liệu và siêu dit liệu bây giờ chỉ được nạp vào bộ nhớ khi cần thiết,không giới hạn chiều dữ liệu

+ Một vai tác vụ được thêm vào SSAS có thé được dùng để tạo một giải pháp

khai phá dit liệu hoàn hảo.

— _ Yêu cầu nhóm thành viên cho các chiều dữ liệu đã được loại bỏ

24 Kếtluận

Kho dữ liệu ngày càng phổ biến và các nhà cung cấp vẫn đang tiếp tục mở rộng.phạm vi này để nâng cao hệ quả tối đa do kho dữ liệu mang lại Chương này đã trìnhbày khái quát về kho dữ liệu như: định nghĩa tổng quan kho dữ liệu, loại dir liệu trongkho, kiến trúc của kho và một số mô hình kho dit liệu, các dịch vụ SSIS, SSAS

Trang 38

Chương 3: PHAN TÍCH THIET KE VÀ TẠO KHO QUAN LÝ

KINH DOANH VIỄN THÔNG

Chương này trình bày tổng quan về Tập đoàn Bưu chính Viễn thông Việt NamVNPT, những nét chính trong công tác quản lý kinh doanh tại VNPT Tiền Giang, đềxuất giải pháp xây dựng kho Thiết kế mô hình tổng quan các kho dữ liệu sẽ tạo Xây

dựng các module chức năng.

3.1 Tổng quanvề VNPT

3.1.1 Vai trò nhiệm vụ của VNPT [18]

VNPT là Tập đoàn Bưu chính Viễn thông hàng đầu tại Việt Nam VNPT vừa lànhà cung cấp dịch vụ đầu tiên đặt nền móng cho sự phát triển của ngành Bưu chính,Viễn thông Việt Nam, vừa là tập đoàn có vai trò chủ chốt trong việc đưa Việt Nam trởthành 1 trong 10 quốc gia có tốc độ phát trién Bưu chính Viễn thông nhanh nhất toàncầu Với hạ tầng công nghệ viễn thông tiên tiến, mạng lưới dịch vụ phủ sóng toàn bộ

64 tỉnh thành trên cả nước, VNPT tự hào là nhà cung cấp dịch vụ bưu chính, viễnthông số 1 tại Việt Nam, phục vụ thuê bao di động, thuê bao điện thoại cố định vàcung cấp dịch vụ Internet Tháng 1/2006, VNPT chính thức trở thành Tập đoàn Bưuchính Viễn thông Việt Nam thay thế cho mô hình Tổng công ty cũ theo quyết định số06/2006/QĐ-TTg của Thủ tướng Chính phủ, với chiến lược phát triển theo mô hìnhtập đoàn kinh tế chủ lực của Việt Nam, kinh doanh đa ngành nghề, đa lĩnh vực, đa sởhữu, trong đó Bưu chính - Viễn thông - CNTT là nồng cốt Ngày 24/6/2010, Công ty

mẹ - Tập đoàn Bưu chính Viễn thông Việt Nam chuyển đổi hoạt động sang mô hìnhCông ty trách nhiệm hữu hạn một thành viên do Nhà nước làm chủ sở hữu theo quyếtđịnh số 955/QĐ-TTg của Thủ tướng Chính phủ

3.1.2 Sơ đồ tổng quan VNPT Tiền Giang [19]

VNPT Tiền Giang là đơn vị kinh tế trực thuộc hạch toán phụ thuộc Công ty mẹ Tập đoàn Bưu chính Viễn thông Việt Nam

Trang 39

Cơ cấu tổ chức:

‘TRUNG TÂM ĐIỀU HANH

VIÊN

Hình 3.1: Sơ đồ cơ cấu tổ chức VNPT Tiền Giang

— Lĩnh vực kinh doanh:

Dịch vụ Viễn Thông

Dich vụ điện thoại có định

Dịch vụ điện thoại vô tuyến cố định Gphone

Dịch vụ điện thoại di động Vinaphone

Dịch vụ gia tăng của tông đài điện thoại

Các dịch vụ trên nền mạng thế hệ mới NGN 1800, 1900, 1719

Dịch vụ điện thoại dùng thẻ

Dịch vụ điện thoại 171, 1717

+ + + + + + + + Dịch vụ truyền số liệu, thuê kênh riêng

Dịch vụ Công Nghệ Thông Tin

+ Dịch vụ VNN Internet

+ Các dich vụ gia tăng trên internet

+ Dịch vụ Internet FTTH

Trang 40

3.2 Công tác quản lý kinh doanh tại VNPT Tiền Giang

Định hướng kinh doanh của VNPT Tiền Giang chủ yếu là sản phẩm truyền thống.như điện thoại cố định có dây và không dây, Internet băng thông rộng, dịch vụ di độngVinaphone , VNPT Tiền Giang không những kinh doanh ở những vùng thành thị,đông dân cư, có lợi nhuận mà còn mang tính phục vụ, đưa các dịch vụ viễn thông vềnông thôn nhằm giảm bớt "khoảng cách số" giữa thành thị và nông thôn, góp phầnnâng cao đời sống văn hóa nông thôn VNPT Tiền Giang đã đưa dịch vụ truyền hình

MyTV xuống vùng sâu, vùng xa Dịch vụ truyền hình cáp hiện chỉ phục vụ khu vực

đông dân cư vì đầu tư phát triển mạng cáp chỉ phí lớn nên nhà cung cấp chỉ đầu tưnhững nơi có chỉ phí đầu tư ít nhưng thuê bao nhiều Riêng VNPT Tiền Giang đầu tưMyTV trên phạm vi toàn tỉnh, do có hệ thống cáp quang trải dai từ tỉnh, huyện xuống

xã, phường, kê cả khu dân cư thưa thớt Ngoài ra, với khoảng 400 trạm lắp đặt thiết bịMyTV nên truyền hình cáp MyTV của VNPT Tiền Giang đã cung cấp khoảng 90%trên toàn tinh, kể cả vùng sâu, vùng xa

Một số giải pháp nhằm phát triển hoạt động khai thác và kinh doanh các dịch vụ

của đơn vị trong thời gian tới là:

- Nâng cao chất lượng dịch vụ

— Khai thác hiệu quả các sản phẩm dịch vụ hiện tại

Ngày đăng: 08/11/2024, 17:28

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN