- Kho dữ liệu tập trung chủ đạo: Mô hình dữ liệu cung cấp tập hợp bao gồm toàn bộ các thực thể và thuộc tính thu giữ dữ liệu từ tất cả các hệ thống nguồn và quy trình kinh doanh cho tất cả các mảng sản xuất kinh doanh, cung cấp dịch vụ của tổ chức. DWH xây dựng dùng mô hình dữ liệu này sẽ làm việc như nguồn dữ liệu chính của hệ thống báo cáo phục vụ tổ chức.
- Duy trì dữ liệu lịch sử với dấu vết cho công tác báo cáo và phân tích: Khả năng lưu giữ dữ liệu lịch sử để phân tích, kiểm tra và so sánh với các giai đoạn trước đó nhằm phân tích xu hướng và lập mô hình dự đoán.
- Nền tảng công nghệ DWH có khả năng mở rộng để lưu trữ lượng lớn dữ liệu với hiệu suất tối ưu.
Khóa lu n t t nghi pậ ố ệ
- Khả năng đảm bảo tăng trưởng khối lượng dữ liệu: Giải pháp có thể mềm dẻo đáp ứng tăng trưởng của độ lớn dữ liệu do sự tăng lên của số lượng giao dịch và thêm vào các nguồn dữ liệu mới.
- Lưu trữ dữ liệu đến mức chi tiết nhất: Dữ liệu trong DWH sẽ được giữ tại mức chi tiết nhất. Các chi tiết dữ liệu này có thể được cuộn lên các mức cao hơn bằng cách dùng nhiều chiều khác.
- Thời gian đáp ứng thông tin nhanh: Giải pháp có thể tối ưu hiệu suất và sẽ có thể điều chỉnh các tham số hiệu suất sau khi phân tích các yêu cầu tại mức thấp nhất
- Self service BI (Tự phục vụ): Công cụ phân tích và BI, hỗ trợ self service BI toàn hệ thống. Thông qua Self service BI, người dùng hệ thống được trao quyền chủ động, tự khai thác dữ liệu đã được xây dựng theo mô hình để phục vụ nhu cầu thông tin của mình nhằm đáp ứng các yêu cầu nghiệp vụ, kinh doanh. Self service BI cũng giúp giảm tải cho đội ngũ làm CNTT tại đơn vị.
- Cung cấp dữ liệu sạch và nhất quán: Giải pháp sẽ gồm các tiến trình quản trị dữ liệu cần thiết và công cụ để giảm chi phí cũng như độ phức tạp khi truy cập nguồn và làm sạch dữ liệu.
- Đáp ứng yêu cầu tăng trưởng của việc chuyển giao thông tin: DWH sẽ tổ chức xung quanh các chủ đề riêng biệt, sẵn sàng điều chỉnh mềm dẻo và mở rộng theo nhu cầu tương lai của doanh nghiệp.
- Tích hợp với các nguồn/ứng dụng khác: Giải pháp gồm một mô hình dữ liệu cung cấp tập toàn diện các thực thể và thuộc tính có thể thu giữ dữ liệu từ nhiều hệ thống nguồn giao dịch trực tuyến và tiến trình kinh doanh tại mảng các ứng dụng then chốt của doanh nghiệp. Mô hình dữ liệu này có thể dùng như vùng lưu trữ dữ liệu kết quả cho các động cơ và tiến trình tương tự cung cấp bởi các đối tác khác, hoặc các giải pháp tự xây dựng.
- Phân tích đa chiều: Giải pháp cho phép chọn nhiều chiều dữ liệu từ kho dữ liệu phục vụ cho mục đích tạo báo cáo phân tích.
Khóa lu n t t nghi pậ ố ệ
- Khả năng đào sâu đến mức chi tiết thấp nhất: Giải pháp hoàn toàn tuân thủ theo bản chất chi tiết của các thành phần dữ liệu để có thể đào xuống mức chi tiết thấp nhất.
- Báo cáo hoạt động hiệu quả mà không cần truy cập ứng dụng nguồn: Giải pháp sẽ lưu trữ dữ liệu hoạt động để có thể Báo cáo hoạt động hiệu quả mà không cần truy cập ứng dụng nguồn
- Hỗ trợ khai phá dữ liệu và các phân tích cao cấp trong tương lai.
2.7 Phân tích yêu cầu người dùng
- Yêu cầu của trưởng phòng tại EVNNPC.CC
+ Tình trạng hoạt động của EVNNPC.CC theo thời gian.
+ Tình trạng xử lý phiếu theo dịch vụ theo thời gian.
+ Tình trạng xử lý phiếu theo các đơn vị ở cấp công ty điện lực cấp huyện trực ở 27 tỉnh thành miền Bắc theo thời gian.
- Yêu cầu của giám đốc tại EVNNPC.CC
+ Tổng quan tình hình xử lý phiếu ở các cơ quan cấp công ty điên lực các tỉnh thuộc 27 tỉnh thành miền Bắc theo thời gian.
+ Tình trạng xử phiếu theo loại dịch vụ theo thoi gian.
+ Tình hình quá hạn xử lý theo trạng thái phiếu yêu cầu ở các loại dịch vụ theo thời gian.
Khóa lu n t t nghi pậ ố ệ
KẾT LUẬN CHƯƠNG 2
Chương 2 trình bày tổng quan lý thuyết về kho dữ liệu, khái niệm về kho dữ liệu được tổng hợp từ nhiều nguồn. Sau đó nêu được các đặc điểm, mục đích và lợi ích của kho dữ liệu. Bên cạnh đó tìm hiểu về hệ thống tích hợp dữ liệu, rút trích dữ liệu, biến đổi dữ liệu và nạp dữ liệu vào kho dữ liệu. Phân tích các mô hình tiếp cận ETL. Tiếp theo, khóa luận trình bày về công cụ tạo báo cáo, để khai thác dữ liệu, phân tích và dự báo giá. Cuối cùng, mô tả các đối tượng sử dụng BI, phân tích nghiệp vụ của BI User.
Khóa lu n t t nghi pậ ố ệ
CHƯƠNG 3: TRIỂN KHAI VÀ XÂY DỰNG KHO DỮ LIỆU 3.1 Giới thiệu chung quy trình xử lý phiếu yêu cầu tại EVNNPC.CC
Quy trình xử lý phiếu yêu cầu tại EVNNPC.CC bao gồm 3 giai đoạn: tiếp nhận, giải quyết, hoàn tất yêu cầu của khách hàng. Dưới đây là mô hình thể hiện quy trình nghiệp vụ tại EVNNPC.CC.
Hình 3.1: Quy trình xử lý phiếu yêu cầu tại EVNNPC.CC
Phần tiếp theo của khóa luận sẽ trình bày cụ thể về 3 giai đoạn của quy trình xử lý phiếu yêu cầu.
Khóa lu n t t nghi pậ ố ệ
3.1.1 Giai đoạn tiếp nhận phiếu
Khách hàng gọi đến EVNNPC.CC qua số điện thoại 19006769 để được gặp giao dịch viên trong khoảng thời gian từ 8h - 17h hàng ngày. Tất cả các số điện thoại gọi đến EVNNPC.CC sẽ được lưu trữ tại hệ thống CRM. Khi khách hàng kết nối thành công đến tổng đài viên của EVNNPC.CC, hệ thống CRM sẽ hiển thị các thông tin về khách hàng đã từng kết nối đến EVNNPC.CC bằng số điện thoại đã được lưu trữ trên hệ thống, trên màn hình làm việc của giao dịch viên với các trường thông tin như: tên, mã khách hàng, đơn vị quản lý, nhóm khách hàng, lịch sử yêu cầu trước đây... Đồng thời các trường thông tin này sẽ tự động xuất hiện trong phiếu yêu cầu
Hình 3.2: Thông tin của khách hàng đã gọi đến EVNNPC.CC
Đối với các khách hàng sử dụng số điện thoại chưa được lưu trên hệ thống CRM của EVNNPC.CC, thì giao dịch viên sẽ khai thác thông tin từ khách hàng và điền vào biểu mẫu phiếu yêu cầu.
Kiểu Dữ Liệu Ý nghĩa
ID Uniqueidentifier Khóa chính của bảngLoaidichvu. Với mỗi ID ta sẽ xác định được dịch vụ cũ thể.
Ten Varchar Tên của dịch vụ.
Thongtinchung Varchar Thông tin liên quan đếnloại dịch vụ.
Caunoichuan Varchar Mau câu nói sẽ hiện lênmàn hình của giao dịch
Khóa lu n t t nghi pậ ố ệ
Hình 3.3: Thông tin của số điện thoại khách hàng chưa gọi đến EVNNPC.CC
3.1.2 Giai đoạn xử lý phiếu yêu cầu
Mỗi loại yêu cầu gửi đến EVNNPC.CC đều được quy định rõ ràng về khoảng thời gian xử lý. Đối với các yêu cầu đơn giản như tra cứu hóa đơn tiền điện, lịch cắt điện, giá điện, công nợ tiền điện. đều được giải quyết ngay bởi giao dịch viên. Với các yêu cầu được giải quyết ngay bởi giao dịch viên, sau khi hoàn tất, phiếu yêu cầu sẽ lưu trữ trong hệ thống CRM với trạng thái “Closed”
Với các yêu cầu không thể giải quyết ngay lập tức bởi giao dịch viên như di dời Công-tơ, xử lý mất điện, khiếu nại kiến nghị... thì sẽ được chuyển xuống các công ty điện lực cấp tỉnh- nơi quản lý khách hàng để giải quyết yêu cầu.Tùy theo từng dịch vụ, hệ thống CRM sẽ quy định khoảng thời gian cho phép EVNNPC.CC chuyển phiếu xuống các công ty điện lực và khoảng thời gian cho phép các công ty điện lực nhận phiếu. Phiếu yêu cầu sẽ được gắn trạng thái “Forward” khi được chuyển xử lý và được gắn trạng thaí “Accepted ” khi được công ty điện lực nhận phiếu. Mọi hoạt động trong qúa trình xử lý phiếu yêu cầu được lưu trữ trong hệ thống CRM.
Lê Th Thu Trangị 48
Khóa lu n t t nghi pậ ố ệ
3.1.3 Giai đoạn hoàn tất phiếu yêu cầu
Sau quá trình xử lý phiếu yêu cầu, kết quả xử lý phiếu sẽ được lưu trữ trong hệ thống CRM và tùy theo từng loại dịch vụ mà khách hàng yêu cầu, kết quả xử lý sẽ được gửi tin nhắn đến khách hàng tự động. Khi phiếu được hoàn tất sẽ được lưu trữ với trạng thái “Closed”.
3.2 Xây dựng kho dữ liệu
3.2.1 Giới thiệu nguồn dữ liệu
Nguồn dữ liệu được lấy từ hệ thống CRM của EVNNPC.CC với 3 bảng dữ liệu là: Bảng Loaidichvu,bảng Organization, bảng Phieuyeucau, bảng Phieuyeucau.log1, bảng Phieuyeucau_Log_V1
3.2.1.1 Bảng Loaidichvu:
Bảng Loaidichvu lưu trữ dữ các thông tin về các dịch vụ mà EVNNPC.CC chịu trách nhiệm giải quyết, với cấu trúc bảng như sau.
viên khi có yêu cầu về dịch vụ, giúp họ khai thác đầy đủ các thông tin cần thiết để giải quyết được yêu cầu từ khách hàng.
Phanloai Varchar
Xác định dịch vụ thuộc các phân loại dịch vụ. Hiện nay EVNNPC.CC 6 phân loại dịch vu:
- Xử lý đề xuất, kiến nghị.
- Gi nhận xử lý mất điện
- Yêu cầu cấp điện
- Yêu cầu tra cứu thông tin
- Thay đổi cập nhập thông tin
- Thông báo thông tin
Thoigianxuly Int Thời gian xử lý cho từng
loại dịch vụ.
Thoigian tiepnhan Int
Thời gian cho phép các công ty điện lực tiếp nhận phiếu yêu cầu được chuyển về từ EVNNPC.CC
Lê Th Thu Trangị 49
Loai
Int Phân loại dịch vụ. Hiện nay
có hai loại dịch vụ là: Business và Technical.
ParentID Varchar Xác định dịch vụ thuộc
phân loại dịch vụ nào.
SmsFinish Int
Xác định dịch vụ sau khi hoàn tất xử lý có được gửi tin nhắn thông báo đến khách hàng không.
Tên trường Kiểu dữ liệu Ý nghĩa
ID Uniqueidentifier Với mỗi ID ta sẽ xác địnhđược một Organization cụ thể.
OrganizationName Varchar Tênthuộc quản lý của Tổngcủa Organization công ty điện lực miền Bắc.
ShortName Varchar Tên ngắn gọn của
Organiztion.
Lê Th Thu Trangị 50
Khóa lu n t t nghi pậ ố ệ
Bảng 3.1: Thông tin bảng Loaidichvu
3.2.1.2 Bảng Organization
Bảng Organization lưu trữ dữ liệu về các tổ chức trực thuộc Tổng công ty điện lực miền Bắc, với cấu trúc bảng như sau.
Code
Varchar Tập hợp các ký tự đại
diện cho Organiztion.
PhoneNumber Varchar Số điện thoại liên lạc.
ManagementArea Varchar Khu vực Organization
quản lý.
ParentId Uniqueidentifier Tổ chức quản lý trực tiếp
Organizion.
OrganizationType Varchar Loại tổ chức.
ClosestSubManagementUnitId Uniqueidentifier Cấp quản lý gần nhất của Organization.
Address Varchar Địa chỉ của Organzation.
ClosestManagementUnitId Uniqueidentifier Cấp quản lý gần nhất của SubOrganization.
Tên Kiểu dữ liệu Ý nghĩa
ID Uniqueidentifier Khóa chính của bảngPhiếu yêu cầu.
Lê Th Thu Trangị 51
Khóa lu n t t nghi pậ ố ệ
Bảng 3.2: Thông tin bảng Organization
3.2.1.3 Bảng Phieuyeucau
Bảng phiếu yêu cầu lưu trữ thông tin của các phiếu yêu cầu gửi đến EVNNPC.CC, với cấu trúc bảng như sau:
Createddate
Timestamp Thời gian phiếu yêu cầu được tạo.
Tennguoiyeucau Varchar Tên người yêu cầu
Loaidichvu Uniqueidentifier Mã loại dịch vụ khách hàng yêu cầu.
Noidungyeucau Varchar Nội dung khách hàng yêu
cầu.
Khachhang Varchar Ma khách hàng.
Trangthai Varchar Trạng thái hiện tại của
phiếu.
Dienthoainguoiyeucau Varchar Điện thoại người nhận phiếu.
Createdby Uniqueidentifier Mã giao dịch viên tạo phiếu.
Notexuly Varchar Ghi chú xử lý.
Kenhlienlac Varchar
Kênh liên lạc của khách hàng dùng để kết nối với EVNNPC.CC.
Lê Th Thu Trangị 52
Organizationid
Uniqueidentifier Nơi phụ trách xử lý yêu cầu của khách hàng.
Assignedto Uniqueidentifier
Mã nhân viên phụ trách yêu cầu xử lý yêu cầu của khách hàng.
Forwardeddate Timestamp Thời gian chuyển xử lý
phiếu yêu cầu
Accepteddate Timestamp
Thời gian phiếu yêu cầu được tiếp nhân tại công ty cấp điện lực.
Closeddate Timestamp Thời gian phiếu yêu cầu
được xử lý xong.
Thoidiemquahanxuly Timestamp Thời điểm phiếu yêu cầu bị quá hạn xử lý.
Thoidiemquahantiepnhan Timestamp Thời điểm phiếu yêu cầu bị quá hạn tiếp nhận.
Managementunitid Uniqueidentifier Đơn vị quản lý của
Organizationid.
Locationtypeid Uniqueidentifier Phân loại vị trí khách hàng yêu cầu: Nông thông hay
Lê Th Thu Trangị 53
Thành thị.
Thoidiemquahanchuyenxuly Timestamp Thời điểm phiếu yêu cầu bị quá hạn chuyển xử lý.
Tên Kiểu dữ liêu Ý Nghĩa
ID Uniqueidentifier Khóa chính của bảngphieuyeucau.log, ID sinh ra mỗi khi phiếu yêu cầu có các điều chỉnh.
PhieuYeuCauId Uniqueidentifier ID của phiếu yêu cầu.
TrangThai Varchar Trạng thái của phiếu yêu
cầu với mỗi lần được tác động xử lý.
ModifiedDate Timestamp Thời điểm phiếu yêu cầu
được tác động.
Loaidichvu Uniqueidentifier Loại dịch vụ khách hàng
yêu cầu.
NoiDungYeuCau Varchar Nội dung yêu cầu của
Lê Th Thu Trangị 54
Khóa lu n t t nghi pậ ố ệ
Bảng 3.3: Thông tin bảng Phieuyeucau
3.2.1.4 Bảng Phieuyeucau.logl
Bảng Phieuyeucau.logl lưu trữ quá trình xử liếu phiếu yêu cầu, các trường thông tin được thể hiện dưới bảng.
khách hàng.
Tên Kiểu kí tự Ý nghĩa
Phieuyeucauid Uniqueidentifier ID của Phiếu yêu cầu.
Createddate Timestamp Thời gian phiếu yêu cầuđược tạo.
Loaidichvu Uniqueidentifier Mã loại dịch vụ khách hàng yêu cầu.
Organizationid Uniqueidentifier Nơi phụ trách xử lý yêu cầu của khách hàng.
Kenhlienlac Varchar Kênh liên lạc khách hàng
sử dụng để kết nối với EVNNPC.CC.
Trangthai Varchar Trạng thái của phiếu.
Locationtypeid Uniqueidentifier Phân loại vị trí khách hàng yêu cầu: Nông thông hay Thành thị.
Modifieddate Timestamp Thời điểm phiếu yêu cầu
Lê Th Thu Trangị 55
Khóa lu n t t nghi pậ ố ệ
Bảng 3.4: Thông tin bảng PhieiiyeiicaiLlogl
3.2.1.5 Bảng Phieuyeucau_Log_V1
Là bảng chứa dữ liệu tổng hợp của bảng Phieuyeucau và Phieuyeucau.logl
được tác động.
Thoidiemquahanxuly Timestamp Thời điểm phiếu yêu cầu
bị quá hạn xử lý.
Thoidiemquahantiepnhan Timestamp Thời điểm phiếu yêu cầu bị quá hạn tiếp nhận.
Thoidiemquahanchuyenxuly Timestamp Thời điểm phiếu yêu cầu bị quá hạn chuyển xử lý.
Tinhtrangquahan Int Tình trạng phiếu:Quá hạn,
Không quá hạn.
Lê Th Thu Trangị 56
Bảng 3.5: Thông tin bảng Pliieityeitcait-Log-Vl
❖ Mô tả quá trình ETL dữ liệu
Quá trình ETL dimesion dịch vụ được chạy trên Talend, với chi tiết như sau:
Hình 3.4: Quá trình ETL bảng Phieuyeucau_log_V1
- Thành phần tham gia ETL
+ Bảng nguồn: Phieuyeucau, Phieuyeucau.log1
Tên Kiểu dữ liệu Ý nghĩa
The_Time Time Là khóa chính của bảngtime dimesion.Thời gian trong ngày (HH:mm:ss).
Hour_24 Int Giờ.
Minute_Of_Hour Int Phút.
Am_Pm Varchar Sáng hoặc chiều.
Khóa lu n t t nghi pậ ố ệ
+ Bảng đích: Phieuyeucau_Log_V 1
- Mô tả chi tiết quá trình ETL
Thực hiện inner join bảng phieuyeucau và phieuyeucau.log1 với điều kiện trường thông tin “ID” của bảng Phieuyeucau trùng vơi trường thông tin “PhieuyeucauID” của bảng Phieuyeucau.log1.
3.2.2 Thiết kế kho dữ liệu
- Hệ quản trị cơ sở dữ liệu được dùng để lưu trữ dữ liệu của kho dữ liệu: Postgresql
- Công cụ dùng để ETL dữ liệu: Talend
- Kiến trúc kho dữ liệu được mổ tả dưới hình vẽ:
Hình 3.5: Mô hình kho dữ liệu hình bông tuyết tạiEVNNPC.CC
3.2.2.1 Bảng chiều về thời gian
Thời gian ghi nhận các hoạt động xử lý phiếu yêu cầu được lưu trữ dưới dạng timestamp “MM-DD-YYYY HH:mm:ss” (tháng-ngày-năm giờ-phút-giây). Căn cứ vào kiểu thời gian lưu trữ cũng như tiết kiệm khoảng không gian lưu trữ dữ liệu. Chiều về thời gian đượ chia thành hai hai chiều: Chiều giờ-phút-giây và chiều tháng-ngày-năm.
Lê Th Thu Trangị 58
Khóa lu n t t nghi pậ ố ệ
a) Bảng Time Dimesion
Bảng Time Dimesion lưu trữ với kiểu dữ liệu Time, lưu trữ khoảng thời gian trong một ngày với định dạng giờ, phút, giây (HH:ss:mm), với cấu trúc bảng được thể hiện dưới đây.
Tên Kiểu dữ liệu Ý nghĩa
TheDate Date
Là khóa chính cảu bảng date dimesion, lưu trữ thời gian với định dạng tháng-
ngày-năm (MM-DD-
YYYY).
DayName Varchar Tên ngày trong tuần.
Bảng 3.6: Thông tin bảng Time Dimesion
b) Bảng Date Dimesion
Bảng date dimesion lưu trữ với kiểu dữ liệu Date, lưu trữ dưới định dạng tháng- ngày-năm(MM-DD-YYYY), với cấu trúc bang được thể hiện dưới đây.
DayOfWeek Int
Số thứ tự ngày trong tháng.
WeekOfMonth Int Số thứ tự tuần trong tháng.