- Thành phần tham gia ETL
+ Bảng nguồn: Phieuyeucau, Phieuyeucau.log1
Tên Kiểu dữ liệu Ý nghĩa
The_Time Time Là khóa chính của bảngtime dimesion.Thời gian trong ngày (HH:mm:ss).
Hour_24 Int Giờ.
Minute_Of_Hour Int Phút.
Am_Pm Varchar Sáng hoặc chiều.
Khóa lu n t t nghi pậ ố ệ
+ Bảng đích: Phieuyeucau_Log_V 1 - Mơ tả chi tiết q trình ETL
Thực hiện inner join bảng phieuyeucau và phieuyeucau.log1 với điều kiện trường thông tin “ID” của bảng Phieuyeucau trùng vơi trường thông tin “PhieuyeucauID” của bảng Phieuyeucau.log1.
3.2.2 Thiết kế kho dữ liệu
- Hệ quản trị cơ sở dữ liệu được dùng để lưu trữ dữ liệu của kho dữ liệu: Postgresql
- Công cụ dùng để ETL dữ liệu: Talend
- Kiến trúc kho dữ liệu được mổ tả dưới hình vẽ:
Hình 3.5: Mơ hình kho dữ liệu hình bơng tuyết tạiEVNNPC.CC
3.2.2.1 Bảng chiều về thời gian
Thời gian ghi nhận các hoạt động xử lý phiếu yêu cầu được lưu trữ dưới dạng timestamp “MM-DD-YYYY HH:mm:ss” (tháng-ngày-năm giờ-phút-giây). Căn cứ vào kiểu thời gian lưu trữ cũng như tiết kiệm khoảng không gian lưu trữ dữ liệu. Chiều về thời gian đượ chia thành hai hai chiều: Chiều giờ-phút-giây và chiều tháng-ngày-năm.
Lê Th Thu Trangị 58
Khóa lu n t t nghi pậ ố ệ
a) Bảng Time Dimesion
Bảng Time Dimesion lưu trữ với kiểu dữ liệu Time, lưu trữ khoảng thời gian trong một ngày với định dạng giờ, phút, giây (HH:ss:mm), với cấu trúc bảng được thể hiện dưới đây.
Tên Kiểu dữ liệu Ý nghĩa
TheDate Date
Là khóa chính cảu bảng date dimesion, lưu trữ thời gian với định dạng tháng-
ngày-năm (MM-DD-
YYYY).
DayName Varchar Tên ngày trong tuần.
Bảng 3.6: Thông tin bảng Time Dimesion
b) Bảng Date Dimesion
Bảng date dimesion lưu trữ với kiểu dữ liệu Date, lưu trữ dưới định dạng tháng- ngày-năm(MM-DD-YYYY), với cấu trúc bang được thể hiện dưới đây.
DayOfWeek Int
Số thứ tự ngày trong tháng.
WeekOfMonth Int Số thứ tự tuần trong tháng.
TheMonth Int Số thứ tự tháng trong năm.
MonthName Varchar Tên tháng.
QuarterActual Varchar Tên quý.
YearActual Varchar Số năm.
DayOfMonth Int Số thứ tự ngày trong tháng.
Lê Th Thu Trangị 59
Tên Kiểu dữ liệu
Ý nghĩa
IDLoaidichvu Uniqueidentifier
Khóa chính của bảng Loại dịch vụ. Với mỗi ID ta sẽ xác định được loại dịch vụ cụ thể.
TenLoaidichvu Varchar Tên của loại dịch vụ.
Bảng 3.7: Thông tin bảng Date Dimesion
3.2.2.2 Bảng chiều về dịch vụ
Bảng chiều về dịch vụ thể hiện 3 nội dung chính: 7 phân loại dịch vụ, các dịch vụ trong các phân loại dịch vụ và tính chất của các dịch vụ mà EVNNPC.CC chịu trách nhiệm giải quyết. Mối quan hệ này được biểu diễn bằng bảng 3 bảng
dimesion:Dimesion Loaidichvu, Dimesion Tinhchatdichvu, Dimesion Dichvu. a) Bảng dimesion Loaidichvu
❖ Mô tả bảng: Lưu trữ thơng tin về loại dịch vụ hiện có của EVNNPC.CC, hiện nay có 7 loại dịch vụ chính: Xử lý đề xuất, kiến nghị, Ghi nhận và xử lý mất điện, Yêu cầu Cấp điện, Yêu cầu Tra cứu thông tin, Thay đổi, cập nhật thông tin, Thông báo thông tin.
Lê Th Thu Trangị 60
Tên Kiểu dữ liệu
Ý nghĩa
IdTinhchatdichvu Uniqueidentifier Khóa chính của bảng tínhchất dịch vụ. Với mỗi ID ta sẽ xác định được tính chất của dịch vụ.
TenTinhchatdichvu Varchar Tên của tính chất dịch vụ
Tên
Kiểu dữ liệu Ý nghĩa
Id Uniqueidentifier Khóa chính của bảng dịch
vụ. Với mỗi ID ta sẽ xác định được dịch vụ cũ thể.
Ten Varchar Tên của dịch vụ
Thongtinchung Varchar Thông tin liên quan đến
loại dịch vụ
Caunoichuan Varchar Mau câu nói sẽ hiện lên
Bảng 3.8: Thơng tin bảng dimesion Loaidichvu
❖ Mơ tả q trình ETL
- Bảng nguồn: bảng Loaidichvu
- Bảng đích: Dimesion Loaidichvu
Chèn dữ liệu bảng dimesion Loaidichvu bằng cách thực hiện câu query lấy dữ liệu từ bảng Loaidichvu với điều kiện ParentID của bảng dịch vụ bằng 0.
Lê Th Thu Trangị 61
Khóa lu n t t nghi pậ ố ệ
b) Bảng dimesion Tinhchatdichvu
❖ Mơ tả dimesion Tinhchatdichvu: Lưu trữ tính chất dịch vụ hiện có của EVNNPC.CC, hiện có hai tính chất: Business, Technical.
Bảng 3.9: Thơng tin bảng dimesion Tinhchatdichvu
❖ Quá trình ETL dữ liệu
Nguồn dữ liệu được lấy từ cột “loai” bảng Loaidichvu. c) Bảng dimesion Dichvu
màn hình của giao dịch viên khi có yêu cầu về dịch vụ, giúp họ khai thác đầy đủ các thông tin cần thiết để giải quyết được yêu cầu từ khách hàng
Thoigianxuli Int Thời gian xử lý cho từng
loại dịch vụ
Thoigiantiepnhan Int
Thời gian cho phép các công ty điện lực tiếp nhận phiếu yêu cầu được chuyển về từ EVNNPC.CC
IDTinhChatPhieu Int
Khóa ngoại tham chiếu tới bảng Dimesion Tính chất dịch vụ. Giúp Phân loại dịch vụ. Hiện nay có hai loại dịch vụ là: Business và Technical.
IDLoaidichvu - Uniqueidentifier
- Khóa ngoại tham chiếu
tới bảng Dimesion Loại
dịch vụ. Xác định dịch vụ thuộc các phân loại dịch vụ. Hiện nay EVNNPC.CC 6 phân loại dịch vu:
Lê Th Thu Trangị 62
- Xử lý đề xuất, kiến nghị.
- Gi nhận xử lý mất điện
- Yêu cầu cấp điện
- Yêu cầu tra cứu thông tin
- Thay đổi cập nhập thông tin
- Thông báo thông tin
Lê Th Thu Trangị 63
Bảng 3.10: Mô tả thông tin bảng Dimesion Dichvu
❖ Quá trình ETL
Quá trình ETL dimesion loại dịch vụ được chạy trên Talend, với chi tiết như sau: