Xây dựng kho dữ liệu bao gồm việc xây dựng các bảng chiều (dimension) và các bảng sự kiện (fact). Cĩ nhiều loại lược đồ áp dụng cho việc thiết kế kho dữ liệu, ở đây chúng ta chọn loại lược đồ hình sao (Star). Đặc điểm của loại lược đồ này như đã đề cập trong phần lý thuyết bao gồm một bảng ở trung tâm gọi là bảng sự kiện (fact table). Bảng sự kiện chứa các dữ liệu được tổng hợp theo các đơn vị, theo khoảng thời gian. Xung quanh bảng sự kiện là các bảng chiều cĩ quan hệ với bảng sự kiện bởi một liên kết đơn. Bảng chiều chứa thơng tin mơ tả về các đặc tính khác nhau hay các chiều của một nghiệp vụ. Trong bảng chiều, mỗi chiều sẽ bao gồm một giá trị định danh ID và một giá trị tên mơ tả cho định danh đĩ. Trong các bảng sự kiện sẽ chứa các sự kiện và chứa các định danh của các chiều mà sự kiện sẽ tham chiếu.
Mơ hình kho dữ liệu Cơng nợ
Chọn bảng Fact là CONGNO, các bảng chiều bao gồm:
CN_DDVI_DCHINH
CN_HTHUC_THU CN_LOAI_DVU CN_LOAI_HDON CN_LOAI_KHANG CN_PTTT CN_THOI_GIAN.
Mơ hình kho dữ liệu Tổn thất
Chọn bảng Fact là TONTHAT, các bảng chiều bao gồm:
TT_DCAP_DA TT_DDVI_DCHINH TT_DLOAI_TRAM TT_DNGANH_NGHE TT_DON_VI TT_LOAI_BCS TT_LOAI_KHANG TT_THOI_GIAN 3.5. Kiến trúc ứng dụng
Theo các kết quả phân tích đã trình bày ở trên, ta cĩ được sơ đồ các chức năng của ứng dụng cùng mối quan hệ giữa chúng.
Các chức năng chính của hệ thống bao gồm: Tổng hợp số liệu:
o Tạo nguồn dữ liệu cho kho dữ liệu, tích hợp dữ liệu, trích chọn thơng tin cần thiết, loại bỏ các thơng tin gây nhiễu.
o Cập nhật các danh mục dữ liệu: danh mục đơn vị, phương thức thanh tốn, hình thức thu, loại hố đơn, loại khách hàng, ….
o Vẽ các biểu đồ hiển thị dữ liệu dạng: hình trịn, hình chữ nhật, đồ thị…để minh hoạ dữ liệu cơng nợ theo các thành phần, sự tăng trưởng của dữ liệu cơng nợ (số tiền nợ, số khách hàng nợ), tổn thất qua các tháng trong năm, qua các năm. So sánh các đồ thị tiền nợ, số khách hàng nợ, điện tổn thất giữa các đơn vị, giữa các năm trong cùng đơn vị.
61
Phân tích số liệu cơng nợ theo các thành phần: loại khách hàng, loại dịch vụ, phương thức thanh tốn, loại hĩa đơn, thời gian…Thực hiện dự đốn khách hàng nợ tiền điện theo đơn vị quản lý; tháng – năm hạch tốn, xác xuất dự đốn. Việc phân tích, dự đốn này dựa trên thuật tốn Bayes. Dự đốn số tiền nợ, số khách hàng nợ, tổn thất điện năng theo đơn vị
quản lý, tháng, năm. So sánh số liệu dự đốn và số liệu thực tế qua lưới dữ liệu tính độ lệch và đồ thị. Việc dự đốn này dựa trên thuật tốn ART.
o Hiển thị các khung nhìn dữ liệu dự đốn, dữ liệu thực tế theo các chiều khác nhau để hỗ trợ ra quyết định: Chiều thời gian, chiều đơn vị,…
o Hiển thị các khung nhìn theo các dữ liệu đầu vào, tham số dự đốn từ đĩ cho thấy sự biến đổi của mơ hình theo các tham số đưa vào.
o Đưa ra các dự đốn tăng trưởng theo danh mục ngưỡng dự đốn.
o Phân loại khách hàng nợ tiền điện lớn, các khách hàng thường xuyên nợ tiền điện. Khoanh các vùng cĩ tổn thất lớn, cĩ cơng nợ tiền điện lớn.
Kiến trúc hệ thống như sau:
EVN_KDDN Hĩa đơn Khách hàng Tổn thất OLAP EVN_KDDN Mining model Giao diện ứng dụng Xu thế
- Báo cáo thống kê
- Các biểu đồ dữ liệu theo đơn vị, năm, tháng
- Dự đốn số tiền nợ, số khách hàng nợ, tổn thất điện năng - Dự đốn khách hàng nợ tiền điện
- So sánh các đồ thị tiền nợ, số khách hàng nợ, điện tổn thất giữa các đơn vị, giữa các năm trong cùng đơn vị
- Cập nhật dữ liệu 1 2
3 4 5