Huấn luyện mạng nơron

Một phần của tài liệu Áp dụng các kỹ thuật phân lớp dữ liệu, hồi quy để dự báo số liệu sản xuất kinh doanh cho VNPT (Trang 78)

1) Bước 1: Lựa chọn biến

3.4.7.Huấn luyện mạng nơron

Việc huấn luyện các mạng nơronđược thực hiện với sự trợ giúp của bộ công cụ YALE theo mô hình sau:

Để việc huấn luyện mạng nơron đạt kết quả tốt nhất, đề tài sử dụng một phương pháp tối ưu các tham số của mạng nơronđược cung cấp bởi thao tác GridParameterOptimization trong bộ công cụ YALE. Các tham số được tối ưu của mạng nơron gồm có hệ số học (tham số L trong bộ công cụ YALE) và hằng số xung lượng (tham số M trong bộ công cụ YALE). Thao tác GridParameterOptimization sẽ thử lần lượt từng cặp tham số L và M với các giá trị đã được khai báo từ 0,1 đến 0,9 để huấn luyện mạng nơron và chọn mạng nơron có kết quả tốt nhất để trả về cho người dùng.

Thiết đặt các tham số của các thao tác trong mô hình như sau:

 Database_url: jdbc:mysql://localhost:3306/datamining

 Username: root

 Password: root

 Query (trường hợp này xây dựng mô hình dự báo cho chỉ tiêu Internet

m5831 của đơn vị Hà Nội, với chu kỳ dự báo trước 3 tháng):

select tb1.m5831, tb1.m5832, tb1.m5833, tb1.m5834, tb1.m5835, tb1.m5836, tb2.m5831 label

from internet tb1, internet tb2

where tb1.tinhid='010' and tb2.tinhid='010'

and ((tb2.thang=tb1.thang+3 and tb1.thang+3<=12 and

tb1.nam=tb2.nam)

or (tb2.thang=tb1.thang+3-12 and tb2.nam=tb1.nam+1 and

tb1.thang+3>12)); - ParameterOptimization:  L: 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9  M: 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 - PerformanceEvaluation:  absolute_error: true  relative_error: true - ExperimentLog:  Filename: D:/datamining/log/logm5841_010_3.log - ModelWriter:  model_file: D:/datamining/model/m5831_010_3.mod

Sau khi huấn luyện xong, kết quả thu được như sau:

1 . absolute_error: 37614.91913497647 2 . relative_error: 0.041056307093463335

Theo kết quả trên, sai số tuyệt đối của mô hình được xây dựng đối với chỉ tiêu sản lượng Internet m5831 là 37615 (phút) và sai số tương đối là 0.041, tức là khoảng 4,1%, nhỏ hơn so với yêu cầu đầu bài đặt ra là 10%. Vậy mô hình đã xây dựng có thể chấp nhận được để đưa ra dự báo số liệu.

Để xây dựng mô hình dự báo cho các chỉ tiêu, đơn vị khác, ta cần sửa lại câu Query để lấy mã chỉ tiêu, mã đơn vị và chu kỳ dự báo cho phù hợp.

Một phần của tài liệu Áp dụng các kỹ thuật phân lớp dữ liệu, hồi quy để dự báo số liệu sản xuất kinh doanh cho VNPT (Trang 78)