XÂY DỰNG BÀI TOÁN DỰ BÁO PHỤ TẢI ĐIỆN

Một phần của tài liệu Ứng dụng mạng nơron nhân tạo trong dự báo phụ tải điện ngắn hạn (Trang 38 - 41)

Bài toán dự báo là một bài toán phức tạp, cả về số lượng dữ liệu đưa vào cũng như độ chính xác dữ liệu cần dự báo. Có các phương pháp dự báo khác nhau như phương pháp: Hồi quy tuyến tính, Phương pháp ngoại suy theo thời gian… Tuy nhiên đến thời điểm này đối với các bài toán dự báo phức tạp, đòi hỏi độ chính xác cao người ta thường dùng thuật toán lan truyền ngược để ứng dụng trong các lĩnh vực dự báo, nhận dạng, phân lớp. Các bước chính trong quá trình thiết kế và xây dựng một ứng dụng dựa trên mạng nơron MLP bao gồm:

Bước1: Lựa chọn các biến đầu vào

Đối với bài toán dự báo phụ tải điện, giá trị phụ tải và nhiệt độ tương ứng từng giờ là các dữ liệu đầu vào cho mạng.

Bước2: Thu thập dữ liệu

Xem xét khả năng thu thập dữ liệu, các dữ liệu sau khi thu thập được cần phải kiểm tra tính hợp lệ của chúng.

Bước 3: Phân chia tập dữ liệu

Để huấn luyện mạng ta phải chia tập dữ liệu thành tập huấn luyện và tập kiểm tra. Tập huấn luyện thường là lớn hơn tập kiểm tra, tập huấn luyện thường chứa khoảng 60% - 70% toàn bộ tập dữ liệu. Tập kiểm tra sử dụng để kiểm tra tính đúng đắn của mạng sau khi đã huấn luyện, có hai cách xác định tập kiểm tra, một là lấy ngẫu nhiên các mẫu từ tập huấn luyện ban đầu, hai là chỉ lấy tập dữ liệu gần với hiện tại hơn vì nó quan trọng hơn các dữ liệu trong quá khứ.

`31

Bước 4: Xác định cấu trúc mạng

Để xây dựng một mạng nơron hoàn chỉnh, ta cần xác định các yếu tố sau:  Số đầu vào: Xác định số đầu vào của lớp vào căn cứ vào dữ liệu đầu vào

và quá trình huấn luyện mạng.

Số lớp ẩn: Đối với các bài toán dự báo nói chung thông thường người ta sử dụng một lớp ẩn vì thực tế đã có nhiều nghiên cứu tìm hiểu xem việc thêm các lớp ẩn có làm tăng năng lực học hoặc tốc độ học của mạng không. Tuy nhiên chưa có lập luận lý thuyết nào ủng hộ cho việc thêm các lớp ẩn. Với một lớp ẩn mạng có thể tính toán xấp xỉ một hàm liên tục bất kỳ đối với các biến tương ứng là các tín hiệu đầu vào. Còn với nhiều lớp ẩn mặc dù có thể tính toán xấp xỉ một hàm bất kỳ, tuy vậy số nơron trong các lớp ẩn có thể tăng theo hàm mũ đối với số đầu vào dẫn đến công thức tính toán các đầu vào, đầu ra phức tạp hơn và việc huấn luyện mạng sẽ chậm hơn. Cho đến nay vẫn chưa có những cơ sở lý luận đầy đủ để khảo sát họ các hàm có thể xấp xỉ nhờ các mạng nhiều lớp.

Số nơron trong lớp ẩn: Chưa có phương pháp nào có thể chọn được số tối ưu các nơron sử dụng trong lớp ẩn. Chỉ có một số phương pháp cho ta lựa chọn ban đầu, nhưng muốn có được số tối ưu các nơron trong lớp ẩn thì người thiết kế mô hình cần phải thực hiện nhiều thí nghiệm. Đồng thời, việc chọn lựa số đầu vào mạng cũng mang tính chất quyết định đến cấu trúc mạng để có khả năng tổng quát hoá tốt. Ta cần thực hiện huấn luyện, kiểm tra lỗi của toàn bộ tập mẫu để có thể tăng hoặc giảm các nơron lớp ẩn.

Số nơron đầu ra: Căn cứ vào mục tiêu cụ thể của từng bài toán dự báo để xác định đầu ra tương ứng.

Bước 5: Tiêu chuẩn đánh giá:

Có nhiều cách đánh giá độ chính xác của bài toán dự báo nhưng thường chọn hàm SSE (Sum of Squares Errors): Tính tổng các bình phương sai số trên toàn bộ

`32

tập mẫu học, hàm MSE (Mean Sum of Squares Errors): Tính trung bình tổng các bình phương sai số trên toàn bộ tập mẫu học

Hàm APE (Absolute Percent Error): Tính sai số phần trăm tuyệt đối trên bộ mẫu kiểm tra hoặc hàm MAPE (Mean Absolute Percent Error): Tính sai số trung bình phần trăm tuyệt đối

𝐴𝑃𝐸 =|𝑃𝑡ℎ𝑢𝑐𝑡𝑒 − 𝑃𝑑𝑢𝑏𝑎𝑜| 𝑃𝑡ℎ𝑢𝑐𝑡𝑒 ∗ 100 𝑀𝐴𝑃𝐸 = 1 𝑁ℎ∑ = 𝐴𝑃𝐸 𝑁ℎ 1

Trong đó Nh: là số giờ trong thời gian dự báo.

Bước 6: Huấn luyện mạng

Huấn luyện mạng học các dữ liệu bằng cách lần lượt đưa các mẫu vào cùng với những giá trị mong muốn. Mục tiêu của việc huấn luyện mạng là tìm ra tập các trọng số sao cho giá trị nhỏ nhất toàn cục của hàm lỗi. Một câu hỏi đặt ra là khi nào ngừng huấn luyện? Thông thường có hai biện pháp: Thứ nhất ngừng huấn luyện khi không có tiến triển nào của hàm lỗi nữa với dữ liệu trên một số tập các tham số của mạng. Thực chất biện pháp này là xác định được khả năng đạt đến cực tiểu toàn cục lớn nhất. Biện pháp thứ hai là cần thực hiện xem xét thường xuyên khả năng tổng quát hoá bằng cách sau mỗi chu kỳ nào đó thực hiện kiểm tra tổng quát hoá của mạng và sau đó quay lại quá trình huấn luyện.

Việc thực hiện huấn luyện mạng còn cần xem xét khả năng với một số nào đó lần thực hiện huấn luyện mạng trên tập khởi tạo ban đầu của các tham số. Sau khi thực hiện huấn luyện trên tất cả các tham số này, cần thực hiện đánh giá lại kết quả, từ đó đưa ra kết luận về số lần tối đa thực hiện huấn luyện cho mạng cho từng bài toán cụ thể.

Một phương pháp khác là thực hiện việc vẽ đồ thị để có thể theo dõi trạng thái lỗi của mạng. Từ đó có thể quan sát được các vùng mà mạng có trạng thái không thay đổi với dữ liệu vào hay vùng hội tụ chậm. Thông thường số lần thực hiện

`33

huấn luyện mạng có khoảng biến thiên khá lớn từ vài nghìn đến vài chục nghìn chu kỳ. Việc theo dõi được trạng thái của mạng với tập huấn luyện và khả năng tổng quát hoá để có thể ngừng khi cần là quan trọng. Cần phải cập nhật đồ thị sau mỗi chu kỳ để có thể theo dõi được các tham số huấn luyện mạng.

Bước 7: Áp dụng

Mạng nơron có khả năng xử lý tính toán song song, do vậy mạng nơron tốt nhất nên được cài đặt trên các vi mạch điện tử. Trong đó môi trường máy tính cá nhân lại phù hợp trong quá trình huấn luyện để cài đặt đồng thời có khả năng linh hoạt đáp ứng nhiều bài toán.

Một phần của tài liệu Ứng dụng mạng nơron nhân tạo trong dự báo phụ tải điện ngắn hạn (Trang 38 - 41)