Mô hình Rừng ngẫu nhiên (Random Forest Regression)

Một phần của tài liệu Kỹ thuật dự báo trong vận hành thị trường điện Việt Nam (Trang 48 - 54)

RF là một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman

(2001) [56]. Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản được xây dựng bằng cách sử dụng thuật toán Bagging [57]. Khi xây dựng một cơ sở phân loại, các nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên ngẫu nhiên.

Trong CART truyền thống, mỗi nút bên trong là tập con của tập dữ liệu ban đầu và nút gốc chứa tất cả dữ liệu ban đầu. Các rừng ngẫu nhiên để hồi quy được hình thành bằng cách hình thành cây dựa vào một vector ngẫu nhiên sao cho cây tiên đoán có các giá trị số cao hơn so với các nhãn lớp. Tập huấn luyện được rút ra

(1.29)

(1.30)

21

một cách độc lập từ sự phân bố của vector ngẫu nhiên, các dự đoán rừng ngẫu nhiên được hình thành bằng cách lấy trung bình trên k của cây. Giải thuật rừng ngẫu nhiên sinh ra mô hình có độ chính xác cao đáp ứng được yêu cầu thực tiễn cho vấn đề phân loại, hồi qui [58] – [63].

Giải thuật rừng ngẫu nhiên có thể được trình bày ngắn gọn như sau:

Hình 1.4 – Thuật toán Rừng ngẫu nhiên Hồi qui

• Từ tập dữ liệu học LS có m phần tử và n biến (thuộc tính), xây dựng T cây quyết định một cách độc lập nhau.

• Mô hình cây quyết định thứ t được xây dựng trên tập mẫu Bootstrap thứ t (lấy mẫu m phần tử có hoàn lại từ tập học LS).

• Tại nút trong, chọn ngẫu nhiên n’ biến (n’<<n) và tính toán phân hoạch tốt nhất dựa trên n’ biến này.

• Cây được xây dựng đến độ sâu tối đa không cắt nhánh.

Kết thúc quá trình xây dựng T mô hình cơ sở, dùng chiến lược bình chọn số đông để phân lớp một phần tử mới đến hoặc giá trị trung bình cho bài toán hồi quy.

1.2. Các yếu tố tác động đến các mô hình dự báo phụ tải ngắn hạn

Dự báo phụ tải ngắn hạn trong vận hành thị trường điện thường là dự báo phụ tải cho ngày tới, tuần tới với chu kỳ 60/30 phút, nó được chia thành các loại

22

ngày trong tuần, chẳng hạn như: ngày bình thường (thứ ba đến thứ 6); ngày thứ 2;

ngày thứ 7; ngày chủ nhật, các ngày lễ, Tết (Dương lịch và Nguyên Đán); các kỳ nghỉ trong năm. Mỗi loại ngày có một đặc điểm hình thái riêng của nó, do đó mô hình dự báo được thiết lập phải làm sao phản ánh được các đặc tính này.

Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có xu hướng tương đồng mô hình tải trước đó, tuy nhiên, nó sẽ dẫn đến dự đoán sai giữa các ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó tác động. Ngoài ra, sự biến đổi theo mùa, xu thế khí tượng học (như El nino, La nina) cũng được xem xét cẩn thận.

Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải. Nhiều biến thời tiết có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm), nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau. Theo nhiều tác giả, nhiệt độ là một biến được chấp nhận rộng rãi trong dự báo tải điện. Tuy nhiên, ở đây cần phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với dự báo tải điện và nhiệt độ ước tính được sử dụng cho đầu vào thay vì số thực. Tuy nhiên, không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có thể làm giảm độ chính xác của kết quả dự báo.

Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn đề cần được quan tâm và khó dự đoán nhất đó chính là các ngày lễ, Tết Nguyên Đán (thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch). Thường kết

quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày dương lịch và ngày âm lịch.

Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để làm dữ liệu đầu vào huấn luyện. Như trình bày trên, do đặc thù là nước sử dụng cả lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết

23

quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02. Quan sát biểu đồ phụ tải của tháng 01 và tháng 02, chúng ta sẽ thấy có sự biến động rất lớn về hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu quá khứ để dự báo cho khoảng thời gian này là hết sức phức tạp. Trên thực tế, các thuật toán khi áp

dụng để dự báo cho Việt Nam đều phải thực hiện qua một khâu trung gian đó là qui đổi các tháng này thành các tháng thông thường và sau khi chạy kết quả dự báo sẽ qui đổi ngược lại hoặc là chấp nhận sai số lớn. Các phần mềm thương mại do nước ngoài cung cấp đều gặp rắc rối này.

Thêm nữa, với sự tác động của biến đổi khí hậu toàn cầu thì các số liệu dự

báo thời tiết gần đây hầu như không chuẩn xác và khoảng thời gian dự báo tin cậy cũng rất ngắn chỉ từ 05 đến 07 ngày, khó đáp ứng yêu cầu ngày càng cao của các qui định thị trường điện bán buôn cạnh tranh (các Tổng công ty Điện lực phải công bố bảng chào Qc tháng N+1 24 chu kỳ trước ngày 20 của tháng N,…).

1.3. Mục tiêu của luận án

Luận án đặt mục tiêu xây dựng Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa

đơn vị (SLP) – Support Vector Regression (SVR) để giải quyết các vấn đề khó khăn tác động đến các mô hình dự báo phụ tải ngắn hạn nêu trên và đáp ứng các yêu cầu về dự báo ngắn hạn của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương. Đồng

thời, áp dụng giải thuật này vào thực tế dự báo ngắn hạn của EVNHCMC, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh, cũng như đánh giá, hiệu chỉnh kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất từ thị trường.

1.4. Nhiệm vụ và giới hạn của luận án

Một số vấn đề ra cần phải giải quyết khi nghiên cứu như sau:

24

− Nghiên cứu các đặc tính, các thành phần của chuỗi dữ liệu quá khứ điện năng

ghi nhận được theo năm, theo tháng, theo ngày và theo giờ (thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc và thành phần theo mùa).

− Nghiên cứu các kỹ thuật ước lượng lại dữ liệu bị lỗi, thiếu và sai sót.

− Các mô hình dự báo phụ tải điện.

− Nghiên cứu các mô hình dự báo tiên tiến trên thế giới để xây dựng giải thuật

mới để áp dụng dự báo phụ tải theo từng tháng/năm; dự báo ngày/tháng và dự báo phụ tải 24 giờ/ngày, có xem xét tác động của yếu tố thời tiết và các

yếu tố tác động khác (nếu có), tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối và bán lẻ cạnh tranh.

− Đánh giá sự ảnh hưởng của thị trường điện đến công tác dự báo nhu cầu phụ

tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi nhuận của hoạt động Sản xuất – Kinh doanh các Tổng công ty Điện lực phân phối trong môi trường thị trường điện.

1.5. Phương pháp nghiên cứu

− Thống kê, tổng hợp và xử lý các số liệu điện thương phẩm, công suất cực đại

– cực tiểu (Pmax – Pmin), tốc độ phát triển điện, tốc độ tăng trưởng của nền kinh tế, số liệu thống kê nhiệt độ thời tiết, giá điện các thành phần,… dữ liệu quá khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ trong các năm vừa qua (từ khoảng 4 – 5 năm).

− Xử lý các thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được

theo năm, theo tháng, theo ngày và theo giờ để xác định các thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc và thành phần theo mùa.

− Nghiên cứu mô hình thống kê Box-Jenkin (SARIMA), nghiên cứu các mô

hình học máy tiên tiến như: Neural Network, Support Vector Regression, Random Forest,… để xây dựng mô hình dự báo (dự báo ngắn hạn, trung hạn) theo yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương.

25

− Nghiên cứu và đánh giá sự ảnh hưởng thị trường điện đến việc dự báo nhu

cầu phụ tải điện. Đồng thời, xác định các mối quan hệ tác động ảnh hưởng đến các thành phần phụ tải, dự báo xu hướng để xây dựng kế hoạch phát triển dài hạn.

− Các modules về xử lý dữ liệu, về các giải thuật dự báo đều được chính tác

giả lặp trình bằng ngôn ngữ Matlab 2017; Bộ dữ liệu sử dụng trong luận án là bộ dữ liệu được thu thập trong quá trình vận hành hệ thống điện của EVNHCM và dữ liệu vận hành Thị trường điện bán buôn (VWEM) của A0;

1.6. Đóng góp của luận án

− Luận án đã nghiên cứu, xây dựng được công cụ tự động ước lượng các dữ

liệu bị lỗi (dữ liệu thiếu, sai sót, ngoại lai,…) mà trước đây phải thực hiện thực một cách thủ công. Đã đề xuất Mô hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) góp một phần không nhỏ trong kỹ thuật ước lượng lại dữ liệu bị lỗi.

− Luận án đã xây dựng thành công giải thuật mới là sử dụng Biểu đồ phụ tải

chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có Tết âm lịch);

− Luận án cũng đã thử nghiệm được nhiều mô hình dự báo tiên tiến theo xu

hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo (học máy) – mô hình Support Vector Regression (SVR); mạng Neural

Network, Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Qua đó, đã đánh giá kết quả các giải thuật xây dựng đường cong hồi qui của từng mô hình, với những bộ trọng số khác nhau, để từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự báo STLF;

26

− Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường

SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất;

1.7. Ý nghĩa thực tiễn của luận án

Việc dự báo nhu cầu phụ tải điện có ý nghĩa khác nhau đối với các đơn vị có chức năng khác nhau khi tham gia vào thị trường điện, cụ thể:

− Xây dựng được cho ngành điện thêm một công cụ dự báo mang tính ứng

dụng cao giải quyết các vấn đề của các nghiên cứu trước đây: vẫn còn nặng về nghiên cứu phương pháp luận và học thuật, chưa đi vào số liệu cụ thể, sai số dự báo còn cao và nhất là khả năng áp dụng còn nhiều giới hạn; Áp dụng giải thuật này vào thực tế dự báo ngắn hạn của EVNHCMC, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh;

− Các thành viên tham gia thị trường cần phải dự báo nhu cầu phụ tải trước để

lên kế hoạch sản xuất kinh doanh, cũng như lập kế hoạch phân bổ nguồn vốn đầu tư một cách hợp lý để tối ưu hoá lợi nhuận, hạn chế rủi ro;

− Những đơn vị điều hành thị trường điện cũng có thể vận dụng dự báo nhu

cầu phụ tải và giá điện để xác định phản ứng của thị trường tại vào các thời điểm khác nhau từ đó có chiến lược điều tiết thị trường một cách hợp lý;

1.8. Bố cục của luận án

Luận án được xây dựng với bố cục như sau:

− CHƯƠNG I: TỔNG QUAN

Chương này cho biết tổng quan về các kỹ thuật dự báo, mục tiêu nghiên cứu của luận án, phạm vi và phương pháp nghiên cứu, và những điểm mới của luận án.

Bên cạnh đó, những giá trị thực tiễn từ luận án nghiên cứu cũng đã được đề cập đến.

Một phần của tài liệu Kỹ thuật dự báo trong vận hành thị trường điện Việt Nam (Trang 48 - 54)

Tải bản đầy đủ (PDF)

(70 trang)