1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Quản lý xây dựng: Mô hình tự động máy hỗ trợ véc-tơ ước lượng năng suất điện năng lượng mặt trời

94 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Mô hình tự động máy hỗ trợ véc-tơ ước lượng năng suất điện năng lượng mặt trời
Tác giả Nguyễn Phúc Hạnh
Người hướng dẫn TS. Nguyễn Đăng Trình, PGS.TS. Trần Đức Học
Trường học Trường Đại học Bách Khoa, Đại học Quốc gia TP.HCM
Chuyên ngành Quản lý xây dựng
Thể loại Luận văn thạc sĩ
Năm xuất bản 2022
Thành phố Hồ Chí Minh
Định dạng
Số trang 94
Dung lượng 1,63 MB

Cấu trúc

  • CHƯƠNG 1 GIỚI THIỆU CHUNG (14)
    • 1.1. ĐẶT VẤN ĐỀ (14)
    • 1.2. MỤC TIÊU ĐỀ TÀI (15)
    • 1.3. PHẠM VI NGHIÊN CỨU (15)
    • 1.4. ĐÓNG GÓP NGHIÊN CỨU (16)
      • 1.4.1. Đóng góp về mặt học thuật (16)
      • 1.4.2. Đóng góp về mặt thực tiễn (16)
  • CHƯƠNG 2 TỔNG QUAN VÀ CƠ SỞ LÝ THUYẾT (17)
    • 2.1. TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN (17)
      • 2.1.1. Tổng quan năng lượng điện trên thế giới (17)
      • 2.1.2. Tổng quan năng lượng điện trong nước (18)
      • 2.1.3. Khái niệm tổng quan về điện năng lượng mặt trời (20)
    • 2.2. TÌNH HÌNH NGHIÊN CỨU (21)
    • 2.3. TỔNG QUAN CÁC THUẬT TOÁN TRÍ TUỆ NHÂN TẠO (24)
      • 2.3.1. Các khái niệm về thuật toán trí tuệ nhân tạo (24)
      • 2.3.2. Khái niệm học máy (Machine Learning) (25)
    • 2.4. THUẬT TOÁN MÁY HỖ TRỢ VÉC-TƠ (26)
    • 2.5. THUẬT TOÁN LEAST SQUARE SUPPORT VECTOR MACHINE (28)
      • 2.5.1. Khái niệm (28)
      • 2.5.2. Ưu điểm và nhược điểm (30)
    • 2.6. THUẬT TOÁN TIẾN HÓA VI PHÂN (31)
      • 2.6.1. Khái niệm (31)
      • 2.6.2. Ưu điểm và nhược điểm (32)
    • 2.7. PHƯƠNG PHÁP KIỂM CHỨNG CHÉO DỮ LIỆU (35)
      • 2.7.1. Khái niệm (35)
      • 2.7.2. Kỹ thuật kiểm chứng chéo k-fold (35)
    • 2.8. PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU SUẤT MÔ HÌNH (37)
  • CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU (38)
    • 3.1. NỘI DUNG VÀ QUÁ TRÌNH NGHIÊN CỨU (38)
    • 3.2. PHƯƠNG PHÁP THU THẬP DỮ LIỆU (39)
      • 3.2.1. Xác định các nhân tố ảnh hưởng (39)
      • 3.2.2. Thu thập dữ liệu đo lường năng suất điện năng lượng mặt trời (39)
    • 3.3. CÔNG CỤ NGHIÊN CỨU (40)
      • 3.3.1. Phần mềm Matlab (40)
      • 3.3.2. Công cụ khác (40)
  • CHƯƠNG 4 THU THẬP DỮ LIỆU VÀ XÂY DỰNG MÔ HÌNH DỰ BÁO (41)
    • 4.1. THU THẬP DỮ LIỆU (41)
    • 4.2. THỰC HIỆN MÔ HÌNH (43)
      • 4.2.1. Trình tự thực hiện và đánh giá các mô hình (43)
      • 4.2.2. Quy trình xây dựng các mô hình (44)
      • 4.2.3. Chia fold kiểm chứng chéo dữ liệu (46)
      • 4.2.4. Thực hiện mô hình trên phần mềm Matlab (47)
    • 4.3. KẾT QUẢ ĐÁNH GIÁ CÁC MÔ HÌNH (48)
      • 4.3.1. Kết quả đánh giá mô hình LSSVM (48)
      • 4.3.2. Kết quả đánh giá mô hình LSSVM kết hợp DE (49)
    • 4.4. TỔNG HỢP VÀ NHẬN XÉT KẾT QUẢ ĐÁNH GIÁ CÁC MÔ HÌNH (50)
  • CHƯƠNG 5 KẾT LUẬN (51)
    • 5.1. KẾT LUẬN (51)
    • 5.2. ĐỀ XUẤT HƯỚNG NGHIÊN CỨU TIẾP THEO (52)
  • TÀI LIỆU THAM KHẢO (54)
  • PHỤ LỤC (59)
    • A.1. Dữ liệu đo lường (59)
    • A.2. Dữ liệu đo lường sau khi chia fold (64)
    • C.1. Kết quả dự đoán và chỉ số đánh giá của mô hình sử dụng thuật toán LSSVM (71)
    • C.2. Kết quả dự đoán và chỉ số đánh giá của mô hình sử dụng thuật toán LSSVM kết hợp DE (81)

Nội dung

GIỚI THIỆU CHUNG

ĐẶT VẤN ĐỀ

Trước tình trạng dân số thế giới ngày càng tăng, đồng thời nền kinh tế toàn cầu phát triển mạnh mẽ, nhu cầu sử dụng năng lượng ngày càng tăng là một điều tất yếu, bên cạnh đó nguồn nhiên liệu hóa thạch đang dần cạn kiệt theo từng ngày Điều này là một trong những lý do dẫn đến việc năng lượng tái tạo đã được thiết lập trên toàn cầu như một nguồn phát điện chính trong khoảng một thập kỷ qua [1]

Trong khi đó, nguồn năng lượng thủy điện từ các nhà máy thủy điện ngày càng bị hạn chế do sự tác động tới môi trường trong suốt quá trình khai thác lâu dài Các nghiên cứu trước đây đã chứng minh rằng các nguồn năng lượng tái tạo, đặc biệt là năng lượng mặt trời và gió, có thể là những lựa chọn thay thế phù hợp cho các nguồn năng lượng truyền thống để đáp ứng nhu cầu toàn cầu và bảo vệ môi trường khí quyển [2]

Tỷ trọng năng lượng tái tạo trong sản xuất điện tiếp tục tăng trên khắp thế giới trong những năm gần đây, với nhu cầu ngày càng tăng về năng lượng tái tạo nói riêng và năng lượng điện nói chung trên toàn thế giới dẫn đến cuộc khủng hoảng năng lượng toàn cầu Điều này đã thúc đẩy nhiều nhà khoa học tham gia điều tra, nghiên cứu phát triển nhiều nguồn năng lượng tái tạo khác nhau, đặc biệt là năng lượng mặt trời đồng thời phát triển các phương pháp, kỹ thuật chuyển đổi bức xạ mặt trời thành điện năng nhằm mang lại hiệu suất tối ưu [3]

Việc dự báo sản lượng điện năng lượng mặt trời bị ảnh hưởng bởi nhiều yếu tố như điều kiện thời tiết, vị trí lắp đặt, môi trường xung quanh, loại hình và quy mô dự án khác nhau,

Do đó, việc dự báo chính xác sản lượng điện mặt trời là khá khó khăn, rất cần thiết trong việc tối ưu sử dụng nguồn tài nguyên này và cực kỳ quan trọng đối với nền công nghiệp điện mặt trời đồng thời là căn cứ thúc đẩy sự triển khai trên quy mô lớn

Có nhiều phương pháp khác nhau đã được áp dụng để dự báo các nguồn năng lượng mặt trời [2] Hiện nay các thuật toán trí tuệ nhân tạo (Artificial Intelligence - AI) được ứng dụng rất rộng rãi trong quản lý xây dựng với khả năng “học” từ các dữ liệu trong quá khứ Đối với hệ thống điện mặt trời, AI có thể tham gia vào tất cả các khía cạnh của việc thiết kế hệ thống quang điện như điều khiển, giám sát và nghiên cứu nhằm hướng tới các hệ thống quang điện thông minh trong tương lai [3]

Việc ứng dụng trí tuệ nhân tạo tự động hóa quá trình ước lượng năng suất điện mặt trời thông qua công suất sản sinh quang điện dựa trên các số liệu đo đạc thực tế và yếu tố ảnh hưởng khách quan không chỉ để tăng hiệu quả dự báo, mà còn để loại trừ các yếu tố sai sót do các yếu tố chủ quan do không lường hết các điều kiện ảnh hưởng khi ước lượng bằng các phương pháp tính toán truyền thống thông thường

Trong những thuật toán trí tuệ nhân tạo được sử dụng phổ biến hiện nay, phương pháp học máy (Machine Learning) sử dụng kỹ thuật học có giám sát (Supervised Learning) là một trong những phương pháp được sử dụng nhiều trong các nghiên cứu khoa học trong lĩnh vực khai phá dữ liệu Căn cứ vào đó, đồng thời dựa trên các nghiên cứu trước, tác giả nhận thấy việc sử dụng thuật toán Least Square Support Vector Machine (LSSVM) là một phiên bản điều chỉnh của thuật toán Máy hỗ trợ véc-tơ (Support Vector Machine) kết hợp với thuật toán Tiến hóa vi phân (Differential Evolution) trên mang lại hiệu quả cao trong các vấn đề của lĩnh vực khai phá dữ liệu, luận văn đề xuất sử dụng kết hợp hai thuật toán này để xây dựng, thực hiện và đánh giá mô hình dự đoán năng suất dự án điện năng lượng mặt trời Để mô hình dự đoán đạt hiệu quả cao, luận văn tổng hợp và sử dụng một số kết quả nghiên cứu của các nghiên cứu trước và sử dụng tập dữ liệu được thu thập từ những nguồn dữ liệu đo lường thực tế uy tín có thể được sử dụng cho các nghiên cứu khoa học.

MỤC TIÊU ĐỀ TÀI

Nhìn chung, đề tài này đem lại mục tiêu chính là tìm ra và ứng dụng thuật toán trí tuệ nhân tạo tối ưu để dự đoán công suất sản xuất năng lượng điện mặt trời ở Việt Nam

Phân tích cụ thể hơn nữa, đề tài giúp làm rõ hơn sự ảnh hưởng của các nhân tố ảnh hưởng chính đến công suất của các dự án sản xuất năng lượng mặt trời ở Việt Nam được tổng hợp từ các nghiên cứu trước Đồng thời, căn cứ vào dữ liệu từ các nghiên cứu trước, đề tài còn xây dựng nên các mô hình sử dụng thuật toán trí tuệ nhân tạo (Artificial intelligence - AI) và phương pháp học máy (Machine Learning) nhằm ước tính công suất sản xuất năng lượng mặt trời hiệu quả cao và phân tích đề xuất mô hình tối ưu trong các mô hình được đề cập đến.

PHẠM VI NGHIÊN CỨU

Về phạm vi địa lý, các dự án điện năng lượng mặt trời được nghiên cứu trong nước Việt Nam, được tổng hợp đầy đủ ở tất cả các vùng khí hậu khác nhau

Loại hình các dự án điện năng lượng mặt trời được khảo sát trải đều ở 4 loại hình dự án được xây dựng phổ biến hiện tại như: hệ thống điện mặt trời trên mái nhà dân dụng, hệ thống điện mặt trời trên mái nhà công nghiệp, hệ thống nhà máy điện năng lượng mặt trời trên mặt đất, hệ thống nhà máy điện năng lượng mặt trời trên mặt nước

Về phương pháp nghiên cứu, luận văn sử dụng các thuật toán trí tuệ nhân tạo nói chung và sử dụng kỹ thuật học máy nói riêng, cụ thể luận văn nghiên cứu sử dụng thuật toán LSSVM và DE để dự đoán năng suất dự án điện năng lượng mặt trời.

ĐÓNG GÓP NGHIÊN CỨU

1.4.1 Đóng góp về mặt học thuật

Nghiên cứu tổng hợp bộ dữ liệu đo lường thực tế gồm 100 dự án điện năng lượng mặt trời ở Việt Nam trải khắp đất nước từ Miền Bắc vào Miền Nam Bên cạnh đó, nghiên cứu còn đóng góp mô hình thuật toán học máy LSSVM và tiến hóa vi phân (DE) được xây dựng trên phần mềm Matlab, đồng thời chỉ ra kết quả đánh giá mô hình sử dụng thuật toán LSSVM kết hợp DE là tối ưu hơn so với mô hình chỉ sử dụng thuật toán LSSVM

1.4.2 Đóng góp về mặt thực tiễn

Thông qua kết quả của nghiên cứu, các nhà đầu tư có thể lựa chọn vị trí xây dựng và ước lượng được năng suất dự án điện năng lượng mặt trời trong giai đoạn thực hiện nghiên cứu tiền khả thi dự án đầu tư Đồng thời, các nhà đầu tư cũng có thể dự báo được năng suất của dự án khi thay đổi quy mô dự án

Từ đó dựa vào nghiên cứu này, nhà đầu tư có thêm giải pháp để ước tính được năng suất và lợi nhuận mang lại trước khi thực hiện dự án và vạch ra trước kế hoạch thực hiện dự án.

TỔNG QUAN VÀ CƠ SỞ LÝ THUYẾT

TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN

2.1.1 Tổng quan năng lượng điện trên thế giới

Sự xuất hiện và lây lan nhanh chóng của COVID-19 vào cuối năm 2019 đã biến thành đại dịch toàn cầu vào đầu năm 2020, gây ra một cuộc khủng hoảng kinh tế và sức khỏe toàn cầu, chính điều này cũng góp phần ảnh hưởng đến vấn đề năng lượng trên toàn thế giới

Dữ liệu của các quốc gia đại diện cho hơn một phần ba nhu cầu điện toàn cầu cho thấy mỗi tháng đóng cửa hoàn toàn làm giảm nhu cầu điện trung bình 20% Riêng trong quý đầu của năm 2020, nhu cầu điện toàn cầu giảm 2,5%, và nhu cầu về than và dầu lần lượt giảm gần 8% và 5% Năng lượng tái tạo là nguồn điện duy nhất ghi nhận tăng trưởng nhu cầu trong giai đoạn này, do chi phí vận hành thấp và khả năng tiếp cận mạng lưới điện ưu đãi [4]

Trong các nguồn năng lượng tái tạo, năng lượng gió và mặt trời đã trở thành nguồn điện chính và ngày càng có giá thành cạnh tranh với các nhà máy điện sử dụng nhiên liệu hóa thạch Gần như ở khắp mọi nơi trên thế giới, sản xuất điện từ năng lượng tái tạo tiết kiệm chi phí hơn so với sản xuất từ các nhà máy nhiệt điện than [5]

Theo thống kê tính đến năm 2018, năng lượng tái tạo hiện đại (không bao gồm năng lượng sinh khối truyền thống) chiếm khoảng 11% tổng mức tiêu thụ năng lượng (Total Final Energy Consumption – TFEC) Trong đó, phần lớn nhất là điện tái tạo (5,7% TFEC), tiếp theo là nhiệt tái tạo (4,3%) và nhiên liệu sinh học vận tải (1,0%) [4]

Hình 2.1 Tỷ lệ năng lượng tái tạo ước tính của tổng mức tiêu thụ năng lượng 2018 [4]

Sinh khối, mặt trời, địa nhiệt

Năng lượng gió, mặt trời, sinh khối, địa nhiệt

Năng lượng tái tạo đang phát triển ở tất cả các nơi trên thế giới Trên toàn cầu, 32 quốc gia đã có ít nhất 10 GW công suất điện tái tạo vào năm 2019, tăng so với chỉ 19 quốc gia một thập kỷ trước đó [6] Tiềm năng năng lượng tái tạo đặc biệt là điện mặt trời trên thế giới rất dồi dào, cần tăng cường khai thác hiệu quả để thay thế nguồn năng lượng hóa thạch và các nguồn năng lượng ảnh hưởng đến môi trường, góp phần phục vụ nhu cầu năng lượng toàn cầu, xem Hình 2.2

Hình 2.2 Bản đồ tiềm năng năng lượng quang điện trên thế giới

2.1.2 Tổng quan năng lượng điện trong nước

Nhu cầu năng lượng của Việt Nam được dự báo sẽ tăng trên 8% mỗi năm trong giai đoạn 2021-2030 Nhu cầu điện dự kiến là 265-278 tỷ kWh vào năm 2020, tăng lên 572-632 tỷ kWh vào năm 2030 so với 86 tỷ kWh vào năm 2010 [7], Việt Nam cần bổ sung 6.000- 7.000MW công suất hàng năm với chi phí 148 tỷ USD vào năm 2030 [8] Để đáp ứng nhu cầu đó, Chính phủ Việt Nam đã phải điều chỉnh Quy hoạch phát triển điện năng để tăng tỷ trọng tái tạo năng lượng như sinh khối, mặt trời và gió để giảm chênh lệch giữa cung và cầu Hiện tại, năng lượng tái tạo chỉ chiếm 2,1% tổng lượng điện năng được tạo ra [9]

Hiện tại, năng lượng từ thủy điện chiếm tỷ lệ lớn nhất trong các nguồn năng lượng tái tạo, tiếp đến là sinh khối và gió Còn lại các công nghệ năng lượng mặt trời, khí sinh học và chất thải thành năng lượng đang phát triển chậm trong khi năng lượng địa nhiệt và năng lượng thủy triều vẫn đang ở giai đoạn mới phát triển [9], xem Bảng 2.1

Bảng 2.1 Công suất các nguồn năng lượng tái tạo khai thác ở Việt Nam 2018 [8]

Nguồn năng lượng tái tạo Công suất tiềm năng Công suất đã lắp đặt

Thủy điện cỡ nhỏ 7000 MW (technical) 1648 MW (23.5%)

Sinh khối 318630 MW (theoretical) 270 MW (0.84%)

Mặt trời 7140 MW (commercial) 8 MW (0,1%) Địa nhiệt 350 MW 0

Chất thải rắn 400 MW 2 MW (0,5%)

Hình 2.3 Bản đồ tiềm năng năng lượng quang điện ở Việt Nam

Dữ liệu mới nhất cho thấy hiện nay có tổng cộng 332 dự án năng lượng mặt trời đã được đăng ký với tổng công suất 26.290 megawatt đỉnh (MWp), bao gồm 121 dự án (tổng công suất 7.234MWp) sẽ bắt đầu phát điện vào năm 2020 và 211 (13.069MWp) đang chờ

[10] Các dự án năng lượng mặt trời, bao gồm năng lượng mặt trời trên mái nhà, được xem là một trong những giải pháp chính để giảm áp lực cho ngành điện Tiềm năng của

Việt Nam đối với các dự án năng lượng mặt trời được cho là rất hấp dẫn vì nó được hưởng lợi từ cường độ năng lượng mặt trời tự nhiên trung bình là 5kWh/ m² [9]

Năng lượng mặt trời ở Việt Nam thực sự tăng trưởng mạnh mẽ khi Nghị định 11/2017

/ QĐ-TTg về cơ chế khuyến khích phát triển điện mặt trời ở Việt Nam do Thủ tướng chính phủ ban hành Nhờ chính sách ưu đãi của Chính phủ, danh sách các dự án năng lượng mặt trời do các nhà đầu tư nước ngoài đăng ký tại Việt Nam ngày càng tăng, các tên tuổi điển hình như Tata Power, Sunseap Group, ACWA Power, SY Panel Group, AIN Group, Siemens Gamesa Renewable Energy, Gulf Energy Development, Dragon Capital and Pacifico Energy [9]

2.1.3 Khái niệm tổng quan về điện năng lượng mặt trời

Năng lượng mặt trời là sự khai thác, lưu trữ lượng bức xạ và nhiệt từ nguồn ánh sáng mặt trời, chúng được chuyển đổi thành điện năng thông qua tấm pin năng lượng mặt trời Nguồn năng lượng này hầu như không gây ảnh hưởng tiêu cực đến môi trường, là một nguồn năng lượng gần như vô tận, đồng thời là nguồn nguyên liệu sạch, thân thiện, việc sử dụng nguồn năng lượng này góp phần bảo vệ môi trường đồng thời giảm thiểu hiệu ứng nhà kính

Nguồn năng lượng mặt trời được chuyển hóa thành điện năng thông qua hệ thống quang điện mà bộ phận chính là tấm pin năng lượng mặt trời được gắn bất cứ nơi nào đón nhận

Hình 2.4 Các dự án điện năng lượng mặt trời được lên kế hoạch ở Việt Nam [49] được ánh sáng mặt trời Ngoài ra, hệ thống quang điện còn bao gồm các thành phần không thể thiếu khác như: bộ biến tần, thiết bị lưu trữ và ổn định điện năng.

TÌNH HÌNH NGHIÊN CỨU

Trên thế giới đã có rất nhiều nghiên cứu ứng dụng các thuật toán trí tuệ nhân tạo trong quản lý xây dựng và lĩnh vực năng lượng như:

- Dự báo chi phí xây dựng: So sánh độ chính xác của hồi quy tuyến tính và mô hình máy vector hỗ trợ [11], nghiên cứu này sử dụng mô hình hồi quy tuyến tính (Linear Regression) và mô hình máy hỗ trợ véc-tơ (SVM) để dự báo chi phí xây dựng dự án, kết quả nghiên cứu cho thấy kết quả của mô hình dự báo sử dụng thuật toán SVM chính xác hơn đáng kể

- Dự toán chi phí xây dựng đường bằng mạng nơ ron nhân tạo [12] Trong nghiên cứu này, các mạng nơ-ron nhân tạo (MLP, GRNN, RBFNN) được sử dụng để ước tính chi phí xây dựng đường Trong quá trình mô hình hóa, cơ sở dữ liệu về các con đường đã được xây dựng và khai thác trên lãnh thổ của nước Cộng hòa Croatia Kết quả so sánh hiệu suất cho thấy mạng nơ-ron GRNN đạt được độ chính xác tốt nhất

- Mô hình mạng nơ ron nhân tạo (ANN) để đánh giá dự án xây dựng [13] Nghiên cứu này xác định được 16 yếu tố hiệu quả nhất ảnh hưởng đến hiệu quả hoạt động của các dự án xây dựng, đồng thời phát triển một mô hình ANN sử dụng các thuật toán Back-Propagation và Elman-Propagation để đánh giá ảnh hưởng của các yếu tố phối hợp đến hiệu quả hoạt động của các dự án xây dựng như chi phí, thời gian và chất lượng

- Ứng dụng mô hình máy vector hỗ trợ để dự báo các nguồn năng lượng mặt trời và năng lượng gió [2] Nghiên cứu này đã chỉ ra có nhiều phương pháp khác nhau để dự báo các nguồn năng lượng mặt trời và năng lượng gió, tuy nhiên việc sử dụng mô hình máy hỗ trợ véc-tơ (SVM) đem lại hiệu suất dự đoán năng lượng mặt trời và năng lượng gió tại hầu hết các địa điểm đều tốt hơn so với các mô hình hóa khác

- Học máy trong việc ước tính hiệu suất và tiêu thụ năng lượng của tòa nhà [14] Nghiên cứu này cung cấp một đánh giá về bốn phương pháp tiếp cận thường được áp dụng trong dự báo và cải thiện hiệu suất năng lượng của tòa nhà là: học máy (Machine Learning) chính bao gồm mạng nơ-ron nhân tạo (ANN), máy hỗ trợ véc- tơ (SVM), hồi quy dựa trên Gaussian và phân cụm (Gaussian-based regressions and clustering)

- Công cụ dự báo dựa trên hồi quy vectơ hỗ để dự đoán sản lượng điện mặt trời [15] Nghiên cứu này phát triển một phương pháp dự đoán chính xác được để giải quyết vấn đề khó khăn của việc dự đoán và đánh giá năng lượng quang điện trong quy hoạch và vận hành Cách tiếp cận được đề xuất dựa trên phân tích mô hình thực nghiệm nâng cao (EEMD) và cuối cùng sử dụng công cụ dự báo hỗn hợp bao gồm hồi quy vectơ hỗ trợ cải tiến (ISVR) kết hợp với thuật toán tối ưu hóa để tinh chỉnh các tham số tự do liên quan

Bên cạnh đó, ở Việt Nam trong vài năm trở lại đây cũng nở rộ các nghiên cứu ứng dụng trong lĩnh vực này như:

- Dự báo mức tiêu thụ năng lượng trong căn hộ sử dụng mô hình tiến hóa trí tuệ nhân tạo [16] Nghiên cứu này đã đưa ra các nhân tố và mức độ ảnh hưởng của chúng đến việc sử dụng năng lượng trong căn hộ, đồng thời xây dựng các mô hình dự báo mức tiêu thụ năng lượng điện trong căn hộ bằng cách sử dụng các thuật toán trí tuệ nhân tạo, học máy để bằng việc xây dựng các mô hình đơn kết hợp như LR, SVM, ANN, CART, các mô hình kết hợp ensemnle và kết hợp hai mô hình bằng trọng số Kết quả đánh giá và phân tích hiệu số cho thấy mô hình kết hợp trọng số của 2 mô hình tốt nhất là 0.96*Stacking (LR+ANN+CART) + 0.04*Bagging ANN đáng tin cậy và có hiệu suất tốt nhất

- Dự đoán mức tiêu thụ năng lượng trong nhiều tòa nhà bằng cách sử dụng máy học [17] Nghiên cứu này đã đề xuất một mô hình dự đoán dựa trên thuật toán Random Forests (RF) để dự đoán mức tiêu thụ năng lượng ngắn hạn trong trong nhiều tòa nhà Kết quả đánh giá mô hình RF vượt trội hơn hẳn so với mô hình M5P và Random Tree (RT) trong việc dự báo mức tiêu thụ năng lượng của tòa nhà

- Dự đoán khả năng phun vữa của vữa xi măng mịn tự hút dựa trên các kỹ thuật trí tuệ nhân tạo [18] Nghiên cứu này dự đoán khả năng phun vữa bằng cách sử dụng các kỹ thuật trí tuệ nhân tạo (AI- artificial intelligence) khác nhau, một số mô hình dự đoán đã được tạo ra như máy vectơ hỗ trợ, kỹ thuật cây quyết định CHAID, cây phân loại và hồi quy (C & R) để kiểm nghiệm độ chính xác của các mô hình hiện tại Dựa vào bộ dữ liệu bao gồm 240 mẫu được ghi lại tại các công trường xây dựng ở Đài Loan, sau khi so sánh với các kết quả của các phương pháp truyền thống và một số phương pháp khác kết quả, kết quả chỉ ra kỹ thuật AI là một phương pháp dự đoán chính xác và là một phương pháp thay thế hiệu quả để dự đoán khả năng phun vữa của vữa xi măng mịn tự hút

- Ước tính khả năng làm việc của bê tông dựa trên việc kiểm tra độ sụt với Least Squares Support Vector Regression [19] Nghiên cứu này đề xuất sử dụng mô hình học máy để dự đoán độ sụt của bê tông dựa trên thuật toán Least Squares Support Vector Regression (LS-SVR) LS-SVR được sử dụng để thành lập mô hình ánh xạ phi tuyến giữa các thành phần hỗn hợp và giá trị độ sụt Đồng thời, nghiên cứu sử dụng một bộ dữ liệu bao gồm các thí nghiệm độ sụt bê tông thực tế từ một dự án xây dựng đập thủy điện ở Việt Nam Kết quả thực nghiệm cho thấy mô hình đề xuất có khả năng tính toán độ sụt của bê tông một cách chính xác

- Ước tính khoảng chi phí xây dựng sau khi hoàn thành dự án sử dụng thuật toán Least Squares Support Vector Machine (LSSVM) [20] Nghiên cứu này sử dụng thuật toán Least Squares Support Vector Machine (LS-SVM), Machine Learning Based Interval Estimation (MLIE) và Tiến hóa vi phân (Differential Evolution - DE) để thiết lập một mô hình mới để dự đoán chi phí dự án xây dựng Nghiên cứu phát triển một mô hình mới được đặt tên là EAC-LSPIM, mang lại kết quả bao gồm ước tính điểm kết hợp với các giới hạn dự đoán thấp hơn và trên, ở một mức độ tin cậy nhất định, để làm nổi bật sự không chắc chắn So sánh mô phỏng và hiệu suất chứng minh rằng mô hình mới có khả năng mang lại kết quả dự báo chính xác và đáng tin cậy

- Dự báo độ sâu sói mòn tại chân cầu sử dụng chương trình LSSVM phát triển trên nền tảng Visual C# NET [21] Nghiên cứu này xây dựng các mô hình học máy dựa trên thuật toán Least Squares Support Vector Machine (LSSVM), một phương pháp học máy có hiệu quả cao trong phân tích hồi quy, để ước tính xói mòn xung quanh các trụ cầu Nghiên cứu còn phát triển một chương trình phần mềm để ước tính độ sâu xói mòn xung quanh các trụ cầu sử dụng mô hình trên dựa vào nền tảng Visual

- Dự báo xói mòn đất do mưa gây ra ở vùng đồi núi Việt Nam bằng phương pháp học máy [22] Nghiên cứu này xây dựng các mô hình dựa trên cơ sở dữ liệu sẵn có ở vùng Tây Bắc Việt Nam để dự đoán tình trạng xói mòn bằng các thuật toán học máy Kết quả nghiên cứu cho thấy tất cả các mô hình học máy có thể đạt được kết quả dự đoán tốt với tỷ lệ chính xác trong phân loại đều cao hơn 80 % Trong đó mô hình dựa trên RVM là thuật toán phù hợp nhất vì nó đạt được kết quả dự đoán cao nhất trong cả hai giai đoạn đào tạo và giai đoạn kiểm nghiệm.

TỔNG QUAN CÁC THUẬT TOÁN TRÍ TUỆ NHÂN TẠO

2.3.1 Các khái niệm về thuật toán trí tuệ nhân tạo

Trí tuệ nhân tạo, được dịch từ tiếng anh là Artificial Intelligence hay viết tắt AI, là một sự mô phỏng hành vi thông minh của con người Đó là một máy tính hoặc hệ thống được thiết kế để nhận thức môi trường của nó, hiểu các hành vi của nó và thực hiện các hành động

Sự thành công với AI đòi hỏi nhiều hơn là việc chỉ đào tạo một mô hình AI Một quy trình làm việc AI vững chắc bao gồm các công việc chính [23]:

- Thiết kế hệ thống mà mô hình sẽ chạy ;

- Triển khai đại trà cho các hệ thống phần cứng hoặc doanh nghiệp

Hình 2.5 Các bước cơ bản trong quy trình làm việc với AI [23] Định nghĩa về AI được đưa ra vào những năm 1950 và vẫn được sử dụng là "khả năng của một cỗ máy bắt chước hành vi thông minh của con người." AI trở nên thú vị hơn khi máy móc không những chỉ bắt chước mà còn làm tốt hơn hoặc thậm chí vượt quá hiệu suất của con người, nó cho chúng ta cơ hội giảm tải các tác vụ lặp đi lặp lại hoặc thậm chí để máy tính thực hiện công việc một cách an toàn và hiệu quả hơn chúng ta có thể

Thực tế mà nói, khi mọi người nghĩ về AI ngày nay, họ gần như luôn có nghĩa là học máy: đào tạo một cỗ máy để học một hành vi mong muốn Trong lập trình truyền thống, họ sẽ viết một chương trình xử lý dữ liệu để tạo ra kết quả đầu ra mong muốn Với học máy (Machine Learning), các bước được thực hiện ngược lại: bạn nhập dữ liệu và kết quả đầu ra mong muốn, và máy tính sẽ viết chương trình cho bạn Các chương trình học máy (hay chính xác hơn là các mô hình) phần lớn là hộp đen Chúng có thể tạo ra đầu ra mong muốn, nhưng chúng không bao gồm một chuỗi hoạt động như một chương trình hoặc thuật toán truyền thống

Mô hình Trí tuệ nhân tạo

Ngày nay, có rất nhiều điều thú vị về một loại học máy chuyên biệt được gọi là học sâu (Deep Learning) Học sâu sử dụng mạng nơ-ron (Thuật ngữ "sâu" đề cập đến số lớp trong mạng, càng nhiều lớp, mạng càng sâu) Một lợi thế chính của học sâu là nó loại bỏ nhu cầu về các bước xử lý dữ liệu thủ công và kiến thức miền mở rộng cần thiết cho các kỹ thuật Để đưa các thuật ngữ chính vào ngữ cảnh, hãy nghĩ về học máy và học sâu như những cách để đạt được AI, chúng là những kỹ thuật phổ biến nhất được áp dụng ngày nay

2.3.2 Khái niệm học máy (Machine Learning)

Học máy (Machine Learning) là một kỹ thuật phân tích dữ liệu dạy máy tính làm những việc một cách tự nhiên giống như con người thông qua việc học hỏi từ kinh nghiệm sẵn có

Những thuật toán của Machine learning sử dụng những phương pháp tính toán bằng máy tính để học thông tin trực tiếp từ dữ liệu dựa vào một phương trình tiên đoán giống như là một mô hình Những thuật toán đó cải thiện năng suất của chúng như là số lượng của mẫu có sẵn giúp sự gia tăng sự học hỏi cho thuật tuán Học sâu (Deep Learning) là một hình thức học máy chuyên biệt

Với sự phát triển lớn mạnh của dữ liệu lớn (Big Data), học máy đã trở thành một kỹ thuật quan trọng để giải quyết nhiều vấn đề trong các lĩnh vực như:

- Tài chính tính toán, cho điểm tín dụng và giao dịch theo thuật toán

- Xử lý hình ảnh và thị giác máy tính, để nhận dạng khuôn mặt, phát hiện chuyển động và phát hiện đối tượng

- Sinh học tính toán, để phát hiện khối u, phát hiện thuốc và giải trình tự DNA

- Sản xuất năng lượng, để dự báo giá cả và tải trọng

- Ô tô, hàng không vũ trụ và sản xuất, để bảo trì dự đoán

- Xử lý ngôn ngữ tự nhiên, cho các ứng dụng nhận dạng giọng nói,…

Hình 2.6 Quan hệ trí tuệ nhân tạo và học máy [24]

Machine learning sử dụng 2 loại kỹ thuật [24]:

- Unsupervised Learning (Học không giám sát): tìm ra những mẫu hoặc bản chất của cấu trúc ẩn bên trong dữ liệu đầu vào

- Supervised Learning (Học có giám sát): huấn luyện một mô hình dựa trên dữ liệu đầu vào và đầu ra, vì vậy có thể dự đoán kết quả trong tương lai

Hình 2.7 Phân loại kỹ thuật học máy (Machine Learning) [24]

THUẬT TOÁN MÁY HỖ TRỢ VÉC-TƠ

Máy hỗ trợ véc tơ (Support Vector Machine - SVM) là một công cụ học máy phổ biến để phân loại và hồi quy, được giới thiệu vào năm 1995 bởi Vladimir Vapnik và các đồng nghiệp [25], đây là mô hình học dựa trên lý thuyết học thống kê và là một kỹ thuật được đề xuất để xử lý các bài toán phân lớp Một số nghiên cứu gần đây [26], [2], [11]đã đề xuất sử dụng SVM giải quyết bài toán tối ưu hóa hồi quy; đồng thời SVM cũng được sử dụng để khai phá luật mờ từ dữ liệu số [26], [27] Hồi quy SVM được coi là một kỹ thuật phi tham số vì nó dựa vào các chức năng của hạt nhân

Trong thuật toán SVM hồi quy (SVR), đầu vào được ánh xạ và một vùng đặc tính không

(Sự hồi quy) Nhóm và giải thích dữ liệu dựa trên dữ liệu đầu vào

Phát triển mô hình dự đoán dựa trên cả dữ liệu đầu vào và đầu ra gian n chiều bằng cách sử dụng một hàm phi tuyến như công thức sau:

𝑓(𝑥, 𝜔) = (𝑥, 𝜔) + 𝑏 𝑣ớ𝑖 𝜔, 𝑏 𝜖 (2.1) Độ chính xác của SVR đang được đo bằng tính toán sai số của phép tính gần đúng Hàm lỗi hoặc mất mát độ nhạy ε của Vapnik được sử dụng rộng rãi, nó được đưa ra trong (2.2) Độ chính xác của f(x) có thể được ước lượng dựa vào sự mất mát của hàm L(x) như sau [28]:

|𝑦 − 𝑓(𝑥, 𝜔)|, 𝑜𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒 (2.2) ε là khoảng cách lớn nhất của hàm f từ các giá trị thực tế của biến mục tiêu, tức là các giá trị của hàm f phải nằm trong một ống có bán kính ε như Hình 2.8

Hình 2.8 Ống bán kính ε [29]

Hình 2.9 Ống bán kính ε khi hàm xấp xỉ f thu được là tuyến tính

Việc giải quyết vấn đề SVR sẽ được giải thích ngắn gọn như một vấn đề hồi quy tuyến tính Trong trường hợp này, hàm xấp xỉ f thu được là tuyến tính và nó sẽ gần đúng với tất cả các cặp dữ liệu (xi, yi) với độ lệch cực đại ε như Hình 2.9 và công thức (2.3):

Vì chiều rộng của ống tỉ lệ nghịch với định mức của vectơ , ||||, khoảng cách cực đại cho phép của các cặp (xi, yj) sẽ được tính bằng cách tối thiểu hóa |||| Để tiện cho việc tính toán, điều kiện này được định nghĩa là tối thiểu của 1

2‖𝜔‖ 2 thay vì giảm thiểu w và xem xét phương trình (2.2) và phương trình (2.3), lời giải của bài toán này được rút gọn thành bài toán tối ưu hóa được đưa ra bởi các điều kiện (2.4):

Hàm hồi quy của mô hình SVR được đúc kết lại là vấn đề tối ưu hóa như hàm sau [30]:

Trong đó, C ≥ 0 là hằng số được xác định là sự đánh đổi giữa độ phẳng của 𝑓(𝑥, 𝜔) và sai số cho phép cho độ lệch lớn hơn so với .

THUẬT TOÁN LEAST SQUARE SUPPORT VECTOR MACHINE

Thuật toán Least Square Support Vector Machine (LSSVM) được giới thiệu bởi Suykens và các đồng nghiệp [31], là một phiên bản điều chỉnh của thuật toán SVM (Support Vector Machine) để khắc phục nhược điểm của SVM đồng thời giảm đi một phần gánh nặng tính toán Trong tiến trình đào tạo model sử dụng thuật toán LSSVM, một hàm sai số bình phương nhỏ nhất được đưa ra để quy về một tập các phương trình tuyến tính trong không gian kép Vấn đề huấn luyện dữ liệu thay vì hàm bậc hai như trong SVM tiêu chuẩn thì giờ đây LSSVM đơn giản hơn là chỉ giải quyết một tập hợp các phương trình tuyến tính [20] Nhiều nghiên cứu đã thể hiện được khả năng tổng quát hóa tuyệt vời đi kèm sự tính toán nhanh và độ chính xác dự đoán của LSSVM [32], [33]

Công thức sau đây mô tả mối quan hệ tuyến tính giữa các biến đầu vào và kết quả đầu ra [31]:

Trong đó: 𝑥 ∈ 𝑅 𝑛 , 𝑦 ∈ 𝑅 và 𝜑(𝑥): 𝑅 𝑛 → 𝑅 𝑛ℎ là ánh xạ tới không gian đặc trưng kích thước lớn

Trong LSSVM để phân tích hồi quy, một tập dữ liệu huấn luyện (training dataset) được chuẩn bị {𝑥 𝑘 , 𝑦 𝑘 } 𝑘=1 𝑁 , việc đào tạo mô hình lúc này quy thành vấn đề tối ưu hóa như công thức sau:

𝑦 𝑘 = 𝜔 𝑇 𝜑(𝑥 𝑘 ) + 𝑏 + 𝑒 𝑘 , 𝑘 = 1, … , 𝑁 (2.9) Trong đó: 𝑒 𝑘 ∈ 𝑅 là những biến sai số, 𝛾 > 0 biểu thị một hằng số ổn định

Hàm Lagrangian được thể hiện như sau:

Trong đó, 𝛼 𝑘 là nhân tử Lagrange

Các điều kiện để tối ưu:

Sau khi e và w được loại bỏ, thu được hệ phương trình tuyến tính như sau:

Hàm hạt nhân được áp dụng như sau:

Mô hình kết quả LSSVM cho hàm dự đoán được thể hiện như sau:

Trong đó, 𝛼 𝑘 và b là kết quả từ hệ phương trình tuyến tính (2.12) Hàm hạt nhân RBF (Radial basic function) thường được sử dụng nhất và được biểu diễn như sau [20]:

Trong đó 𝜎 là tham số hạt nhân (Kernel parameter)

Trong trường hợp của hạt nhân Hàm cơ sở hướng tâm, có hai tham số điều chỉnh (γ, σ) cần được xác định trong LSSVM Tham số chính quy hóa (γ) kiểm soát hình phạt được áp dụng đối với các điểm dữ liệu sai lệch khỏi hàm hồi quy Trong khi đó, tham số hạt nhân (σ) ảnh hưởng đến độ trơn của hàm hồi quy Lưu ý rằng cần phải thiết lập thích hợp các thông số điều chỉnh này để đảm bảo hiệu suất mong muốn của mô hình dự đoán [31]

2.5.2 Ưu điểm và nhược điểm

Một số ưu điểm của LS-SVM có thể được kể đến như sau:

- Thuật toán này có tính tổng quát hóa tốt, nó có thể xử lý tốt đối với loại dữ liệu nhiễu [33] [31]

- Chi phí tính toán của LS-SVM thấp hơn nhiều so với các kỹ thuật trí tuệ nhân tạo khác như Máy véc-tơ hỗ trợ (SVM) và Mạng thần kinh nhân tạo (ANN) Bởi vì trong quá trình đào tạo của mô hình sử dụng thuật toán LS-SVM, tập hợp các phương trình tuyến tính có thể được LS-SVM giải một cách hiệu quả hơn bằng các phương pháp lặp lại đơn giản [31]

- LS-SVM đem lại kết quả dự đoán có hiệu quả tốt hơn Mạng thần kinh nhân tạo

ANN, bởi vì quá trình huấn luyện của ANN đạt được thông qua một thuật toán giảm dần độ dốc trên không gian lỗi, thuật toán này rất phức tạp và có thể chứa nhiều điểm cực tiểu cục bộ [34]

- LS-SVM có ít tham số hiệu chỉnh hơn so với ANN [35]

- LS-SVM có thể xử lý các quan hệ ánh xạ phức tạp, do đó nó rất phù hợp để giải quyết các vấn đề không được xác định rõ hoặc không có cấu trúc điển hình tương tự như là các vấn đề trong lĩnh vực quản lý xây dựng [33]

Bên cạnh đó, việc sử dụng LS-SVM vẫn còn tồn tại một số trở ngại đáng kể khi như [31]:

- Để triển khai LS-SVM, các tham số chính quy cần được thiết lập thích hợp nhằm kiểm soát những giải pháp xử lý đối với các điểm sai lệch dữ liệu so với chức năng hồi quy và tham số hạt nhân (Kernel parameter), việc này liên quan đến tính trơn của chức năng hồi quy của thuật toán

- Việc cài đặt tham số của LS-SVM là một vấn đề phụ thuộc Điều này yêu cầu nhiều quy trình kinh nghiệm đúc kết từ quá trình thử và tìm ra lỗi

- Đối với việc học không cân bằng đặc biệt là các trường hợp dự đoán chuỗi thời gian, LS-SVM vẫn chưa xử lý được hiệu quả

- LS-SVM chưa xử lý tốt với các tập dữ liệu không chính xác thu được từ việc phán đoán của con người.

THUẬT TOÁN TIẾN HÓA VI PHÂN

Thuật toán tiến hóa vi phân (Differential evolution - DE) là một trong những thuật toán tiến hóa mạnh mẽ áp dụng cho việc giải các bài toán tối ưu hóa phức tạp, được phát triển bởi Storn và Price [36] Mục đích của thuật toán là từ một quần thể bao gồm nhiều cá thể được khởi tạo ngẫu nhiên, những cá thể mới được sản sinh ra đồng thời đấu tranh chọn lọc với những cá thể cũ Những cá thể trong quần thể được đánh giá thông qua một hàm mục tiêu f(x) được định nghĩa bằng một vấn đề tối ưu hóa cụ thể Những cá thể tốt sẽ được giữ lại đến các thế hệ sau, đồng thời, các cá thể kém hơn sẽ bị tiêu diệt Quá trình chọn lọc này tương tự như quá trình chọn lọc tự nhiên được đề cập trong học thuyết tiến hóa của nhà bác học Charles Robert Darwin

Thuật toán DE thường bao gồm bốn giai đoạn là khởi tạo (initialization), đột biến véc-tơ đột biến thường được sử dụng nhất là DE/rand/1 và DE/best/1 như sau [38]:

Trong đó, r1, r2, và r3 là 3 số nguyên được lấy ngẫu nhiên trong đoạn [1; N], chúng được tạo ra sao cho không trùng với thứ tự i của véc-tơ mẹ; F là biên độ đột biến được xác định theo phân phối chuẩn N(0.5; 0.22) [39]; X best là cá thể tốt nhất của quần thể

Quá trình đột biến theo DE/rand/1 (2.17) có khuynh hướng khai phá không gian tìm kiếm, điều này giúp cho thuật toán hạn chế rơi vào vùng tối ưu cục bộ, nhưng làm chậm quá trình hội tụ của thuật toán [38] Quá trình đột biến theo DE/best/1 (2.18) có xu hướng khai thác giá trị Xbest đã tìm được, đột biến theo phương thức này có khuyết điểm là thuật toán dễ rơi vào vùng tối ưu cục bộ khi bài toán tìm kiếm là phức tạp nhưng ngược lại giúp thuật toán hội tụ nhanh [39]

Mục tiêu của giai đoạn lai ghép này là trao đổi các thành phần của véc-tơ đột biến và véc- tơ mẹ nhằm mục đích tăng tính đa dạng cho quần thể hiện tại Giai đoạn này tạo ra véc-tơ con U i,g và thành phần thứ j của nó, ký là hiệu U j,i,g , được tạo ra theo phương pháp sau [36]:

Trong đó, rnb(i) là một số thực được khởi tạo ngẫu nhiên trong đoạn [1;P]; Cr là xác xuất lai ghép, thông thường lấy bằng 0.8; U j,i,g+1 là một số thực ngẫu nhiên thuộc [0;1]

Trong giai đoạn chọn lọc, các cá thể véc-tơ mẹ X i,g và véc-tơ con U i,g được so sánh với nhau, hàm mục tiêu của cá thể véc-tơ nào có giá trị tốt hơn sẽ được giữ lại, ngược lại, sẽ bị loại bỏ, Xi,g+1 biểu thị véc-tơ mục tiêu trong thế hệ tiếp theo như công thức sau:

2.6.2 Ưu điểm và nhược điểm

Một số ưu điểm của DE có thể được kể đến như sau [36] [40] [41]:

(mutation), lai ghép (crossover) và chọn lọc (selection); toàn bộ quá trình được lặp lại cho đến khi điều kiện kết thúc được thỏa mãn, nhằm tìm ra giải pháp tốt nhất cho vấn đề cần xử lý, các giai đoạn của DE được mô tả theo lưu đồ dưới đây [37]:

Hình 2.10 Lưu đồ thuật toán Differential evolution (DE) [38]

Thông thường, số lượng cá thể được lấy trong khoảng P = 4D ÷ 8D Trong đó, P là số lượng cá thể trong quần thể, D là số biến thiết kế Thuật toán được xem là tối ưu khi điều kiện về số thế hệ tối đa G được thỏa mãn

Một cá thể được đại diện bằng một véc-tơ và số biến thiết kế D chính bằng số thành phần của véc-tơ chính đó Vì vậy, một quần thể gồm nhiều cá thể được đại diện bằng một ma trận PxD Việc khởi tạo một cách ngẫu nhiên những cá thể của quần thể đầu tiên được thể hiện như sau:

Trong đó, i = 1, 2,…, P là số thứ tự cá thể trong quần thể; mj là số thực được khởi tạo ngẫu nhiên nằm trong khoảng [0, 1] đại diện cho một biến ngẫu nhiên có phân phối đều; j = 1, 2,…, D với D là số biến cần tìm; LBj và UBj tương ứng là hai vectơ giới hạn dưới và giới hạn trên của các biến

Với mỗi véc-tơ mẹ được đại diện bằng một véc-tơ X ở thế hệ g hiện tại, một véc-tơ đột biến V i,g+1 được tạo ra bằng nhiều phương pháp [37], trong đó có hai phương pháp khởi tạo

1 Khởi tạo 2 Đột biến 3 Lai ghép 4 Chọn lọc

Nhân tố biên độ đột biến F

Giải pháp tối ưu Xác xuất lai ghép Cr

Sự đánh giá giá trị phù hợp

- DE không yêu cầu bất kỳ giả thiết nào về quyền lợi ưu tiên ban đầu và nó có thể tìm kiếm trong không gian rất lớn của tập hợp các lựa chọn được đề ra

- DE không sử dụng độ dốc của vấn đề đang được giải quyết Do đó, thuật toán tìm kiểm của DE không yêu cầu bài toán tối ưu hóa phải khác biệt như yêu cầu của các phương pháp tối ưu hóa cổ điển chẳng hạn như phương pháp giảm độ dốc

- DE có thể được sử dụng để giải quyết các vấn đề tối ưu hóa mà không bị gián đoạn, nhiễu và biến động

- Việc áp dụng và hiệu chỉnh được DE thực hiện nhanh chóng và đơn giản

- DE sở hữu khả năng tối ưu hóa tổng quát rất hiệu quả

Tuy nhiên, bên cạnh những ưu điểm vượt trội trên, DE vẫn còn tồn tại một số nhược điểm được liệt kê dưới đây [36] [42]:

- DE thuộc về lớp thuật toán metaheuristic (dạng thuật toán có quy trình tính toán được lặp đi lặp lại nhiều lần để tìm ra giải pháp tối ưu nhất định) Do đó, DE chưa đảm bảo là một sự lựa chọn hữu hiệu nhất về tất cả các khía cạnh như thời gian và bộ nhớ tính toán

PHƯƠNG PHÁP KIỂM CHỨNG CHÉO DỮ LIỆU

Mục tiêu quan trọng của học máy là xây dựng được mô hình dự đoán có khả năng tổng quát hóa tốt nhất Thực tế có nhiều trường hợp bộ dữ liệu huấn luyện ban đầu rất phù hợp với mô hình hồi quy, tuy nhiên khi mô hình hoạt động với một tập dữ liệu mới lại đưa ra kết quả kém, vấn đề này được gọi là sự quá khớp của bộ dữ liệu huấn luyện ban đầu

Do đó, một phương pháp thường được sử dụng trong học máy là kiểm chứng chéo (cross- validation), phương pháp này là một phương pháp lấy mẫu lại dữ liệu được sử dụng rộng rãi để dự đoán lỗi của mô hình và ước lượng hiệu quả của các mô hình học máy, đặc biệt để hạn chế sự quá khớp (overfitting) với mẫu ban đầu

Khi sử dụng phương pháp này, dữ liệu đầu vào được chia thành các fold cho phép một phần dữ liệu đầu vào sử dụng để đào tạo, phần dữ liệu còn lại được dùng để đánh giá hiệu suất mô hình Kết quả hiệu suất mô hình được đánh giá dựa vào kết quả hiệu suất dự đoán trung bình của các tập dữ liệu được lấy mẫu lại sau thông qua phương pháp kiểm chứng chéo

2.7.2 Kỹ thuật kiểm chứng chéo k-fold

Một trong những kỹ thuật thường được sử dụng của phương pháp kiểm chứng chéo dữ liệu là kỹ thuật k-fold Trong kỹ thuật kiểm chứng chéo k-fold, tham số quan trọng trong kỹ thuật này là k, giá trị k này được xác định phụ thuộc vào kích thước của tập dữ liệu Đặc biệt đối với các tập dữ liệu nhỏ, k = 10 thường được xem là một lựa chọn đem lại kết quả tốt Tuy nhiên, tương ứng với số lượng fold càng lớn (giá trị k càng lớn) thì kết quả mô hình dự đoán càng đạt được hiệu suất cao, đồng thời chi phí và thời gian tính toán cũng tăng đồng biến, đặc biệt là đối với các mô hình trí tuệ lai Điều này yêu cầu cần phải cân nhắc lựa chọn một giá trị k có thể ước tính hiệu suất mô hình hiệu quả đồng thời đảm bảo tài nguyên và chi phí trong giới hạn đề ra

Thông qua thực nghiệm, [43] cho rằng giá trị k = 5 có thể mang lại mô hình ước tính đáng tin cậy với sai số dự đoán không đáng kể Bên cạnh đó, [44] cho thấy việc số lần kiểm chứng chéo nên nằm trong khoảng từ năm đến mười lần (k = 5  10) vì hiệu suất mô hình không cải thiện thêm được nhiều đối với một số fold lớn hơn

Trong phạm vi của nghiên cứu, tác giả lựa chọn k = 10 là một giá trị thường được sử dụng trong các nghiên cứu trước đồng thời nhằm đem lại phương sai nhỏ nhất cho mô hình dự đoán [45]

1 Kỹ thuật này sau khi xáo trộn tập dữ liệu một cách ngẫu nhiên, sau đó chia tập dữ liệu thành k = 10 nhóm

2 Chọn 1 nhóm để làm nhóm dữ liệu kiểm tra, 9 nhóm còn lại làm nhóm dữ liệu huấn luyện 1 mô hình tương ứng là 1 fold (thực hiện bước này 10 lần tương ứng với 10 fold dữ liệu cho 10 mô hình)

3 Tiến hành huấn luyện và đánh giá mô hình 10 lần (mỗi lần sử dụng 1 fold dữ liệu khác nhau)

4 Tổng hợp hiệu quả của mô hình từ các số liệu đánh giá, kết quả tổng hợp chính là trung bình hiệu quả của 10 lần đánh giá

Hình 2.11 Kỹ thuật kiểm chứng chéo k-fold cross-validation

Fold 01Fold 02Fold 03Fold 04Fold 05Fold 06Fold 07Fold 08Fold 09Fold 10

PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU SUẤT MÔ HÌNH

Tác giả sử dụng các kỹ thuật sau để đánh giá độ chính xác của quá trình dự đoán của các mô hình:

❖ Kỹ thuật sử dụng hệ số tương quan tuyến tính (R) hoặc hệ số xác định của phương trình hồi quy (R 2 ):

Trong đó, y là giá trị thực tế, y’ là giá trị dự báo và n là số lượng mẫu dữ liệu

Hệ số xác định R 2 dùng để đo mức độ chính xác của biến y’ so với biến y Tác giả dùng hệ số 1-R để đo lường sai số của biến y’ so với y

❖ Kỹ thuật sử dụng phần trăm sai số trung bình tuyệt đối - MAPE (Mean absolute percentage error):

❖ Kỹ thuật sử dụng sai số trung bình tuyệt đối - MAE (Mean absolute error):

❖ Kỹ thuật sử dụng sai số toàn phương trung bình - RMSE (Root mean square errors):

PHƯƠNG PHÁP NGHIÊN CỨU

NỘI DUNG VÀ QUÁ TRÌNH NGHIÊN CỨU

Quá trình nghiên cứu được chia làm 4 bước tương ứng với 4 nội dung chính của nghiên cứu:

- Xác định các yếu tố ảnh hưởng đến năng suất điện năng lượng mặt trời

- Thu thập các dữ liệu đo lường điện năng lượng mặt trời của các dự án điện năng lượng mặt trời ở Việt Nam

- Xây dựng các mô hình bằng các thuật toán trí tuệ nhân tạo, sử dụng kỹ thuật Machine learning;

- Thực hiện huấn luyện các mô hình thông qua công cụ phần mềm MATLAB Sau đó dự đoán kết quả dựa trên bộ dữ liệu kiểm tra và tính toán các thông số đánh giá mô hình; cuối cùng thực hiện phân tích, so sánh, đề xuất mô hình tối ưu

Tổng thể nghiên cứu bao gồm 2 giai đoạn Ở giai đoạn 1, tác giả xác định các nhân tố ảnh hưởng đến năng suất dự án điện mặt trời bằng cách tham khảo và tổng hợp các nhân tố từ các nghiên cứu trong và ngoài nước Sau khi có được bảng tổng hợp các nhân tố ảnh hưởng, tác giả tiến hành tổng hợp dữ liệu đo lường các nhân tố trên được thu thập tại các trạm đo lường điện năng lượng mặt trời ở Việt Nam Ở giai đoạn tiếp theo, tác giả nghiên cứu nắm vững các lý thuyết và xây dựng mô hình dự đoán bằng thuật toán trí tuệ nhân tạo với kỹ thuật học máy thông qua sự hỗ trợ của công cụ phần mềm Matlab Tác giả sử dụng chính các mô hình đó để huấn luyện bộ dữ liệu đo lường năng suất các dự án điện mặt trời đã thu thập được từ các dự án thực tế, mô hình sau khi huấn luyện cho kết quả dự đoán dựa trên bộ dữ liệu kiểm tra Cuối cùng, tác giả tính toán các thông số phục vụ việc đánh giá các mô hình và phân tích đề xuất mô hình tốt ưu nhất Chi tiết 2 giai đoạn nghiên cứu thể hiện ở Hình 3.1

Xác định vấn đề, mục tiêu và phạm vi nghiên cứu Giai đoạn 1

Xác định và tổng hợp các nhân tố ảnh hưởng đến năng suất dự án điện năng lượng mặt trời Tổng hợp dữ liệu đo lường các nhân tố tại các trạm đo lường điện năng lượng mặt trời

Xây dựng các mô hình thông qua ứng dụng Matlab

Thực hiện huấn luyện các mô hình

Xuất kết quả dự đoán và đánh giá hiệu suất các mô hình

So sánh, đề xuất mô hình tối ưu

Hình 3.1 Quá trình nghiên cứu

PHƯƠNG PHÁP THU THẬP DỮ LIỆU

3.2.1 Xác định các nhân tố ảnh hưởng

Những nhân tố ảnh hưởng đến năng suất hệ thống điện năng lượng mặt trời được tác giả tổng hợp và trích dẫn từ các nghiên cứu trước liên quan đến lĩnh vực năng lượng tái tạo trong và ngoài nước, đồng thời sử dụng kết quả của bài báo học viên đã tham gia nghiên cứu [48]

3.2.2 Thu thập dữ liệu đo lường năng suất điện năng lượng mặt trời

Bộ dữ liệu đo lường năng suất điện năng lượng mặt trời được tác giả tổng hợp từ Global Solar Atla và được cung cấp bởi tổ chức The World Bank and the International Finance Corporation Bộ dữ liệu này được đo lường thực tế và công khai kết quả đo lường nhằm phục vụ cho công tác dự đoán năng suất các dự án điện năng lượng mặt trời [46].

CÔNG CỤ NGHIÊN CỨU

Matlab (Matrix Laboratory) là một công cụ phần mềm do công ty MathWorks thiết kế và phát hành, công cụ này cung cấp môi trường lập trình và tính toán số Ngoài ra, với giao diện mạnh mẽ cùng những lợi thế trong kỹ thuật lập trình đáp ứng cho việc giải quyết nhiều vấn đề hết sức đa dạng từ các lĩnh vực kỹ thuật chuyên ngành như: điện, điện tử, điều khiển tự động, vật lý hạt nhân, cho đến các ngành xử lý toán chuyên dụng như kế toán, thống kê, một cách hoàn toàn đơn giản, trực quan mà không đòi hỏi người sử dụng phải có kiến thức lập trình như là những lập trình viên chuyên nghiệp [47]

Ngoài ra, Matlab còn cho phép người dùng thực hiện tính toán số với ma trận, vẽ biểu đồ thông tin hoặc đồ thị hàm số, khởi tạo các giao diện người dùng và có thể liên kết với các chương trình máy tính được viết trên nhiều nền tảng ngôn ngữ lập trình khác

Hiện nay, Matlab có kho thư viện rộng lớn bao gồm hàng nghìn lệnh và hàm tiện ích hỗ trợ Ngoài ra, Matlab còn trang bị các hộp công cụ để mở rộng lập trình sẵn các lệnh và hàm ứng dụng chuyên biệt tập trung giải quyết các bài toán thuộc các lĩnh vực riêng

Luận văn sử dụng phần mềm Matlab để xây dựng các mô hình dự đoán dựa trên các thuật toán trí tuệ nhân tạo nói chung và kỹ thuật học máy nói riêng

Luận văn sử dụng phần mềm Microsoft Excel để tổng hợp số liệu và tính toán so sánh kết quả các mô hình dự đoán Ngoài ra, tác giả đã sử dụng các phần mềm hỗ trợ trong việc thực hiện luận văn như: Microsoft Word, Microsoft Visio, Microsoft PowerPoint Bên cạnh đó, tác giả còn sử dụng phần mềm IBM SPSS để phân tích các nhân tố ảnh hưởng nhằm thực hiện bài báo [48].

THU THẬP DỮ LIỆU VÀ XÂY DỰNG MÔ HÌNH DỰ BÁO

THU THẬP DỮ LIỆU

Căn cứ vào kết quả nghiên cứu tổng hợp, phân tích các nhân tố ảnh hưởng đến năng suất dự án điện năng lượng mặt trời bằng phương pháp khảo sát thực tế dựa trên nguồn dữ liệu các nhân tố từ các nghiên cứu trước và ý kiến đề xuất chuyên gia [48], luận văn trích lại các nhân tố ảnh hưởng đến năng suất dự án điện năng lượng mặt trời (bảng rút gọn 16 nhân tố) để thu thập dữ liệu đo lường nhằm phục vụ việc xây dựng và huấn luyện mô hình dự báo, các nhân tố này được thể hiện trong bảng sau:

Bảng 4.1 Các nhân tố ảnh hưởng nhiều nhất đến năng suất hệ thống điện năng lượng mặt trời (rút gọn)

Khả năng đáp ứng của lưới điện tại địa phương I.10 4.42 1

Cường độ chiếu sáng và cường độ bức xạ năng lượng mặt trời phát ra II.1 4.40 2

Chính sách khuyến khích (giá, quy hoạch, ưu đãi về thuế, giấy phép) của chính phủ I.3 4.36 3 Độ cao địa hình xây dựng I.2 4.34 4

Năng lực, kinh nghiệm đơn vị thiết kế, thi công và vận hành I.8 4.31 5

Năng lực tài chính của Chủ đầu tư I.5 4.22 6

Số giờ nắng trong ngày II.12 4.19 7

Quy mô xây dựng dự án I.7 4.18 8

Năng lực đơn vị quản lý dự án từ giai đoạn nghiên cứ đến khi vận hành nhà máy I.6 4.15 9

Sự khuếch tán bức xạ mặt trời phương ngang II.2 4.13 10

Công nghệ sản xuất/ Chất lượng và độ bền vật liệu tấm pin

(độ giảm hiệu suất làm việc theo thời gian các tế bào quang điện)

Hiệu suất tấm pin (mức độ chuyển hóa quang năng thành điện năng) IV.4 4.05 12

Sự ảnh hưởng của việc lựa chọn loại hình và vị trí lắp đặt của hệ thống điện II.5 4.04 13

Quỹ đất và cơ sở hạ tầng có sẵn của địa phương I.1 4.00 14

Sự ảnh hưởng của nhiệt độ môi trường II.4 4.00 14

Hướng và góc nghiêng của mô-đun tấm pin III.2 3.98 16

Từ vào các nhân tố này, tác giả chọn ra 9 nhân tố để thu thập dữ liệu đo lường dựa trên các yếu tố:

• Bảng xếp hạng mức độ ảnh hưởng của các nhân tố

• Độ tin cậy thang đo của từng nhóm nhân tố (ưu tiên chọn nhóm nhân tố II có hệ số Cronback’s Alpha là 0.901)

• Dễ dàng định lượng thuận tiện cho công tác đo đạc và khảo sát thực tế (nhóm nhân tố I, II, III)

• Sự tư vấn của các chuyên gia

Kết quả tác giả đề xuất sử dụng 9 nhân tố tương ứng với 9 biến để đo lường thể hiện qua bảng sau:

Bảng 4.2 Các nhân tố ảnh hưởng phục vụ việc thu thập dữ liệu đo lường năng suất dự án điện năng lượng mặt trời

Tên biến Đơn vị Loại biến

Sự ảnh hưởng của việc lựa chọn loại hình dự án và vị trí lắp đặt của hệ thống điện II.5 X1 Set Độ cao địa hình xây dựng I.2 X2 m Range

Quy mô xây dựng dự án I.7 X3 kWp Range

Hướng và góc nghiêng của mô-đun tấm pin III.2 X4 o (độ) Range Cường độ chiếu sáng và cường độ bức xạ năng II.1 X5 kWh/m² Range

Tên biến Đơn vị Loại biến lượng mặt trời phát ra

Chiếu xạ ngang toàn cầu (Sự khuếch tán bức xạ mặt trời phương ngang) II.2 X6 kWh/m² Range

Chiếu xạ ngang khuếch tán (Sự khuếch tán bức xạ mặt trời phương ngang) II.2 X7 kWh/m² Range

Sự ảnh hưởng của nhiệt độ môi trường II.4 X8 o C Range

Số giờ nắng trong ngày II.12 X9 h Range

Sản lượng điện quang điện cụ thể hàng năm Y kWh/kWp

Dữ liệu đo lường dựa vào các biến ở Bảng 4.2 được tác giả tổng hợp từ bộ dữ liệu đo lường thực tế của Global Solar Atlas, được cung cấp bởi tổ chức The World Bank and the International Finance Corporation [46], chi tiết bộ dữ liệu này được thể hiện trong phụ lục A.1 của luận văn này.

THỰC HIỆN MÔ HÌNH

4.2.1 Trình tự thực hiện và đánh giá các mô hình

Trình tự các bước thực hiện xây dựng và đánh giá các mô hình:

Bước 1: Trước khi được đưa vào mô hình, dữ liệu đầu vào được phân chia thành 10 fold một cách ngẫu nhiên, mỗi fold gồm 10 nhóm nhỏ (9 nhóm dữ liệu huấn luyện và 1 nhóm dữ liệu kiểm tra)

Bước 2: Thực hiện kiểm chứng chéo dữ liệu bằng kỹ thuật 10-fold cross-validation và huấn luyện các mô hình dựa trên dữ liệu huấn luyện đã chia fold

Bước 3: Tiến hành dự đoán năng suất điện mặt trời sử dụng tập dữ liệu kiểm tra dựa trên và mô hình đã huấn luyện

Bước 4: Tổng hợp sai số và đánh giá các mô hình dự đoán

4.2.2 Quy trình xây dựng các mô hình

Quy trình xây dựng mô hình LSSVM bằng matlab thể hiện qua sơ đồ sau:

Mô hình đào tạo LSSVM

4 Testing for new solar energy project input patterns

Kiểm tra cho dự án NLMT mới

Kiểm chứng chéo dữ liệu

LSSVM training / đào tạo LSSVM validation / xác thực

Mô hình dự đoán LSSVM

Hình 4.1 Sơ đồ trình tự xây dựng mô hình LSSVM

Bước 1: Khởi chạy mô hình và các thông số của thuật toán LSSVM

Bước 2: Đưa dữ liệu huấn luyện đã chia fold vào mô hình đào tạo Mô hình tiến hành đào tạo và xác thực chéo dữ liệu dựa trên việc lần lượt nhập k lần các fold dữ liệu vào mô hình

Bước 3: Xây dựng được mô hình dự đoán dựa trên mô hình thuật toán và bộ dữ liệu huấn luyện ở bước 1 và bước 2

Bước 4: Thực hiện dự đoán năng suất dự án điện NLMT mới dựa vào mô hình dự đoán và bộ dữ liệu kiểm tra

Quy trình xây dựng mô hình DE-LSSVM bằng matlab thể hiện qua sơ đồ sau:

4.Termination Criteria Điều kiện kết thúc

Mô hình dự doán LSSVM

3 Evaluate model using fitness function Đánh giá mô hình sử dụng hàm phù hợp

Thông số được tối ưu

Kiểm chứng chéo dữ liệu

Testing for new solar energy project input patterns

Kiểm tra cho dự án NLMT mới

LSSVM training / đào tạo LSSVM validation / xác thực

Tối ưu hóa Tiến hóa vi phân

Hình 4.2 Sơ đồ trình tự xây dựng mô hình DE-LSSVM

Bước 1: Khởi chạy mô hình và các thông số của thuật toán LSSVM

Bước 2: Đưa dữ liệu huấn luyện đã chia fold vào mô hình đào tạo Mô hình tiến hành đào tạo và xác thực chéo dữ liệu dựa trên việc lần lượt nhập k lần các fold dữ liệu vào mô hình Bước 3: Sử dụng hàm phù hợp để đánh giá mô hình

Bước 4: Kết thúc huấn luyện nếu mô hình thỏa điều kiện 2 thông số 𝛾 𝑣à 𝜎 của thuật toán LSSVM được tối ưu nhất bởi thuật toán DE

Bước 5: Sử dụng mô hình có thông số 𝛾 𝑣à 𝜎 được tối ưu để dự đoán năng suất cho dự án NLMT mới (bộ dữ liệu kiểm tra)

4.2.3 Chia fold kiểm chứng chéo dữ liệu

Với tập dữ liệu gồm 100 mẫu, áp dụng kỹ thuật k-fold, tác giả chia dữ liệu thành 10 nhóm dữ liệu, mỗi nhóm gồm 10 bộ dữ liệu đo lường tại 10 dự án Sau đó chọn ngẫu nhiên 1 nhóm làm tập dữ liệu kiểm tra (testing dataset) và 9 nhóm còn lại làm tập dữ liệu huấn luyện (traning dataset), tương ứng với tỉ lệ Training data / testing data = 9/1

Với cách chia này, sẽ phân loại được 10 trường hợp (fold) khác nhau (mỗi fold gồm 9 training dataset và 1 testing dataset) như hình dưới đây:

Hình 4.3 Chia fold kiểm chứng chéo dữ liệu

Chi tiết bộ dữ liệu huấn luyện và dữ kiệu kiểm tra sau khi chia fold được trình bày trong phụ lục A.2 của luận văn này

4.2.4 Thực hiện mô hình trên phần mềm Matlab

Dữ liệu huấn luyện được tác giả đưa vào mô hình thông qua giao diện phần mềm Matlab, trình tự thực hiện huấn luyện mô hình và xuất kết quả dự đoán bằng phần mềm Matlab thể hiện qua sơ đồ sau:

Nạp mô hình vào phần mềm

Nạp dữ liệu vào phần mềm

4 Traning model and predicting result

Huấn luyện mô hình và dự đoán kết quả

5 Summarize the results and evaluate the model with fold k

Tổng hợp kết quả và đánh giá mô hình ứng với fold k

Training data/Dữ liệu đào tạo Testing data/Dữ liệu kiểm tra

Dữ liệu đã chia fold

6.Termination Criteria Điều kiện kết thúc k = 10 ?

7 Sum the results for the folds

Tổng hợp kết quả ứng với các fold

Hình 4.4 Sơ đồ trình tự thực hiện mô hình trên phần mềm Matlab

Bước 1: Chuẩn bị mô hình, nạp mô hình thuật toán đã được lập trình vào phần mềm Matlab

Bước 2: Chuẩn bị file excel chứa dữ liệu fold thứ k = 1

Bước 3: Chạy file duong_dan.m, nạp file excel fold 1 vào matlab, dữ liệu huấn luyện được nạp vào biến Xtr, Xte, Ytr, Yte, các biến này được lưu trữ trong file InputData.mat

Bước 4: Chạy file interface.m (huấn luyện mô hình và dự đoán cho dữ liệu test) Dữ liệu dự đoán được nạp vào biến Ytr và Yte, các biến này được lưu trữ trong file Predict.mat

Bước 5: Tổng hợp kết quả dự đoán và đánh giá mô hình k, tương ứng với bộ dữ liệu của fold k

Bước 6: Tăng k = k +1 (fold thứ k+1), lặp lại bước 2, 3, 4 và 5 cho đến khi k (tương ứng với fold 10)

Bước 7: Tổng hợp kết quả dự đoán và kết quả đánh giá các fold

Chi tiết trình tự các bước thực hiện mô hình trên phần mềm Matlab dựa trên bộ dữ liệu kiểm tra của từng fold được thể hiện chi tiết trong PHỤ LỤC B của luận văn này.

KẾT QUẢ ĐÁNH GIÁ CÁC MÔ HÌNH

4.3.1 Kết quả đánh giá mô hình LSSVM

Kết quả chỉ số đánh giá mô hình với các tập dữ liệu kiểm tra (testing dataset) được thể hiện qua bảng sau:

Bảng 4.3 Kết quả đánh giá hiệu suất mô hình mô hình LSSVM với các tập dữ liệu kiểm tra

Trung bình 0.020 0.011 15.541 22.631 4.3.2 Kết quả đánh giá mô hình LSSVM kết hợp DE

Kết quả chỉ số đánh giá mô hình với các tập dữ liệu kiểm tra (testing dataset) được thể hiện qua bảng sau:

Bảng 4.4 Kết quả đánh giá hiệu suất mô hình LSSVM kết hợp DE với các tập dữ liệu kiểm tra

TỔNG HỢP VÀ NHẬN XÉT KẾT QUẢ ĐÁNH GIÁ CÁC MÔ HÌNH

Từ các kết quả đánh giá trên, tác giả tổng hợp được bảng so sánh kết quả đánh giá các mô hình như sau:

Bảng 4.5 Tổng hợp kết quả đánh giá hiệu suất các mô hình

Kết quả so sánh hiệu suất 2 mô hình trên thể hiện rõ mô hình dự đoán năng suất dự án điện năng lượng mặt trời có hiệu suất vượt trội hơn là mô hình sử dụng thuật toán LSSVM kết hợp thuật toán DE với chỉ số 1-R, MAPE, MAE và RMSE lần lượt là 0.004, 0.005, 6.381, 10.259, tất cả các chỉ số đều vượt trội hơn so với mô hình còn lại chỉ sử dụng thuật toán LSSVM với các chỉ số tương ứng lần lượt là 0.02, 0.011, 15.541 và 22.631 (giá trị các chỉ số càng lớn chứng tỏ sai số giữa kết quả dự đoán và kết quả thực tế càng nhiều) Điều này thể hiện rõ ràng rằng mô hình sử dụng thuật toán LSSVM kết hợp với thuật toán DE có hiệu suất dự đoán năng suất điện năng lượng mặt trời tốt hơn hẳn so với mô hình chỉ sử dụng thuật toán LSSVM.

Ngày đăng: 31/07/2024, 09:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN