1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Quản lý xây dựng: Mô hình tự động máy hỗ trợ véc-tơ ước lượng năng suất điện năng lượng mặt trời

94 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM

Trang 2

CÔNG fTRÌNH fKHOA fHỌC fĐƯỢC fHOÀN fTHÀNH fTẠI TRƯỜNG fĐẠI fHỌC fBÁCH fKHOA

ĐẠI fHỌC fQUỐC fGIA fTPHCM

Cán fbộ fHướng fdẫn fkhoa fhọc f1: fTS. fNguyễn fĐăng fTrình

Cán fbộ fHướng fdẫn fkhoa fhọc f2: fPGS.TS. fTrần fĐức fHọc

Cán fbộ fchấm fphản fbiện f1: fPGS TS Lương Đức Long

Cán fbộ fchấm fphản fbiện f2: fTS Nguyễn Thanh Việt

Luận fvăn fthạc fsĩ fđược fbảo fvệ ftại fTrường fĐại fhọc fBách fKhoa, fĐHQG fTP. fHCM fngày 16tháng 01fnăm f2022

Thành fphần fHội fđồng fđánh fgiá fluận fvăn fthạc fsĩ fgồm: f

1 Chủ ftịch: TS Đỗ Tiến Sỹ

2 Thư fký: TS Trần Nguyễn Ngoc Cương 3 Ủy fviên: PGS TS Phạm Anh Đức 4 Phản fbiện f1: PGS TS Lương Đức Long 5 Phản fbiện f2: TS Nguyễn Thanh Việt

Xác fnhận fcủa fChủ ftịch fHội fđồng fđánh fgiá fLuận fvăn fvà fTrưởng fKhoa fquản flý fchuyên fngành

fsau fkhi fluận fvăn fđã fđược fsửa fchữa f(nếu fcó)

KỸ THUẬT XÂY DỰNG

TS ĐỖ TIẾN SỸ

Trang 3

ĐẠI fHỌC fQUỐC fGIA fTP. fHCM CỘNG fHÒA fXÃ fHỘI fCHỦ fNGHĨA fVIỆT fNAM TRƯỜNG fĐẠI fHỌC fBÁCH fKHOA Độc fLập f– fTự fDo f– fHạnh fPhúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ fvà ftên fhọc fviên : fNguyễn fPhúc fHạnh MSHV : f1970320 Ngày ftháng fnăm fsinh : f14/12/1993 Nơi fsinh : fLâm fĐồng Chuyên fngành : fQuản flý fxây fdựng Mã fsố f : f8580302 f

I. fTÊN fĐỀ fTÀI:

MÔ fHÌNH fTỰ fĐỘNG fMÁY fHỖ fTRỢ fVÉC-TƠ fƯỚC fLƯỢNG fNĂNG fSUẤT fĐIỆN

fNĂNG fLƯỢNG fMẶT fTRỜI

II. fNHIỆM fVỤ fVÀ fNỘI fDUNG

- Phân ftích fsự fảnh fhưởng fcác fnhân ftố fảnh fhưởng fđến fnăng fsuất fđiện fnăng flượng fmặt ftrời

- Xây fdựng fmô fhình tối ưu fmáy fhỗ ftrợ fvéc-tơ fđể fước flượng fnăng fsuất fdự fán fđiện fnăng

flượng fmặt ftrời

III. fNGÀY fGIAO fNHIỆM fVỤ : f21/09/2020

IV. fNGÀY fHOÀN fTHÀNH fNHIỆM fVỤ : f05/01/2022

Trang 4

LỜI CẢM ƠN

Lời đầu tiên, tôi xin dành lời cảm ơn chân thành và sâu sắc đến TS Nguyễn Đăng Trình và PGS TS Trần Đức Học, cảm ơn quý Thầy đã tận tình hướng dẫn giúp tôi trau dồi được nhiều kiến thức quý báu trong suốt thời gian thực hiện luận văn, đồng thời sự hướng dẫn tận tâm của quý Thầy còn là một phần rất quan trọng giúp tôi hoàn thành thành công bài luận văn này

Bên cạnh đó, xin cảm ơn các anh chị, bạn bè cùng khóa K2019 và các đồng nghiệp cùng các chuyên gia trong ngành Quản lý xây dựng nói chung đã giúp đỡ, chia sẻ kinh nghiệm và trao đổi nhiều kiến thức, đồng thời nhiệt tình tham gia bài khảo sát, điều này góp sức to lớn hỗ trợ tôi hoàn thành giai đoạn khảo sát dữ liệu phục vụ cho nghiên cứu trong luận văn này

Cuối cùng, tôi xin dành lời cảm ơn chân thành nhất gửi đến quý Thầy Cô giáo đang công tác tại khoa Kỹ thuật xây dựng – bộ môn Thi công và Quản lý xây dựng nói riêng và toàn bộ quý Thầy Cô đang công tác tại trường Đại học Bách Khoa – Đại học Quốc gia Tp.HCM nói chung đã tận tâm truyền đạt vô số kiến thức bổ ích trong suốt thời gian gần hai năm tôi học chương trình cao học tại trường

Tôi kính gửi lời chúc sức khỏe và thành công đến tất cả quý Thầy Cô, anh chị chuyên gia, đồng nghiệp, bạn bè của tôi Sự giúp đỡ của mọi người là một phần to lớn cho sự thành công của luận văn này

Tp.HCM, ngày 16 tháng 01 năm 2022

Tác giả luận văn

Nguyễn Phúc Hạnh

Trang 5

TÓM TẮT

Nhu cầu năng lượng điện của Việt Nam nói riêng và toàn cầu nói chung ngày càng tăng theo xu hướng của sự phát triển kinh tế toàn cầu Trong khi đó, trước sự hạn chế của các nguồn tài nguyên năng lượng điện khác, sự phát triển của năng lượng tái tạo đặc biệt là năng lượng điện mặt trời là điều tất yếu

Để lên kế hoạch xây dựng các dự án điện năng lượng mặt trời, điều tiên quyết là nhà đầu tư cần khảo sát được năng suất dự án trước khi quyết định đầu tư Tác giả thực hiện nghiên cứu này nhằm giúp nhà đầu tư xác định và xếp hạng mức độ ảnh hưởng của các nhân tố đến năng suất của dự án điện năng lượng mặt trời ở Việt Nam Kết quả nghiên cứu này nhằm mục đích giúp nhà đầu tư ước lượng được năng suất sản xuất điện năng lượng mặt trời căn cứ vào các thông số có thể đo lường trước của dự án trước khi tiến hành đầu tư xây dựng dự án mới

Ở các nghiên cứu trước, đã có nhiều công cụ được sử dụng để ước lượng được năng suất dự án điện năng lượng mặt trời Trong đó, việc sử dụng các thuật toán trí tuệ nhân tạo đem lại hiệu quả rất tốt và đã được kiểm chứng thông qua nhiều nghiên cứu trước đây Trong nghiên cứu này, thuật toán Least Square Support Vector Machine (LSSVM) – một phiên bản điều chỉnh của máy hỗ trợ véc-tơ (SVM) nhằm tăng hiệu suất và thuật toán Tiến hóa vi phân (Differential Evolution - DE) đã được sử dụng để xây dựng mô hình dự đoán dựa trên môi trường tính toán của phần mềm Matlab

Để việc dự đoán đạt được hiệu quả, nghiên cứu đã sử dụng nguồn dữ liệu năng suất điện mặt trời được đo lường tại các dự án điện năng lượng mặt trời ở các tỉnh thành trải dài từ Nam ra Bắc ở Việt Nam Ngoài ra, trong quá trình đào tạo, nghiên cứu đã sử dụng phương pháp kiểm chứng chéo 10-fold để giảm thiểu sai số tối đa liên quan đến việc lấy mẫu ngẫu nhiên Hiệu suất các mô hình được đánh giá thông qua các chỉ số R, RMSE, MAPE và MAE Kết quả thu được đối với mô hình có kết hợp cả hai thuật toán trên đem lại hiệu quả vượt trội hơn hẳn so với mô hình chỉ sử dụng thuật toán Least square support vector machine Từ đó, nghiên cứu đề xuất sử dụng mô hình sử dụng thuật toán Least square support vector machine kết hợp với tiến hóa vi phân để dự đoán năng suất dự án điện năng lượng mặt trời trong giai đoạn nghiên cứu tiền khả thi dự án đầu tư, đồng thời còn đóng góp nguồn dữ liệu cho các nghiên cứu kế tiếp trong tương lai

Trang 6

ABSTRACT

The demand for electric energy in Vietnam in particular and globally in general is increasing in line with the trend of global economic development Meanwhile, in the face of the limitation of other electric energy resources, the development of renewable energy, especially solar power, is inevitable

In oder to plan the construction of solar power projects, it is a prerequisite that investors need to survey the project's productivity before deciding to invest The author conducted this study to help investors identify and rank the degree of influence of factors on the productivity of solar power projects in Viet Nam The results of this study aim to help investors estimate solar power production capacity based on predictable parameters of the project before investing in building a new project

In previous studies, many tools were used to estimate the productivity of solar power projects In particular, the use of artificial intelligence algorithms brings very good results and has been verified through previous studies In this study, the Least Square Support Vector Machine (LSSVM) algorithm - a modified version of the Support Vector Machine (SVM) to increase performance and Differential Evolution (DE) algorithm was used to build the predictive model based on the computing environment of Matlab software

In order to achieve efficient prediction results, the study used data sources of solar power productivity measured at solar power projects in provinces stretching from South to North in Vietnam In addition, during training, the study used 10-fold cross-validation to minimize the maximum error associated with random sampling Model performance is evaluated through R, RMSE, MAPE and MAP indexes The results obtained for the model with the combination of both algorithms are much better than the model using only the Least square support vector machine algorithm From there, the study proposes to use a model using the Least square support vector machine algorithm combined with differential evolution to predict the productivity of solar power projects in the pre-feasibility study phase of the first project and also contribute data sources for future studies

Trang 7

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này là công trình nghiên cứu cho chính cá nhân tôi thực hiện dưới sự hướng dẫn của Thầy TS Nguyễn Đăng Trình và Thầy PGS TS Trần Đức Học Các số liệu và kết luận được trình bày trong luận văn này hoàn toàn trung thực và chưa được công bố trong các ấn phẩm khoa học trước đây

Ngoài ra, trong luận văn có sử dụng các nhận xét và kết quả nghiên cứu của các tác giả, tổ chức trong và ngoài nước, các nội dung này đều được trích dẫn nguồn gốc một cách rõ ràng

Tp.HCM, ngày 16 tháng 01 năm 2022

Nguyễn Phúc Hạnh

Trang 8

MỤC LỤC

NHIỆM VỤ LUẬN VĂN THẠC SĨ i

LỜI CẢM ƠN ii

CHƯƠNG 2 - TỔNG QUAN VÀ CƠ SỞ LÝ THUYẾT 4

2.1 TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN 4

2.1.1 Tổng quan năng lượng điện trên thế giới 4

2.1.2 Tổng quan năng lượng điện trong nước 5

2.1.3 Khái niệm tổng quan về điện năng lượng mặt trời 7

2.2 TÌNH HÌNH NGHIÊN CỨU 8

2.3 TỔNG QUAN CÁC THUẬT TOÁN TRÍ TUỆ NHÂN TẠO 11

2.3.1 Các khái niệm về thuật toán trí tuệ nhân tạo 11

2.3.2 Khái niệm học máy (Machine Learning) 12

2.4 THUẬT TOÁN MÁY HỖ TRỢ VÉC-TƠ 13

2.5 THUẬT TOÁN LEAST SQUARE SUPPORT VECTOR MACHINE 15

2.5.1 Khái niệm 15

2.5.2 Ưu điểm và nhược điểm 17

2.6 THUẬT TOÁN TIẾN HÓA VI PHÂN 18

2.6.1 Khái niệm 18

2.6.2 Ưu điểm và nhược điểm 20

2.7 PHƯƠNG PHÁP KIỂM CHỨNG CHÉO DỮ LIỆU 22

Trang 9

2.7.1 Khái niệm 22

2.7.2 Kỹ thuật kiểm chứng chéo k-fold 22

2.8 PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU SUẤT MÔ HÌNH 24

CHƯƠNG 3 - PHƯƠNG PHÁP NGHIÊN CỨU 25

3.1 NỘI DUNG VÀ QUÁ TRÌNH NGHIÊN CỨU 25

3.2 PHƯƠNG PHÁP THU THẬP DỮ LIỆU 26

3.2.1 Xác định các nhân tố ảnh hưởng 26

3.2.2 Thu thập dữ liệu đo lường năng suất điện năng lượng mặt trời 26

3.3 CÔNG CỤ NGHIÊN CỨU 27

4.2.1 Trình tự thực hiện và đánh giá các mô hình 30

4.2.2 Quy trình xây dựng các mô hình 31

4.2.3 Chia fold kiểm chứng chéo dữ liệu 33

4.2.4 Thực hiện mô hình trên phần mềm Matlab 34

4.3 KẾT QUẢ ĐÁNH GIÁ CÁC MÔ HÌNH 35

4.3.1 Kết quả đánh giá mô hình LSSVM 35

4.3.2 Kết quả đánh giá mô hình LSSVM kết hợp DE 36

4.4 TỔNG HỢP VÀ NHẬN XÉT KẾT QUẢ ĐÁNH GIÁ CÁC MÔ HÌNH 37

CHƯƠNG 5 - KẾT LUẬN 38

5.1 KẾT LUẬN 38

5.2 ĐỀ XUẤT HƯỚNG NGHIÊN CỨU TIẾP THEO 39

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ 40

TÀI LIỆU THAM KHẢO 41

PHỤ LỤC 46

PHỤ LỤC A - DỮ LIỆU NGHIÊN CỨU 46

A.1 Dữ liệu đo lường 46

A.2 Dữ liệu đo lường sau khi chia fold 51

PHỤ LỤC B – TRÌNH TỰ THỰC HIỆN MÔ HÌNH TRONG PHẦN MỀM MATLAB 53

Trang 10

PHỤ LỤC C - KẾT QUẢ DỰ ĐOÁN NĂNG SUẤT DỰ ÁN ĐIỆN NĂNG LƯỢNG MẶT TRỜI VÀ ĐÁNH GIÁ MÔ HÌNH DỰA TRÊN BỘ DỮ LIỆU KIỂM TRA 58

C.1 Kết quả dự đoán và chỉ số đánh giá của mô hình sử dụng thuật toán LSSVM 58C.2 Kết quả dự đoán và chỉ số đánh giá của mô hình sử dụng thuật toán LSSVM kết hợp DE 68PHỤ LỤC D - MÔ HÌNH THUẬT TOÁN 78LÝ LỊCH TRÍCH NGANG 81

Trang 11

DANH MỤC HÌNH ẢNH

Hình 2.1 Tỷ lệ năng lượng tái tạo ước tính của tổng mức tiêu thụ năng lượng 2018 [4] 4

Hình 2.2 Bản đồ tiềm năng năng lượng quang điện trên thế giới 5

Hình 2.3 Bản đồ tiềm năng năng lượng quang điện ở Việt Nam 6

Hình 2.4 Các dự án điện năng lượng mặt trời được lên kế hoạch ở Việt Nam [49] 7

Hình 2.5 Các bước cơ bản trong quy trình làm việc với AI [23] 11

Hình 2.6 Quan hệ trí tuệ nhân tạo và học máy [24] 13

Hình 2.7 Phân loại kỹ thuật học máy (Machine Learning) [24] 13

Hình 2.8 Ống bán kính ε [29] 14

Hình 2.9 Ống bán kính ε khi hàm xấp xỉ f thu được là tuyến tính 14

Hình 2.10 Lưu đồ thuật toán Differential evolution (DE) [38] 19

Hình 2.11 Kỹ thuật kiểm chứng chéo k-fold cross-validation 23

Hình 3.1 Quá trình nghiên cứu 26

Hình 4.1 Sơ đồ trình tự xây dựng mô hình LSSVM 31

Hình 4.2 Sơ đồ trình tự xây dựng mô hình DE-LSSVM 32

Hình 4.3 Chia fold kiểm chứng chéo dữ liệu 33

Hình 4.4 Sơ đồ trình tự thực hiện mô hình trên phần mềm Matlab 34

Trang 12

DANH MỤC BẢNG BIỂU

Bảng 2.1 Công suất các nguồn năng lượng tái tạo khai thác ở Việt Nam 2018 [8] 6Bảng 4.1 Các nhân tố ảnh hưởng nhiều nhất đến năng suất hệ thống điện năng lượng mặt trời (rút gọn) 28Bảng 4.2 Các nhân tố ảnh hưởng phục vụ việc thu thập dữ liệu đo lường năng suất dự án điện năng lượng mặt trời 29Bảng 4.3 Kết quả đánh giá hiệu suất mô hình mô hình LSSVM với các tập dữ liệu kiểm tra 35Bảng 4.4 Kết quả đánh giá hiệu suất mô hình LSSVM kết hợp DE với các tập dữ liệu kiểm tra 36Bảng 4.5 Tổng hợp kết quả đánh giá hiệu suất các mô hình 37

Trang 13

DANH MỤC TỪ VIẾT TẮT

AI: Trí tuệ nhân tạo (Artificial Intelligence)

SVM: Máy hỗ trợ véc-tơ (Support Vector Machine) SVM: Hỗ trợ véc-tơ hồi quy (Support Vector Regression) LSSVM: Least Square Support Vector Machine

DE: Tiến hóa vi phân (Differential Evolution)

EFA: Phân tích nhân tố khám phá (Exploratory Factor Analysis)

SPSS: Statistical Package for the Social Sciences

R: Hệ số tương quan tuyến tính

RMSE: sai số toàn phương trung bình (Root mean square errors):

MAPE: phần trăm sai số trung bình tuyệt đối (Mean absolute percentage error)

MAE: sai số trung bình tuyệt đối (Trung bình của sai biệt tuyệt đối)

Trang 14

CHƯƠNG 1 - GIỚI THIỆU CHUNG 1.1 ĐẶT VẤN ĐỀ

Trước tình trạng dân số thế giới ngày càng tăng, đồng thời nền kinh tế toàn cầu phát triển mạnh mẽ, nhu cầu sử dụng năng lượng ngày càng tăng là một điều tất yếu, bên cạnh đó nguồn nhiên liệu hóa thạch đang dần cạn kiệt theo từng ngày Điều này là một trong những lý do dẫn đến việc năng lượng tái tạo đã được thiết lập trên toàn cầu như một nguồn phát điện chính trong khoảng một thập kỷ qua [1]

Trong khi đó, nguồn năng lượng thủy điện từ các nhà máy thủy điện ngày càng bị hạn chế do sự tác động tới môi trường trong suốt quá trình khai thác lâu dài Các nghiên cứu trước đây đã chứng minh rằng các nguồn năng lượng tái tạo, đặc biệt là năng lượng mặt trời và gió, có thể là những lựa chọn thay thế phù hợp cho các nguồn năng lượng truyền thống để đáp ứng nhu cầu toàn cầu và bảo vệ môi trường khí quyển [2]

Tỷ trọng năng lượng tái tạo trong sản xuất điện tiếp tục tăng trên khắp thế giới trong những năm gần đây, với nhu cầu ngày càng tăng về năng lượng tái tạo nói riêng và năng lượng điện nói chung trên toàn thế giới dẫn đến cuộc khủng hoảng năng lượng toàn cầu Điều này đã thúc đẩy nhiều nhà khoa học tham gia điều tra, nghiên cứu phát triển nhiều nguồn năng lượng tái tạo khác nhau, đặc biệt là năng lượng mặt trời đồng thời phát triển các phương pháp, kỹ thuật chuyển đổi bức xạ mặt trời thành điện năng nhằm mang lại hiệu suất tối ưu [3]

Việc dự báo sản lượng điện năng lượng mặt trời bị ảnh hưởng bởi nhiều yếu tố như điều kiện thời tiết, vị trí lắp đặt, môi trường xung quanh, loại hình và quy mô dự án khác nhau, Do đó, việc dự báo chính xác sản lượng điện mặt trời là khá khó khăn, rất cần thiết trong việc tối ưu sử dụng nguồn tài nguyên này và cực kỳ quan trọng đối với nền công nghiệp điện mặt trời đồng thời là căn cứ thúc đẩy sự triển khai trên quy mô lớn

Có nhiều phương pháp khác nhau đã được áp dụng để dự báo các nguồn năng lượng mặt trời [2] Hiện nay các thuật toán trí tuệ nhân tạo (Artificial Intelligence - AI) được ứng dụng rất rộng rãi trong quản lý xây dựng với khả năng “học” từ các dữ liệu trong quá khứ Đối với hệ thống điện mặt trời, AI có thể tham gia vào tất cả các khía cạnh của việc thiết kế hệ thống quang điện như điều khiển, giám sát và nghiên cứu nhằm hướng tới các hệ thống quang điện thông minh trong tương lai [3]

Trang 15

Việc ứng dụng trí tuệ nhân tạo tự động hóa quá trình ước lượng năng suất điện mặt trời thông qua công suất sản sinh quang điện dựa trên các số liệu đo đạc thực tế và yếu tố ảnh hưởng khách quan không chỉ để tăng hiệu quả dự báo, mà còn để loại trừ các yếu tố sai sót do các yếu tố chủ quan do không lường hết các điều kiện ảnh hưởng khi ước lượng bằng các phương pháp tính toán truyền thống thông thường

Trong những thuật toán trí tuệ nhân tạo được sử dụng phổ biến hiện nay, phương pháp học máy (Machine Learning) sử dụng kỹ thuật học có giám sát (Supervised Learning) là một trong những phương pháp được sử dụng nhiều trong các nghiên cứu khoa học trong lĩnh vực khai phá dữ liệu Căn cứ vào đó, đồng thời dựa trên các nghiên cứu trước, tác giả nhận thấy việc sử dụng thuật toán Least Square Support Vector Machine (LSSVM) là một phiên bản điều chỉnh của thuật toán Máy hỗ trợ véc-tơ (Support Vector Machine) kết hợp với thuật toán Tiến hóa vi phân (Differential Evolution) trên mang lại hiệu quả cao trong các vấn đề của lĩnh vực khai phá dữ liệu, luận văn đề xuất sử dụng kết hợp hai thuật toán này để xây dựng, thực hiện và đánh giá mô hình dự đoán năng suất dự án điện năng lượng mặt trời

Để mô hình dự đoán đạt hiệu quả cao, luận văn tổng hợp và sử dụng một số kết quả nghiên cứu của các nghiên cứu trước và sử dụng tập dữ liệu được thu thập từ những nguồn dữ liệu đo lường thực tế uy tín có thể được sử dụng cho các nghiên cứu khoa học

1.3 PHẠM VI NGHIÊN CỨU

Về phạm vi địa lý, các dự án điện năng lượng mặt trời được nghiên cứu trong nước Việt Nam, được tổng hợp đầy đủ ở tất cả các vùng khí hậu khác nhau

Trang 16

Loại hình các dự án điện năng lượng mặt trời được khảo sát trải đều ở 4 loại hình dự án được xây dựng phổ biến hiện tại như: hệ thống điện mặt trời trên mái nhà dân dụng, hệ thống điện mặt trời trên mái nhà công nghiệp, hệ thống nhà máy điện năng lượng mặt trời trên mặt đất, hệ thống nhà máy điện năng lượng mặt trời trên mặt nước

Về phương pháp nghiên cứu, luận văn sử dụng các thuật toán trí tuệ nhân tạo nói chung và sử dụng kỹ thuật học máy nói riêng, cụ thể luận văn nghiên cứu sử dụng thuật toán LSSVM và DE để dự đoán năng suất dự án điện năng lượng mặt trời

1.4 ĐÓNG GÓP NGHIÊN CỨU 1.4.1 Đóng góp về mặt học thuật

Nghiên cứu tổng hợp bộ dữ liệu đo lường thực tế gồm 100 dự án điện năng lượng mặt trời ở Việt Nam trải khắp đất nước từ Miền Bắc vào Miền Nam Bên cạnh đó, nghiên cứu còn đóng góp mô hình thuật toán học máy LSSVM và tiến hóa vi phân (DE) được xây dựng trên phần mềm Matlab, đồng thời chỉ ra kết quả đánh giá mô hình sử dụng thuật toán LSSVM kết hợp DE là tối ưu hơn so với mô hình chỉ sử dụng thuật toán LSSVM

1.4.2 Đóng góp về mặt thực tiễn

Thông qua kết quả của nghiên cứu, các nhà đầu tư có thể lựa chọn vị trí xây dựng và ước lượng được năng suất dự án điện năng lượng mặt trời trong giai đoạn thực hiện nghiên cứu tiền khả thi dự án đầu tư Đồng thời, các nhà đầu tư cũng có thể dự báo được năng suất của dự án khi thay đổi quy mô dự án

Từ đó dựa vào nghiên cứu này, nhà đầu tư có thêm giải pháp để ước tính được năng suất và lợi nhuận mang lại trước khi thực hiện dự án và vạch ra trước kế hoạch thực hiện dự án

Trang 17

CHƯƠNG 2 - TỔNG QUAN VÀ CƠ SỞ LÝ THUYẾT 2.1 TỔNG QUAN VỀ NĂNG LƯỢNG ĐIỆN

2.1.1 Tổng quan năng lượng điện trên thế giới

Sự xuất hiện và lây lan nhanh chóng của COVID-19 vào cuối năm 2019 đã biến thành đại dịch toàn cầu vào đầu năm 2020, gây ra một cuộc khủng hoảng kinh tế và sức khỏe toàn cầu, chính điều này cũng góp phần ảnh hưởng đến vấn đề năng lượng trên toàn thế giới Dữ liệu của các quốc gia đại diện cho hơn một phần ba nhu cầu điện toàn cầu cho thấy mỗi tháng đóng cửa hoàn toàn làm giảm nhu cầu điện trung bình 20% Riêng trong quý đầu của năm 2020, nhu cầu điện toàn cầu giảm 2,5%, và nhu cầu về than và dầu lần lượt giảm gần 8% và 5% Năng lượng tái tạo là nguồn điện duy nhất ghi nhận tăng trưởng nhu cầu trong giai đoạn này, do chi phí vận hành thấp và khả năng tiếp cận mạng lưới điện ưu đãi [4] Trong các nguồn năng lượng tái tạo, năng lượng gió và mặt trời đã trở thành nguồn điện chính và ngày càng có giá thành cạnh tranh với các nhà máy điện sử dụng nhiên liệu hóa thạch Gần như ở khắp mọi nơi trên thế giới, sản xuất điện từ năng lượng tái tạo tiết kiệm chi phí hơn so với sản xuất từ các nhà máy nhiệt điện than [5]

Theo thống kê tính đến năm 2018, năng lượng tái tạo hiện đại (không bao gồm năng lượng sinh khối truyền thống) chiếm khoảng 11% tổng mức tiêu thụ năng lượng (Total Final Energy Consumption – TFEC) Trong đó, phần lớn nhất là điện tái tạo (5,7% TFEC), tiếp theo là nhiệt tái tạo (4,3%) và nhiên liệu sinh học vận tải (1,0%) [4]

Hình 2.1 Tỷ lệ năng lượng tái tạo ước tính của tổng mức tiêu thụ năng lượng 2018 [4]

Năng lượng hạt nhân

Nhiên liệu hóa thạch

6.9%Sinh khối truyền thống

Trang 18

Năng lượng tái tạo đang phát triển ở tất cả các nơi trên thế giới Trên toàn cầu, 32 quốc gia đã có ít nhất 10 GW công suất điện tái tạo vào năm 2019, tăng so với chỉ 19 quốc gia một thập kỷ trước đó [6] Tiềm năng năng lượng tái tạo đặc biệt là điện mặt trời trên thế giới rất dồi dào, cần tăng cường khai thác hiệu quả để thay thế nguồn năng lượng hóa thạch và các nguồn năng lượng ảnh hưởng đến môi trường, góp phần phục vụ nhu cầu năng lượng toàn cầu, xem Hình 2.2

Hình 2.2 Bản đồ tiềm năng năng lượng quang điện trên thế giới

2.1.2 Tổng quan năng lượng điện trong nước

Nhu cầu năng lượng của Việt Nam được dự báo sẽ tăng trên 8% mỗi năm trong giai đoạn 2021-2030 Nhu cầu điện dự kiến là 265-278 tỷ kWh vào năm 2020, tăng lên 572-632 tỷ kWh vào năm 2030 so với 86 tỷ kWh vào năm 2010 [7], Việt Nam cần bổ sung 6.000-7.000MW công suất hàng năm với chi phí 148 tỷ USD vào năm 2030 [8] Để đáp ứng nhu cầu đó, Chính phủ Việt Nam đã phải điều chỉnh Quy hoạch phát triển điện năng để tăng tỷ trọng tái tạo năng lượng như sinh khối, mặt trời và gió để giảm chênh lệch giữa cung và cầu Hiện tại, năng lượng tái tạo chỉ chiếm 2,1% tổng lượng điện năng được tạo ra [9] Hiện tại, năng lượng từ thủy điện chiếm tỷ lệ lớn nhất trong các nguồn năng lượng tái tạo, tiếp đến là sinh khối và gió Còn lại các công nghệ năng lượng mặt trời, khí sinh học và chất thải thành năng lượng đang phát triển chậm trong khi năng lượng địa nhiệt và năng lượng thủy triều vẫn đang ở giai đoạn mới phát triển [9], xem Bảng 2.1

Trang 19

Bảng 2.1 Công suất các nguồn năng lượng tái tạo khai thác ở Việt Nam 2018 [8]

Nguồn năng lượng tái tạo Công suất tiềm năng Công suất đã lắp đặt

Thủy điện cỡ nhỏ 7000 MW (technical) 1648 MW (23.5%)

Trang 20

Dữ liệu mới nhất cho thấy hiện nay có tổng cộng 332 dự án năng lượng mặt trời đã được đăng ký với tổng công suất 26.290 megawatt đỉnh (MWp), bao gồm 121 dự án (tổng công suất 7.234MWp) sẽ bắt đầu phát điện vào năm 2020 và 211 (13.069MWp) đang chờ [10] Các dự án năng lượng mặt trời, bao gồm năng lượng mặt trời trên mái nhà, được xem là một trong những giải pháp chính để giảm áp lực cho ngành điện Tiềm năng của Việt Nam đối với các dự án năng lượng mặt trời được cho là rất hấp dẫn vì nó được hưởng lợi từ cường độ năng lượng mặt trời tự nhiên trung bình là 5kWh/ m² [9]

Năng lượng mặt trời ở Việt Nam thực sự tăng trưởng mạnh mẽ khi Nghị định 11/2017 / QĐ-TTg về cơ chế khuyến khích phát triển điện mặt trời ở Việt Nam do Thủ tướng chính phủ ban hành Nhờ chính sách ưu đãi

của Chính phủ, danh sách các dự án năng lượng mặt trời do các nhà đầu tư nước ngoài đăng ký tại Việt Nam ngày càng tăng, các tên tuổi điển hình như Tata Power, Sunseap Group, ACWA Power, SY Panel Group, AIN Group, Siemens Gamesa Renewable Energy, Gulf Energy Development, Dragon Capital and Pacifico Energy [9]

2.1.3 Khái niệm tổng quan về điện năng lượng mặt trời

Năng lượng mặt trời là sự khai thác, lưu trữ lượng bức xạ và nhiệt từ nguồn ánh sáng mặt trời, chúng được chuyển đổi thành điện năng thông qua tấm pin năng lượng mặt trời Nguồn năng lượng này hầu như không gây ảnh hưởng tiêu cực đến môi trường, là một nguồn năng lượng gần như vô tận, đồng thời là nguồn nguyên liệu sạch, thân thiện, việc sử dụng nguồn năng lượng này góp phần bảo vệ môi trường đồng thời giảm thiểu hiệu ứng nhà kính Nguồn năng lượng mặt trời được chuyển hóa thành điện năng thông qua hệ thống quang điện mà bộ phận chính là tấm pin năng lượng mặt trời được gắn bất cứ nơi nào đón nhận

Hình 2.4 Các dự án điện năng lượng mặt trời được lên kế hoạch ở Việt Nam [49]

Trang 21

được ánh sáng mặt trời Ngoài ra, hệ thống quang điện còn bao gồm các thành phần không thể thiếu khác như: bộ biến tần, thiết bị lưu trữ và ổn định điện năng

- Dự toán chi phí xây dựng đường bằng mạng nơ ron nhân tạo [12] Trong nghiên cứu này, các mạng nơ-ron nhân tạo (MLP, GRNN, RBFNN) được sử dụng để ước tính chi phí xây dựng đường Trong quá trình mô hình hóa, cơ sở dữ liệu về các con đường đã được xây dựng và khai thác trên lãnh thổ của nước Cộng hòa Croatia Kết quả so sánh hiệu suất cho thấy mạng nơ-ron GRNN đạt được độ chính xác tốt nhất - Mô hình mạng nơ ron nhân tạo (ANN) để đánh giá dự án xây dựng [13] Nghiên cứu này xác định được 16 yếu tố hiệu quả nhất ảnh hưởng đến hiệu quả hoạt động của các dự án xây dựng, đồng thời phát triển một mô hình ANN sử dụng các thuật toán Back-Propagation và Elman-Propagation để đánh giá ảnh hưởng của các yếu tố phối hợp đến hiệu quả hoạt động của các dự án xây dựng như chi phí, thời gian và chất lượng

- Ứng dụng mô hình máy vector hỗ trợ để dự báo các nguồn năng lượng mặt trời và năng lượng gió [2] Nghiên cứu này đã chỉ ra có nhiều phương pháp khác nhau để dự báo các nguồn năng lượng mặt trời và năng lượng gió, tuy nhiên việc sử dụng mô hình máy hỗ trợ véc-tơ (SVM) đem lại hiệu suất dự đoán năng lượng mặt trời và năng lượng gió tại hầu hết các địa điểm đều tốt hơn so với các mô hình hóa khác - Học máy trong việc ước tính hiệu suất và tiêu thụ năng lượng của tòa nhà [14] Nghiên cứu này cung cấp một đánh giá về bốn phương pháp tiếp cận thường được áp dụng trong dự báo và cải thiện hiệu suất năng lượng của tòa nhà là: học máy (Machine Learning) chính bao gồm mạng nơ-ron nhân tạo (ANN), máy hỗ trợ véc-tơ (SVM), hồi quy dựa trên Gaussian và phân cụm (Gaussian-based regressions and

Trang 22

clustering)

- Công cụ dự báo dựa trên hồi quy vectơ hỗ để dự đoán sản lượng điện mặt trời [15] Nghiên cứu này phát triển một phương pháp dự đoán chính xác được để giải quyết vấn đề khó khăn của việc dự đoán và đánh giá năng lượng quang điện trong quy hoạch và vận hành Cách tiếp cận được đề xuất dựa trên phân tích mô hình thực nghiệm nâng cao (EEMD) và cuối cùng sử dụng công cụ dự báo hỗn hợp bao gồm hồi quy vectơ hỗ trợ cải tiến (ISVR) kết hợp với thuật toán tối ưu hóa để tinh chỉnh các tham số tự do liên quan

Bên cạnh đó, ở Việt Nam trong vài năm trở lại đây cũng nở rộ các nghiên cứu ứng dụng trong lĩnh vực này như:

- Dự báo mức tiêu thụ năng lượng trong căn hộ sử dụng mô hình tiến hóa trí tuệ nhân tạo [16] Nghiên cứu này đã đưa ra các nhân tố và mức độ ảnh hưởng của chúng đến việc sử dụng năng lượng trong căn hộ, đồng thời xây dựng các mô hình dự báo mức tiêu thụ năng lượng điện trong căn hộ bằng cách sử dụng các thuật toán trí tuệ nhân tạo, học máy để bằng việc xây dựng các mô hình đơn kết hợp như LR, SVM, ANN, CART, các mô hình kết hợp ensemnle và kết hợp hai mô hình bằng trọng số Kết quả đánh giá và phân tích hiệu số cho thấy mô hình kết hợp trọng số của 2 mô hình tốt nhất là 0.96*Stacking (LR+ANN+CART) + 0.04*Bagging ANN đáng tin cậy và có hiệu suất tốt nhất

- Dự đoán mức tiêu thụ năng lượng trong nhiều tòa nhà bằng cách sử dụng máy học [17] Nghiên cứu này đã đề xuất một mô hình dự đoán dựa trên thuật toán Random Forests (RF) để dự đoán mức tiêu thụ năng lượng ngắn hạn trong trong nhiều tòa nhà Kết quả đánh giá mô hình RF vượt trội hơn hẳn so với mô hình M5P và Random Tree (RT) trong việc dự báo mức tiêu thụ năng lượng của tòa nhà

- Dự đoán khả năng phun vữa của vữa xi măng mịn tự hút dựa trên các kỹ thuật trí tuệ nhân tạo [18] Nghiên cứu này dự đoán khả năng phun vữa bằng cách sử dụng các kỹ thuật trí tuệ nhân tạo (AI- artificial intelligence) khác nhau, một số mô hình dự đoán đã được tạo ra như máy vectơ hỗ trợ, kỹ thuật cây quyết định CHAID, cây phân loại và hồi quy (C & R) để kiểm nghiệm độ chính xác của các mô hình hiện tại Dựa vào bộ dữ liệu bao gồm 240 mẫu được ghi lại tại các công trường xây dựng ở Đài Loan, sau khi so sánh với các kết quả của các phương pháp truyền thống và

Trang 23

một số phương pháp khác kết quả, kết quả chỉ ra kỹ thuật AI là một phương pháp dự đoán chính xác và là một phương pháp thay thế hiệu quả để dự đoán khả năng phun vữa của vữa xi măng mịn tự hút

- Ước tính khả năng làm việc của bê tông dựa trên việc kiểm tra độ sụt với Least Squares Support Vector Regression [19] Nghiên cứu này đề xuất sử dụng mô hình học máy để dự đoán độ sụt của bê tông dựa trên thuật toán Least Squares Support Vector Regression (LS-SVR) LS-SVR được sử dụng để thành lập mô hình ánh xạ phi tuyến giữa các thành phần hỗn hợp và giá trị độ sụt Đồng thời, nghiên cứu sử dụng một bộ dữ liệu bao gồm các thí nghiệm độ sụt bê tông thực tế từ một dự án xây dựng đập thủy điện ở Việt Nam Kết quả thực nghiệm cho thấy mô hình đề xuất có khả năng tính toán độ sụt của bê tông một cách chính xác

- Ước tính khoảng chi phí xây dựng sau khi hoàn thành dự án sử dụng thuật toán Least Squares Support Vector Machine (LSSVM) [20] Nghiên cứu này sử dụng thuật toán Least Squares Support Vector Machine (LS-SVM), Machine Learning Based Interval Estimation (MLIE) và Tiến hóa vi phân (Differential Evolution - DE) để thiết lập một mô hình mới để dự đoán chi phí dự án xây dựng Nghiên cứu phát triển một mô hình mới được đặt tên là EAC-LSPIM, mang lại kết quả bao gồm ước tính điểm kết hợp với các giới hạn dự đoán thấp hơn và trên, ở một mức độ tin cậy nhất định, để làm nổi bật sự không chắc chắn So sánh mô phỏng và hiệu suất chứng minh rằng mô hình mới có khả năng mang lại kết quả dự báo chính xác và đáng tin cậy

- Dự báo độ sâu sói mòn tại chân cầu sử dụng chương trình LSSVM phát triển trên nền tảng Visual C# NET [21] Nghiên cứu này xây dựng các mô hình học máy dựa trên thuật toán Least Squares Support Vector Machine (LSSVM), một phương pháp học máy có hiệu quả cao trong phân tích hồi quy, để ước tính xói mòn xung quanh các trụ cầu Nghiên cứu còn phát triển một chương trình phần mềm để ước tính độ sâu xói mòn xung quanh các trụ cầu sử dụng mô hình trên dựa vào nền tảng Visual C # NET

- Dự báo xói mòn đất do mưa gây ra ở vùng đồi núi Việt Nam bằng phương pháp học máy [22] Nghiên cứu này xây dựng các mô hình dựa trên cơ sở dữ liệu sẵn có ở vùng Tây Bắc Việt Nam để dự đoán tình trạng xói mòn bằng các thuật toán học máy Kết quả nghiên cứu cho thấy tất cả các mô hình học máy có thể đạt được kết

Trang 24

quả dự đoán tốt với tỷ lệ chính xác trong phân loại đều cao hơn 80 % Trong đó mô hình dựa trên RVM là thuật toán phù hợp nhất vì nó đạt được kết quả dự đoán cao nhất trong cả hai giai đoạn đào tạo và giai đoạn kiểm nghiệm

2.3 TỔNG QUAN CÁC THUẬT TOÁN TRÍ TUỆ NHÂN TẠO 2.3.1 Các khái niệm về thuật toán trí tuệ nhân tạo

Trí tuệ nhân tạo, được dịch từ tiếng anh là Artificial Intelligence hay viết tắt AI, là một sự mô phỏng hành vi thông minh của con người Đó là một máy tính hoặc hệ thống được thiết kế để nhận thức môi trường của nó, hiểu các hành vi của nó và thực hiện các hành động Sự thành công với AI đòi hỏi nhiều hơn là việc chỉ đào tạo một mô hình AI Một quy trình làm việc AI vững chắc bao gồm các công việc chính [23]:

- Chuẩn bị dữ liệu;

- Tạo mô hình;

- Thiết kế hệ thống mà mô hình sẽ chạy ;

- Triển khai đại trà cho các hệ thống phần cứng hoặc doanh nghiệp

Hình 2.5 Các bước cơ bản trong quy trình làm việc với AI [23]

Định nghĩa về AI được đưa ra vào những năm 1950 và vẫn được sử dụng là "khả năng của một cỗ máy bắt chước hành vi thông minh của con người." AI trở nên thú vị hơn khi máy móc không những chỉ bắt chước mà còn làm tốt hơn hoặc thậm chí vượt quá hiệu suất của con người, nó cho chúng ta cơ hội giảm tải các tác vụ lặp đi lặp lại hoặc thậm chí để máy tính thực hiện công việc một cách an toàn và hiệu quả hơn chúng ta có thể

Thực tế mà nói, khi mọi người nghĩ về AI ngày nay, họ gần như luôn có nghĩa là học máy: đào tạo một cỗ máy để học một hành vi mong muốn Trong lập trình truyền thống, họ sẽ viết một chương trình xử lý dữ liệu để tạo ra kết quả đầu ra mong muốn Với học máy (Machine Learning), các bước được thực hiện ngược lại: bạn nhập dữ liệu và kết quả đầu ra mong muốn, và máy tính sẽ viết chương trình cho bạn Các chương trình học máy (hay chính xác hơn là các mô hình) phần lớn là hộp đen Chúng có thể tạo ra đầu ra mong muốn, nhưng chúng không bao gồm một chuỗi hoạt động như một chương trình hoặc thuật toán truyền thống

Trang 25

Ngày nay, có rất nhiều điều thú vị về một loại học máy chuyên biệt được gọi là học sâu (Deep Learning) Học sâu sử dụng mạng nơ-ron (Thuật ngữ "sâu" đề cập đến số lớp trong mạng, càng nhiều lớp, mạng càng sâu) Một lợi thế chính của học sâu là nó loại bỏ nhu cầu về các bước xử lý dữ liệu thủ công và kiến thức miền mở rộng cần thiết cho các kỹ thuật Để đưa các thuật ngữ chính vào ngữ cảnh, hãy nghĩ về học máy và học sâu như những cách để đạt được AI, chúng là những kỹ thuật phổ biến nhất được áp dụng ngày nay

2.3.2 Khái niệm học máy (Machine Learning)

Học máy (Machine Learning) là một kỹ thuật phân tích dữ liệu dạy máy tính làm những việc một cách tự nhiên giống như con người thông qua việc học hỏi từ kinh nghiệm sẵn có Những thuật toán của Machine learning sử dụng những phương pháp tính toán bằng máy tính để học thông tin trực tiếp từ dữ liệu dựa vào một phương trình tiên đoán giống như là một mô hình Những thuật toán đó cải thiện năng suất của chúng như là số lượng của mẫu có sẵn giúp sự gia tăng sự học hỏi cho thuật tuán Học sâu (Deep Learning) là một hình thức học máy chuyên biệt

Với sự phát triển lớn mạnh của dữ liệu lớn (Big Data), học máy đã trở thành một kỹ thuật quan trọng để giải quyết nhiều vấn đề trong các lĩnh vực như:

- Tài chính tính toán, cho điểm tín dụng và giao dịch theo thuật toán

- Xử lý hình ảnh và thị giác máy tính, để nhận dạng khuôn mặt, phát hiện chuyển

động và phát hiện đối tượng

- Sinh học tính toán, để phát hiện khối u, phát hiện thuốc và giải trình tự DNA

- Sản xuất năng lượng, để dự báo giá cả và tải trọng

- Ô tô, hàng không vũ trụ và sản xuất, để bảo trì dự đoán

- Xử lý ngôn ngữ tự nhiên, cho các ứng dụng nhận dạng giọng nói,…

Trang 26

Hình 2.6 Quan hệ trí tuệ nhân tạo và học máy [24]

Machine learning sử dụng 2 loại kỹ thuật [24]:

- Unsupervised Learning (Học không giám sát): tìm ra những mẫu hoặc bản chất của cấu trúc ẩn bên trong dữ liệu đầu vào

- Supervised Learning (Học có giám sát): huấn luyện một mô hình dựa trên dữ liệu đầu vào và đầu ra, vì vậy có thể dự đoán kết quả trong tương lai

Hình 2.7 Phân loại kỹ thuật học máy (Machine Learning) [24]

2.4 THUẬT TOÁN MÁY HỖ TRỢ VÉC-TƠ

Máy hỗ trợ véc tơ (Support Vector Machine - SVM) là một công cụ học máy phổ biến để phân loại và hồi quy, được giới thiệu vào năm 1995 bởi Vladimir Vapnik và các đồng nghiệp [25], đây là mô hình học dựa trên lý thuyết học thống kê và là một kỹ thuật được đề xuất để xử lý các bài toán phân lớp Một số nghiên cứu gần đây [26], [2], [11]đã đề xuất sử dụng SVM giải quyết bài toán tối ưu hóa hồi quy; đồng thời SVM cũng được sử dụng để khai phá luật mờ từ dữ liệu số [26], [27] Hồi quy SVM được coi là một kỹ thuật phi tham số vì nó dựa vào các chức năng của hạt nhân

Trong thuật toán SVM hồi quy (SVR), đầu vào được ánh xạ và một vùng đặc tính không

MACHINE LEARNING

(Học máy)

UNSUPPERVISED LEARNING

(Học không giám sát)

SUPPERVISED LEARNING

liệu đầu vào

Phát triển mô hình dự đoán dựa trên cả dữ liệu đầu vào và đầu ra

Trang 27

gian n chiều bằng cách sử dụng một hàm phi tuyến như công thức sau:

𝑓(𝑥, 𝜔) = (𝑥, 𝜔) + 𝑏 𝑣ớ𝑖 𝜔, 𝑏 𝜖 (2.1) Độ chính xác của SVR đang được đo bằng tính toán sai số của phép tính gần đúng Hàm lỗi hoặc mất mát độ nhạy ε của Vapnik được sử dụng rộng rãi, nó được đưa ra trong (2.2) Độ chính xác của f(x) có thể được ước lượng dựa vào sự mất mát của hàm L(x) như sau [28]:

Hình 2.9 Ống bán kính ε khi hàm xấp xỉ f thu được là tuyến tính

Việc giải quyết vấn đề SVR sẽ được giải thích ngắn gọn như một vấn đề hồi quy tuyến

Trang 28

tính Trong trường hợp này, hàm xấp xỉ f thu được là tuyến tính và nó sẽ gần đúng với tất cả các cặp dữ liệu (xi, yi) với độ lệch cực đại ε như Hình 2.9 và công thức (2.3):

Vì chiều rộng của ống tỉ lệ nghịch với định mức của vectơ , ||||, khoảng cách cực đại cho phép của các cặp (xi, yj) sẽ được tính bằng cách tối thiểu hóa |||| Để tiện cho việc tính toán, điều kiện này được định nghĩa là tối thiểu của 1

2‖𝜔‖2 thay vì giảm thiểu w và xem xét phương trình (2.2) và phương trình (2.3), lời giải của bài toán này được rút gọn thành bài toán tối ưu hóa được đưa ra bởi các điều kiện (2.4):

Trang 29

Công thức sau đây mô tả mối quan hệ tuyến tính giữa các biến đầu vào và kết quả đầu ra [31]:

Tối thiểu hóa:

𝐽𝑝(𝜔, 𝑒) =12𝜔

Hàm Lagrangian được thể hiện như sau:

𝜕𝜔 = 0 → ∑ 𝛼𝑘 = 0

𝜕𝐿

𝜕𝜔 = 0 → 𝛼𝑘 = 𝛾𝑒𝑘, 𝑘 = 1, … , 𝑁𝜕𝐿

𝜕𝜔 = 0 → 𝜔𝑇𝜑(𝑥𝑘) + 𝑏 + 𝑒𝑘 − 𝑦𝑘 = 0, 𝑘 = 1, … , 𝑁

(2.11)

Sau khi e và w được loại bỏ, thu được hệ phương trình tuyến tính như sau:

Trang 30

[0 1𝑣𝑇1𝑣 Ω + 𝐼/𝛾] [

Trong đó, 𝑦 = [𝑦1, … , 𝑦𝑁], 1𝑣 = [1, … ,1] 𝑣à 𝛼 = [𝛼1, … , 𝛼𝑁] Hàm hạt nhân được áp dụng như sau:

𝜑 = 𝜑(𝑥𝑘)𝑇𝜑(𝑥𝑙) = 𝐾(𝑥𝑘, 𝑥𝑙), 𝑘, 𝑙 = 1, … , 𝑁 (2.13) Mô hình kết quả LSSVM cho hàm dự đoán được thể hiện như sau:

Trong đó 𝜎 là tham số hạt nhân (Kernel parameter)

Trong trường hợp của hạt nhân Hàm cơ sở hướng tâm, có hai tham số điều chỉnh (γ, σ) cần được xác định trong LSSVM Tham số chính quy hóa (γ) kiểm soát hình phạt được áp dụng đối với các điểm dữ liệu sai lệch khỏi hàm hồi quy Trong khi đó, tham số hạt nhân (σ) ảnh hưởng đến độ trơn của hàm hồi quy Lưu ý rằng cần phải thiết lập thích hợp các thông số điều chỉnh này để đảm bảo hiệu suất mong muốn của mô hình dự đoán [31]

2.5.2 Ưu điểm và nhược điểm

Một số ưu điểm của LS-SVM có thể được kể đến như sau:

- Thuật toán này có tính tổng quát hóa tốt, nó có thể xử lý tốt đối với loại dữ liệu nhiễu [33] [31]

- Chi phí tính toán của LS-SVM thấp hơn nhiều so với các kỹ thuật trí tuệ nhân tạo khác như Máy véc-tơ hỗ trợ (SVM) và Mạng thần kinh nhân tạo (ANN) Bởi vì trong quá trình đào tạo của mô hình sử dụng thuật toán LS-SVM, tập hợp các phương trình tuyến tính có thể được LS-SVM giải một cách hiệu quả hơn bằng các phương pháp lặp lại đơn giản [31]

- LS-SVM đem lại kết quả dự đoán có hiệu quả tốt hơn Mạng thần kinh nhân tạo

Trang 31

ANN, bởi vì quá trình huấn luyện của ANN đạt được thông qua một thuật toán giảm dần độ dốc trên không gian lỗi, thuật toán này rất phức tạp và có thể chứa nhiều điểm cực tiểu cục bộ [34]

- LS-SVM có ít tham số hiệu chỉnh hơn so với ANN [35]

- LS-SVM có thể xử lý các quan hệ ánh xạ phức tạp, do đó nó rất phù hợp để giải quyết các vấn đề không được xác định rõ hoặc không có cấu trúc điển hình tương tự như là các vấn đề trong lĩnh vực quản lý xây dựng [33]

Bên cạnh đó, việc sử dụng LS-SVM vẫn còn tồn tại một số trở ngại đáng kể khi như [31]: - Để triển khai LS-SVM, các tham số chính quy cần được thiết lập thích hợp nhằm kiểm soát những giải pháp xử lý đối với các điểm sai lệch dữ liệu so với chức năng hồi quy và tham số hạt nhân (Kernel parameter), việc này liên quan đến tính trơn của chức năng hồi quy của thuật toán

- Việc cài đặt tham số của LS-SVM là một vấn đề phụ thuộc Điều này yêu cầu nhiều quy trình kinh nghiệm đúc kết từ quá trình thử và tìm ra lỗi

- Đối với việc học không cân bằng đặc biệt là các trường hợp dự đoán chuỗi thời gian, LS-SVM vẫn chưa xử lý được hiệu quả

- LS-SVM chưa xử lý tốt với các tập dữ liệu không chính xác thu được từ việc phán đoán của con người

2.6 THUẬT TOÁN TIẾN HÓA VI PHÂN 2.6.1 Khái niệm

Thuật toán tiến hóa vi phân (Differential evolution - DE) là một trong những thuật toán tiến hóa mạnh mẽ áp dụng cho việc giải các bài toán tối ưu hóa phức tạp, được phát triển bởi Storn và Price [36] Mục đích của thuật toán là từ một quần thể bao gồm nhiều cá thể được khởi tạo ngẫu nhiên, những cá thể mới được sản sinh ra đồng thời đấu tranh chọn lọc với những cá thể cũ Những cá thể trong quần thể được đánh giá thông qua một hàm mục tiêu f(x) được định nghĩa bằng một vấn đề tối ưu hóa cụ thể Những cá thể tốt sẽ được giữ lại đến các thế hệ sau, đồng thời, các cá thể kém hơn sẽ bị tiêu diệt Quá trình chọn lọc này tương tự như quá trình chọn lọc tự nhiên được đề cập trong học thuyết tiến hóa của nhà bác học Charles Robert Darwin

Thuật toán DE thường bao gồm bốn giai đoạn là khởi tạo (initialization), đột biến

Trang 32

véc-tơ đột biến thường được sử dụng nhất là DE/rand/1 và DE/best/1 như sau [38]:

DE/rand/1: 𝑉𝑖,𝑔+1 = 𝑋𝑟1,𝑔+ 𝐹 × (𝑋𝑟2,𝑔− 𝑋𝑟3,𝑔) (2.17) DE/best/1: 𝑉𝑖,𝑔+1 = 𝑋𝑏𝑒𝑠𝑡,𝑔+ 𝐹 × (𝑋𝑟1,𝑔− 𝑋𝑟2,𝑔) (2.18)

Trong đó, r1, r2, và r3 là 3 số nguyên được lấy ngẫu nhiên trong đoạn [1; N], chúng được tạo ra sao cho không trùng với thứ tự i của véc-tơ mẹ; F là biên độ đột biến được xác định theo phân phối chuẩn N(0.5; 0.22) [39]; Xbest là cá thể tốt nhất của quần thể

Quá trình đột biến theo DE/rand/1 (2.17) có khuynh hướng khai phá không gian tìm kiếm,

điều này giúp cho thuật toán hạn chế rơi vào vùng tối ưu cục bộ, nhưng làm chậm quá trình

hội tụ của thuật toán [38] Quá trình đột biến theo DE/best/1 (2.18) có xu hướng khai thác

giá trị Xbest đã tìm được, đột biến theo phương thức này có khuyết điểm là thuật toán dễ rơi vào vùng tối ưu cục bộ khi bài toán tìm kiếm là phức tạp nhưng ngược lại giúp thuật toán hội tụ nhanh [39]

(3) Giai đoạn lai ghép:

Mục tiêu của giai đoạn lai ghép này là trao đổi các thành phần của tơ đột biến và tơ mẹ nhằm mục đích tăng tính đa dạng cho quần thể hiện tại Giai đoạn này tạo ra véc-tơ

véc-con Ui,g và thành phần thứ j của nó, ký là hiệu Uj,i,g, được tạo ra theo phương pháp sau [36]:

Trong giai đoạn chọn lọc, các cá thể véc-tơ mẹ Xi,g và véc-tơ con Ui,g được so sánh với

nhau, hàm mục tiêu của cá thể véc-tơ nào có giá trị tốt hơn sẽ được giữ lại, ngược lại, sẽ bị loại bỏ, Xi,g+1 biểu thị véc-tơ mục tiêu trong thế hệ tiếp theo như công thức sau:

𝑋𝑖,𝑔+1 = {𝑈𝑖,𝑔, 𝑖𝑓 𝑓(𝑈𝑖,𝑔) ≤ 𝑓(𝑋𝑖,𝑔),

𝑋𝑖,𝑔, 𝑖𝑓 𝑓(𝑈𝑖,𝑔) > 𝑓(𝑋𝑖,𝑔), (2.20)

2.6.2 Ưu điểm và nhược điểm

Một số ưu điểm của DE có thể được kể đến như sau [36] [40] [41]:

Trang 33

(mutation), lai ghép (crossover) và chọn lọc (selection); toàn bộ quá trình được lặp lại cho đến khi điều kiện kết thúc được thỏa mãn, nhằm tìm ra giải pháp tốt nhất cho vấn đề cần xử lý, các giai đoạn của DE được mô tả theo lưu đồ dưới đây [37]:

Hình 2.10 Lưu đồ thuật toán Differential evolution (DE) [38]

Thông thường, số lượng cá thể được lấy trong khoảng P = 4D ÷ 8D Trong đó, P là số lượng cá thể trong quần thể, D là số biến thiết kế Thuật toán được xem là tối ưu khi điều kiện về số thế hệ tối đa G được thỏa mãn

(1) Giai đoạn khởi tạo:

Một cá thể được đại diện bằng một véc-tơ và số biến thiết kế D chính bằng số thành phần của véc-tơ chính đó Vì vậy, một quần thể gồm nhiều cá thể được đại diện bằng một ma trận PxD Việc khởi tạo một cách ngẫu nhiên những cá thể của quần thể đầu tiên được thể hiện như sau:

𝑋𝑗,𝑖 = 𝐿𝐵𝑗 + 𝑚𝑗(𝑈𝐵𝑗 − 𝐿𝐵𝑗) (2.16) Trong đó, i = 1, 2,…, P là số thứ tự cá thể trong quần thể; mj là số thực được khởi tạo ngẫu nhiên nằm trong khoảng [0, 1] đại diện cho một biến ngẫu nhiên có phân phối đều; j = 1, 2,…, D với D là số biến cần tìm; LBj và UBj tương ứng là hai vectơ giới hạn dưới và giới hạn trên của các biến

(2) Giai đoạn đột biến:

Với mỗi véc-tơ mẹ được đại diện bằng một véc-tơ X ở thế hệ g hiện tại, một véc-tơ đột biến Vi,g+1 được tạo ra bằng nhiều phương pháp [37], trong đó có hai phương pháp khởi tạo

1 Khởi tạo 2 Đột biến 3 Lai ghép 4 Chọn lọcNhân tố biên độ

Trang 34

- DE không yêu cầu bất kỳ giả thiết nào về quyền lợi ưu tiên ban đầu và nó có thể tìm kiếm trong không gian rất lớn của tập hợp các lựa chọn được đề ra

- DE không sử dụng độ dốc của vấn đề đang được giải quyết Do đó, thuật toán tìm kiểm của DE không yêu cầu bài toán tối ưu hóa phải khác biệt như yêu cầu của các phương pháp tối ưu hóa cổ điển chẳng hạn như phương pháp giảm độ dốc

- DE có thể được sử dụng để giải quyết các vấn đề tối ưu hóa mà không bị gián đoạn, nhiễu và biến động

- Việc áp dụng và hiệu chỉnh được DE thực hiện nhanh chóng và đơn giản

- DE sở hữu khả năng tối ưu hóa tổng quát rất hiệu quả

Tuy nhiên, bên cạnh những ưu điểm vượt trội trên, DE vẫn còn tồn tại một số nhược điểm được liệt kê dưới đây [36] [42]:

- DE thuộc về lớp thuật toán metaheuristic (dạng thuật toán có quy trình tính toán được lặp đi lặp lại nhiều lần để tìm ra giải pháp tối ưu nhất định) Do đó, DE chưa đảm bảo là một sự lựa chọn hữu hiệu nhất về tất cả các khía cạnh như thời gian và bộ nhớ tính toán

- Việc triển khai DE cũng yêu cầu cần phải có sự cài đặt các tham số điều chỉnh của nó một cách thích hợp mặc dù các tham số này không quá nhạy cảm với hiệu suất thuật toán (chẳng hạn như F và Cr)

- Trong một vài bài toán, việc khởi tạo ngẫu nhiên tập hợp ban đầu có thể ảnh hưởng đến kết quả của quá trình tối ưu hóa

- Trong trường hợp tối ưu hóa có nhiều tùy chọn tối ưu cục bộ, phương pháp sử dụng thuật toán DE có thể chỉ là giải pháp tối ưu phụ

Trang 35

2.7 PHƯƠNG PHÁP KIỂM CHỨNG CHÉO DỮ LIỆU 2.7.1 Khái niệm

Mục tiêu quan trọng của học máy là xây dựng được mô hình dự đoán có khả năng tổng quát hóa tốt nhất Thực tế có nhiều trường hợp bộ dữ liệu huấn luyện ban đầu rất phù hợp với mô hình hồi quy, tuy nhiên khi mô hình hoạt động với một tập dữ liệu mới lại đưa ra kết quả kém, vấn đề này được gọi là sự quá khớp của bộ dữ liệu huấn luyện ban đầu Do đó, một phương pháp thường được sử dụng trong học máy là kiểm chứng chéo (cross-validation), phương pháp này là một phương pháp lấy mẫu lại dữ liệu được sử dụng rộng rãi để dự đoán lỗi của mô hình và ước lượng hiệu quả của các mô hình học máy, đặc biệt để hạn chế sự quá khớp (overfitting) với mẫu ban đầu

Khi sử dụng phương pháp này, dữ liệu đầu vào được chia thành các fold cho phép một phần dữ liệu đầu vào sử dụng để đào tạo, phần dữ liệu còn lại được dùng để đánh giá hiệu suất mô hình Kết quả hiệu suất mô hình được đánh giá dựa vào kết quả hiệu suất dự đoán trung bình của các tập dữ liệu được lấy mẫu lại sau thông qua phương pháp kiểm chứng chéo

2.7.2 Kỹ thuật kiểm chứng chéo k-fold

Một trong những kỹ thuật thường được sử dụng của phương pháp kiểm chứng chéo dữ liệu là kỹ thuật k-fold Trong kỹ thuật kiểm chứng chéo k-fold, tham số quan trọng trong kỹ thuật này là k, giá trị k này được xác định phụ thuộc vào kích thước của tập dữ liệu Đặc biệt đối với các tập dữ liệu nhỏ, k = 10 thường được xem là một lựa chọn đem lại kết quả tốt Tuy nhiên, tương ứng với số lượng fold càng lớn (giá trị k càng lớn) thì kết quả mô hình dự đoán càng đạt được hiệu suất cao, đồng thời chi phí và thời gian tính toán cũng tăng đồng biến, đặc biệt là đối với các mô hình trí tuệ lai Điều này yêu cầu cần phải cân nhắc lựa chọn một giá trị k có thể ước tính hiệu suất mô hình hiệu quả đồng thời đảm bảo tài nguyên và chi phí trong giới hạn đề ra

Thông qua thực nghiệm, [43] cho rằng giá trị k = 5 có thể mang lại mô hình ước tính đáng tin cậy với sai số dự đoán không đáng kể Bên cạnh đó, [44] cho thấy việc số lần kiểm chứng chéo nên nằm trong khoảng từ năm đến mười lần (k = 5  10) vì hiệu suất mô hình không cải thiện thêm được nhiều đối với một số fold lớn hơn

Trong phạm vi của nghiên cứu, tác giả lựa chọn k = 10 là một giá trị thường được sử dụng trong các nghiên cứu trước đồng thời nhằm đem lại phương sai nhỏ nhất cho mô hình dự

Trang 36

3 Tiến hành huấn luyện và đánh giá mô hình 10 lần (mỗi lần sử dụng 1 fold dữ liệu khác nhau)

4 Tổng hợp hiệu quả của mô hình từ các số liệu đánh giá, kết quả tổng hợp chính là trung bình hiệu quả của 10 lần đánh giá

Hình 2.11 Kỹ thuật kiểm chứng chéo k-fold cross-validation

Trang 37

2.8 PHƯƠNG PHÁP ĐÁNH GIÁ HIỆU SUẤT MÔ HÌNH

Tác giả sử dụng các kỹ thuật sau để đánh giá độ chính xác của quá trình dự đoán của các mô hình:

❖ Kỹ thuật sử dụng hệ số tương quan tuyến tính (R) hoặc hệ số xác định của

phương trình hồi quy (R2):

𝑅 = 𝑛 ∑(𝑦 × 𝑦

′) − ∑(𝑦) × ∑(𝑦′)

√𝑛(∑ 𝑦2) − (∑ 𝑦)2× √𝑛(∑ 𝑦′2) − (∑ 𝑦′)2 (2.21)

Trong đó, y là giá trị thực tế, y’ là giá trị dự báo và n là số lượng mẫu dữ liệu

Hệ số xác định R2 dùng để đo mức độ chính xác của biến y’ so với biến y Tác giả dùng hệ số 1-R để đo lường sai số của biến y’ so với y

❖ Kỹ thuật sử dụng phần trăm sai số trung bình tuyệt đối - MAPE (Mean

absolute percentage error):

𝑀𝐴𝑃𝐸 =1𝑛∑ |

𝑦 − 𝑦′𝑦 |

(2.24)

Trang 38

CHƯƠNG 3 - PHƯƠNG PHÁP NGHIÊN CỨU 3.1 NỘI DUNG VÀ QUÁ TRÌNH NGHIÊN CỨU

Quá trình nghiên cứu được chia làm 4 bước tương ứng với 4 nội dung chính của nghiên cứu:

- Xác định các yếu tố ảnh hưởng đến năng suất điện năng lượng mặt trời

- Thu thập các dữ liệu đo lường điện năng lượng mặt trời của các dự án điện năng lượng mặt trời ở Việt Nam

- Xây dựng các mô hình bằng các thuật toán trí tuệ nhân tạo, sử dụng kỹ thuật Machine learning;

- Thực hiện huấn luyện các mô hình thông qua công cụ phần mềm MATLAB Sau đó dự đoán kết quả dựa trên bộ dữ liệu kiểm tra và tính toán các thông số đánh giá mô hình; cuối cùng thực hiện phân tích, so sánh, đề xuất mô hình tối ưu

Tổng thể nghiên cứu bao gồm 2 giai đoạn Ở giai đoạn 1, tác giả xác định các nhân tố ảnh hưởng đến năng suất dự án điện mặt trời bằng cách tham khảo và tổng hợp các nhân tố từ các nghiên cứu trong và ngoài nước Sau khi có được bảng tổng hợp các nhân tố ảnh hưởng, tác giả tiến hành tổng hợp dữ liệu đo lường các nhân tố trên được thu thập tại các trạm đo lường điện năng lượng mặt trời ở Việt Nam

Ở giai đoạn tiếp theo, tác giả nghiên cứu nắm vững các lý thuyết và xây dựng mô hình dự đoán bằng thuật toán trí tuệ nhân tạo với kỹ thuật học máy thông qua sự hỗ trợ của công cụ phần mềm Matlab Tác giả sử dụng chính các mô hình đó để huấn luyện bộ dữ liệu đo lường năng suất các dự án điện mặt trời đã thu thập được từ các dự án thực tế, mô hình sau khi huấn luyện cho kết quả dự đoán dựa trên bộ dữ liệu kiểm tra Cuối cùng, tác giả tính toán các thông số phục vụ việc đánh giá các mô hình và phân tích đề xuất mô hình tốt ưu nhất Chi tiết 2 giai đoạn nghiên cứu thể hiện ở Hình 3.1

Trang 39

Xác định vấn đề, mục tiêu và

phạm vi nghiên cứu Giai đoạn 1

Giai đoạn 2

Xác định và tổng hợp các nhân tố ảnh hưởng đến năng suất dự án điện

năng lượng mặt trời

Tổng hợp dữ liệu đo lường các nhân tố tại các trạm đo lường điện năng

lượng mặt trời

Nghiên cứu thuật toán

Xây dựng các mô hình thông qua ứng dụng Matlab

Thực hiện huấn luyện các mô hình

Xuất kết quả dự đoán và đánh giá hiệu suất các mô hình

So sánh, đề xuất mô hình tối ưu

Hình 3.1 Quá trình nghiên cứu

3.2 PHƯƠNG PHÁP THU THẬP DỮ LIỆU 3.2.1 Xác định các nhân tố ảnh hưởng

Những nhân tố ảnh hưởng đến năng suất hệ thống điện năng lượng mặt trời được tác giả tổng hợp và trích dẫn từ các nghiên cứu trước liên quan đến lĩnh vực năng lượng tái tạo trong và ngoài nước, đồng thời sử dụng kết quả của bài báo học viên đã tham gia nghiên cứu [48]

3.2.2 Thu thập dữ liệu đo lường năng suất điện năng lượng mặt trời

Bộ dữ liệu đo lường năng suất điện năng lượng mặt trời được tác giả tổng hợp từ Global Solar Atla và được cung cấp bởi tổ chức The World Bank and the International Finance Corporation Bộ dữ liệu này được đo lường thực tế và công khai kết quả đo lường nhằm phục vụ cho công tác dự đoán năng suất các dự án điện năng lượng mặt trời [46]

Trang 40

3.3 CÔNG CỤ NGHIÊN CỨU 3.3.1 Phần mềm Matlab

Matlab (Matrix Laboratory) là một công cụ phần mềm do công ty MathWorks thiết kế và phát hành, công cụ này cung cấp môi trường lập trình và tính toán số Ngoài ra, với giao diện mạnh mẽ cùng những lợi thế trong kỹ thuật lập trình đáp ứng cho việc giải quyết nhiều vấn đề hết sức đa dạng từ các lĩnh vực kỹ thuật chuyên ngành như: điện, điện tử, điều khiển tự động, vật lý hạt nhân, cho đến các ngành xử lý toán chuyên dụng như kế toán, thống kê, một cách hoàn toàn đơn giản, trực quan mà không đòi hỏi người sử dụng phải có kiến thức lập trình như là những lập trình viên chuyên nghiệp [47]

Ngoài ra, Matlab còn cho phép người dùng thực hiện tính toán số với ma trận, vẽ biểu đồ thông tin hoặc đồ thị hàm số, khởi tạo các giao diện người dùng và có thể liên kết với các chương trình máy tính được viết trên nhiều nền tảng ngôn ngữ lập trình khác

Hiện nay, Matlab có kho thư viện rộng lớn bao gồm hàng nghìn lệnh và hàm tiện ích hỗ trợ Ngoài ra, Matlab còn trang bị các hộp công cụ để mở rộng lập trình sẵn các lệnh và hàm ứng dụng chuyên biệt tập trung giải quyết các bài toán thuộc các lĩnh vực riêng Luận văn sử dụng phần mềm Matlab để xây dựng các mô hình dự đoán dựa trên các thuật toán trí tuệ nhân tạo nói chung và kỹ thuật học máy nói riêng

3.3.2 Công cụ khác

Luận văn sử dụng phần mềm Microsoft Excel để tổng hợp số liệu và tính toán so sánh kết quả các mô hình dự đoán Ngoài ra, tác giả đã sử dụng các phần mềm hỗ trợ trong việc thực hiện luận văn như: Microsoft Word, Microsoft Visio, Microsoft PowerPoint Bên cạnh đó, tác giả còn sử dụng phần mềm IBM SPSS để phân tích các nhân tố ảnh hưởng nhằm

thực hiện bài báo [48]

Ngày đăng: 31/07/2024, 09:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN