1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Quản lý xây dựng: Tối ưu hóa năng suất điện mặt trời bằng các mô hình trí tuệ nhân tạo đơn và kết hợp

189 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Đứngtrước nhu cầu đó học viên đã thực hiện khảo sát và nghiên cứu các tác nhân ảnh hưởng đếnhiệu quả hay năng suât của một dự án điện năng lượng mặt trời.”Bang cách tìm hiểu các nghiên c

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM

TOI UU HOA NANG SUAT DIEN MAT TROI BANG CAC MO

HINH TRI TUE NHAN TAO DON VA KET HOP

Chuyén nganh: Quan Ly Xay dung

Mã số: 8580302

LUẬN VĂN THẠC SỸ

TP HO CHI MINH, tháng 01 năm 2022

Trang 2

TRƯỜNG ĐẠI HỌC BACH KHOA - ĐẠI HỌC QUOC GIA TPHCMCán bộ Hướng dẫn khoa hoc 1: TS Nguyễn Dang Trình Chữ ký:

Cán bộ Hướng dẫn khoa học 2: PGS.TS Trần Đức Học Chữ ký:

Cán bộ cham phản biện 1: TS Đỗ Tiến Sỹ Chữ ký:

Cán bộ chấm phản biện 2: TS Nguyễn Hoài Nghĩa Chữ ký:

Luận văn thạc sĩ được bảo vệ tại Truong Đại học Bach Khoa, DHQG Tp HCM ngày

16 tháng 01 năm 2022.

Thành phân Hội đồng đánh giá luận văn thạc sĩ gồm:

1 TS Nguyễn Anh Thư Chủ tịch hội đồng

2 TS Trần Nguyễn Ngọc Cương Ủy viên thư kí

3 TS Nguyễn Thanh Phong Ủy viên

4 TS Đỗ Tiên Sỹ Cán bộ phản biện 1

5 TS Nguyễn Hoài Nghia Cán bộ phản biện 2

Xác nhận của Chủ tịch Hội đồng đánh giá Luận văn và Trưởng Khoa quản lý chuyênngành sau khi luận văn đã được sửa chữa (nếu có)

CHỦ TỊCH HỘI ĐÔNG TRƯỞNG KHOA

KY THUẬT XÂY DUNG

TS Nguyễn Anh Thư

Trang 3

ĐẠI HỌC QUOC GIA TP.HCM CỘNG HOA XÃ HỘI CHỦ NGHĨA VIỆT NAMTRƯỜNG ĐẠI HỌC BÁCH KHOA Độc Lập — Tự Do — Hạnh Phúc

NHIEM VỤ LUẬN VĂN THẠC SĨ

Họ và tên học viên : Lê Hải Đăng MSHV : 1970092

Ngày tháng năm sinh : 12/02/1996 Nơi sinh : Tra Vinh

Chuyên ngành : Quản lý xây dựng Mãsố : 8580302

I TEN DE TÀI:

TOI UU HOA NANG SUAT DIEN MAT TROI BANG CAC MO HINH TRI TUE NHANTAO DON VA KET HOP

Il NHIEM VU VA NOI DUNG

- Phân tích sự anh hưởng các nhân tố anh hưởng đến năng suất điện năng lượng mặt trời

- Xây dựng mô hình tối ưu hóa dự đoán năng suất hệ thống điện năng lượng mặt trời bằngcác thuật toán trí tuệ nhân tạo trên phần mén Clementine

Ill NGÀY GIAO NHIỆM VỤ : 21/09/2020

IV NGÀY HOÀN THÀNH NHIỆM VU : 20/12/2021

V CÁN BỘ HƯỚNG DÂN:

- Giảng viên hướng dẫn 1: TS Nguyễn Đăng Trình

- Giảng viên hướng dẫn 2: PGS.TS Trần Đức Học

Tp Hô Chi Minh, ngày 20 thang 12 năm 2021CÁN BỘ HƯỚNG DÂN 1 CÁN BỘ HƯỚNG DÂN 2

TS NGUYÊN ĐĂNG TRÌNH PGS.TS TRAN DUC HỌC

CHỦ NHIỆM BỘ MÔN TRƯỞNG KHOA

KY THUẬT XÂY DUNG

HVTH: Lê Hải Dang Trang 1

Trang 4

LỜI CÁM ƠN

Trước khi bước vào mục chính của luận văn này, tôi xin phép được gửi lời cảm

ơn chân thành nhất đến thầy PGS TS Trần Đức Hoc va thay TS Nguyễn Dang Trình đãnhiệt tình hỗ trợ tôi trong suốt quá trình thực hiện luận văn Thông qua những lần duyệtbài, những ý kiến xác đáng về chuyên môn, những buổi hướng dẫn trình bày, hướng dẫnthu thập dữ liệu và những động viên tình của hai thầy đã giúp tôi hoan thành luận vănmột cách tốt nhất

Đồng thời, xin cảm ơn quý Thầy, Cô của bộ môn Thi Công và Quản Lý Xây Dựngkhoa Kỹ thuật Xây dựng trường Dai Học Bách Khoa Thanh phó Hỗ Chi Minh đã tạođiều kiện, giúp đỡ, truyền đạt nhiều kiến thức chuyên mô trong suốt quá trình học bốnnăm Đại học và hai năm Cao học Sự giúp đỡ của quý thay cô là nguồn động lực dé tôitiếp tục nghiên cứu và công hiến cho khoa học trong thời gian sắp tới

Bên cạnh đó, tôi xin gửi lời cảm ơn chân thành đến bạn bè, anh chị em cùng lớpQuản lý xây dựng Khóa K2019, đã nhiệt tình hỗ trợ tôi trong học tap, trao đối kinh nghiệmlàm việc cũng như các mối quan hệ xã hội hỗ trợ tối thực hiện tốt luận văn này

Tôi xin gửi lời cảm ơn sâu sắc đến Quý chuyên gia đã bỏ ra hàng giờ đồng hồ détrò chuyện và hướng dẫn tôi với các dự án mà các chuyên gia đã trãi qua Nhờ sự giúp

đỡ này, luận văn càng thêm có giá trỊ.

Cuối cùng xin cảm ơn gia đình và đồng nghiệp đã đồng hành và hỗ trợ tôi trongsuôt hai năm học tập, tạo điều kiện dé tôi hoàn thành luận van.

Thành phố Hỗ Chí Minh, ngày 20, tháng 12, năm 2021

HVTH: Lê Hải Dang Trang 1

Trang 5

TÓM TATViệt Nam là một quốc gia được đánh giá có nhiều tiềm năng trong việc tạo ra nguồnnăng lượng mặt trời, số lượng dự án điện năng lượng mặt trời ngày càng rộng khắp cả nước.Tuy nhiên việc đưa ra các quyết định đầu tư dựa trên hiệu quả dự án cũng như quản lý xâydựng các dự án năng lượng mặt trời, cơ sở hạ tang phuc vu du an con nhiều mới mẻ Đứngtrước nhu cầu đó học viên đã thực hiện khảo sát và nghiên cứu các tác nhân ảnh hưởng đếnhiệu quả hay năng suât của một dự án điện năng lượng mặt trời.”

Bang cách tìm hiểu các nghiên cứu trước và khảo sát ý kiến từ các chuyên gia, nghiêncứu đã xác định được 16 nhân t6 ảnh hưởng trực tiếp đến năng suất của một dự án xây dựngnhà máy điện năng lượng mặt trời tại Việt Nam như: Khả năng đáp ứng của lưới điện tại địaphương, Cường độ chiều sáng và cường độ bức xạ năng lượng mặt trời phát ra, Độ cao địahình xây dựng, Các nhân tổ nay sẽ là cơ sở tham khảo quan trọng cho các nhà dau tư đánhgiá tìm năng ban đầu khi có ý định đầu tư dự án điện năng lượng mặt trời

Bên cạnh việc tìm ra 16 nhân tố ảnh hưởng đến năng suất của hệ thống điện nănglượng mặt trời, nghiên cứu còn tiễn hành tối ưu dự đoán năng suất của hệ thống điện nănglượng mặt trời bằng cách sử dụng phầm mén Clementine (hay còn được biết đến là IBMSPSS Modeler) ứng dụng sáu mô hình trí tuệ nhân tạo đơn bao gồm: hồi quy tuyến tinh(LR), hồi quy tuyến tinh tong quát (GENLIN), mang than kinh nhân tao (ANN), máy vector

hỗ trợ (SVM), cây phân loại và hồi quy (CART) và mô hình phát hiện tương tác tự độngChi — Squared (CHAID) dé tiễn hành phan tích khai thác các dữ liệu thu thập được từ trangweb Global Solar Atlas Sáu mô hình được sử dụng một cách độc lập để khai phá dữ liệuthu thập, bằng cách thực hiện việc kiểm chứng chéo bằng mô hình k — fold Sáu mô hìnhđơn với 10 tệp dữ liệu được đánh giá thông qua hệ số hiệu suất tổng hợp SI từ đó học viêntiếp tục xây dựng bốn mô hình kết hợp giữa các mô hình đơn có hiệu suất tốt nhất dé tôi ưuhóa kết quả dự đoán năng suất của dự án xây dựng điện năng lượng mặt trời

Kết quả cho thấy đối với nhóm mô hình đơn hai mô hình cho kết quả dự đoán tốtnhất là SVM và ANN, hai mô hình cho kết quả kém nhất là GENLIN và CHAID Sau khikết hợp các mô hình dự đoán đơn, mô hình kết hợp MH2 được kết hợp từ 2 mô hình SVM

và ANN cho ra kêt quả tôi ưu vượt trội hơn hăn các mô hình đơn trước đó.

HVTH: Lê Hải Dang Trang il

Trang 6

Vietnam is a country that is assessed to have a lot of potential in creating solar energy sources, the number of solar power projects is increasingly spreading across the country However, making investment decisions based on project efficiency as well as construction management of solar energy projects and project infrastructure is still new In the context

of this development, students have conducted surveys and researched the factors affecting the efficiency or productivity of a solar power project.

By studying previous studies, papers and surveying the experts, the study identified

16 factors that directly affect the productivity of a solar power plant construction project in Vietnam, such as: The responsiveness of the local power grid, the intensity of light and the intensity of solar radiation emitted, the elevation of the construction terrain, etc These factors will be an important reference base for Investors evaluate the initial potential when intending to invest in a solar power project.

Beside of finding out 16 factors affecting the productivity of solar power systems, the study also optimizes the predictive performance of solar power systems by using Clementine software (or also known as IBM SPSS Modeler) applies six single artificial intelligence models including: linear regression (LR), generalized linear regression (GENLIN), artificial neural network (ANN), support vector machine (SVM), Classification and regression trees (CART) and Chi — Squared automatic interaction detection (CHAID)

to conduct the analysis to exploit the data collected from the Global Solar Atlas website Six models were used independently to mine the collected data, by performing cross- validation using the k-fold model Six single models with 10 data files are evaluated through the SI performance factor from which students continue to create four combinated models that combine the best performing single models to optimize results predicting the yield of a solar power construction project.

The results show that for the single model group, the two models with the best predictive results are SVM and ANN, and the two models with the worst results are GENLIN and CHAID The combined model MH2 is combined from the SVM and ANN models, giving the optimal results that are superior to the previous single models.

HVTH: Lé Hai Dang Trang 11

Trang 7

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn này do chính tôi thực hiện dưới sự hướng dẫn của TS Nguyễn

Đăng Trình và PGS TS Trần Đức Học Các số liệu được sử dụng cho các phân tíchtrong luận văn minh bạch và được thu thập thông qua các khảo sát thực tế và công bốđúng quy định.

Tp.HCM, ngày 20 thang 12 năm 2021

HVTH: Lé Hai Dang Trang iv

Trang 8

MỤC LỤC

0902.) 090 iTOM TAT woicecccccccccccscscscsscscscsscscscsscscsesscscsvsscscsvsscscsesscsvsesscssesscsesecscscsesseavscsecseassecatssecesavees iiABSTRACT uoceccccscscssscsscscscssescssscscsssscsvsscscsvsscscsvsscstssscsssvsscssssscsesssscsssesacacavsssasavsesatenseeees iiiLOI CAM DOAN oiveecccccccccsccscscsscscscsscscscsscscscsscscscsscscssscsessecscsvsscsssssecassvsecssssecscassnesessavees ivDANH MỤC HINH ANH eecccccccccscccscsssscscssescscsscscscsscscsssscscsvsscscscsscsesssecstsssecstsssecsessesees ixDANH MỤC BANG BIEU o.ieeececcccsescescssssescsscscscsscsescssescsssscscsssscssssscssssscstssssestsssesnseseee xiDANH MỤC TU VIET TAT woieecccccccccccscccscscscscsscscscssescsssscsssssscssssscsssssscsssssestsessnasseeass xiiiCHUONG 1 - DAT VAN DE woeecccccccccccccccscsscscssscscsscscscssescsvsssscsesscsescsecstsssscstsnsseatsnsecssavees |1.1 GIỚI THIỆU CHỮƯNGG ¿2 52 SE EE2SE2E9EEEEEEEEEEEE151521E111 1111151151111 cXe, |1.2 ĐẶT VAN Đ - - c HT T1 12111111211 1111211 1111111111 111101111 111121111 1121111010210 21.3 MỤC TIỂU DE TÀI NGHIÊN CÍỨU - ¿2 - 22+ £E£E+E£EE£ESEEEEEESEErkrkrree, 21.4 PHAM VI NGHIÊN CỨU - - 2E S2 SE£E9EEEEEEEEEEEEEEEEEE1512511 115111110 31.5 DONG GÓP NGHIÊN CỨU ¿2-52 E9 SE E5 E3 15E1E12151511717115 11111 L.00 3

1.5.1 Đóng góp về mặt thực tiỄn + St St 11113 1E 11 1111111115 1E EEEErrrrrre 31.5.2 Đóng góp về mặt khoa HOC cccsesesessevscsvsesesececevecevsesesececevevevsesvstssecevevevsvsnseseeeeees 4

CHƯƠNG2 - TONG QUAN DE TÀI VÀ CÁC NGHIÊN CỨU HIỆN TẠI 52.1 TINH HINH PHÁT TRIEN NGÀNH ĐIỆN MAT TRỜI - 2 2 s+s+s¿ 5

2.1.1 Điều kiện thiên nhiên tại Việt Nam thuận lợi cho su phát triển năng lượng mặt trời Š 2.1.2 Tình hình phat triển các đự án điện năng lượng mặt trời tại Việt Nam 5

2.2 TRÍ TUỆ NHÂN TẠO VA HƯỚNG NGHIÊN CUU UNG DUNG TRONGNGANH NĂNG LƯỢNG MAT TRỜI ¿- - <5 +k+E SE 2E EEEE121515 1111111 8

2.2.1 Trí tuệ nhân tạo và các ứng dụng - 11122 22223111112 2501111111158 111g ky 8 2.2.2 Hướng nghiên cứu ứng dung tri tuệ nhân tao trong lĩnh vực năng lượng tái tao 9

2.3 MOT SO NGHIEN CUU HIEN TAI VE NANG LUONG MAT TROI TAI VIETNAM 0G G1 0 1 1 11111511 1111211 111111111111 11 111111111111 1111111111111 1111121111012 11g 102.4 MỘT SỐ NGHIÊN CUU UNG DUNG TRÍ TUE NHÂN TẠO TRONG LĨNHVUC NĂNG LƯỢNG MAT TRỜII ¿2 52 SE E2 EEEESEEEEEEEE5E1E115 11711110 112.5 DE XUẤT CÁC NHÂN TO ANH HUONG DEN NĂNG SUAT CUA HỆ THONGĐIỆN NANG LUONG MAT TRRỜI ¿- - << E2 EEEES E1 1515112115111 7111 1c, 122.6 TRIEN VỌNG CUA HƯỚNG NGHIÊN CỨU ¿-2- 25252 s+cz£cxzezrsceee 15

HVTH: Lê Hải Dang Trang v

Trang 9

2.7 TONG QUAN VE TRI TUỆ NHÂN TẠO VA CAC THUAT TOÁN 15

2.7.1 Khái niệm trí tuệ nhân tao oo ccececcccccceeeecececececeeeccecceceuaussecececauusesecceeauaeseseeeess 15 2.7.2 Khái niệm học máy (Machine Learning) - - - - 5 + + 2322113133 * 2E Esssseseeeeses l6 2.7.3 Khai phá dữ liệu (Data min1n8) - c2 3222222311 11123531 1111115821111 vn nreg 17

2.7.4 Mang than kinh nhân tạo ANN.oo cccccccccccsceccsssccessesessesecsesacsevasstsecsevassevacsevatsevacseeaesees 18 2.7.5 Mô hình máy vector hỗ tro (Support vector machine - SVM) ccccccssec: 20 2.7.6 Mô hình héi quy tuyến tinh (Linear Regression) c.ccccecesesesesessesesesesesesesevsvseeee 22

2.7.7 Mô hình hồi quy tuyén tinh tong quát (General Linear Regression - GenLin) 222.7.8 Mô hình cây phân loại và hồi quy (Classification and Regression Tree — CART) 23

2.7.9 Mô hình tự động phát hiện tương tác Chi — squared (CHAITD) - 25

2.7.10 Mô hình kết hop (Ensemble model) -¿- ¿+ tscs‡EvEEEEEEESEEESEEEEEEEEEEEErksrrrerrrees 25

2.8 PHƯƠNG PHAP KIEM CHUNG CHEO (CROSS VALIDATION) 26

2.8.1 Giới thiệu chung về phương pháp kiểm chứng chéo 5 cv EzE£E+ErEcrvzee: 26

2.8.2 Áp dụng kiểm chứng ChEO s.cccccccccescssesesessvsvsecevsvsusecevseesecsvsusavsvsvsesecevsnsasecevaneavevens 27

CHƯƠNG 3 - PHƯƠNG PHÁP NGHIÊN CỨU 2-2 + + +E+E+E+ESESEErEeEersrrered 283.1 QUY TRÌNH NGHIÊN CỨU - G6 S6 SE ESESESESESEEEEEEEEEEESEEEEEEEeEsrerrererered 283.2 THU THAP DU LIEU 0000 31

3.2.1 Thu thập các nhân tố anh hưởng đến năng suất ảnh hưởng đến năng suất hệ thống điện

MAE LOL, occ : 31

3.2.2 Thiết kế bảng câu hỏi - 2 E13 SE ESE2151115E171111151111E7E1E1EE1E 1E EEETEErrre 33

3.2.3 Khảo sat và thu thập dữ liệu - - - Q2 2223111112223 11 1115821111111 ng 1 vn ngu 36

3.3 THANG ĐO VA KIEM ĐỊNH THANG ĐO - ¿-5c2tccvccrcrverrrrrerrrre 37

3.3.1 Phân tích độ tin cậy Cronbach's Alpha - - 7 22 222111112222 221 11 E11 EEEcseerxks 37

3.3.2 Phân tích nhân tố khám phá EEA ¿2 St 3‡ESEEEEE2ESEEEEEEEEEEEESEEEEEEEEEEEEEErkrkerere 38

3.4 GIỚI THIỆU CONG CỤ NGHIÊN CỨU -¿-55¿25ccccvrxssrvsrrrsrrrrrrree 40

3.4.1 Phần mềm phân tích thống kê IBM SPSS -¿ 2 St SE EEEEE2E1EEEEEEEEEEErkrrerrre 40 3.4.2 Phần mềm khai thác đữ liệu IBM SPSS Modeler — Clementine 2s sa s2: 40

CHUONG 4 - PHAN TÍCH DỮ LIỆU 2-55¿25+2£++£xt+Extzrtsrrsrtrrrrsrkrrrrree 424.1 PHAN TÍCH DAC DIEM DU LIEU NGHIÊN CỨU .- -5 52 424.2 ĐẶC DIEM MÂU NGHIÊN CUU -¿-55¿+c+c2xt+Extsrterrsrkrrrrrrrerrrree 42

4.2.1 Chuyên ngành làm việc của đối tượng tham gia khảo sát . 2cccccceczczec: 42 4.2.2 Sô năm kinh nghiệm trong lĩnh vực làm viỆc - + +2 + ‡EvEEESEEEE+Erxerrrerrrssees 43

4.2.3 Vị trí làm việc của đối tượng tham gia khảo sát - - 7-5522 S2+2<s++szsseeea 44

4.2.4 Thời gian làm việc trong lĩnh vực năng lượng tái fạO . - 55555 c<<<<cccs++ 45 HVTH: Lê Hải Dang Trang vi

Trang 10

4.3 KIEM ĐỊNH CRONBACH’S ALPHA - ¿2-5-5252 E+EEE£E2EEEEEEEEEEEEEerkrkrree 46

4.3.1 Nhĩm I - Các nhân tố liên quan đến quy hoạch và xây dựng - -cccccczec: 47 4.3.2 Nhĩm II — Các nhân tố liên quan đến thời tiết và vị trí địa lý -cscccccccec: 48

4.3.3 Nhĩm III — Các nhân tố liên quan đến kỹ thuật của hệ thống điện mặt trời 494.3.4 Nhĩm IV - Các nhân tố liên quan đến chất lượng của hệ thống điện mặt trời 494.3.5 Nhĩm V - Các nhân tổ liên quan đến vận hành hệ thống điện mặt trời 50

4.4 PHAN TÍCH NHÂN TO KHAM PHA EEFA 5-5 +52 E+EE+E+E£E+EeErereesee 514.5 XEP HANG MUC ĐỘ ANH HUONG CÁC NHÂN TƠ 255555: 55CHƯƠNG 5 - MƠ HINH NGHIÊN CỨU VA KET QUA TOI ƯU -5-5¿ 585.1 XÂY DUNG MO HINH NGHIÊN CUU - 25 2S2+E+Ez£E£EzEzrreerered 58

5.1.1 Xây dung mơ hình nghiên cứu - + 2211332233311 31123381 111115855111 xrre 58 5.1.2 Dữ liệu nghiên cứu -. 2c 111122 22111111152511 111155531 111111511111 vn rrc 59

5.1.3 Phương pháp đánh giá hiệu suất mơ hình huấn luyện + 2 x+x+x+xezvzeErsze2 61

5.2 THUC HIỆN MƠ HÌNH + 2E S223 E5 E23 EEE121111111111511 1151111 Txcxe, 62

5.2.1 Phân chia chia dữ liệu thành 10 — ÍoÏd G c7 1611011331111 111110 151111 k key 62

5.2.2 Khai báo các thơng số cho các mơ hình 5c E+EEE‡EEEEESEEEESEEErrrrerrrersred 64

5.2.3 Xây dựng mơ hình trong Clementine - - +5 5 22 E3 332222 £+++xzeeeeeeezzeesees 67

5.3 KET QUA TOI UU MƠ HINH ĐƠN - Gv S HE kg re, 68

5.3.1 Kết quả đánh giá fold Loic cccccccccccscsesecesesesscscsesvssececscsvsvsvssecacecevevsvsusvacevevevevevanees 685.3.2 Kết quả đánh giá fold 2 ooo ccceccccccceccscscsececesevscscsvsvsesecececevevsvssecececevevsvsescacevevevevevanees 685.3.3 Kết quả đánh giá fold 3 5 s1 1133 EEEEEE1E115111EE7111112111 111 ETETETEEEtErrrrrrrei 685.3.4 Kết quả đánh giá fold 4 ooo cccccccccccccscsesccesesesecscsvsvsesececscevevsvsusececevevevsveescacecevevevevanees 695.3.5 Kết uả đánh giá fold 5 cceccccccccscscsesesececsvsvecsusecececevsvevsusesecevavevsvsnsesecevevevevsnseseeeees 695.3.6 Kết quả đánh giá fold 6 ooo ccccccccceccscseseceseserecscsesesusscecscevevsvsusecacecevsvsvsescacecevevevevanees 705.3.7 Kết quả đánh giá fold 7 oo ceeccccccecccscsesecesecevecsvsesvsusscececsvevsvsusecececevevsvesusacecevevsvevsnees 705.3.8 Kết quả đánh giá fold 8 ooo cccccccccccccscsesecesesesscsvsesvsusececscevevsvsusecacecevevsvevsusacecevevevevsnees 705.3.9 Kết quả đánh giá fold 9 ooo ceccccccccccscsesecesesevscsvsvsvsusecececevevsvsusecacecevevsvsessacevevevsvevsnees 715.3.10 Kết quả đánh giá fold 10 ccccccccccccsecccesesesscscsesecesececscsvsvsvsusecececevecsvsnsessevevecevevsnees 715.3.11 Kết quả đánh giá tong hop cccsececececesescsesesececsvsvevsusesecscevevsvsnsessvecevevsvevseeees 715.3.12 Kết qua tổng hợp hệ số đánh giá mức độ quan trong của biến (Variable Importance)

¬ = 72

5.4 KET QUÁ DANH GIA MƠ HÌNH KET HỢP - 2 2 SE SEeE+E+EzEsxserees 75

5.4.1 Xây dựng mơ hình kết hợpp - c t3 E2 EE1E215EE1EEEEE 711121111111 EEEEEErerrrerrred 75

5.4.2 Kết quả đánh giá mơ hình kết hợp, tập huấn luyện số I - ¿2225 zcxczvzvErszx2 76

HVTH: Lê Hải Dang Trang vil

Trang 11

5.4.3 Kết quả đánh giá mô hình kết hợp, tập huấn luyện số 2 ¿222cc cxccvzvErszx2 77 5.4.4 Kết quả đánh giá mô hình kết hop, tập huấn luyện số 3.0 ceseceeeceseesceeseeeseeeees 77 5.4.5 Kết quả đánh giá mô hình kết hop, tập huấn luyện số 4.0.0.0 ccseceeeceseesceeseeeseeeees 77 5.4.6 Kết quả đánh giá mô hình kết hop, tập huấn luyện $6 5.0.0 ccccccccseceeecesessceeseeeseeeees 78 5.4.7 Kết quả đánh giá mô hình kết hop, tập huấn luyện $6 6.0 0.ccccccccccseceeeseseseerseseeeeeees 78 5.4.8 Kết quả đánh giá mô hình kết hop, tập huấn luyện $6 7.0 cececcecccsececeseseeseeseeeeeeeees 78 5.4.9 Kết qua đánh giá mô hình kết hop, tập huấn luyện số 8 2 25c sec czvErsze2 78 5.4.10 Kết quả đánh giá mô hình kết hop, tập huấn luyện số 9.0 ccecececeseeeeseseeeseeeees 79 5.4.11 Kết quả đánh giá mô hình kết hợp, tập huấn luyện số 10 5 +cccscezrsss2 79 5.4.12 Kết quả đánh giá tong hợp các chỉ số của mô hình kết hợp : ssscsss¿ 79

5.5 SO SÁNH KET QUA GIỮA MÔ HINH DON VA MÔ HINH KET HỢP 80CHUONG 6 - KET LUẬẬN - - - + EEESESEEE9 E8 EE1E115111111151111111511 1111k 846.1 KẾT LUẬN 5c S221 1 E5 1215151121515 1111511111511 1115 11111010111 010101 1111111 ke 846.2 KIÊN NGHỊ HƯỚNG NGHIÊN CỨU TƯƠNG LLAI - 2 2255+s£s2s+: 85DANH MỤC CONG TRINH DA CÔNG BỒ S2 1 1211 1112112111211 1111 te 86TÀI LIEU THAM KHẢO G5562 12 521 1515211115 1111511 1115111115111 1151111011111 87

0809 2 9]PHU LUC 1 - BANG CẤU HOI KHAO SÁT CÁC NHÂN TO ANH HƯỞNG 91PHU LUC 2 — KET QUA KIEM ĐỊNH CRONBACH’S ALPHA - -5- 98PHU LUC 3 - KET QUA PHAN TICH EFA Q ccecescscscsecececececececececececececesvsvevevaveveveees 103PHU LUC 4- BO DU LIEU SỬ DUNG CHO NGHIÊN CỨU GIAI DOAN 2 113PHU LUC 5 - KET QUA TOI UU DU DOAN NĂNG SUAT HE THONG ĐIỆN NANGLUONG MAT TRỜI TỪ CÁC MÔ HINH Qu eececcscecccscescecssesescssesesessessssssesssssseeeeees 122DANH SÁCH CAC CHUYEN GIA THAM GIA KHAO SÁTT - 25s: 172

LY LICH TRÍCH NGANG - 5223 E5 1 E9EE1E1515111115 1111111111111 T111 X6 173

HVTH: Lê Hải Dang Trang vill

Trang 12

DANH MỤC HÌNH ANH

Hình 1.1 Công suất lắp đặt năng lượng mặt trời khu vực ASEAN từ 2010 - 2019[2] 2Hình 2.1 Biểu đồ sự phát triển năng lượng khu vực ASEAN giai đoạn 2005 — 2040[2] 6Hình 2.2 Bảng đồ công suất điện mặt trời tại một số tỉnh thành.[4] - - 2s s +: 7Hình 2.3 Ứng dụng của AI trong năng lượng tái tạO cv evekrereeree 10Hình 2.4 Mô hình hóa quy trình của trí tuệ nhân †ạo - 555cc issssssseesres 15 Hình 2.5 Mô hình phan loại các thuật toán Machine learning - << < «<< ssss++ 17 Hình 2.6 Mô hình thuật toán ANN LLc- cv 19 Hình 2.7 Mô hình thuật toán SVÌM - - cv 21Hình 2.8 Mô hình phương pháp kiểm chứng chéo ¿2-2-5 + +E+E£E+E+E+EeErezxsez 27Hình 3.1 Sơ đồ khối quy trình nghiên cứu giai đoạn Ì - 2 2 s+s+s+x+s+Ee£+e+xexez 29Hình 3.2 Sơ đồ khối quy trình nghiên cứu giai đoạn 2 - - + 2 s+s+x+x+x+EsErezxsee 30Hình 4.1 Biểu đồ thé hiện cơ cấu chuyên ngành của đối tượng tham gia khảo sát 43Hình 4.2 Biểu đồ thể hiện cơ cau số năm đối tượng tham gia khảo sát - 44Hình 4.3 Biéu đồ thé hiện cơ cấu vị trí làm việc của đối tượng tham gia khảo sát 45Hình 4.4 Biéu đỗ thé hiện cơ cau thời gian làm việc trong lĩnh vực năng lượng tái tạo củađối tượng tham gia khảo sấtt - - - - E111 9E9E9 5E EvSTTcTT T111 11 0111111111111 46Hình 5.1 Lưu đồ mô hình nghiên cứỨu 2-2-5 2S +E+E+E£E+EEEE+E£E£ESEEEEEEEEEEeEeEererkrkrree 58Hình 5.2 Sơ đồ phân chia dữ liệu thành 10 — fold - + 2 256 S+E+E£E£EE+E+EeEerererxrsee 62Hình 5.3 Nhập tập dữ liệu số 1 vào mô hình Clementine khai báo các thông SỐ 63Hình 5.4 Gan dé liệu huấn luyện vào mô hình Clementine - - 5 s+s+s+s+sscse 64Hình 5.5 Ví dụ khai báo cho mô hình SVMM - SH HH HH HH nen 67Hình 5.6 Mô hình huan luyện đơn trong Clementine 2-5 + 2+ s+x+x+x+Es£+x+xxez 67Hình 5.7 Biểu đồ thể hiện chỉ số đánh giá mức độ quan trọng của bién mô hình SVM 72Hình 5.8 Biểu đồ thể hiện chỉ số đánh giá mức độ quan trọng của biến mô hình ANN 73Hình 5.9 Biểu đồ thể hiện chỉ số đánh giá mức độ quan trọng của biến mô hình GENLIN

Hình 5.10 Biểu đồ thể hiện chỉ số đánh giá mức độ quan trong của bién mô hình LR 74Hình 5.11 Biểu dé thé hiện chỉ số đánh giá mức độ quan trọng của biến mô hình CART

HVTH: Lê Hải Dang Trang 1x

Trang 13

Hình 5.13 Mô hình huấn luyện kết hợp trong Clementine ¿2 - + +s+z+xe+x+x+ssz 76Hình 5.14 Biéu đồ thé hiện hệ số hiệu suất tổng hop SI của các mô hình 81Hình 5.15 Biéu đồ thể hiện hệ số TQTT R của các mô hình - - 5 +s+s+x+e+esese 82Hình 5.16 Biểu đồ thé hiện MAPE của các mô hình - 2 5- 2 2+s+£z£z+xz£z£szxez 82Hình 5.17 Biểu đồ thé hiện MAE của các mô hình ¿- - 2 2s +£2£E+Ez£zsz£z£zzxez 83Hình 5.18 Biểu đồ thé hiện RMSE của các mô hình - 25-5 2 2+s+£+£+x+£z£scxez 83

HVTH: Lê Hải Dang Trang x

Trang 14

DANH MỤC BANG BIEU

Bảng 2.1 Thống kê số giờ năng trong năm tại một số vùng trên cả nước 5Bảng 2.2 Mục tiêu năng lượng tái tạo tầm nhìn 20300 - G6 evekeeeeeree 8Bảng 2.3 Bảng các nhân tổ dé xuất ảnh hưởng đến năng suất hệ thống điện năng lượngMAt {TỜI - L- << Ă E131 111100300 111 E1 ng E 13

¬ 3lBảng 3.2 Mức độ ảnh hưởng của các nhân tỐ - - + + SE ‡keEeEEEeEeEerersrrecee 33Bảng 3.3 Mức độ ảnh hưởng của các nhân tỐ - - - + + SE ‡keEeEeEeEeEerersrerecee 34Bảng 3.4 Giá trị tiêu chuẩn của hệ số tải tương ứng với kích thước mẫu 39Bảng 4.1 Thống kê chuyên ngành làm việc của người tham gia khảo sát - 42Bảng 4.2 Thống kê số năm kinh nghiệm làm việc của người tham gia khảo sát 43Bảng 4.3 Thống kê vị trí làm việc của người tham gia khảo sát - 5-5-5 5552 44Bảng 4.4 Thống kê thời gian làm việc trong lĩnh vực năng lượng tái tạo của của ngườitham gia Khao Sat 0117 444 45Bang 4.5 Kết quả kiểm định Cronbach’s Alpha đối với từng nhóm nhân tố 46Bảng 4.6 Hệ số Cronbach’s Alpha nhóm nhân tổ liên quan đến quy hoạch và xây dựng47Bang 4.7 Hệ số Cronbach’s Alpha nhóm nhân tô liên quan đến thời tiết và vị trí địa lý 48Bảng 4.8 Hệ số Cronbach’s Alpha nhóm nhân tố liên quan đến kỹ thuật của hệ thống điệnMAt {TỜI - L- << Ă E131 111100300 111 E1 ng E 49Bang 4.9 Hệ số Cronbach’s Alpha nhóm nhân tố liên quan đến chất lượng của hệ thốngđiện MAt {TỜI - - + + Ă E113 161118050 111181001 net 50Bang 4.10 Hệ số Cronbach’s Alpha nhóm nhân tố liên quan đến vận hành hệ thống điệnMAt {TỜI - L- << Ă E131 111100300 111 E1 ng E S1Bang 4.11 Kết quả kiểm định KMO và Bartleft”§ - - S33 E#ESESESEeErkrkrkeeekeed 52Bảng 4.12 Kết quả phân tích nhân tỐ - - - + E+E+ESESEEEEEEEEEE£EeEeEEEekekekekrerreree 52Bảng 4.13 Bảng xếp hạng mức độ ảnh hưởng của các nhân tố đến năng suất của hệ thốngdién nang LONG MAC LOL 0.2 eee 4111 55Bang 5.1 Bang xếp hạng các nhân tô ảnh hưởng nhiều nhất đến năng suất hệ thống điệnNANG [WONG MAL POL eee 7 = ae 59Bảng 5.2 Các nhân tô được chon phục vụ thu thập dữ liệu giai đoạn 2 60Bảng 5.3 Bảng các thông số khai báo mô hình - - + + + SE £E£E+E£EeEeEeEeEsrereree 64

HVTH: Lê Hải Dang Trang xi

Trang 15

Bảng 5.4 Kết quả các thông số đánh giá mô hình đơn cho fold 1 5-5-5 +52: 68 Bảng 5.5 Kết quả các thông số đánh giá mô hình đơn cho fold 1 5- 5-5 +52: 68 Bảng 5.6 Kết quả các thông số đánh giá mô hình đơn cho fold 1 - 5-5-5 +52: 68 Bảng 5.7 Kết quả các thông số đánh giá mô hình đơn cho fold 1 - 5-5-5 +52: 69 Bảng 5.8 Kết quả các thông số đánh giá mô hình đơn cho fold 1 5-5-5 +52: 69 Bảng 5.9 Kết quả các thông số đánh giá mô hình đơn cho fold 1 5- 5-5-5552: 70 Bang 5.10 Kết quả các thông số đánh giá mô hình đơn cho fold 1 eee 70 Bang 5.11 Kết quả các thông số đánh giá mô hình đơn cho fold 1 5-5- 25s: 70 Bang 5.12 Kết qua các thông số đánh giá mô hình đơn cho fold 1 5-5- 25s: 71 Bang 5.13 Kết qua các thông số đánh giá mô hình đơn cho fold 1 5-5- 25s: 71

Bang 5.14 Kết qua tong hợp các chỉ số đánh giá đối với mô hình don 71

Bảng 5.15 Mô hình kết hop v.cccccscscsesscscscscsesececscecscsvsvevsvsvsvsesececscscacasavsvavavavsssesecssnenens 75 Bang 5.16 Kết quả các thông số đánh giá mô hình kết hợp cho fold 1 76

Bang 5.17 Kết quả các thông số đánh giá mô hình kết hợp cho fold 2 -. : 77

Bang 5.18 Kết qua các thông số đánh giá mô hình kết hợp cho fold 3 77

Bang 5.19 Kết quả các thông số đánh giá mô hình kết hợp cho fold 4 77

Bang 5.20 Kết quả các thông số đánh giá mô hình kết hợp cho fold § - 78

Bảng 5.21 Kết quả các thông số đánh giá mô hình kết hợp cho fold 6 78

Bang 5.22 Kết quả các thông số đánh giá mô hình kết hợp cho fold 7 78

Bang 5.23 Kết quả các thông số đánh giá mô hình kết hợp cho fold 8 - 78

Bảng 5.24 Kết quả các thông số đánh giá mô hình kết hợp cho fold 9 - +: 79

Bang 5.25 Kết quả các thông số đánh giá mô hình kết hợp cho fold 10 79

Bảng 5.26 Kết quả các thông số đánh giá mô hình kết hợp cho fold 1 - 79

Bang 5.27 Bảng so sánh các chỉ số đánh giá mô hình đơn và kết hợp -: 80

HVTH: Lé Hai Dang Trang xI

Trang 16

DANH MỤC TU VIET TAT

LR: Hồi quy tuyến tinh (Linear Regression)

GENLIN: Hồi quy tuyến tính tổng quát (General Linear Regression)

ANN: Mạng than kinh nhân tao (Artificial neural network)

SVM: Vector hé tro (Support Vector Machine)

CART: Cây phân loại va hồi quy (Classification and regression trees)

CHAID: Mô hình phát hiện tương tác tự động Chi - Squared (Chi — Squared Automatic Interaction Detection)

EFA: Phân tích nhân tố chính (Exploratory Factor Analysic)

AI: Trí tuệ nhân tao (Artificial Intelligence)

ML: Machine Learing (Học may)

SI: Chỉ số tổng hop

R: Hệ số tương quan tuyến tính

MPAE: Phần trăm sai số trung bình tuyệt đối

MAE: Sai số trung bình tuyệt đối

RMSE: Sai số toàn phương trung bình

TOE: Tan dầu tương đương (Tonne Oil Equivalent)

NLP: Xử lý ngôn ngữ tự nhiên (Natural Language Processing)

NLMT: Năng lượng mặt trời

NLTT: Năng lượng tái tạo

TQTT: tương quan tuyến tính

HQTT: hồi quy tuyến tính

HVTH: Lê Hải Dang Trang xiii

Trang 17

CHUONG 1 - ĐẶT VAN DE

1.1 GIỚI THIỆU CHUNG

Hiện nay van dé chung của nhân loại chính là các van đề liên quan đến môi trường vàtình trạng biến đối khí hậu trên toàn cầu đã diễn ra không ngừng, trong đó việc khai thác

và sử dụng các nguồn nhiên liệu như dầu mỏ, than đá, khí tự nhiên để nham mục đíchtạo ra hệ thống điện chính là nguyên nhân chính Trước thực trạng này, NLTT dang được

áp dụng như một phương pháp để hạn chế tiêu cực trên

Một số loại năng lượng có thé tái tạo tiềm năng như: Gió, mặt trời, năng lượng sinhkhối, địa nhiệt các thành phan này đang dan trở thành một phần không thể thiếu củangành điện, bên cạnh đó là thủy điện Theo [1] được đăng trên trang web Our World inData, biểu đồ dự báo xu hướng tăng trưởng của NLTT toàn cau được thể hiện ở hình 1.1

Ngành NL tái tạo được dự báo sẽ phát triển vượt bậc trong khoảng thời gian tới, đây

là xu hướng chung của toàn cầu dé hạn chế ton hại về môi trường và đảm bảo an ninh nănglượng.

Đông Nam A không năm ngoài xu hướng nay, nganh năng lượng tái tạo liên tụctăng trưởng đòi hỏi việc xây dựng và quản lý xây dựng các cơ sở cho ngành là vô cũng cầnthiết và cấp bách Việt Nam được xem xét là một đất nước có nhiều lợi thế để phát triểnlĩnh vực này ở khu vực Đông Nam Á dựa trên các số liệu thống kê về những dự án xâydựng và đang chờ cấp phép

Sự tăng trưởng của các nguồn NLTT tại Việt Nam tương đối mạnh, trong bối cảnhcác nhà máy thủy điện có tác động khá lớn đến môi trường tự nhiên và dân cư Tính đếnnăm 2019, Việt Nam là đất nước đi đầu trong cuông cuộc xây dựng các nhà máy điệnNLMT.

Trong thời gian gan đây, Việt Nam là quốc gia có tốc độ xây dựng điện NLTT nhanhchóng trải dài khắp toàn quốc

HVTH: Lê Hải Dang Trang |

Trang 18

BIEU DO NĂNG LƯỢNG MAT TRỜI ĐƯỢC LAP DAT KHU

VỰC DONG NAM A GIAI DOAN 2010 - 2019

Indonesia Malaysia Philipines Singapore Thái Lan Việt Nam

Năng suât năng lượng mặt tròi lắp đặt (MW)

Trước sự tăng trưởng mạnh và xây dựng có kế hoạch của các dự án điện NLMT, tuynhiên các nghiên cứu có sự tồn tại của yếu tố khí hau, vị tri XD, CSVC va KT vẫn còntương đối ít

Ngành công nghiệp NLTT và năng lượng MT là các ngành mới mẻ tại Việt Nam và cónhiều cơ hội để phát triển, nhưng việc tìm kiếm, ước tính va toi ưu năng suất của một hệthống năng lượng mặt trời dựa trên các yếu t6 ảnh hưởng được khảo sát và nghiên cứu tạiViệt Nam là chưa nhiều Điều đó đặc ra vẫn đề về tính cần thiết và cấp thiết phải có cácnghiên cứu về van dé này dé hiểu, quản ly và xây dựng các dự án năng lượng mặt trời cũngnhư NLTT một cách có hiệu quả va đạt được lợi ích tối ưu nhất

1.3 MỤC TIỂU DE TÀI NGHIÊN CỨU

Mục tiêu chính của dé tài này là ứng dụng trí tuệ nhân tạo để tối ưu các nhà máy NLMTtại Việt Nam, với mức von đâu tư lớn và hiệu quả thiệt thực Ngoài ra nghiên cứu còn tập trung vào việc chỉ ra các nhân tô ảnh hưởng đên hiệu năng của các nhà máy này tại Việt

HVTH: Lê Hải Dang Trang 2

Trang 19

Nam và đánh giá các nhân tố đó.

Xây dựng mô hình tối ưu năng suất dựa trên các nhân tô ảnh hưởng đã xác định được.Đưa ra phương hướng cho các nghiên cứu tiếp theo trong lĩnh vực năng lượng mặt trờitại Việt Nam nói riêng và trên thế giới nói chung

1.4 PHAM VI NGHIÊN CUU

Đối tượng nghiên cứu:

+ Các nhà máy điện NLMT tại Việt Nam

+ Các chuyên gia làm việc tại các nhà máy, các công ty thiệt kê các nha máy điện năng lượng mặt trời.

+ Cac nhà cung cap, đơn vi sản xuât các tam pin năng lượng mặt trời.

Các thuật toán được sử dụng để nghiên cứu tôi ưu năng suất hệ thống điện năng lượng mặttrời dự kiến được dùng trong nghiên cứu:

+ Máy học vector hỗ trợ (SVM)

+ Mạng thần kinh nhân tạo (ANN)

+ Mô hình hồi quy tuyến tính (LR)

+ Mô hình hỏi quy tổng quát (GENLIN)

+ Mô hình cây phân loại và hồi quy (CART)

+ Mô hình tự động nhận diện tương tác (CHAID)

+ Xây dựng mô hình kết hợp (Esemble model)

Trang 20

Dé xuât được hướng nghiên cứu khác cho các nghiên cứu tới.

HVTH: Lê Hải Dang Trang 4

Trang 21

CHƯƠNG2 - TONG QUAN DE TÀI VA CÁC NGHIÊN CỨU HIEN TẠI

2.1 TINH HÌNH PHÁT TRIEN NGÀNH ĐIỆN MAT TROT

2.1.1 Điều kiện thiên nhiên tại Việt Nam thuận lợi cho sự phát triển năng lượngmặt trời.

Bức xạ mặt trời là một nguồn tài nguyên nội bật tai Việt Nam, cùng với số 210 nanghàng năm rat cao từ 1500 — 1700 giờ một năm ở miền Bắc va từ 2000 — 2600 giờ một năm

ở miễn Nam Với lợi thê nay đã tạo cơ hội phát triên cho các nha máy điện mặt trời.

Với số 210 nang cao, lượng bức xạ mặt trời — một trong những nhân tố ảnh hưởng đếnnăng suất của hệ thống điện mặt trời, cũng có sản lượng rất lớn và dồi dào từ 3.69 kWh/m2dén 5.6kWh/m2

Bang 2.1 Thong kê sô giờ nang trong năm tai mot so vùng trên ca HưÓc.

Khu vực Số giờ nắng mộtnăm Cường độ bức xa Đánh giaĐông Bắc Bộ 1600 — 1750 3.3— 4.1 Trung bìnhTây Bắc Bộ 1750 — 1800 4.1—4.9 Trung bìnhBắc Trung Bộ 1700 — 2000 4.6 — 5.2 Tốt

2.1.2 Tình hình phát triển các dự án điện năng lượng mặt trời tại Việt Nam

Bởi chính sách đối mới của nhà nước và đặc biệt là điều kiện tự nhiên thuận lợi đã giúptăng trưởng về số lượng nhà máy điện NLMT trong thời gian gần đây Thoe ước tính có

102 nhà máy điện mặt trời đi vào hoạt động và cung cấp hơn 5.245MW điện mặt trời cho

HVTH: Lê Hải Dang Trang 5

Trang 22

thị trường vào năm 2020 Song song tại thời điểm này có 260 dự án đã và đang được tiếnhành đầu tư với tổng công suất 28.300MW.

ASEAN Installed Power Generation Capacity Growth, APS

Tăng trưởng công suất phát điện lắp đặt của ASEAN

từ mức không đáng kề hiện nay lên đạt khoảng 0,5% (2020), khoảng 6% (2030) và khoảng20% (2050).

Việc sử dụng hệ thống điện năng lượng mặt trời để cung cấp cho các hộ dân cưnhăm mục đích cho việc sản xuât và dịch vụ Tong năng lượng mặt trời cung cap nhiệt tang

từ 1,1 triệu TOE (2020) lên khoảng 3,1 triệu TOE (2030) và 6,0 triệu TOE (2050).

HVTH: Lê Hải Dang Trang 6

Trang 23

Quang Ngài

_- 345 MW Bình Denh

1932 MW

Phu Yen

1286 MW Khanh Hoa

1165 MW Ninh Thuan

5420 MW Binh Thuan

3593 Mw

Ba Ria Vung Tau

Hình 2.2 Bang đô công suất điện mặt trời tại một số tỉnh thanh.[4]

Theo [5]: Tăng trưởng nguồn điện NLMT bao gồm cả nguồn điện lắp đặt trên mặtđất va mái nhà: Dua tổng công suất nguồn điện mặt trời từ mức không đáng kế hiện naylên Khoảng 850 MW (2020), Khoảng 4.000 MW (2025) và Khoảng 12.000 MW (2030).Điện năng sản xuất từ nguồn điện mặt trời chiém ty trọng Khoảng 0,5% năm 2020, Khoảng1,6% (2025) và Khoảng 3,3% (2030).

HVTH: Lê Hải Dang Trang 7

Trang 24

Bảng 2.2 Mục tiêu năng lượng tai tạo tam nhìn 2030

Loại năng

lượng tái tạo 2020 2025 2030

Gió Tổng công suất (MW) 800 2.000 6.000

2.2.1 Tri tuệ nhân tạo và các ứng dung.

Trí tuệ nhân tao đang là xu hướng được dùng dé ứng dụng tối ưu trong nhiều lĩnhvực đời sống Khả năng học và nâng cao kết quả theo thời gian của thuật toán trí tuệ nhântạo, giúp kết quả dự đoán tối ưu càng chính xác hơn theo thời gian [6]

Bên cạnh đó khả năng xử lý được dit liệu lớn, nhiều bién phức tạp với sự hỗ trợ củamáy, điều này giúp ta có thé xét đến nhiều yếu tố có ảnh hưởng nhưng bị bỏ qua trước đây

do sự hạn chết của thuật toán hay công cụ xử lý dữ liệu

Trong ngành xây dựng, trí tuệ nhân tạo giữ vai trò cần thiết trong quá trình tối ưuhóa thiết kế, sử dụng nguyên vật liệu và chi phí thích hợp cho dự án hoặc ứng dụng trí tuệnhân tạo trong mạng lưới đô thị, căn hộ thông minh là một xu hướng đang được ứng dụngmạnh mẽ Ngành QL xây dựng cũng ngày càng nhiều nghiên cứu va ứng dụng trí tuệ nhântạo được đưa ra Tự động hóa và tối ưu hóa dự đoán hệ thống NLMT là dé tài nắm bắt xuhướng này là thỏa mãn tính cấp thiết của thực tế ngành trong thời gian gần đây

HVTH: Lê Hải Dang Trang §

Trang 25

Tự động hóa quá trình ước lượng năng suất dự án điện mặt trời thông qua công suất sảnsinh quang điện dựa trên các số liệu và nhân tô tác động khách quan không chỉ để tăng hiệuquả dự báo mà còn đê loại trừ các yêu tô sai sót do chủ quan.

2.2.2 Hướng nghiên cứu ứng dụng trí tuệ nhân tạo trong lĩnh vực năng lượng tái

tạo.

Trong xây dựng, AI có nhiều ứng dụng như:

- _ Điều khiến tập trung, thông minh — Tối ưu hóa hiệu năng và dự báo năng suất của

hệ thống trong nhiều điều kiện phức tạp mà khả năng của con người giới hạn.[7]

- Ung dụng nghiên cứu, ứng phó và giảm đi rủi ro trong xây dựng bang mô thuật toánkết hợp Fuzzy FMEA và Fuzzy AHP [8]

- Kiém soát an toàn trên công trường thông qua hệ thống nhận diện rủi ro bang tri tuệnhân tao [9]

- Thiét lập nên tang dữ liệu của ngành QL xây dựng, vòng đời công trinh, va cònrất nhiều hướng ứng dựng khác liên quan đến AI [10], [11]

- M6 hình mạng noron nhân tạo (ANN) dé đánh giá dự án xây dựng.[12]

- Dw toán chi phí xây dựng đường bằng mạng no ron nhân tạo[13]

- Ung dụng machine learning trong việc ước tính hiệu suất và tiêu thụ năng lượng củatòa nhà [14]

- Du đoán kha năng phun vữa của vữa xi măng min tự hút dựa trên các kỹ thuật tri tuệ nhân tao[15]

Một số xu hướng ứng dụng AI trong lĩnh vựa NLTT có thé kế đến như:

- Du đoán và tối ưu hóa năng suất của hệ thống điện, dựa trên các dữ kiện thời tiết và

hệ thống.[16]

- Nang cao mạng lưới điện nhỏ khi dau nối vào mạng lưới điện lớn [17]

- Thu thập dữ liệu và cải thiện độ an toàn và tin cậy của lưới điện, làm cho hệ thốngđiện thông minh và điện được lưu trữ một cach thông minh.[18]

- _ Nghiên cứu và đánh giá thị trường, tối ưu hóa thế mạnh dé mở rộng thị trường

HVTH: Lê Hải Dang Trang 9

Trang 26

Theo nghiên cứu của tac giả Huynh Tan Hợi: “O miền Trung và Miền Nam Việt Nam

là nơi có cường độ bức xạ mặt trời cao nhất nên ở hai vùng nay được đánh giá có tiềm năngphát triển cao Số giờ nắng khoảng 1400 - 2700 giờ / năm ở các tỉnh thành hai vùng miềnnày Đối với khu vực có số giờ khoảng 1.800 giờ / năm trở lên được coi là có tiềm năngkhai thác và sử dụng Đối với Việt Nam, tiêu chí này phù hợp với nhiều vùng miễn, đặcbiệt là các tỉnh phía Nam.”[4] Cũng theo tác giả này: “Việc sản xuất điện từ các nguồnnăng lượng mặt trời được chú ý băng cách lắp đặt trên mặt đất và trên mái nhà Việt Nam

HVTH: Lê Hải Dang Trang 10

Trang 27

là nước có lượng nang ôn định, đặc biệt là miền Nam Tổng công suất của các nguồn nănglượng mặt trời sẽ được nâng lên khoảng 12.000 MW vào năm 2030 và day được coi là mộtước tính ấn tượng và khả thi.

O Việt Nam lượng mặt trời được phân bô rộng khap trên tat cả các vùng miễn và khá

ôn định quanh năm Trong đó, sô ngày năng trung bình của các tỉnh miễn Trung và miễn Nam khoảng 300 ngày / năm.”|[20|

Theo báo cáo của tác giả Nhan T Nguyen và Minh Ha Duong: “ Ở miền Trung và Nam

ở Việt Nam được đánh giá là nơi có tiềm năng lớn về bức xạ ánh nang mặt trời cụ thé ởphía bac thấp nhất khoảng 4 kWh/ m2 do miền bắc đặc thù thời tiết 4 mùa, có nhiều may

và có mùa đông lạnh, miễn Trung va Nam trung bình là 5 kWh / m2 Ở Việt Nam, bức xamặt trời trung bình 150 kcal / m2 chiếm khoảng 2.000-5.000 h mỗi năm, với ước tính tiềmnăng lý thuyết là khoảng 43,9 tỷ TOE Tiềm năng năng lượng mặt trời cũng được đánh giácao khi Việt Nam là quốc gia có thời gian nắng nhiều trong năm với cường độ bức xạ cao

ở miền Trung và miền Nam Các tỉnh có số giờ năng trong năm khoảng 1400-2700 giờ /năm Theo đánh giá, những khu vực có số giờ năng từ 1.800 h / năm trở lên được coi là cótiềm năng khai thác sử dụng Đối với Việt Nam, tiêu chí này phù hợp với nhiễu vùng miền,đặc biệt là các tỉnh phía Nam.”[21]

2.4 MỘT SỐ NGHIÊN CỨU ỨNG DỤNG TRÍ TUỆ NHÂN TẠO TRONG LĨNHVUC NANG LƯỢNG MAT TROL

Trong bài nghiên cứu về vai trò của AI trong thiết kế và điều khiển hệ thống điện nănglượng mặt trời của A Youssef, M El — Telbany va A Zekry Ai Cập đã thống kê được cácthuật toán thường được ứng dung trong lĩnh này như Neural Network (NN), Particle Swarm optimization (PSO), Fuzzy logic (FL), Simulated Annealing (SA), Genertic Algorithm (GA), Ant Colony (ACO), Hydrid techniques, Adaptive-Neuro Fuzzy Inference Systems (ANFIS), GA-fuzzy and NN-fuzzy [6]

Trong bai báo “Du báo công suất quang điện trong thời gian ngắn bang cách sử dungthuật toán bay đàn mạng no-ron phức hop [22], nhóm tác giả Aprillia, Happy Yang, HongTzer Huang, Chao Ming đã tạo ra 5 mô hình dự đoán ứng năng suất của hệ thông pin nănglượng mặt trời ứng với 5 loại thời tiết : mưa, nhiều mây, có mây, it mây, va năng Sau đó

so sánh hiệu quả của các thuật toán nay”.

Dũ liệu của các hệ thông pin năng lượng mặt trời đã được nhóm tác giả Monowar

HVTH: Lê Hải Dang Trang 11

Trang 28

Hossain, Lanre Olatomiwa, Shahaboddin Shamshirband, Saad Mekhilef , Malihe Danesh, thu thập và sử dung mô hình Extreme learning machine, SVM va Artificial neural networkArtificial dé dự đoán năng suất ngăn han của hé thống này, mô hình này có khả năng dựđoán công suất đâu ra của hệ thống điện năng lượng mặt trời ở quy mô nhỏ.[23]

Theo nghiên cứu về ứng dụng học sâu vào dự đoán năng suất của hệ thống pin nănglượng mặt trời của Li, Pengtao Zhou, Kaile Lu, Xinhui Yang, Shanlin, nó đã ứng dung Wavelet packet decomposition (WPD), long short-term memory networks, linear combination method for multiple single LSTM networks WPD-LSTM forecasting model.[24]

Trong bai bao: “Multiple steps ahead solar photovoltaic power forecasting based on univariate machine learning models and data re-sampling” của nhóm hai tác gia M Rana,

A Rahman vào năm 2019 đã trình bày một phương pháp đơn biến đơn giản nhưng hiệuquả để dự đoán sản lượng điện mặt trời bang nhiều bước Mục tiêu là duy trì độ chính xáccao của các thuật toán học máy để dự đoán trước nhiều bước Sự mới mẻ của bài báo làcách tiếp cận việc tích hợp kỹ thuật lẫy mẫu lại dữ liệu với các thuật toán học máy Bài báonày cũng sử dụng dữ liệu 2 năm từ hệ thống PV 1,22 MW ở Úc [25]

Năm 2020, Thạc sỹ Lê Tan Tài đã thực hiện luận văn của minh bang cách tối ưu hóaước tính lượng năng lượng tiêu thụ bang các thuật toán trí tuệ nhân tạo [26]

Bên cạnh những bài báo nói trên, còn có rât nhiêu các bài báo khác vê ứng dụng của trí tuệ nhân tạo trong lý vực năng lượng tái tạo và xây dựng.

2.5 DE XUẤT CÁC NHÂN TO ANH HUONG DEN NANG SUAT CUA HE

THONG ĐIỆN NANG LƯỢNG MAT TROL

Theo K.V Vidyanandan, da dua ra 13 nhan t6 anh hưởng tới năng suất của một hệthống điện năng lượng mặt trời trong nghiên cứu của mìnhbao gồm: “Chất lượng loại vậtliệu, cường độ bức xạ mặt trời nhận được, nhiệt độ mddu, điện trở ký sinh (phần tử củamạch điện: điện trở, độ tự cảm, điện dung), mây và các hiệu ứng bóng khác, hiệu suấtbiến tần, bụi ban, hướng và góc nghiên của mô-đun tam pin, điều kiện thời tiết, vị trí địa

lý, độ dày cáp, hệ số lap day, Potential Induced Degradation (PID)” [27]

Theo [16] Nhiệt độ, lượng mua, độ âm tương đối, bức xạ bầu trời quang đãng, nhiệt độmô-đun và tôc độ gió là các nhân tô chính ảnh hưởng đên năng suât hệ thông điện năng

HVTH: Lê Hải Dang Trang 12

Trang 29

lượng mặt trời.

Trong khi đó “Lượng bức xạ, Độ trong suốt, Số 210 nang, Tốc độ 210, Hướng gid, Ap suat,May, Do âm Vi độ (VỊ tri) [28] là các nhân tố mà A Mellit, và A Pavan cho rằng ảnhhưởng tới năng suất của hệ thống điện mặt trò”

Cũng theo [24]: “Công suất đầu ra PV (kW), Bức xạ ngang toàn cầu (W / m2), Bức xạngang khuếch tán (W / m2), Nhiệt độ môi trường (° C), Tốc độ gió (m/s), Độ am tươngđối (%) là các nhân t6 ảnh hưởng đến năng suất của hệ thông điện năng lượng mặt trời”.Sau quá trình tiềm hiểu, học viên đề xuất bảng nhân t6 sau, bảng nhân t6 nay sẽ được xemxét, bố sung và chỉnh sửa sau khi tham khảo ý kién các chuyên gia trong ngành

Dựa trên các bài báo khoa học, các nghiên cứu trước đây, tác giả đề xuất một số nhân tốtác động đến hệ thống điện NLMT ở bảng sau:

Bang 2.3 Bang các nhân tô đề xuất ảnh hưởng đến năng suất hệ thong điện năng lượng

mat trởi

STT Nhân tố

1 Quỹ đất và cơ sở hạ tang có sẵn của địa phương

2 _ Độ cao địa hinh xây dựng

3 Chính sách khuyến khích (giá, quy hoạch, ưu đãi về thuế, giấy phép) của chính phủ

4 Sw trì hoãn trong quá trình thực hiện dự án

5 _ Năng lực tài chính của Chủ dau tu

6 Năng lực đơn vị quản lý dự án từ giai đoạn nghiên cứu đến khi vận hành nha máy

7 Quy mô xây dựng dự án

8 Nang lực, kinh nghiệm don vi thi công và vận hành

9 Khả năng dap ứng của lưới điện tại địa phương

10 Cường độ chiếu sáng và cường độ bức xạ năng lượng mặt trời phát ra

I1 Sự khuếch tán bức xạ mặt trời phương ngang

12 Su hap thu nang lượng bức xa bởi các hạt bụi bân trong không khí

13 Sự ảnh hưởng của nhiệt độ môi trường

14 Sự ảnh hưởng của việc lựa chọn loại hình va vi tri lắp đặt của hệ thống điện

HVTH: Lê Hải Dang Trang 13

Trang 30

15 Sự ảnh hưởng của sự phân chia mùa trong năm

16 Sự ảnh hưởng của điều kiện thời tiết (thường xảy ra giông bão, mưa nhiều, nóng am,

số giờ nắng trong ngảy )

I7 Sự ảnh hưởng của tốc độ gió

18 Sự ảnh hưởng của hướng gid

19 Sự buc xạ ngược cua bề mặt trái đất khi nhận ánh sáng mặt trời

20 Các vật cản ánh sáng mặt trời tiếp xúc hệ pin (hiệu ứng bóng ram), như mây, bụi

21 Số giờ nắng trong ngày

22 Độ âm tương đối của không khí

23 Áp suất không khí

24 Sự ảnh hưởng của điện trở của mạch điện (suy hao do dây dan)

25 Hướng và góc nghiêng của mô-đun tam pin

26 Nguồn năng lượng điện dau ra

27 Công nghệ sản xuất, chất lượng và độ bên vật liệu tam pin (độ giảm hiệu suất làmviệc theo thời gian các tế bào quang điện)

28 Nhiệt độ các tế bao quang điện của tam pin

29 Hiéu suất của biến tan

30 Hiệu suất tam pin (mức độ chuyển hóa quang năng thành điện năng)

31 Hiện tượng suy giảm hiệu suất của hệ thống

32 Thi công dam bảo yêu câu kỹ thuật

33 Quy mô, chất lượng hệ thống lưu trữ điện

34 Công tác vệ sinh bé mặt tam pin

35 Công tác kiểm tra, bảo trì kỹ thuật hệ thong định kỳ

36 Hư hỏng hệ thống do nguyên nhân không lường trước

37 Năng lực, kinh nghiệm cua đơn vi thiết kế

38 Biến động giá vật tư xây dựng

39 Vitri xây dung

HVTH: Lê Hải Dang Trang 14

Trang 31

2.6 TRIEN VONG CUA HƯỚNG NGHIÊN CỨU.

Hiện tại song song với ngành NLTT va NLMT thì AI cũng là một trong những hướng phat triên tiêm năng trong thực tiên đời sông.

2.7 TONG QUAN VE TRÍ TUỆ NHÂN TẠO VÀ CÁC THUẬT TOÁN

2.7.1 Khái niệm trí tuệ nhân tạo.

Là quá trình mô phỏng lại bộ não con người bang các thiết bị công nghệ như máytinh, các thiết bị này được lập trình dé tạo nên một cá thé giả định có các hành vi giốngcon người và có trí thông minh giông như con người hoặc hơn.

AI được ứng dụng trong hệt thống mô phỏng ứng xử và hành vi, xử lý ngôn ngữ tựnhiên (NLP), nhận diện giọng nói, hệ thống nhận diện, tối ưu hóa

Sự khác biệt của TTNT (Trí tuệ nhân tạo) so với lập trình logic trong các ngôn ngữ lậptrình là việc ứng dụng máy móc để mô phỏng bộ não của con người trong các xử lý mà conngười thực hiện tốt hơn máy tính

AI đang là xu hướng được sử dụng dé ứng dụng tối ưu trong nhiều lĩnh vực đời sống.Khả năng học và cải thiện kết quả theo thời gian của thuật toán trí tuệ nhân tạo, giúp kếtquả dự đoán tối ưu càng chính xác hơn theo thời gian

Bên cạnh đó khả năng xử lý được số lượng dữ liệu lớn, nhiều biến phức tạp với sự hỗtrợ của máy, điều này giúp ta có thể xét đến nhiều tác nhân có ảnh hưởng nhưng bị bỏ quatrước đây do sự hạn chết của thuật toán hay công cụ xử lý dữ liệu

THU THẬP DU LIEU HUAN LUYEN MO HÌNH CAI THIEN MO HiNH

= (=) = €

BƯỚC 1 BƯỚC 3 BƯỚC 5

LAM SẠCH, CHUAN BỊ KIEM TRA

VA VAN DUNG DU LIEU DU LIEU VA MO HINH

Hình 2.4 Mô hình hóa quy trình cua trí tuệ nhân tao

HVTH: Lê Hải Dang Trang 15

Trang 32

Đối với xây dựng, TTNT còn giúp tối ưu hóa thiết kế, vật liệu xây dựng, chi phí chocác dự án phù hợp với vốn dau tư, ngoài ra ứng dụng trí tuệ nhân tạo trong hệ thông đô thị,căn hộ thông minh là một xu hướng đang được ứng dụng cao Ngành QL xây dựng cũngngày cảng nhiều nghiên cứu và sử dụng TTNT Tu động hóa va tối ưu hóa dự đoán hệthống NLMT là đề tài năm bắt xu hướng này là thỏa mãn tính cấp thiết của thực tế ngànhtrong thời gian hiện tại.

Tự động hóa quá trình ước lượng năng suất dự án điện mặt trời thông qua công suất sảnsinh quang điện dựa trên các số liệu và tác nhân ảnh hưởng khách quan không chỉ để tănghiệu quả dự báo mà còn dé loại trừ các yêu tô sai sót do chủ quan.

2.7.2 Khái niệm học máy (Machine Learning)

Học máy (Machine Learning) là một nhánh con của TINT, là một phan của trí tuệ nhântạo Học máy được sử dụng pho bién do kha năng tu học dựa trên dữ liệu có san mà khôngcần phải lập trình cụ thé

Machine Learing là mộ phương tiện để thực hiện mục tiêu là trí tuệ nhân tạo Các thuậttoán machine learning giúp máy tính có khả năng giúp con người xử lý lượng lớn dữ liệu

ma trước đây khó có thé xử lý tốt bằng lập trình thông thường Dữ liệu về các thông số vàkết quả năng suất của hệ thống điện năng lượng mặt trời là một trong những dạng dữ liệulớn.

Machine Learning có ba nhánh chính là: Học có giám sát, học không có giám sát vàhọc củng có Các nhánh của machine learning được trình bày như hình 2.7 bên dưới:

HVTH: Lê Hải Dang Trang l6

Trang 33

MACHINE LEARNING

|

Tính chất học Phương thức học

aed Thuật toán hôi quy Hoc có giám sát

> Thuat toan phan loai Học không có giám sat “

| Thuat toan mang than kinh Học bắn giám sắt <_

nhan tao

> T huật toán kết hợp Hoc củng cô +

Hình 2.5 Mô hình phân loại các thuật toản Machine learning.

2.7.3 Khai phá dữ liệu (Data mining)

Khai phá dữ liệu là để tìm ra các mẫu trong các bộ dữ liệu lớn tại giao điểm của họcmáy thống kê và hệ cơ sở dữ liệu Đây là lĩnh vực liên ngành của lĩnh vực khoa học máytính [29|

Khai pha dự liệu là một bước nhỏ của quá trình KDD (Knowledge Discovery in Database) [29].

Mô hình KDD bao gồm bảy bước chính như sau:

- Lam sạch dữ liệu

- Tich hợp dữ liệu

- - Lựa chọn dt liệu

- Chuyén đôi dữ liệu

HVTH: Lê Hải Dang Trang 17

Trang 34

- Khai pha dữ liệu.

- - Đánh giá kết quả

- Biéu diễn tri thức

Khai phá dữ liệu có nhiều ứng dụng như sau: mô tả khái niệm, luật kết hợp, đặc biệt

là được sử dụng trong phân lớp và dự đoán, phân cụm đều được ứng dụng trong học máy.Một số cách thức khai phá dữ liệu có thé kế đến như: phân loại, hồi quy, phân nhóm tonghop, mô hình ràng buộc, dò tìm và biến đối độ lệch Những phương pháp nay hầu hết được

sử dụng trong luận văn.

2.7.4 Mạng thần kinh nhân tạo ANN

2.7.4.1 Giới thiệu chung về mạng thân kinh nhân tạo

Mang than kinh nhân tạo (hay Artificial Neural Networks — ANN) là mô hình tínhtoan dugc su dung dé dự đoán, hoặc điều khiển bang cách huan luyện mô hình thong quacác tập dữ liệu có san Mạng thần kinh nhân tạo bao gém nhiều nút mạng (hay còn gọi làcác nơ ron) nối với nhau theo mô phỏng theo mạng nơ ron thân kinh sinh học

Trong mô hình ANN có hai dạng mạng ANN được sử dụng phô biến là mạng truyềnthăng dữ liệu được xử lý qua nhiều lớp tuy nhiên không có sự liên kết phản hồi giữ đầu ra

và đầu vào Ngược lại hình thức mạng ANN lan truyền ngược hay còn gọi là mạng hồi quyđược sử dụng rộng rãi và phô biến hơn do có chứa các liên kết giữa đầu vào và đầu ra.Ngày nay, mô hình ANN được sử dụng rộng rãi và đang ngày càng phố biến hơn nhờvào sự phát triển của khoa học và kỹ thuật máy tính Mang ANN duoc sử dụng để mô hìnhhóa các mối quan hệ giữa các nhân tố của dữ liệu đầu vào, ma do khối lượng to lớn trướcđây không thể xử lý được

Mô hình ANN được mô phỏng theo mô hình xử lý thông tin của não bộ con ngườibao gồm các thành phần như sau:

Lớp thứ 1: Dữ liệu đầu vao là cổng nhận thông tin đầu vào của mô hình

Lớp thứ 2: Lớp an bao gồm một hoặc nhiều lớp thực hiện các tính toán dé đưa ra kết quả.Lớp thứ 3: Lớp đầu ra, sau quá trình tính toán và phân tích ở các lớp ấn, kết quả sẽ đượcthể hiện qua lớp thứ ba

Sau đây là sơ đồ đơn giản thể hiện mô hình ANN

HVTH: Lê Hải Dang Trang 18

Trang 35

(Input layer) (Hidden layer) | Output Layer

Hình 2.6 Mo hình thudt toan ANN

2.7.4.2 Thuật toán mô hình ANN ứng dung toi wu năng suất hệ thông điện năng lượngmat troi.

Theo mô hình thuật toán ANN, lớp dau vào hay input là các thông số đầu vào baogồm: dữ liệu các tác nhân ảnh hưởng đến năng suất hệ thống điện NLMT, dữ liệu năngsuất của hệ thông tương ứng với các nhân tổ trên Trong đó các nhận tô ảnh hưởng đượcxem là đầu vào và năng suất của hệ thống được xem là đầu ra, mục tiêu của mô hình huấnluyện.

Trong thuật toán ANN dạng lan truyền ngược, các đặc điểm cần quan tâm bao gồm:

- Hàm huấn luyện với trọng số được cập nhật sau mỗi chu kỳ huấn luyện / với trọng

Wy; (t) = wij (ft — 1) + Awy; (£)

- Gia trị thay đôi:

Trong đó:

n — tham số tốc độ huấn luyện

6.pj — $ai sô lan truyên.

Opj — kết quả của no ron thứ / trong lần huấn luyện thứ ø

HVTH: Lê Hải Dang Trang 19

Trang 36

œ — tham số khuếch đại.

Wyj( — 1) — giá tri thay đối cho w;, j trong lần huấn luyện trước

2.7.5 Mô hình máy vector hỗ trợ (Support vector machine - SVM)

2.7.5.1 Giới thiệu chung về thuật toán SVM

Trong lĩnh vực học máy, mô hình máy hỗ trợ vector là một thuật toán được phân loại

thuộc nhóm học có giám sát, có liên quan đến đến phân loại và phân tích hồi quy Mô hìnhSVM xây dựng một hoặc nhiều các mặt siêu phang trong không gian đa chiều dé xử lý cácyêu cầu về phân loại và hồi quy Trong rất nhiều trường hợp, các dữ liệu không tuyến tínhtrong không gian ban đầu do đó cần có các ánh xạ từ không gian ban đầu vảo không gianmới dé dé dang phân loại Mô hình SVM được cầu tạo từ các hàm ánh xạ đầu vào và đầu

ra của dữ liệu, vì mô hình SVM xử lý cả việc phân loại và việc hồi quy nên hàm ánh xạnày cũng làm được điều tương tự

Mô hình SVM được sử dụng nhiều cho các bài toán phân lớp và dự đoán, do SVM cóhiệu quả rất cao trong xử lý các dữ liệu có số chiều lớn, giải quyết tốt vẫn đề quá khớp(overfitting) do dữ liệu nhỏ hoặc nhiễu, hiệu suất tong hop, tính toán tốt và phân lớp nhanh.2.7.5.2 Thuật toán mô hình SVM ứng dụng toi tru năng suất hệ thông điện năng lượngmat troi.

Đầu vào của mô hình là mộ hàm ánh xa phi tuyến như sau:

ƒ(x,œ) = (w,x) +b

HVTH: Lé Hai Dang Trang 20

Trang 37

Trong đó: x EX,wEX

Mức độ tốn thất được tính như sau:

0 nếu |y— f(x,@)| <e

ly — f(x,q@)| cho các trường hợp con lại

Le = Iy,/Gœ,6)] =|

SVM hỏi quy sử dung ¢ — ton that không nhạy cam, dé tính ham HQTT cho các khônggian có đặc tinh cao hon và làm giảm mức độ phức tap của mô hình SVM băng việc giảmllco|l|? Hàm được biểu diễn như sau:

C >0-— hăng số xác định sự đánh đổi giữa độ phang của f(x;,w) và dung sai cho độlệch lớn hơn so với €

Trang 38

2.7.6 Mô hình hồi quy tuyến tính (Linear Regression)

2.7.6.1 Giới thiệu chung về thuật todn hồi quy tuyến tinh

Phân tích HQTT là một hình thức cơ bản trong thống kê, cho phép tìm mối quan hệgiữa một biến Y — biến phụ thuộc và các biến X — biến độc lập Tùy vào số lượng biến độclập chúng ta có mô hình hồi quy đơn biến khi chỉ có một biến độc lập và đa biến với nhiềuhơn một biết độc lập [30]

Trong học máy (machine learning — ML) HQTT được xếp vào nhóm học có giámsát HQ TT được sử dụng rộng rãi do tinh đơn giản, có thé kế đến như dự đoán kết quả haygiảm thiểu sai số thông qua việc sử dụng phương trình hồi quy hay sửu dụng để giải thích

sự biến động của biến phụ thuộc dựa vào mỗi quan hệ của biến phụ thuộc va biến độc lậpđầu vào.

2.7.6.2 Mô hình LR trong toi wu hóa hệ thong điện năng lượng mặt trời

Đề dự đoán năng suất của hệ thống điện Y là kết quả năng suất điện của hệ thông các

hệ số Øạ là hang số của đường hồi quy, £ là sai số của mô hình, các hệ số B; là hệ số hoiquy X; là các bién ảnh hưởng đến năng suất của hệ thông điện năng lượng mặt trời với i=1 n là số lượng nhân t6 ảnh hưởng Mô hình HQ TT được biểu diễn như sau:

n

i=1

Thuật toán hồi quy bao gồm ba phương pháp chính: stepwise được kết hợp từ 2 phươngpháp là stepwise thuận hay còn gọi là forward và hồi quy stepwise nghịch hay còn gọi làhồi quy backward Hồi quy stepwise được sử dụng trong luận văn nay do tính đơn giản, dé

sử dụng đồng thời kết quả của mô hình forward và backward có thể khác nhau do đó tínhđồng bộ của mô hình không được đảm bảo

2.7.7 Mô hình hồi quy tuyến tính tong quát (General Linear Regression - GenLin)2.7.7.1 Giới thiệu chung vệ thuật todn hồi quy tuyến tinh tông quái

Nhằm phát triển một thuật toán mới có thể phân tích trên nhiễu phân phối xác suất khácnhau như phân phối chuẩn, phân phối Poision, phân phối nhị thức, năm 1972 hai nhatoán học John Nelder và Wedderburn đã xây dựng mô hình HQTT tổng quát Mô hình cóthé xử lý các tình huéng phức tạp hon và phân tích tác động đồng thời của nhiều biến, bao

HVTH: Lê Hải Dang Trang 22

Trang 39

gồm hỗn hợp các bién phân loại và biến liên tục [31]

Mô hình đồng thời cho phép dùng hàm liên kế để tính toán các mối quan hệ giữa biến

dự báo tuyến tính và hàm trung bình của biến phụ thuộc

Mô hình GenLin cho thấy tính ưu thế về sự linh hoạt và thực tế của mình khi so sánhvới thuật toán hồi quy đơn

2.7.7.2 Mô hình GENLIN trong toi wu năng suất hệ thông điện năng lượng mặt trời

Phương trình xác định mối quan hệ giữa biến phụ thuộc Y va biến độc lập X, cùngvới mẫu phân phối giả thuyết của dit liệu

Ba thành phần chính của mô hình tuyến tin tong quát gồm một biết phụ thuộc haybiến kết quả Y có phân phối ngẫu nhiên cụ thé với kỳ vọng u và phương sai ø?(E(Y) =u) thành phan thứ hai là hàm liên kết g với giá trị kì vọng của Y dé đưa ra các giá trị dựđoán của n[n = g()] va một mô hình tuyến tính

Tóm lại mô hình HỌ TT tong quả được biéu diễn theo phương trình sau:

n= g(E()) = X¡f;¡ + 0,Y~FTrong đó:

2.7.8.1 Giới thiệu chung về thuật toán cây phân loại và hồi quy CART

Trong học máy, cây phân loại và hồi quy là một thuật toán học có giám sát tương đốiđược sử dụng rộng rãi cho cả hai nhiệm vụ quan trọng là phân loại và hồi quy được pháttriển bởi Leo Breiman.[32]

HVTH: Lê Hải Dang Trang 23

Trang 40

Cây phân loại và hồi quy hoạt động trên nguyên lý chia dữ liệu gốc thành nhiều tậpcon dựa trên kết quả của việc phân loại các thuộc tính của tập dữ liệu đảm bảo rằng cácmau dữ liệu trong tập con có sự đồng nhất cao hơn tập dữ liệu trước nó Quá trình phânloại này chi dừng lại khi không thể tiếp tục phân chia dữ liệu được nữa hoặc khi các phan

tử của tập dữ liệu con có thể phân loại đơn

Cây phân loại va hồi quy có nhiều ưu điểm như có thé xử lý cả dữ liệu số và dữ liệuphân loại, chúng có thé thực hiện phân loại đa lớp với việc cung cấp kha năng diễn giải môhình đơn giản, bên cạnh đó các mối quan hệ phi tuyến của dữ liệu không ảnh hưởng đếnhiệu suất của mô hình Tuy nhiên cây phân loại và hồi quy có nhược điểm tương đối lớn

là hiện tượng quá khớp (overfitting) hay khi thay đôi một nhân tố nhỏ trong dữ liệu có khanăng ảnh hưởng đến tính chính xác của mô hình.[32]

2.7.8.2 Mô hình CART trong toi wu năng suất hệ thong điện năng lượng mặt trời

Gini thường được sử dụng trong thuật toán CART Tuy nhiên việc lựa chon vi trí phan chia cho mô hình còn phụ thuộc vào mục tiêu.

Gini thường được su dụng khu mục tiêu là tượng trung trong lúc đó phương pháp bìnhphương cực tiểu sẽ chọn các mục tiệu một các liên tục động mà không giải thích đượcchúng Gini là thông số đánh giá mức độ đồng bộ hay nhiễu của dữ liệu, sự khác biệt giátrị của cá điểm dữ liệu trong tập con hay trong một nhánh của cây phân loại

Gini được tính theo công thức sau:

g(t) — là gini tại nút ¢ trong mô hình.

p(j) — là xác suất cho trước tại 7

N,Œ) - là số lượng mẫu loại j trong nút ¢

HVTH: Lê Hải Dang Trang 24

Ngày đăng: 03/08/2024, 12:31

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN