Bài viết Phát hiện sự cố trong hệ thống điện mặt trời dựa trên học máy đề xuất sử dụng phương pháp học máy, cụ thể là mô hình thuật toán học tập theo nhóm để tự động hóa việc phát hiện các sự cố trong hệ thống điện mặt trời. Mô hình được huấn luyện và kiểm thử trên bộ dữ liệu gồm hơn 2 triệu các trạng thái sự cố khác nhau.
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG, VOL 20, NO 5, 2022 67 PHÁT HIỆN SỰ CỐ TRONG HỆ THỐNG ĐIỆN MẶT TRỜI DỰA TRÊN HỌC MÁY PV SYSTEM FAULT RECOGNITION BASED ON MACHINE LEARNING Nguyễn Quốc Minh*, Nguyễn Tiến Thành Trường Điện - Điện tử, Đại học Bách Khoa Hà Nội1 *Tác giả liên hệ: minh.nguyenquoc@hust.edu.vn (Nhận bài: 21/01/2022; Chấp nhận đăng: 30/4/2022) Tóm tắt - Việc xác định cố vị trí xảy cố hệ thống điện mặt trời đóng vai trị quan trọng việc đảm bảo an toàn vận hành, độ tin cậy hiệu suất sử dụng tối đa hệ thống điện mặt trời Các cố thường đa dạng xuất nhiều vị trí khác hệ thống đặt thách thức lớn cho người giám sát vận hành Trong nghiên cứu này, nhóm tác giả đề xuất sử dụng phương pháp học máy, cụ thể mơ hình thuật tốn học tập theo nhóm để tự động hóa việc phát cố hệ thống điện mặt trời Mơ hình huấn luyện kiểm thử liệu gồm triêụ trạng thái cố khác Kết độ xác thuật tốn đạt 98,83% cho thấy mơ hình đề xuất phát cố hệ thống điện mặt trời với độ xác cao Abstract - Identifying faults in PV systems plays an important role in ensuring safety, reliability and maximum efficiency of the solar energy system Faults in PV systems are often difficult to detect due to the complexity of the systems, posing big challenges for supervisors and operators In this research, we propose a novel model based on machine learning method, specifically the Ensemble Learning model, to detect the faults in the PV systems automatically The proposed model is trained and tested on a dataset of million PV system fault states The accuracy result of the algorithm is 98,83%, showing that the proposed model can detect the faults in the solar power system with high accuracy Từ khóa - Hệ thống điện mặt trời; học máy; cố; học tập theo nhóm Key words - PV system; machine learning; fault; Ensemble Learning Đặt vấn đề Hiện nay, tiềm nguồn lượng thủy điện khai thác gần hết, nguồn nhiệt điện gây nhiễm mơi trường, việc sử dụng nguồn lượng tái tạo điện mặt trời, điện gió, điện sinh khối thay cho dạng lượng truyền thống xu hướng tất yếu Theo số liệu Tập đoàn điện lực quốc gia Việt Nam (EVN), tính đến thời điểm đầu tháng 5/2021, tổng công suất điện mặt trời lên tới 19900 MW (trong đó, 10317 MW điện mặt trời trang trại, 9583 MW điện mặt trời áp mái) tăng 20 lần so với quy hoạch [1] Với gia tăng nhanh chóng điện mặt trời nay, dự án, nhà máy điện mặt trời xây dựng đưa vào sử dụng nhiều Trong trình vào vận hành, nhà máy điện mặt trời tránh khỏi việc gặp hư hỏng, cố, ảnh hưởng tới làm việc bình thường hệ thống điện Các dạng hư hỏng, cố đa dạng xảy vị trí khác hệ thống điện mặt trời cố điều tần Inverter đấu nối phía DC phía AC, lỗi cảm biến, tia lửa điện hư hỏng cáp kết nối pin lượng mặt trời hay thiết bị lưu điện, cố sụt áp, hở mạch lưới điện, vết nứt vỡ biến dạng bề mặt pin lượng mặt trời [2] Các lỗi làm giảm chất lượng tuổi thọ cơng trình hiệu đầu tư Một vài cố điển hình kể đến cố vào ngày 23/9/2020, nhà máy sản xuất Công ty cổ phần Điện Gia Lai, xảy vụ cháy 60 pin mặt trời với nguyên nhân vụ cháy xác định mối nối dây dẫn từ pin đến phận xử lý Inverter chưa đảm bảo, dẫn đến thoát nhiệt gây phóng điện cháy; Vào ngày 9/9/2019, đám cháy bất ngờ xuất nhà máy điện mặt trời lớn Nhật Bản nằm thành phố Ichihara tỉnh Chiba, cơng trình lượng mặt trời với diện tích khoảng 18 hec-ta với quy mơ 50 nghìn pin lượng mặt trời… Việc phát nhanh xác cố xảy hệ thống điện mặt trời thách thức lớn kỹ sư giám sát vận hành hệ thống Đã có số nghiên cứu vấn đề phát cố hệ thống điện mặt trời phát cố ngắn mạch dựa thuật toán bám điểm công suất cực đại [3], phát cố chạm đất pha dựa thiết bị đo sóng phản xạ miền thời gian [4], phát cố pin mặt trời dựa phân tích tần số [5] Các phương pháp phát cố nêu có độ xác cao phát dạng cố vị trí định, cố hệ thống điện mặt trời đa dạng xuất nhiều vị trí khác Ngày nay, với phát triển trí tuệ nhân tạo nói chung học máy nói riêng làm cho toán phát phân loại trở nên ngày xác, chí số tác vụ vượt qua người Một số nghiên cứu gần tập trung vào việc ứng dụng phương pháp học máy để phát phân loại cố hệ thống điện [6, 7] Ưu điểm thuật toán học máy phát phân loại cố đa dạng với tốc độ nhanh cho độ xác cao Bên cạnh đó, thuật tốn học máy khơng cần thơng tin từ mơ hình vật lý hệ thống, đặc trưng trích xuất tự động trình huấn luyện Vì vậy, nghiên cứu này, nhóm tác giả đề xuất sử dụng mơ hình thuật tốn học máy học tập theo nhóm (Ensemble Learning) để phát cố hệ thống điện mặt trời School of Electrical and Electronic Engineering, Hanoi University of Science & Technology (Nguyen Quoc Minh, Nguyen Tien Thanh) Nguyễn Quốc Minh, Nguyễn Tiến Thành 68 Mơ hình thuật tốn Ensemble Learning (Học tập theo nhóm) nhánh lĩnh vực học máy Ý tưởng việc học tập theo nhóm có liên quan chặt chẽ với ý tưởng “sự khôn ngoan đám đơng”, theo định, lựa chọn ước tính độc lập khác tổng hợp thành lựa chọn cuối với độ xác thu tốt độ xác lựa chọn đơn lẻ Trong học máy, điều có nghĩa kết hợp dự đốn từ nhiều mơ hình đào tạo tập liệu huấn luyện Thay cố gắng xây dựng mơ hình tốt nhất, xây dựng họ mơ hình yếu hơn, nhiên kết hợp mơ hình lại, thu mơ hình vượt trội Khi gặp toán phân loại (classification) hay hồi quy (regression) việc chọn mơ hình đủ tốt ln vấn đề mấu chốt Khác với Deep Learning (học sâu), việc tìm mơ hình tốt việc cố gắng thay đổi số lớp hay thay đổi cấu trúc mạng, thuật toán học máy việc lựa chọn mơ hình việc tối ưu tham số, quan sát đặc điểm số chiều không gian liệu, hiểu hết đa dạng đặc trưng, lựa chọn cẩn thận cách kết hợp đặc trưng đó, đặt giả thiết phân phối liệu Tất bước xây dựng mơ hình chất xoay quanh giải vấn đề độ lệch (bias) phương sai (variance), (bias-variance trade off) Hiểu đơn giản biasvariance trade off tức mong muốn huấn luyện mơ hình có độ lệch thấp phương sai thấp Tuy nhiên, độ lệch phương sai thường có xu hướng nghịch đảo với nhau, lựa chọn tăng chấp nhận giảm [8] Một điểm lưu ý sử dụng mơ hình để huấn luyện vấn đề “bias-variance trade off” điều tránh khỏi - Phương pháp đóng bao (Bagging Ensembles): Xây dựng lượng lớn mơ hình, thường loại, mẫu khác lấy ngẫu nhiên từ tập liệu huấn luyện, đảm bảo mơ hình mẫu liệu khơng trùng lặp Những mơ hình huấn luyện độc lập song song với đầu chúng trung bình cộng kết cuối Một số thuật tốn điển hình như: Decision Tree, Random Subspaces, Random Forest, Extra Trees - Phương pháp tăng cường (Boosting Ensembles): Xây dựng lượng lớn mơ hình cách tuần tự, mơ hình sau học cách sửa lỗi mơ hình trước tạo thành chuỗi mơ hình mà mơ hình sau tốt mơ hình trước trọng số cập nhật qua lần xây dựng, cụ thể trọng số liệu dự đốn khơng đổi, cịn trọng số dự liệu dự đốn sai tăng thêm Kết mơ hình cuối chuỗi lấy làm kết trả Một số thuật tốn điển hình như: AdaBoost, Gradient Boosting, XGBoost, LightGBM, CatBoost - Phương pháp xếp chồng (Stacking Ensembles): Kỹ thuật đề cập tới việc xây dựng số mơ hình mơ hình giám sát (meta model), huấn luyện mơ hình độc lập, sau mơ hình giám sát học cách kết hợp kết dự đoán số mơ hình cách tốt Một số kỹ thuật điển hình như: Voting, Weighted Averrange, Blending, Stacking, Super Learner Hình Sơ đồ khối minh họa nhóm Hình Mối quan hệ bias variance Để giải vấn đề “bias-variance trade off”, hướng giải đề xuất sử dụng mô hình kết hợp lựa chọn có độ xác thấp để đưa lựa chọn có độ xác tốt Hiểu cách đơn giản phương pháp mơ hình khơng thể tự giải được, để nhiều mơ hình giải Tuy nhiên, nhiều mơ hình loại áp dụng phần liệu khác (kì vọng độc lập với nhau) mơ hình hồn tồn khác loại kết hợp lại Mỗi kiểu kết hợp mơ hình áp dụng tùy theo mục đích định Dựa vào tính chất này, thuật tốn Ensemble Learning chia thành nhóm chính, bao gồm: Trong nghiên cứu này, nhóm tác giả đề xuất sử dụng thuật tốn thuộc nhóm phương pháp tăng cường (Boosting Ensembles) để phát cố hệ thống điện mặt trời Nhóm tăng cường đề cập đến lớp thuật toán học máy kết hợp thường sử dụng phổ biến cho vấn đề dự đốn có cấu trúc, chẳng hạn phân loại hồi quy liệu dạng bảng, phù hợp với liệu mà nhóm nghiên cứu sử dụng 2.1 Thuật tốn AdaBoost Adaptive Boosting, gọi tắt AdaBoost, mơ hình xây dựng thuật tốn nhằm giải tốn tối ưu sau: minCn = 1:N, w n = 1:N L y, N C w n n =1 n (1) Trong đó, L giá trị loss function, y nhãn (label), Cn trọng số weak learner thứ n (confidence score), wn weak learner thứ n AdaBoost tiến hành huấn luyện mơ hình dựa việc đánh lại trọng số cho điểm liệu tại, nhằm giúp mơ hình tập trung vào ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG, VOL 20, NO 5, 2022 mẫu liệu bị học sai, từ làm giảm giá trị loss mơ hình [9] Cụ thể, bước triển khai sau: - Khởi tạo trọng số ban đầu (bằng 1/N) cho điểm liệu - Tại vòng lặp thứ i: + Huấn luyện mơ hình với trọng số wi (weak learner) thêm vào; + Tính tốn giá trị mát (loss), từ tính tốn giá trị trọng số Ci mơ hình vừa huấn luyện; + Cập nhật mơ hình W = W + Ci.wi; + Cuối cùng, đánh lại trọng số cho điểm liệu (các điểm liệu bị đoán sai tăng trọng số, điểm liệu dự đốn giảm trọng số) - Sau lặp lại với vịng lặp thêm mơ hình i+1 2.2 Thuật toán Gradient Boosting Gradient Boosting dạng tổng qt hóa AdaBoost Thay cố gắng tìm tất giá trị Cn, wn để tìm nghiệm tối ưu tồn cục AdaBoost - cơng việc tốn nhiều thời gian tài nguyên, Gradient Boosting tìm giá trị nghiệm cục sau thêm mơ hình vào chuỗi mơ hình với mong muốn dần đến nghiệm toàn cục Cn , w n L ( y, Wn −1 + Cn w n ) (2) N −1 với Wn −1 = C w n n n =1 Nếu coi chuỗi mơ hình hàm số W, hàm học coi tham số w Để cực tiểu hóa hàm mát L ( y, W ) áp dụng phương pháp gradient descent: Wn = Wn −1 − L ( Wn −1 ) w (3) Đến đây, ta thấy mối quan hệ liên quan sau: Cn w n − L ( Wn −1 ) w với, wn mơ hình thêm vào Khi đó, mơ hình cần học để khớp với giá trị − L ( Wn −1 ) Giá w trị − L ( Wn −1 ) cịn có tên gọi khác “pseudow residuals” [10] Tóm lại, tóm tắt q trình thuật tốn sau: - Huấn luyện mơ hình thêm vào để làm phù hợp giá trị “pseudo-residuals” có - Tính tốn giá trị trọng số Ci mơ hình vừa huấn luyện - Cập nhật mơ hình W = W + Ci.wi - Cuối cùng, tính tốn giá trị “pseudo-residuals” để làm nhãn cho mơ hình - Lặp lại với vịng lặp i+1 69 Có thể thấy, phương pháp cập nhật trọng số điểm liệu AdaBoost trường hợp Gradient Boosting Do đó, Gradient Boosting bao quát nhiều trường hợp Về mặt lý thuyết, phương pháp Gradient Boosting hoạt động tốt AdaBoost, nhiên dễ gặp cố mức (overfitting) thời gian chạy lâu để tăng độ dốc 2.3 Thuật toán XGBoost XGBoost (Extreme Gradient Boosting) giải thuật xây dựng dựa tảng Gradient Boosting Tuy nhiên, kèm theo cải tiến to lớn mặt tối ưu thuật toán, kết hợp sức mạnh phần mềm phần cứng, giúp đạt kết vượt trội thời gian huấn luyện nhớ sử dụng Thứ nhất, cải thiện việc mức (overfitting) cách sử dụng quy hóa Thứ hai, cải thiện tốc độ chạy cách tối ưu hóa việc xếp việc chạy song song [11] XGBoost sử dụng để tất vấn đề từ hồi quy (regression), phân loại (classification), ranking giải vấn đề người dùng tự định nghĩa 2.4 Thuật toán LightGBM Light Gradient Boosted Machine, gọi tắt LightGBM, thư viện tăng cường độ dốc mã nguồn mở xuất phát từ thuật toán học tập dựa định (Decision Tree) Nó áp dụng thuật toán dựa biểu đồ chia tách biến liên tục thành nhóm khác thay xếp chúng riêng lẻ Nó sử dụng phương pháp phát triển theo thay phương pháp tăng trưởng theo cấp (được sử dụng hầu hết phương pháp dựa định khác), điều làm nên điểm khác biệt LightGBM Kích thước liệu tăng lên ngày thuật toán khoa học liệu truyền thống trở nên khó khăn để đưa kết nhanh LightGBM khắc phục vấn đề này, thuật toán cải thiện thời gian chạy nhiều cách làm cho khối lượng cơng việc tính tốn trở nên ‘nhẹ nhàng’ trì mức hiệu suất mơ hình so với thuật tốn khác [12] Hình Kỹ thuật phát triển Một vài điểm tạo nên tốc độ độ xác đáng kinh ngạc mơ hình kể đến như: - LightGBM sử dụng "histogram-based algorithms" Nguyễn Quốc Minh, Nguyễn Tiến Thành 70 thay cho "pre-sort-based algorithms" thường dùng giải thuật tăng cường để tìm kiếm điểm phân chia (split point) trình xây dựng (tree) Cải tiến giúp LightGBM tăng tốc độ huấn luyện, đồng thời làm giảm nhớ cần sử dụng Ngoài ra, điểm tối ưu LightGBM thuật toán: GOSS (Gradient Based One Side Sampling) EFB (Exclusive Feature Bundling) giúp tăng tốc đáng kể q trình tính tốn [12] - LightGBM phát triển dựa phương pháp leafwise, hầu hết giải thuật tăng cường khác, kể XGBoost, dựa phương pháp level-wise Phương pháp leaf-wise lựa chọn nút để phát triển dựa tối ưu toàn cây, phương pháp level-wise tối ưu nhánh xét, đó, với số nút nhỏ, xây dựng từ leaf-wise thường có kết tốt nhiều so với level-wise Bộ liệu dùng nghiên cứu Trong nghiên cứu này, nhóm tác giả sử dụng liệu tạo từ phịng thí nghiệm PV microgrid system [13], mơ hình miêu tả Hình Hệ thống PV nối lưới bao gồm nguồn mô pin lượng mặt trời tạo qua lập trình Chroma 62150H-1000s Bộ nguồn mơ có độ ổn định cao có thiết kế đáp ứng thay đổi điều kiện thời tiết thay đổi khác giống PV thực tế mức độ xạ, nhiệt độ hiệu ứng đám mây Nguồn xoay chiều lập trình Chroma 61511 Programmable AC Source sử dụng mô lưới, đáp ứng đa dạng tượng đường dây Các loại mạch điều khiển mơ hình hóa phần mềm Matlab Simulink Thuật toán điều khiển thực bo mạch Dspace 1104, sử dụng cho việc thu thập liệu Kỹ thuật điều khiển định hướng điện áp thì sử dụng kêt hợp với điều chế độ rộng xung không gian để điều khiển công suất tác dụng cơng suất phản kháng dựa tín hiệu từ lưới Điện áp đồng với điện áp lưới qua vòng khóa pha Mơ hình sử dụng tải xoay chiều dùng cho mục đích bảo vệ hệ thống đưa đầu vào lỗi xuất thực tế chế độ điểm công suất trung gian IPPT (Intermediate Power Point Tracking) Pavailable Plimit hệ thống dùng để tạo thu thập liệu lỗi thực tế theo thời gian thực Bảng Các cố hệ thống điện mặt trời Lỗi F0 Loại lỗi Khơng có lỗi F1 Lỗi biến tần Mơ tả Hỏng hồn tồn sáu IGBTs F2 Lỗi cảm biến phản hồi Cảm biến pha lỗi 20% F3 Sự cố lưới điện Hiện tượng sụt áp lưới điện Lỗi không đồng 10 20% PV bị bóng F4 PV râm che khuất Lỗi không đồng F5 15% hở mạch PV PV Hệ số khuếch đại điều Lỗi điều khiển khiển PI điều khiển chế F6 độ MPPT/IPPT boost MPPT/IPPT converter bị giảm 20% Tham số thời gian điều Lỗi điều khiển Boost khiển PI điều khiển chế F7 độ MPPT/IPPT boost converter converter bị tăng thêm 20% Dữ liệu thu thập từ phép đo cảm biến trích xuất thành phần PMU (Phase Measurement Unit) vi mơ Để khơng làm tính tổng qt PMU vi mơ sử dụng với độ phân giải micro giây với độ xác đến mili giây Có tất kịch bao gồm lỗi không lỗi đưa ra, ký hiệu F0, F1, F2, F3, F4, F5, F6, F7, kịch thể Bảng Các lỗi thuộc nhiều dạng vị trí khác hệ thống để đảm bảo phân tích nhận dạng đầy đủ cố ảnh hưởng trực tiếp đến hệ thống Các thí nghiệm thực cách độc lập liên tiếp khoảng thời gian từ 10 đến 15 giây cố đưa vào khoảng giây thứ đến giây thứ 8, mô tả Hình Thời gian lấy mẫu để thu thập liệu khoảng thời gian Ts = 100 s Hình Quá trình xảy lỗi hệ thống PV Hình Mơ hình hệ thống pin mặt trời nối lưới mơ phịng thí nghiệm [13] Hệ thống điều khiển dựa kỹ thuật tối ưu hóa phần tử bầy đàn (Particle Swarm Optimization) để đảm bảo công suất hai chế độ điểm công suất tối đa MPPT (Maximum Power Point Tracking) Pavailable Plimit Các lỗi biến tần hay cố lưới điện F1 F3 xảy phía lưới hệ thống PV, chúng gây ảnh hưởng đến phía AC, thơng số lưới thay đổi nhỏ minh họa Hình hậu gây nên với lưới nghiêm trọng, nên lỗi cần phát giai đoạn đầu xử lý Các lỗi không đồng pin PV lỗi F4, F5, gây biến đổi lớn cảm biến phía DC, lỗi có mức độ nguy hiểm thấp, gây ảnh hưởng đến đến hệ thống không nhiều gây tổn thất điện lớn hệ thống Thuật toán phát lỗi cảm biến phản hồi (F2), lỗi điều khiển tích phân tỷ lệ PI ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG, VOL 20, NO 5, 2022 điều khiển chế độ MPPT/IPPT phía DC (F6, F7) Trong đó, lỗi điều khiển F7 cho biết hệ số khuếch đại điều khiển PI điều khiển chế độ MPPT/ IPPT Boost Converter bị giảm xuống 20% F6 tăng thêm 20%, việc dẫn đến giảm hiệu suất việc theo dõi quỹ đạo MPPT/ IPPT Những lỗi phổ biến thực tế, tác động cố đến hệ thống PV, mô tả phần lý thuyết đường đặc tính U-I trình bày 71 đánh giá chi tiết [14] Ngoài ra, lỗi hệ thống PV xảy hao mịn pin, suy thối tế bào quang điện hay hư hỏng mối nối, lỗi xuống cấp không nghiêm trọng chúng tránh thơng qua q trình bảo trì, kiểm tra định kỳ, việc phát chúng đòi hỏi cần có liệu dài hạn với khoảng thời gian lấy mẫu lớn lỗi liên quan đến vấn đề không xét nghiên cứu Hình Sự dao động thơng số lưới gặp cố F1, F3 [13] Mỗi cố Bảng 1, mô tả thông số liên quan trực tiếp đến lỗi là: I PV ,VPV ,VDC , Ia , Ib , Ic ,Va ,Vb ,Vc , Iabc , f I ,Vabc , fV Trong đó, I PV dịng điện pin PV; VPV điện áp pin PV; VDC điện áp phía chiều; I a , I b , I c dòng điện pha A, B, C phía xoay chiều; Va ,Vb ,Vc điện áp pha A, B, C phía xoay chiều; I abc ,Vabc cường độ dòng điện, điện áp thứ tự thuận; f I , fV tần số dòng điện điện áp Các thơng số đặc trưng mà nhóm nghiên cứu sử dụng làm đầu vào mơ hình thuật tốn để phân loại cố hệ thống điện mặt trời Vì vậy, đầu vào thuật tốn mảng có kích 1x13 bao gồm thơng số đặc trưng nêu Hình Mức độ ảnh hưởng đặc trưng Trong q trình huấn luyện mơ hình, nhóm nghiên có trích suất mức độ ảnh hưởng đặc trưng Hình Trục hồnh số chuẩn hóa cho số ảnh hưởng tất đặc trưng Trục tung đặc trưng xếp giảm dần từ xuống Từ có nhìn tổng quan tầm quan trọng hay đóng góp tương đối đặc trưng đến toán phân loại cố hệ thống điện mặt trời Kết Với liệu đầu vào lớn với triệu trạng thái lỗi khác tránh khỏi điểm liệu bị lỗi, nhiễu bị thiếu, trình tiền xử lý liệu, nhóm nghiên cứu tiến hành loại bỏ điểm khỏi Data Ngồi ra, trạng thái có đặc trưng 𝑰𝑷𝑽 , 𝑽𝑷𝑽 , 𝑽𝑫𝑪 , 𝑰a , 𝑰b , 𝑰c , 𝑽a , 𝑽b , 𝑽c , 𝑰abc , 𝒇𝑰 , 𝑽abc , 𝒇𝑽 có giải biến thiên tương đối khác Điều ảnh hưởng lớn tới sai số việc xác định trọng số mơ hình thuật tốn, nhóm nghiên cứu chuẩn hóa đặc trưng theo phương pháp min-max scaling Đây phương pháp cho phép biến đại lượng X có giải biến thiên thành đại lượng X’ có giải biến từ đến X = X − X X max − X (4) Trong đó, X giá trị ban đầu; X giá trị sau chuẩn hóa; X max , X giá trị lớn nhỏ tính tồn liệu thành phần Sau có liệu hoàn chỉnh, liệu chia thành hai phần tập huấn luyện tập kiểm thử với tỷ lệ 70-30 Bước xây dựng mơ hình, nhóm nghiên cứu sử dụng kỹ thuật GridSearch nhằm thay đổi tìm hyperparameter tối ưu cho mơ hình, từ kết hợp tham số cải thiện hiệu suất tổng qt hóa mơ hình Bước cuối đánh giá độ xác thuật tốn Các bước tóm tắt sơ đồ Hình Sau nhiều lần xây dựng thuật toán, tối ưu tham số bên mơ hình, độ xác lớn mơ hình phát cố đạt 98,83 % Để đánh giá trực quan độ xác mơ hình, chúng tơi sử dụng ma trận hợp (Confusion matrix) Hình thể ma trận hợp thuật toán LightGBM, ma trận có kích thước 8x8 có kịch lỗi cần phát bao gồm F0, F1, F2, F3, F4, F5, F6, F7 Trục hoành thể trạng Nguyễn Quốc Minh, Nguyễn Tiến Thành 72 thái dự đoán mơ hình, cịn trục tung thể trạng thái thực tế Với định nghĩa thấy, phần tử đường chéo ma trận thể số trạng thái có dự đốn giống với thực tế, cịn phần tử nằm ngồi đường chéo thể số dự đốn khác với thực tế Ví dụ phần tử C(4,3) có giá trị 90, tức có 90 trạng thái thực tế lỗi F5 mơ hình dự đốn nhầm thành trạng thái lỗi F3 hay phần tử C (4,5) có giá trị 50712 tức trạng thái thực tế lỗi F3 mơ hình dự đốn xác lỗi F3 Căn vào ma trận hợp ta tính độ xác thuật tốn theo cơng thức: 𝑎𝑐𝑐 = 𝑆ố 𝑑ự đ𝑜á𝑛 đú𝑛𝑔 𝑇ổ𝑛𝑔 𝑠ố 𝑑ự đ𝑜á𝑛 (4) Tương tự, ma trận hợp thuật toán AdaBoost, Gradient Boosting, XGBoost thể Hình 10-12 Nhóm nghiên cứu thống kê lại thời gian huấn luyện nhận dạng thuật toán Kết cho thấy mơ hình thuật tốn LightGBM cải thiện đáng kể tốc độ tính tốn so với thuật tốn khác nhóm Ensembe Learning huấn luyện liệu lớn, với triệu trạng thái khác Hình 10 Ma trận hợp thuật tốn AdaBoost Hình 11 Ma trận hợp thuật tốn XGBoost Hình Sơ đồ khối mơ hình phát cố hệ thống điện mặt trời dựa học máy Hình 12 Ma trận hợp thuật toán G.Boosting Bảng Độ xác (%) loại lỗi Hình Ma trận hợp thuật toán LightGBM Lỗi AdaBoost Gradient Boosting Light GBM XGBoost F0 92,91 97,66 98,57 98,01 F1 94,42 98,84 99,18 99,05 F2 92,90 97,64 99,25 98,01 F3 68,14 92,63 97,48 94,94 F4 99,98 99,99 100 99,98 F5 84,88 97,81 98,43 98,21 F6 92,52 97,52 98,97 98,18 F7 86,32 96,32 98,25 96,77 ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ - ĐẠI HỌC ĐÀ NẴNG, VOL 20, NO 5, 2022 Bảng So sánh thời gian huấn luyện, nhận dạng độ xác thuật toán [5] Ada Gradient Light XGBoost Boost Boosting GBM Thời gian huấn luyện (s) 6238 4226,1 321,7 5038,3 Thời gian nhận dạng (s) 0,0233 0,0082 0,0035 0,0104 Độ xác (%) 97,53 98,83 98,04 90,06 [6] [7] Kết luận Nghiên cứu đề xuất cách tiếp cận để phát tự động cố hệ thống điện mặt trời dựa thuật toán học máy Kết nghiên cứu cho thấy, mơ hình học máy phát cố đa dạng hệ thống điện mặt trời với độ xác lên tới 98,83% Trong nghiên cứu tiếp theo, nhóm tác giả tiếp tục cải thiện mơ hình để nâng cao tốc độ tính tốn thuật tốn liệu có kích thước lớn TÀI LIỆU THAM KHẢO [1] Tập đoàn Điện lực Việt Nam “Báo cáo thường niên”, 2021 [2] K AbdulMawjood, S S Refaat and W G Morsi, "Detection and prediction of faults in photovoltaic arrays: A review", 2018 IEEE 12th International Conference on Compatibility, Power Electronics and Power Engineering (CPE-POWERENG 2018), 2018, pp 1-8 [3] D S Pillai and N Rajasekar, "An MPPT-Based Sensorless Line– Line and Line–Ground Fault Detection Technique for PV Systems", in IEEE Transactions on Power Electronics, vol 34, no 9, Sept 2019, pp 8646-8659 [4] S Roy, M K Alam, F Khan, J Johnson and J Flicker, "An Irradiance-Independent, Robust Ground-Fault Detection Scheme for PV Arrays Based on Spread Spectrum Time-Domain Reflectometry (SSTDR)", in IEEE Transactions on Power Electronics, vol 33, no [8] [9] [10] [11] [12] [13] [14] 73 8, Aug 2018, pp 7046-7057 P Sevilla-Camacho, M Zuñiga-Reyes, J Robles-Ocampo, R Castillo-Palomera, J Muñiz and J Rodríguez-Reséndiz, "A Novel Fault Detection and Location Method for PV Arrays Based on Frequency Analysis", in IEEE Access, vol 7, 2019, pp 72050-72061 H A Tokel, R A Halaseh, G Alirezaei and R Mathar, "A New Approach for Machine Learning-based Fault Detection and Classification in Power Systems", 2018 IEEE Power & Energy Society Innovative Smart Grid Technologies Conference (ISGT), 2018, pp 1-5 K Moloi and A O Akumu, "Power Distribution Fault Diagnostic Method Based on Machine Learning Technique", 2019 IEEE PES/IAS PowerAfrica, 2019, pp 238-242 Belkin, M., Hsu, D., Ma, S., Mandal, S Reconciling modern machine-learning practice and the classical bias variance trade-off Proc Natl Acad Sci 32, 116 (2019), 15849—15854 Wu, P., Zhao, H Some Analysis and Research of the AdaBoost Algorithm In: Chen, R (eds) Intelligent Computing and Information Science ICICIS 2011 Communications in Computer and Information Science, vol 134 Springer, Berlin, Heidelberg, 2011 Haihao Lu, Sai Praneeth Karimireddy, Natalia Ponomareva, Vahab Mirrokni, "Accelerating Gradient Boosting Machines", Proceedings of the Twenty Third International Conference on Artificial Intelligence and Statistics, PMLR 108:516-526, 2020 Jason Brownlee, "Gradient Boosted Trees with XGBoost and Scikit - learn", edition v1.15, 2021 Guolin Ke, Qi Meng, Thomas Finley, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, Tie-Yan Liu, "LightGBM: A Highly Efficient Gradient Boosting Decision Tree", Advances in Neural Information Processing Systems 30 (NIPS 2017), 2017 A.Guichi, A.Talha, E.M.Berkouk, S.Mekhilef and S.Gassab, "A New Method for Intermediate Power Point Tracking for PV Generator under Partially Shasded Conditions in Hybrid System", Solar Energy, vol 170, Aug 2018, pp 974-987 Pillai DS, Rajasekar N A comprehensive review on protection challenges and fault diagnosis in PV systems Renew Sust Energy Rev 2018;91:18–40 ... tiếp cận để phát tự động cố hệ thống điện mặt trời dựa thuật toán học máy Kết nghiên cứu cho thấy, mơ hình học máy phát cố đa dạng hệ thống điện mặt trời với độ xác lên tới 98,83% Trong nghiên... cố hệ thống điện mặt trời Lỗi F0 Loại lỗi Khơng có lỗi F1 Lỗi biến tần Mô tả Hỏng hoàn toàn sáu IGBTs F2 Lỗi cảm biến phản hồi Cảm biến pha lỗi 20% F3 Sự cố lưới điện Hiện tượng sụt áp lưới điện. .. thuật tốn AdaBoost Hình 11 Ma trận hợp thuật tốn XGBoost Hình Sơ đồ khối mơ hình phát cố hệ thống điện mặt trời dựa học máy Hình 12 Ma trận hợp thuật tốn G.Boosting Bảng Độ xác (%) loại lỗi Hình Ma