1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Sử dụng R trong phân tích hồi quy áp dụng cho dự án điện mặt trời áp mái

10 3 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 1,56 MB

Nội dung

Bài viết Sử dụng R trong phân tích hồi quy áp dụng cho dự án điện mặt trời áp mái sử dụng R trong phân tích các yếu tố ảnh hưởng đến sản lượng điện năng của nhà máy điện mặt trời có công suất 1195kWp. Với bộ dữ liệu khảo sát, thu thập được, tác giả phân tích các yêu tố ảnh hưởng đến sản lượng điện năng do tấm pin mặt trời sản xuất ra (Quantity.PV) và lựa chọn mô hình hồi quy tuyến tính phù hợp.

TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) SỬ DỤNG R TRONG PHÂN TÍCH HỒI QUY ÁP DỤNG CHO DỰ ÁN ĐIỆN MẶT TRỜI ÁP MÁI USE R IN REGRESSION ANALYSIS APPLIED TO ROOFTOP SOLAR POWER PROJECT Chu Văn Tuấn, Nguyễn Thúy Ninh Đại học Điện lực Ngày nhận bài: 02/06/2022, Ngày chấp nhận đăng: 12/08/2022, Phản biện: TS Đỗ Anh Tuấn Tóm tắt: Hiện có nhiều phương pháp, phần mềm dùng để phân tích hồi quy, báo tác giả sử dụng R R ngơn ngữ thống kê học, xem phần mềm sử dụng cho phân tích thống kê đồ thị R sử dụng cho nhiều mục tiêu khác nhau, từ tính tốn đơn giản, tốn học giải trí, tính tốn ma trận đến phân tích thống kê phức tạp Sử dụng R phân tích yếu tố ảnh hưởng đến sản lượng điện nhà máy điện mặt trời có cơng suất 1195kWp phương pháp hồi quy tuyến tính Từ ý nghĩa tham số mơ hình, cách đánh giá tầm quan trọng biến tiên lượng, quy trình xây dựng kiểm định mơ hình dự báo xem xét đến vấn đề đa cộng tuyến hoán chuyển liệu Trong tương lai không xa, thị trường điện phát triển, kết việc nghiên cứu mơ hình dự báo hay chào giá sản lượng điện dự án mặt trời tạo có ý nghĩa vơ quan trọng Từ khóa: Phân tích, thống kê, đồ thị, R, hồi quy, điện mặt trời Abstract: There are many methods and software used for regression analysis, in this paper the author used R R is not only a statistical language but also a software that can be used for statistical analysis and graphs Additionaly R can be used for a variety of purposes, from simple calculations, recreational math, matrix calculations to complex statistical analyses Using R in analyzing factors affecting power output of a solar power plant with a capacity of 1195kWp by linear regression It shows the meaning of the parameters in the model, how to evaluate the importance of prognostic variables, and the process of building and testing the predictive model considering both multicollinearity and transformation problems data In the not-so-distant future, when the electricity market develops, the results of studying the forecasting model or the price of electricity generated by solar projects are extremely important Keywords: Analysis, statistics, graph, R, regression, solar power I/ ĐẶT VẤN ĐỀ Phân tích hồi quy tập hợp phương pháp thống kê sử dụng để ước tính mối quan hệ biến phụ thuộc nhiều biến độc lập Nó sử dụng để đánh giá mối quan hệ biến mơ hình hóa mối quan hệ tương lai chúng Trong dự án, phân tích hồi quy sử dụng để xác định biến số biến thực có tác động Nó trả lời câu hỏi: Yếu tố quan trọng nhất? Yếu tố bỏ qua? Các 42 yếu tố tương tác với nào? Ứng dụng mơ hình hồi quy địi hỏi kỹ mơ hình hóa, kiến thức, khơng ứng dụng sai mơ hình, khơng kiểm tra giả định, phải xem xét tượng đa cộng tuyến, hoán vị liệu … Xây dựng mơ hình tiên lượng phải có độ xác cao đồng thời phải đơn giản, thực tế dễ áp dụng Hiện có nhiều phương pháp, phần mềm dùng để phân tích hồi quy, báo tác giả sử Số 29 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) dụng R R ngôn ngữ thống kê học, xem phần mềm sử dụng cho phân tích thống kê đồ thị Phần R bao gồm số lệnh/hàm phổ biến sử dụng cho phân tích đơn giản Các hàm rnorm, mean, sd, hist, lm, glm… có sẵn Base R Tuy nhiên, thực tế, phân tích chuyên biệt mơ hình hồi quy phi tuyến tính Base R khơng làm Trong trường hợp phân tích chun biệt, cần dùng đến package chuyên biệt Trong R có nhiều package (hơn 10.000 packages), package Sử dụng R phân tích yếu tố ảnh hưởng đến sản lượng điện nhà máy điện mặt trời có cơng suất 1195kWp Có nhiều phương pháp phân tích hồi quy hồi quy logistics, hồi quy Cox, hồi quy Poisson … nhiên tùy thuộc vào đối tượng phân tích, liệu thu thập được, tác giả lựa chọn phương pháp hồi quy tuyến tính để phân tích yếu tố ảnh hưởng đến sản lượng điện pin mặt trời sản xuất (Quantity.PV) Qua tác giả ý nghĩa tham số mô hình, cách đánh giá tầm quan trọng biến tiên lượng, quy trình xây dựng kiểm định mơ hình dự báo xem xét đến vấn đề đa cộng tuyến hoán chuyển liệu [3] Trong tương lai không xa, thị trường điện phát triển, kết việc nghiên cứu mơ hình dự báo, đưa chiến lược chào giá dựa sản lượng điện dự án mặt trời tạo có ý nghĩa vơ quan trọng II/ CƠ SỞ LÝ THUYẾT Để xây dựng mơ hình để định lượng hóa dự báo, mơ hình phổ biến mơ hình hồi quy tuyến tính (line regression model) Gọi (xi, yi) cặp giá trị x y đối tượng i (i=1,2,3…n) Mơ hình hồi quy tuyến tính: yi = α+βxi Tuy nhiên kỳ vọng mơ hình đường khơng thể nối kết tất giá trị (xi,yi) Sẽ có số giá trị lệch khỏi mơ hình Do đó, thêm yếu tố khác mơ hình εi yi = α + βxi + εi (1) Đó mơ hình cho tổng thể Chúng ta giá trị tham số α β, có mẫu quan sát để ước tính cho tham số Mơ hình cho mẫu nghiên cứu là: yi = a + bxi + ei (2) a ước số α b ước số β Biến e phần dư tức phần cịn lại y mà mơ hình Số 29 tập trung làm số phân tích chuyên sâu Các package có CRAN Mỗi package có lệnh/hàm riêng mà nhà thiết kế cài sẵn Do đó, để sử dụng package, cài đặt trực tiếp install.packages Trước dùng R cho phân tích liệu, liệu phải đọc vào R R đọc hầu hết loại liệu dạng Excel, Stata, SPSS… Đối với liệu đơn giản nhập trực tiếp vào R mà không cần dùng chương trình (package) cách dùng hàm c() sau đưa vào dataset (R gọi dataser data.frame) để phân tích [1], [2] a + bx khơng giải thích Nói cách khác, mơ hình hồi quy tuyến tính: Giá trị quan sát y = giá trị tiên lượng + phần dư hay y = 𝑦̂ + e Phần dư = giá trị quan sát – giá trị tiên lượng e = y-𝑦̂ = y - (a + bx) (3) Phương pháp bình phương cực tiêu có mục tiêu cực tiểu hóa tổng phần dư min∑ (𝑦 − 𝛼 − 𝛽𝑥)2 hay mục tiêu cần tìm a b cho tổng bình phương phần dư nhỏ b= ∑ (𝑥𝑖 −𝑥)(𝑦𝑖 −𝑦) ∑ (𝑥𝑖 −𝑥)2 a=𝑦-bx (4) Sau có giá trị ước lượng a b, ta ước lượng giá trị y cho giá trị x: 𝑦̂𝑖 = 𝑎 + 𝑏𝑥𝑖 (5) Hai số để đánh giá hữu dụng mơ hình hồi quy tuyến tính hệ số R2 MSE (mean square error) Chỉ số đơn giản để thể độ biến thiên tổng bình phương (sum of squares hay SS) Nhưng SS cần điểm tham chiếu Chúng ta thấy điểm tham chiếu biến y giá trị trung bình tính SS cho y (ký hiệu TSS) nhu sau: TSS = ∑𝑛𝑖=1 (𝑦𝑖 − 𝑦)2 (6) Tổng bình phương từ giá trị tiên lượng giá trị trung bình là: RSS = ∑𝑛𝑖=1 (𝑦̂𝑖 − 𝑦𝑖 )2 (7) Tổng bình phương phần dư: ESS = ∑𝑛𝑖=1 (𝑦𝑖 − 𝑦̂𝑖 )2 (8) Hệ số xác định (R ) mơ hình hồi quy tỷ số RSS TSS: 𝑅2 = 𝑅𝑆𝑆 𝑇𝑆𝑆 (9) 43 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) R2 nằm khoảng Hệ số xác định R2 phần trăm phương sai y giải thích mơ hình hồi quy tuyến tính Một số quan trọng khác MSE (mean squared error phương sai y sau hiệu chỉnh cho x Trong thực tế, MSE ước tính từ phần dư, phần dư phản ánh phần phương sai mà mơ hình khơng giải thích ∑ (𝑦 − 𝑦̂ )2 ∑𝑛 số liệu thu thập lúc cách gọi library(psych) package: ggplot2 >pairs.panels(m) (𝑒 )2 𝑖 𝑖 𝑀𝑆𝐸 = = 𝑖=1𝑛−2 𝑖 𝑛−2 (10) Độ lệch chuẩn y sau hiệu chỉnh cho x: ∑ RMSE = √ (𝑦𝑖 − 𝑦̂𝑖 )2 𝑛−2 (𝑒𝑖 )2 𝑛−2 ∑𝑛𝑖=1 =√ (11) Để đánh giá mơ hình hồi quy tuyến tính có đại diện cho liệu, sử dụng hệ số xác định R2 MSE Mơ hình có R2 cao có nghĩa mơ hình giải thích nhiều phương sai giảm độ bất định nên MSE thấp Mô hình có R2 thấp tính bất định tiên lượng cao điều phản ánh qua giá trị MSE tăng [4], [5] III/ KẾT QUẢ NGHIÊN CỨU Dự án điện mặt trời: Dự án điện mặt trời áp mái có cơng suất lắp đặt 1195kWp phương pháp hồi quy tuyến tính Chủ đầu tư: Công ty TNHH NTPM (Việt Nam), đơn vị tổng thầu: Công ty TNHH Năng lượng bền vững Việt Nga Nhập liệu phân tích Như biết, lượng điện pin mặt trời sinh nhờ ánh nắng mặt trời Vì số ánh nắng vô quan trọng, định sản lượng điện sinh nhiều hay không Trong giai đoạn dự án nay, số liệu thu thập, khảo sát ghi lại theo thời gian vào file liệu Excel Có nhiều đối tượng quan sát file thu thập Sử dụng R vào thống kê mô tả đối tượng liệu nghiên cứu, sử dụng hàm describe package psych[9], [10] >library(psych) >describe(m) Trước sâu vào phân tích lựa chọn mơ hình hồi quy tuyến tính phù hợp, tác giả muốn độ tương quan biến độc lập 44 Hình Biểu đồ tương quan biến Biểu đồ ma trận biểu đồ cung cấp cho biểu đồ tương quan biến đường biểu diễn cách trực quan Phần phía ma trận hệ số tương quan Các ô đường chéo vẽ phân bố biến Trong báo này, tác giả tập trung phân tích biến ảnh hưởng đến sản lượng điện pin mặt trời sản xuất (Quantity.PV) Kết từ hàm pairs.panels(m) cho thấy biến Quantity.PV có mối liên quan mật thiết với biến: Cường độ xạ (Intensity.of.Global.radiation) thời gian có nắng (Sunny.hours) có hệ tương quan cao 0.97 0.54 Mơ hình 1: Quantity.PV~ Intensity.of Intensity.of.Global.radiation Chúng ta tập trung phân tích ảnh hưởng biến “Intensity.of.Global.radiation" đến biến "Quantity.PV" Để phân tích biểu đồ tương quan biến, gọi hàm ggplot2[5], [6] >library(ggplot2) >p=ggplot(data=m,aes(x=Intensity.of.Glob al.radiation,y=Quantity.PV)) >p=p+geom_point()+geom_smooth()+ggtit le("Association between Intensity of Global radiation and Quantity PV")+theme(plot.title=element_text(lineheight= 0.8,face="bold",hjust=0.5)) > p=p+theme(legend.position="centre") >p Số 29 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Hình Biểu đồ tương quan hai biến Nhìn vào biểu đồ tương quan hai biến trên, ta thấy Intensity.of.Global.radiation Quantity.PV tương quan gần đường thẳng Phân tích biến sâu hơn, tác giả sử dụng biểu đồ phân bố Đây phương tiện có ích để thể phân bố biến số liên tục Để thể phân bố biến Intensity.of.Global.radiation, Quantity.PV ta dùng hàm geom_histogram sau: >g=ggplot(data=m,aes(Intensity.of.Global.r adiation)) >g=g+geom_histogram(bins=20,aes(y= de nsity ),col="white",fill="blue",lwd=0.5 ) >g=g+geom_density() >n=ggplot(data=m,aes(Quantity.PV )) >n=n+geom_histogram(bins=20,aes(y= de nsity ),col="white",fill="blue",lwd=0.5) >n=n+geom_density() Hình Biểu đồ phân bố Biểu đồ dùng để thể biến liên tục, trình bày theo dạng ngang để nhấn mạnh hai đối tượng phân tích Qua biểu đồ phân tích mối tương quan x=Intensity.of.Global.radiation, y=Quantity.PV, thấy có mối tương quan thuận Khi cường độ xạ điểm đo giảm sản lượng điện pin mặt trời sản xuất giảm ngược lại Vấn đề đặt làm để định lượng hóa mối tương quan Hệ số tương quan Pearson Spearman cho thấy mối quan hệ Theo Số 29 Pearson để đo lường mối tương quan, cần xác định số covariance (hiệp phương sai) Trong R, theo phương pháp Pearson ta dùng cor.test(x,y) Kết phân tích: >cor.test(x=m$Intensity.of.Global.radiation ,y=m$Quantity.PV) Pearson's product-moment correlation data: m$Intensity.of.Global.radiation and m$Quantity.PV t = 14.954, df = 12, p-value = 4.026e-09 alternative hypothesis: true correlation is not equal to 95 percent confidence interval: 0.9182656 0.9920164 sample estimates: cor 0.9742015 r=0.97>0 gần 1, mối tương quan Intensity.of.Global.radiation, Quantity.PV chặt chẽ tương quan thuận với Trong trường hợp(x,y) không tuân theo quy luật phân bố chuẩn, để đánh giá mối tương quan, thay dùng hệ số Pearson, ta dùng hệ số Spearman (ρ) >cor.test(x=m$Intensity.of.Global.radiation ,y=m$Quantity.PV,method="spearman") Kết quả: Spearman's rank correlation rho data: m$Intensity.of.Global.radiation and m$Quantity.PV S = 22, p-value < 2.2e-16 alternative hypothesis: true rho is not equal to sample estimates: rho 0.9516484 Hệ số tương quan Spearman 0.95, thấp hệ số tương quan Pearson, có ý nghĩa thống kê (Pplot(Quantity.PV~Intensity.of.Global.radi ation,data=m,pch=16,col="blue") >abline(lm(Quantity.PV~Intensity.of.Globa l.radiation,data=m)) Hình Mơ hình hồi quy tuyến tính sản lượng điện cường độ xạ mặt trời Phân tích hồi quy tuyến tính R kết sau: >M1=lm(Quantity.PV~Intensity.of.Global radiation,data=m) >summary(M1) Call: lm(formula = Quantity.PV ~ Intensity.of.Global.radiation, data = m) Residuals: Min 1Q Median 3Q Max -213.56 -69.63 27.30 40.50 211.28 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) -314.68 333.81 -0.943 0.364 Intensity.of.Global.radiation 990.89 66.26 14.954 4.03e-09 *** Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 130.7 on 12 degrees of freedom Multiple R-squared: 0.9491, Adjusted Rsquared: 0.9448 F-statistic: 223.6 on and 12 DF, p-value: 4.026e-09 Trong trường hợp R2 = 0.94 có nghĩa biến độc lập Intensity.of.Global.radiation “giải thích” khoảng 94% biến thiên biến phụ thuộc Quantity.PV Phần cịn lại 6% giải thích biến ngồi mơ hình sai số ngẫu nhiên Cột Estimate cho ta kết ước tính hai 46 tham số mơ hình hồi quy tuyến tính Theo đó, a= -314.68 b=990.89 Do đó, mơ hình là: M1: Quantity.PV = -314.68 + 990.89 Intensity.of.Global.radiation Trong mơ hình này, ý nghĩa b=990.89 cường độ xạ tăng lên 1kWh/m2 sản lượng điện pin mặt trời sinh tăng lên 990.89 kWh Hằng số a=-314.68 có nghĩa cường độ xạ = sản lượng điện -314.68 kWh Điều vơ lý thực sản lượng tạo số âm Tuy nhiên hốn đổi biến cường độ xạ Intensity.of.Global.radiation sang đơn vị z: zIntensity.of.Global.radiation = 𝐼𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑦.𝑜𝑓.𝐺𝑙𝑜𝑏𝑎𝑙.𝑟𝑎𝑑𝑖𝑎𝑡𝑖𝑜𝑛−𝑡𝑟𝑢𝑛𝑔 𝑏ì𝑛ℎ (𝐼𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑦.𝑜𝑓.𝐺𝑙𝑜𝑏𝑎𝑙.𝑟𝑎𝑑𝑖𝑎𝑡𝑖𝑜𝑛) Độ 𝑙ệ𝑐ℎ 𝑐ℎ𝑢ẩ𝑛 𝑐ủ𝑎 𝐼𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑦.𝑜𝑓.𝐺𝑙𝑜𝑏𝑎𝑙.𝑟𝑎𝑑𝑖𝑎𝑡𝑖𝑜𝑛 Giá trị trung bình Intensity.of.Global.radiation 5.01 kWh/m độ lệch chuẩn 0.55 Điều có nghĩa cường độ xạ có giá trị giá trị trung bình zIntensity.of.Global.radiation = Chúng ta hoán đổi cách dùng hàm scale sau: m$zIntensity.of.Global.radiation=scale(m$ Intensity.of.Global.radiation) Đưa biến số zIntensity.of.Global.radiation vào liệu ban đầu Biến số có giá trị trung bình độ lệch chuẩn 1[2] Phân tích mơ hình với biến zIntensity.of.Global.radiation >zM1=lm(Quantity.PV~ zIntensity.of.Global.radiation,data=m) >summary(zM1) Kết sau: Call: lm(formula = Quantity.PV ~ zIntensity.of.Global.radiation, data = m) Residuals: Min 1Q Median 3Q Max -213.56 -69.63 27.30 40.50 211.28 Coefficients: Estimate Std Error t value Pr(>|t|) Số 29 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) (Intercept) 4649.66 34.92 133.15 < 2e-16 *** zIntensity.of.Global.radiation 541.91 36.24 14.95 4.03e-09 *** Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 130.7 on 12 degrees of freedom Multiple R-squared: 0.9491, Adjusted Rsquared: 0.9448 F-statistic: 223.6 on and 12 DF, p-value: 4.026e-09 Các số R-squared = 0.9491 không thay đổi so với mơ hình có biến Intensity.of.Global.radiation Tuy nhiên ý nghĩa tham số a b khác so với mơ hình trước - Tham số a = 4649.66 có nghĩa zIntensity.of.Global.radiation =0 (tức Intensity.of.Global.radiation = 5.01 kWh/m2 = giá trị trung bình) - Tham số b = 541.91, có nghĩa Intensity.of.Global.radiation tăng độ lệch chuẩn (0.55) sản lượng điện pin mặt trời sản xuất tăng 541.91 kWh Trong trường hợp nghiên cứu mơ hình hồi quy tuyến tính này, tác giả hốn vị sang đơn vị z ý nghĩa thực tế tham số Tiến hành kiểm tra giả định hàm autoplot() gói ggfortify >library(ggfortify) >autoplot(M1) Hình Biểu đồ phân tích giả định Biểu đồ phần bên trái trình bày mối liên quan giá trị dự báo với phần dư, cho thấy phần dư xoay quanh giá trị 0, tức với giả định giá trị trung bình phần dư Số 29 Biểu đồ phía bên phải trình bày mối tương quan giá trị lý thuyết thực tế phần dư Nếu phần dư tuân theo luật phân bố bình thường giá trị nằm đường lý thuyết, trường hợp phân tích phần dư xấp xỉ xoay quanh đường lý thuyết Điều có nghĩa giả định phân bố bình thường mơ hình chấp nhận Biểu đồ phần bên trái mối tương quan giá trị dự báo bậc hai phần dư Biểu đồ cho biết phương sai phần dư có hay khơng có liên quan với giá trị biến x Biểu đồ cho thấy khơng có mối liên quan Biểu đồ bên bên phải trình bày giá trị “leverage” phần dư chuẩn hóa Biểu đồ cho biết có giá trị có ảnh hưởng cao hay khơng Tất có giá trị phần dư nằm khoảng -2 đến +2, chấp nhận khơng có giá trị ngoại vi ảnh hưởng đến mơ hình Như vậy, phần phân tích cho mơ hình hồi quy tuyến tính giản đơn Hai số để đánh giá hữu dụng mơ hình hồi quy tuyến tính hệ số R2 phương sai Mơ hình có R2 cao có nghĩa mơ hình giải thích nhiều phương sai giảm độ bất định nên MSE thấp Mơ hình có R2 thấp tính bất định tiên lượng cao điều phản ánh giá trị MSE tăng [2], [4] Tiếp tục dùng lệnh để phân tích phương sai: > anova(M1) Analysis of Variance Table Response: Quantity.PV Df Sum Sq Mean Sq F value Pr(>F) Intensity.of.Global.radiation 3817645 3817645 223.61 4.026e-09 *** Residuals 12 204872 17073 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Phương sai mơ hình mean squared error (MSE) hiểu phương sai y sau hiệu chỉnh cho x Trong thực tế, MSE ước tính từ phần dư phần dư phản ánh phương sai mà mơ hình khơng giải thích Trong phân tích phương sai bảng MSE = 17073 Vậy mơ hình đáp ứng giả định có hệ số R2 cao Một yếu tố ảnh hưởng 47 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) đến sản lượng thời gian có nắng Tác giả tiếp tục đưa mơ hình thứ hai, phân tích biến thời gian có nắng Sunny.hours đến sản lượng điện pin mặt trời sản xuất Mơ hình 2: Quantity.PV~ Sunny.hours >k=ggplot(data=m,aes(x=Intensity.of.Glob al.radiation,y=Quantity.PV,col=Sunny.hours))+ geom_point() Hình Biểu đồ mối tương quan sản lượng thời gian có nắng Biểu đồ cho thấy điểm có màu xanh nhạt thời gian có nắng nhiều, sản lượng sản xuất có xu hướng tăng > M2=lm(Quantity.PV~Sunny.hours,data=m) > summary(M2) Call: lm(formula = Quantity.PV ~ Sunny.hours, data = m) Residuals: Min 1Q Median 3Q Max -1453.34 -74.06 62.09 223.81 454.06 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) -1491.9 2750.9 -0.542 0.5975 Sunny.hours 602.4 269.5 2.235 0.0452 * Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 486.5 on 12 degrees of freedom Multiple R-squared: 0.2939, Adjusted Rsquared: 0.2351 F-statistic: 4.996 on and 12 DF, p-value: 0.04519 48 Tương tự, tác giả kiểm tra mối tương quan biến số có nắng Sunny.hours Quantity.PV theo phương pháp Pearson qua hàm: >cor.test(x=m$Sunny.hours,y=m$Quantity PV) Kết r = 0.54>0, mối tương quan Sunny.hours Quantity.PV quan thuận với R2 = 0.29 có nghĩa biến độc lập Sunny.hours “giải thích” khoảng 29% biến thiên biến phụ thuộc Quantity.PV Phần lại 71% giải thích biến ngồi mơ hình sai số ngẫu nhiên Cột Estimate cho ta kết ước tính hai tham số mơ hình hồi quy tuyến tính Theo đó, a= -1491.9 b=602.4 Do đó, mơ hình là: M2: Quantity.PV = -1491.9 + 602.4 Sunny.hours Phân tích phương sai: >anova(M2) Analysis of Variance Table Response: Quantity.PV Df Sum Sq Mean Sq F value Pr(>F) Sunny.hours 1182365 1182365 4.9956 0.04519 * Residuals 12 2840152 236679 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ MSE = 236679 Vậy so với mơ hình 1, R2 thấp nhiều, tính bất định biến dự báo cao điều phản ánh giá trị MSE tăng Mơ hình 3: Quantity.PV~Intensity.of.Global.radiatio n+Sunny.hours Tác giả thử xem xét đưa biến sunny.hours vào mơ hình >M3=lm(Quantity.PV~Intensity.of.Global radiation+Sunny.hours,data=m) >summary(M3) Call: lm(formula = Quantity.PV ~ Intensity.of.Global.radiation + Sunny.hours, data = m) Số 29 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Residuals: Min 1Q Median 3Q Max -201.47 -71.88 21.08 46.35 218.90 Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 274.77 760.34 0.361 0.725 Intensity.of.Global.radiation 1034.69 83.96 12.323 8.85e-08 *** Sunny.hours -79.34 91.72 -0.865 0.405 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Residual standard error: 132.1 on 11 degrees of freedom Multiple R-squared: 0.9523, Adjusted Rsquared: 0.9436 F-statistic: 109.8 on and 11 DF, p-value: 5.385e-08 Phân tích phương sai mơ hình trên: > anova(M3) Analysis of Variance Table Response: Quantity.PV Df Sum Sq Mean Sq F value Pr(>F) Intensity.of.Global.radiation 3817645 3817645 218.9217 1.316e-08 *** Sunny.hours 13050 13050 0.7483 0.4055 Residuals 11 191822 17438 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ Kết phân tích cho mơ hinh: M3: Quantity.PV = 274.77 + 1034.69 Intensity.of.Global.radiation -79.34 Sunny.hours Xem xét tượng đa cộng tuyến: Kiểm tra tượng đa cộng tuyến ước lượng hệ số hồi quy cho biến Sunny.hours 79.34 tức sản lượng điện giảm số có nắng tăng Xem xét mối liên quan cường độ xạ số có nắng Hệ số tương quan mức 0,603 >with(data=m,cor(Intensity.of.Global.radia tion,Sunny.hours)) [1] 0.6031506 >ggplot(data=m,aes(x=Sunny.hours,y=Inte nsity.of.Global.radiation))+geom_point(col='bl ue') Hình Biểu diễn tương quan cường độ xạ số có nắng Phương pháp phát định lượng đa cộng tuyến Trong R chúng tính VIF qua hàm vif chương trình car >f=lm(Quantity.PV~Intensity.of.Global.rad iation+Sunny.hours,data=m) > library(car) > vif(f) Intensity.of.Global.radiation Sunny.hours 1.57181 1.57181 VIF=1.570 M Quantity.PV = -1491.9 + 602.4 Sunny.hours R2 = 0.29 MSE = 236679 r = 0.54>0 Số 29 M Quantity.PV = -314.68 + 990.89 Intensity.of.Global.radiation M Quantity.PV = 274.77 + 1034.69 Intensity.of.Global.radiation 79.34 Sunny.hours R2 =0.9523 49 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) MSE = 17438 VIF=1.57j=data.frame(Intensity.of.Global.radiation =c(4.5,5,5.5)) >predict(d,j,interval="prediction") fit lwr upr 4144.306 3840.564 4448.047 4639.748 4345.064 4934.433 5135.191 4832.137 5438.245 Nếu cường độ xạ điểm đo 4.5 kWh/m2 sản lượng điện pin mặt trời sản xuất 4144.306 kWh, dao động khoảng 3840.564 đến 4448.047kWh KẾT LUẬN Bài báo sử dụng R phân tích yếu tố ảnh hưởng đến sản lượng điện nhà máy điện mặt trời có cơng suất 1195kWp Với liệu khảo sát, thu thập được, tác giả phân tích yêu tố ảnh hưởng đến sản lượng điện pin mặt trời sản xuất (Quantity.PV) lựa chọn mơ hình hồi quy tuyến tính phù hợp Hàm pairs.panels cung cấp 50 biểu đồ tương quan biến đường biểu diễn cách trực quan, tốc độ xử lý nhanh nhiều so với Excel, SPSS… Kết cho thấy biến Quantity.PV có mối liên quan mật thiết với biến: Intensity.of.Global.radiation Sunny.hours có hệ tương quan cao 0.97 0.54 Bằng cách sử dụng plot abline(lm), tác giả ý nghĩa tham số mơ hình, cách đánh giá tầm quan trọng biến tiên lượng, quy trình xây dựng kiểm định mơ hình dự báo xem xét đến vấn đề đa cộng tuyến hoán chuyển liệu qua hàm scale Mơ hình lựa chọn là: Quantity.PV = -314.68 + 990.89 Intensity.of.Global.radiation, có R2 = 0.94, MSE = 17073 Hàm predict cho kết cường độ xạ điểm đo 4.5 kWh/m2 sản lượng điện pin mặt trời sản xuất 4144.306 kWh, dao động khoảng 3840.564 đến 4448.047kWh Khi thị trường điện phát triển, dự án điện mặt trời nối lưới, vấn đề dự báo hay chào giá sản lượng điện dự án mặt trời tạo có ý nghĩa quan trọng Mơ hình hồi quy tuyến tính mà tác giả lựa chọn biến cường độ xạ mặt trời ảnh hưởng chủ yếu đến sản lượng điện mà pin mặt trời sản xuất Đồng thời, thay việc đo xạ mặt trời theo thiết bị đo cầm tay, việc cập nhật xạ mặt trời nên gắn với hệ thống thiết bị đo quan trắc tích hợp với hệ quản lý lượng từ xa bao gồm thông tin theo chuỗi thời gian cường độ xạ mặt trời, sản lượng điện để liên tục cập nhật số liệu, phục vụ cho cơng tác thu thập số liệu, phân tích số liệu để dự báo sản lượng điện Số 29 TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) TÀI LIỆU THAM KHẢO [1] Nguyễn Văn Tuấn, “Mơ hình hồi quy khám phá khoa học”, 323, NXB tổng hợp thành phố Hồ Chí Minh, 2020 [2] Nguyễn Văn Tuấn, “Phân tích liệu với R”, 520, NXB Thành phố Hồ Chí Minh, 2020 [3] Cole nussbaumer knaflic, dịch giả: Hồ Vũ Thanh Phong, “Storytelling with data let practice, 419, Wiley, 2020 [4] Robert I.Kabacoff, “R in action data analysis and graphics with R”, 608, Manning publications, 2015 [5] Nina Zumel, John Mount, “Practical data science with R”, 519, Manning publications, 2020 [6] Peter Bruce, Andrew Bruce, and Peter Gedeck, “Practical Statistics for Data Scientists 50 + Essential Concepts using R and python, 342, O’Reilly, 2020 [7] Joseph F.Hair JR, William C.Black, Barry J.Babin, Rolph E Anderson, “Multivariate data analysis, 760, Pearson Prentice Hall, 210 [8] Peter Dalgaard, “Introductory statistics with R” 200, Springer, 2004 [9] Julian Faraway, “Linear Models with R”, 213, Chapman & Hall/CRC, 2004 [10] Paul Murrell, “R Graphics (Computer Science and Data Analysis)”, 250, Chapman & Hall/CRC, 2005 Giới thiệu tác giả: Tác giả Chu Văn Tuấn, tốt nghiệp trường Đại học Điện Lực năm 2012, nhận thạc sĩ ngành Hệ thống điện năm 2014 trường Đại học Điện Lực Lĩnh vực nghiên cứu: bù trơn công suất phản kháng, lưới điện thông minh, lượng tái tạo, tinh gọn chuỗi giá trị, khởi nghiệp đổi sáng tạo Tác giả Nguyễn Thúy Ninh, tốt nghiệp trường Đại học Điện Lực năm 2012, nhận thạc sĩ ngành Quản lý Năng lượng năm 2014 trường Đại học Điện Lực Lĩnh vực nghiên cứu: dự báo nhu cầu phụ tải, thị trường điện, lượng tái tạo, nhiên liệu than lò Số 29 51 ... lượng cao điều phản ánh qua giá trị MSE tăng [4], [5] III/ KẾT QUẢ NGHIÊN CỨU Dự án điện mặt trời: Dự án điện mặt trời áp mái có cơng suất lắp đặt 1195kWp phương pháp hồi quy tuyến tính Chủ đầu... Trong R có nhiều package (hơn 10.000 packages), package Sử dụng R phân tích yếu tố ảnh hưởng đến sản lượng điện nhà máy điện mặt trời có cơng suất 1195kWp Có nhiều phương pháp phân tích hồi quy. .. 4448.047kWh Khi thị trường điện phát triển, dự án điện mặt trời nối lưới, vấn đề dự báo hay chào giá sản lượng điện dự án mặt trời tạo có ý nghĩa quan trọng Mơ hình hồi quy tuyến tính mà tác giả

Ngày đăng: 09/12/2022, 10:26

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w