Hướng tiếp cận hồi quy mới cho dự báo tốc độ gió

9 4 0
Hướng tiếp cận hồi quy mới cho dự báo tốc độ gió

Đang tải... (xem toàn văn)

Thông tin tài liệu

Trong bài báo này, chúng tôi giới thiệu một hướng tiếp cận sử dụng hồi quy tuyến tính (Linear Regression - LR) trong hai bước, được gọi là two-step LR, để dự báo cho dữ liệu có cấu trúc không - thời gian (spatio - temporal data). Ở bước đầu tiên tất cả các đặc trưng được chia thành các nhóm con và sử dụng hồi quy tuyến tính cho mỗi nhóm con đặc trưng để có các giá trị hồi quy tương ứng với mỗi nhóm. Bước hai áp dụng hồi quy tuyến tính một lần nữa cho các giá trị hồi quy thu được ở bước một để tạo ra giá trị hồi quy cuối cùng.

Vietnam J Agri Sci 2021, Vol 19, No 4: 443-451 Tạp chí Khoa học Nơng nghiệp Việt Nam 2021, 19(4): 443-451 www.vnua.edu.vn HƯỚNG TIẾP CẬN HỒI QUY MỚI CHO DỰ BÁO TỐC ĐỘ GIĨ Nguyễn Hồng Huy*, Hồng Thị Thanh Giang Khoa Công nghệ thông tin, Học viện Nông nghiệp Việt Nam * Tác giả liên hệ: nhhuy@vnua.edu.vn Ngày nhận bài: 20.07.2020 Ngày chấp nhận đăng: 08.09.2020 TÓM TẮT Trong báo này, giới thiệu hướng tiếp cận sử dụng hồi quy tuyến tính (Linear Regression - LR) hai bước, gọi two-step LR, để dự báo cho liệu có cấu trúc khơng - thời gian (spatio - temporal data) Ở bước tất đặc trưng chia thành nhóm sử dụng hồi quy tuyến tính cho nhóm đặc trưng để có giá trị hồi quy tương ứng với nhóm Bước hai áp dụng hồi quy tuyến tính lần cho giá trị hồi quy thu bước để tạo giá trị hồi quy cuối Cách tiếp cận sử dụng two-step LR có hiệu tốt dự báo tốc độ gió Dự báo tốc độ gió hữu ích cho tích hợp lượng gió vào lưới điện lượng gió sinh tuabin gió, có mối quan hệ mật thiết với tốc độ gió Sự khó dự đốn trước thay đổi liên tục tốc độ gió khó khăn việc tích hợp Từ khóa: Dữ liệu khơng - thời gian, liệu số chiều cao, dự báo tốc độ gió A Novel Regression Approach for wind Speed Forecasting ABSTRACT The paper presents a spatio-temporal data forecasting approach using Linear Regression (LR) in two steps called two-step LR In the first step, all features were divided into subgroups and Linear Regressions was utilized to obtain a regression value for each feature subgroup In the second step, Linear Regressions was applied again to these regression values to generate the final regression value The approach using two -step LR had state-ofthe-art performance for a wind speed forecasting problem Wind speed forecasting would be useful for the integration of wind energy into the power grid because wind power generated by wind turbines has an intimate relationship with wind speed and unpredictability and variability of wind speed is one of the fundamental diff iculties of this integration system Keyworks: spatio-temporal data, high dimensional data, wind speed forecasting ĐẶT VẤN ĐỀ Các hệ thống thu thêp dĂ liệu hin ọi cú khõ nởng sõn sinh lỵng ln d liu, a s trỵng hp s cho s lỵng ln c trỵng ng vi mi mộu d liu Trong mt s trỵng hp, cỏc mộu d liu ỵc thu thêp thąi gian dài dén đến phân bố khơng ổn đðnh, hay thêm chí dĂ liệu khụng liờn quan, vớ dý nhỵ EEG (Nguyen Hoang Huy & cs., 2014), dĂ liệu vên tốc gió (Lei & cs., 2009) Trong nhng trỵng hp ny, chỳng ta phân tích dĂ liệu không thąi gian ngớn hn, vi s lỵng mộu d liu ớt hn, để làm phân bố dĂ liệu ổn đðnh hĄn (Nguyen Hoang Huy & cs., 2014) Tuy nhiên toỏn hi quy thc t, vỗn ny s dộn n tỡnh trọng l s lỵng mộu d liu n khụng ỷ ln so vi s lỵng c trỵng d (vỗn d liu s chiu cao) Khụng may, n khụng ỷ ln so vi d, vỗn hi quy thống kê câ lý thuyết thăc tế khó giâi hĄn (Bai & cs., 2019; Bickel & Levina, 2008; Cai & Zhang, 2019; Hastie & cs., 2009; Lei & cs., 2018) Mt s hỵng tip cờn ó ỵc ỵa giõi quyt vỗn hi quy dĂ liệu số chiều cao nòi (nghïa n lĆn hĄn so vĆi d) Hæu hết phỵng phỏp ny s dýng cỏc mụ hỡnh 443 Hng tiếp cận hồi quy cho dự báo tốc độ giú n giõn vi s tham s ớt hn, nhỵ naive Bayes, hay hi quy thỵa (sparse regression) (Bickel & Levina, 2004; Hastie & cs., 2009; Hastie & cs., 2015), trỏnh vic phõi ỵc lỵng quỏ nhiu tham s mơ hình hồi quy Tuy nhiên, thăc tế dĂ liệu khơng phâi lúc cüng thóa mãn cỏc giõ thit cỷa phỵng phỏp ny Vớ dý nhỵ nhiều tình dĂ liệu khơng thóa mãn giâ thit thỵa, thờm cõ giõ thit ny ỵc thúa thỡ phỵng phỏp hi quy da trờn giõ thit thỵa, cỹng khụng õm bõo s hoọt ng tt vỗn tỵng tỏc gia cỏc c trỵng (Cai & Liu, 2011) Khi dĂ liệu khơng thóa mãn giõ thit thỵa, mt tớnh chỗt quan trng khỏc cỷa d liu s chiu cao thỵng thúa thc t v ỵc khai thỏc ũ l tớnh khõ tỏch (trong dĂ liệu không - thąi gian) (Bai & cs., 2019; Genton, 2007) Lội dĂ liệu có ma hip phỵng sai phồn tỏch ỵc, nghùa l cũ th vit thnh tớch tensor cỷa ma trờn hip phỵng sai khụng gian v ma trờn hip phỵng sai thi gian Cho n nay, chợ cú mt vi phỵng phỏp s dýng tớnh chỗt ny giõi quyt cỏc bi toỏn phân loäi hồi quy đối vĆi dĂ liệu số chiu cao, nhiờn nhng phỵng phỏp ny yờu cổu thờm cỏc giõ thit nhỵ mụ hỡnh trung bỡnh cng tính (Huizenga & cs., 2002; Leiva & Roy, 2014) Hoang & cs (2014) ó xuỗt phỵng phỏp two-step LDA trỏnh vic phõi ỵc lỵng ng thi nhiu tham số áp dýng mơ hình phân tích khác biệt tuyến tính (LDA) Two-step LDA áp dýng LDA hai bỵc thay vỡ mt lổn nhỗt cho tỗt cõ cỏc thuc tớnh ổu tiờn, LDA ỵc ỏp dýng cho cỏc tờp c trỵng Sau ũ LDA ỵc ỏp dýng vo cỏc giỏ tr kt quõ thu ỵc t bỵc th nhỗt Two-step LDA yờu cổu tớnh toỏn ớt hĄn bći khơng cỉn trâi qua quy trỡnh ti ỵu cỏc tham s nhỵ tham s chợnh hóa phân tích khác biệt tuyến tính chỵnh hóa (regularized LDA), v cú hiu nởng tt nhỗt phõn loọi EGG i vi d liu cú tớnh chỗt khõ tách (dĂ liệu thóa mãn giâ thiết ma hiệp phỵng sai khõ tỏch), chỳng tụi ó chng minh ỵc t l li lý thuyt cỷa two-step LDA tỵng ỵng vi phỵng phỏp Bayes vi tợ l li ti ỵu nhỗt, ng thi ỵa 444 hỵng dộn cỏch nhũm cỏc c trỵng bỵc ổu tiờn cỷa two-step LDA Trong two-step LDA ỵc thit k giõi quyt tốn phân lội dĂ liệu số chiều cao có tớnh khõ tỏch, nhỵ d liu khụng thi gian EEG v vộn l cõu húi m, nu phỵng phỏp ny cú th ỵc m rng cho bi toỏn hi quy Trong này, mć rộng two-step LDA thành two-step LR để xā lý dĂ liệu không - thi gian khõ tỏch s chiu cao Ging nhỵ two-step LDA phân lội dĂ liệu EEG, chúng tơi chỵ bìng thăc nghiệm rìng two-step LR hiệu quâ vĆi tốn dă báo tốc độ gió (dĂ liệu khơng - thi gian), cho kt quõ tt hn phỵng phỏp mi nhỗt da vo hỵng tip cờn hc sõu (Deep Learning) Cổn lỵu ý rỡng, d bỏo tc giú nhĂng toán quan trọng khoa hc khớ tỵng (Lei & cs., 2009) Gổn ồy ó cũ nhiu hỵng tip cờn da vo d liu giõi quyt bi toỏn ny t cỏc phỵng phỏp phồn tớch thng kờ theo chui thi gian nhỵ Persistence Forecasting, Autoregressive Model sā dýng mäng thæn kinh nhân tọo nhỵ Wavelet TransformBased Artificial Neural Networks (WT-ANN), ANN-based ST LS-based ST (Bali & cs., 2019; Sanandaji & cs., 2015; Tascikaraoglu & cs., 2016) Trong ANN-based ST, LS-based ST l nhng phỵng phỏp khai thỏc cỗu trỳc khụng thąi gian (ST) cûa dĂ liệu tốc độ gió, sā dýng mọng thổn kinh nhõn tọo, bỡnh phỵng ti thiu (LS) Gỉn đåy tác giâ báo Ghaderi & cs (2017) ó ỵa mụ hỡnh hc sõu LTSM cho toàn dĂ liệu để dă báo tốc giú, m bú qua vic xem xột cỗu trỳc khụng - thi gian Nũ ỵc coi l phỵng phỏp tt nhỗt hin giõi quyt bi toỏn d báo tốc độ gió (Bali & cs., 2019; Ghaderi & cs., 2017) PHƯƠNG PHÁP NGHIÊN CỨU Trong nghiên cĀu này, chúng tơi phân tích, tổng hợp läi cĄ sć lý thuyết cûa hồi quy tuyến tính, cĄ s ũ chỳng tụi xuỗt phỵng phỏp hi quy mĆi two-step LR Trong mơ hình hồi quy tuyến tính, giõ s cú cỏc mộu huỗn luyn c lờp {(xs, ys) ∈ Rd x R, s = 1, „, n} tÿ đám Nguyễn Hoàng Huy, Hoàng Thị Thanh Giang ụng chỵa xỏc nh cú phõn b P(x, y) no đị Cho méu mĆi x cûa đám đơng trên, cỉn tìm hàm hồi quy y  f * x cho vector c trỵng x, cú th d oỏn giỏ tr y chỵa bit ng vi quan sát mĆi x xác tốt Trong nghiên cĀu này, mć rộng two-step LDA (Hoang & cs., 2014) thành two-step LR để xác đðnh hàm hồi quy tuyn tớnh f * x Tỵng t nhỵ two-step LDA, two-step LR ỏp dýng hi quy tuyn tớnh hai bỵc n 2.1 Hi quy tuyn tính   arg  y i  xTi  Hồi quy tuyến tính chĀng minh hiệu quâ cao cho nhiều têp dĂ liệu khác đû nhiu mộu huỗn luyn, cho l vector li ngộu nhiờn kớch thỵc n ì vi cỏc phổn t ϵ1, „, ϵn biến ngéu nhiên độc lêp có phân bố E[ϵi] = 0, Var (ϵi) = 2 < ∞, d lĆn hĄn n (d = 0(n)) n giõn húa v khụng mỗt tính tổng qt, giâ sā hệ số tă cûa hàm hồi quy giá trð trung bỡnh cỷa tỗt cõ cỏc bin u bỡng Giõ thit ny cú th ọt ỵc bỡng cỏch trung tâm hóa bći trung bình méu Hệ số cûa mơ hỡnh hi quy tuyn tớnh (LR) cú th ỵc xỏc nh bỡng phỵng phỏp bỡnh phỵng ti tiu, nghùa l tìm β làm tối tiểu lỗi d log d n  0, xem Bickel & Levina (2008) Hastie & cs (2009) Tuy nhiên n không đû lĆn so vi d thỡ phỵng phỏp ny cũ hiu nởng khụng tốt, thêm chí câ phân bố dĂ liệu xỗp xợ hay l phõn b chuốn Chớnh xỏc hn, n < d +1 ma trờn hip phỵng sai méu  ma kỳ dð, hồi quy tuyn tớnh mộu l khụng xỏc nh Mt s phỵng phỏp ó ỵc ỵa giõi quyt vỗn ny nhỵ Hastie & cs (2009) v Lei & cs (2018) Cỏc phỵng phỏp ph bin thỵng da vo k thuờt chợnh hũa, nhỵ hi quy Ridge v hi quy tuyn tớnh Lasso Cỏc phỵng phỏp Lasso da trờn giõi thit thỵa Tuy nhiờn, cú nhng thuc tớnh cú th làm giâm tỵ lệ lỗi cûa hồi quy tuyến tính Lasso phân tích khác biệt Lasso thơng qua mối tỵng quan vi nhng c trỵng khỏc mc dự mi thuc tớnh ũ khụng cú õnh hỵng gỡ lờn hm phân biệt hồi quy Trọng tâm cûa nghiên cĀu ny l ỵa hỵng tip cờn mi cho xõy dăng hàm hồi quy cho mơ hình tuyến tính khơng gian số chiều trung bình: y = Xβ + ϵ đò y = (y1, „, yn)T, X l ma trờn thit k Gaussian kớch thỵc n ì d, vĆi hàng độc lêp sinh tÿ phân bố xi ~ N(0, ), β vector tham s thc s vi kớch thỵc d ì 1, v ϵ Rd i 1 Để tối tiểu lỗi này, lỗy ọo hm tỵng ng vi ỵc h phỵng trỡnh gm n phỵng trỡnh, d ốn Nu d n, giõi h phỵng trỡnh ny ta ỵc:     X T X  1X T y n d Khi d + > n, XTX l mt ma trờn kớch thỵc d ì d, nhỵng họng cỷa nú thỗp hn n Nu n d , ma XTX khơng khâ nghðch, thêm chí điều kin xỗu (ill-conditioned) vi hổu ht cỏc giỏ tr riờng bìng Xây dăng mơ hình hồi quy tuyến tính s dýng phỵng phỏp bỡnh phỵng ti tiu trỵng hp ny hon ton thỗt bọi Cỏch n giõn nhỗt x lý trỵng hp ny l thay th ma nghðch đâo bìng ma giâ nghðch đâo Moore-Penrose Mt vi hỵng tip cờn khỏc l da trờn k thuờt chợnh hũa nhỵ hi quy Ridge, hi quy Lasso cỹng ó ỵc ỵa Chỳng tụi xuỗt hỵng tip cờn mi, ỵc gi l two-step LR 2.2 Phng phỏp two-step LR Tỵng t nhỵ two-step LDA (Nguyen Hoang Huy & cs., 2014), two-step LR cüng xā lý hai bỵc bỵc ổu tiờn two-step LR phõn chia tỗt cõ cỏc c trỵng thnh q cỏc tờp rąi xg, xsg ∈ Rpg, g = 1, „, q, s = 1,„, n, T T T T  , p1 + „ + p q = x   x1T , ,xqT  , xs   xs1 , ,xsq  d Cách xác đðnh têp c trỵng l rỗt quan trng v chỳng tụi k thÿa tÿ two-step LDA Để đĄn giân hóa, báo chúng 445 Hướng tiếp cận hồi quy cho dự báo tốc độ gió tơi thiết lêp p1 = „ = pq d = pq Sau đò hi quy tuyn tớnh ỵc ỏp dýng cho mi tờp c trỵng xg ỵc hm hi quy tuyến tính f xg   f xg  xgT g ũ, g ỵc xỏc nh bỡng cỏch ỏp dýng phỵng phỏp bỡnh phỵng ti thiu trờn cỏc mộu huỗn luyn: {xsg Rp, g = 1,, q; s = 1,, n} Trong trỵng hp p + > n, ma nghðch đâo ć công thĀc (1) ỵc thay th bi ma trờn giõ nghch õo Moore-Penrose xỏc nh g Trong bỵc hai, hi quy tuyn tớnh ỵc ỏp dýng mt lổn na vi im kt quõ tớnh bỵc mt: T     z   f x1 , ,f xq  , zs  f xs1 , ,f xsq      T vĆi s = 1,, n ỵc hm hi quy two-step f*(x) cui cựng iu ũ cũ nghùa f*(x) xỏc nh nhỵ sau:       f * x  f  f x1 , ,f x q    đị f hàm hồi quy tuyến tính Hỡnh mụ tõ lỵc cỷa quỏ trỡnh thc twostep LR 2.3 Dự báo liệu không - thi gian da trờn two-step LR Tỵng t two-step LDA (Nguyen Hoang Huy & cs., 2014), áp dýng two-step LR cho dĂ liệu không - thąi gian, s dýng d liu t tỗt cõ cỏc a im täi tÿng thąi điểm để dă báo täi thąi im cý th bỵc ổu tiờn Sau ũ tỗt cõ kt quõ d oỏn bỵc ổu tiờn ỵc kết hợp để täo kết quâ dă báo cuối täi thąi điểm xác đðnh Trong phæn chỳng tụi ỵa quy trỡnh ỏp dýng two-step LR để dă báo dĂ liệu täi đða điểm khác nhau, täi h thąi điểm sā dýng dĂ liu l thi im trỵc ũ Chỳng tụi thc hin iu ũ bỡng h bỵc sau: Bỵc 1: D báo dĂ liệu ć đða điểm, täi thąi điểm t + bìng cách áp dýng two-step LR cho khối dĂ liệu täi l thąi điểm, tÿ thąi điểm t l + n t, tỗt cõ cỏc a im Bỵc 2: D bỏo d liu đða điểm, täi thąi điểm t + bìng cách áp dýng two-step LR cho khối dĂ liệu bao gồm dĂ liệu thăc täi l – thąi điểm t t l + n t, tỗt cõ cỏc a im, gp vi d liu ỵc d báo täi thąi điểm t + 1, đåy kết quõ t bỵc Bỵc 3: D bỏo d liu ć đða điểm, täi thąi điểm t + bìng cách áp dýng two-step LR cho khối dĂ liệu bao gồm dĂ liệu thăc täi l – thąi điểm tÿ thąi điểm t – l + đến t, tỗt cõ cỏc a im, gp vi d liệu dă báo täi thąi điểm tÿ t + đến t + 2, đåy kết quâ tÿ bỵc 1, Hỡnh Lc ca two-step LR 446 Nguyễn Hoàng Huy, Hoàng Thị Thanh Giang CĀ tiếp týc lp lọi nhỵ vờy cho n bỵc h Bỵc h: Dă đoán dĂ liệu ć đða điểm, täi thąi điểm t + h bìng cách áp dýng two-step LR cho khối dĂ liệu bao gồm dĂ thăc täi l – h + thąi điểm tÿ thąi điểm t l + h n t, tỗt cõ träm, gộp vĆi dĂ liệu dă báo täi h – thąi điểm tÿ t + đến t + h - 1, đåy kết quâ tÿ bỵc 1, 2,, h Quỏ trỡnh d bỏo h bỵc cho h thi im sau thi im t, s dýng d liu tọi l thi im trỵc ũ ỵc mụ tõ nhỵ sau: sd t l i  Two Step LD , ,sd t ,sd t 1 , ,sd t  i 1   sd t  i i = 1, 2,„, h đò h, l l nhng tham s cho trỵc, sdt, sd t lổn lỵt l d liu thc v d oỏn tọi tỗt cõ cỏc a im (spatial data) vo thąi điểm t KẾT QUẢ VÀ THẢO LUẬN 3.1 Bi toỏn d bỏo tc giú Nởng lỵng giũ ó ỵc phỏt trin nhanh chúng v ngy cng tr thnh nởng lỵng tỏi tọo quan trng nhiu vựng trờn th gii, c bit nhng nỵc chõu u (Lei & cs., 2009) Tớch hp nởng lỵng giũ vo lỵi in trờn din rng l thit yu v nhiu thỏch thc bõn chỗt ngộu nhiờn cỷa giú S tích hợp thuên tiện hĄn dă báo xỏc ỵc nởng lỵng giú ngớn họn (Ghaderi, 2017) Cú nhiu hỵng tip cờn d oỏn nởng lỵng giú, nhiờn hỵng tip cờn da vo d oỏn tc giú vộn ỵc xem l hỵng tip cờn ni bờt nhỗt (Tascikaraoglu & cs., 2016) Nhiu phỵng phỏp d bỏo tc giũ ỵc ỵa ra, cũ th chia lm loọi: phỵng phỏp vờt lý, v phỵng phỏp thng kờ (Lei & cs., 2009) Phỵng phỏp vờt lý khai thỏc nhiu thuc tớnh vờt lý nhỵ a hỡnh, ỏp suỗt, nhit , cú li th d bỏo tc giú di họn Phỵng phỏp thng kờ thỵng da vo giỏ tr lch s, nhỵ mụ hỡnh ARMA, v thỵng cho kt quõ tt d bỏo tốc độ gió ngín hän Bài báo têp trung vào dă báo tốc độ gió ngín hän dăa vào dĂ liệu tốc độ gió lðch sā Mơ hình ARMA v mt s trỵng hp c bit nhỵ mụ hỡnh AR, mụ hỡnh Persistence rỗt thụng dýng d bỏo tc giú (Lei & cs., 2009) Chỳng ỵc xem l cỏc mụ hỡnh chui thi gian n giõn nhỗt nhỵng cũ th vỵt tri nhiu mụ hỡnh phc tọp khác dă báo tốc độ gió ngín hän (Sanandaji & cs., 2015; Tascikaraoglu & cs., 2016) Để câi tiến chớnh xỏc d oỏn, nhiu mụ hỡnh tỵng quan khụng gian ỵc ỵa khai thỏc mi quan hệ tốc độ gió ć nhĂng vð trí khác Tuy nhiờn chỳng chợ gổn nhỵ ỏp dýng cỏc phỵng phỏp hc mỏy nhỵ mọng nron nhồn tọo (ANN-based ST), phỵng phỏp bỡnh phỵng ti tiu (LSbased ST) i vi tỗt cõ d liu khụng - thi gian hoc vi d liu ó ỵc bin i thụng qua bin i Wavelet (WT-ANN),„ (Lei & cs., 2009; Sanandaji & cs., 2015; Tascikaraoglu & Uzunoglu, 2014; Tascikaraoglu & cs., 2016) Gæn đåy cỏc thuờt toỏn hc sồu nhỵ Deep Learning-based Spatio-Temporal Forecasting (DL-STF) ỵc s dýng d bỏo tc giú (Ghaderi & cs., 2017; Yu & cs., 2019; Wu & cs., 2019) Tỵng t nhng phỵng phỏp trờn, nũ khai thỏc ton b d liu khụng - thi gian nhỵ dĂ liệu đỉu vào cho tht tốn dă đốn, sā dýng Recurrent Neural Networks (RNN) Long Short Term Memory (LSTM) (Ghaderi & cs., 2017) Phỵng phỏp ny vỵt tri kết q dă báo tốc độ gió gỉn đåy Tuy nhiờn, tỗt cõ cỏc phỵng phỏp trờn u khụng da vo cỗu trỳc khụng - thi gian bờn cỷa d liu tc giũ, nhỵ tớnh khõ tỏch cỷa ma trờn hip phỵng sai 3.2 Mụ t d liệu 3.2.1 Tập liệu NCHMF Têp dĂ liệu gió NCHMF t trung tõm d bỏo khớ tỵng thỷy vởn quc gia Vit Nam ỵc o 13 trọm thi tiết Hà Giang, Cao Bìng, Tun Quang, Hđa Bình, Nam Đðnh, Hà Đông, Phú Liễn, Läng SĄn, Bãi Cháy, Tiên Yên, Mòng Cái, Bäch Long Vï, Hội Xuân NhĂng träm ć miền bíc Việt Nam vĆi kinh độ tÿ 104.044220 n 107.848208, vù t 20.020846 n 22.401052, nhỵ hình Tốc độ gió ć träm Bäch Long Vù thay i nhanh v khụng n nh nhỵ cỏc träm khác khác DĂ liệu quan sát tÿ ngày 01/10/2016 n 01/01/2019 Tc giũ ỵc o ba gi mt læn 447 Hướng tiếp cận hồi quy cho dự báo tốc độ gió Hình Vị trí trạm khí tượng đo tốc độ gió Trung tâm Dự báo khí tượng thủy văn quốc gia Việt Nam Hình Vị trí trạm đo liệu tốc độ gió METAR 3.2.2 Tập liệu METAR 3.3 Kết ứng dụng two-step LR Têp dĂ liệu tốc độ gió hàng gią METAR ỵc thu thờp t cỏc bỏo cỏo thi tit täi 57 câng sân bay ć bą biển phía đơng Hoa Kỳ, bao gồm Massachusetts, Connecticut, New York, New Hampshire Hỡnh cho thỗy v trớ cỷa cỏc cõng sõn bay ny Dỗu ú l sõn bay ACK, nỡm trờn hđn đâo Tốc độ gió ć đâo đị thay i rỗt nhanh, tỵng t nhỵ nhng gỡ trọm thąi tiết Bäch Long Vï cûa Việt Nam, 13 träm thąi tiết ć hình Tốc độ gió t 06/01/2014 n 20/02/2014 ỵc s dýng kim tra hiu nởng cỷa cỏc phỵng phỏp hc mỏy ỵc nghiờn cĀu Đåy thąi điểm, tốc độ gió khơng ổn nh hn tỗt cõ cỏc khoõng thi gian khỏc Tỵng tă two-step LDA (Nguyen Hoang Huy & cs., 2014), two-step LR xỏc nh cỏc nhũm c trỵng gm tỗt cõ cỏc c trỵng tọi mi thi im Chỳng tụi cỹng khụng ỏp dýng bỗt k k thuờt hc mỏy no nhỵ chợnh hũa nõng cao hiu nởng cỷa hi quy tuyn tớnh ỵc thc hin mi bỵc Do đị khơng cị să thiết lêp siêu tham số khác cûa two-step LR HĄn nĂa độ phĀc täp tính tốn cûa two-step LR giâm chỵ áp dýng hồi quy tuyến tính nhịm đặc trỵng 448 Bõng so sỏnh hiu suỗt cỷa phỵng phỏp ỵc chỳng tụi ỵa vi cỏc phỵng phỏp khác têp dĂ liệu METAR Để so sánh sai số cûa Nguyễn Hoàng Huy, Hoàng Thị Thanh Giang phỵng phỏp, chỳng tụi s dýng ba o thụng dýng MAE, RMSE NRMSE Trong thā nghiệm chọn l = 12, h = theo Ghaderi (2017), đåy tham số cho hiệu nëng tốt nhỗt cỷa DL-STF trờn tờp d liu METAR La chn l = 12, h = cò nghïa two-step LR v cỏc phỵng phỏp khỏc s dýng d = 684 = 57 × 12 giá trð quan tríc (đặc trỵng) t 57 trọm v 12 thi im (gi) trỵc đị để dă đốn giá trð tốc độ gió gią Chúng sā dýng dĂ liệu tốc độ gió tÿ 6.012 gią liên tiếp (250,5 ngày), hỡnh thnh 6.000 mộu huỗn luyn hc mụ hỡnh dă báo méu kiểm tra tốc độ giú giai oọn khụng n nh nhỗt t 06/01/2014 n 20/02/2014 nhỵ ó nờu bi bỏo cỷa Ghaderi & cs (2017) Cý th hn v cỏc phỵng phỏp khỏc ỵc trỡnh by cý th cỏc bi bỏo cûa Sanandaji & cs (2015) Tascikaraoglu & cs (2016) Bâng trình bày sai số trung bình cûa tỗt cõ cỏc trọm trờn tờp d liu METAR Chỳng ta cú th thỗy hiu nởng d oỏn trờn ACK hoc tỗt cõ cỏc trọm cỷa two-step LR tri hn DLSTF, phỵng phỏp tt nhỗt hin Hỡnh biu din d liu tc giú thc t (ỵng mu xanh) v tc giú d oỏn (ỵng mu ú) tÿ dĂ liệu kiểm tra 16 träm quan sát Đồ thð đỉu tiên hình Āng vĆi träm quan sát ć câng sân bay ACK Trong têp dĂ liệu NCHMF, có giá trð tốc độ gió bð thiếu chúng tơi thay chúng bìng giá trð tc giũ o tọi thi im trỵc ũ (3 ting trỵc), cựng trọm Bõng biu din hiu nởng cỷa DL-STF v two-step LR s dýng tỗt câ dĂ liệu tÿ 13 träm thąi tiết vĆi l = 12, h = Bìng cách DL-STF v twostep LR cú th khai thỏc tỗt cõ cỏc thụng tin tỵng tỏc ốn gia cỏc trọm Qua bõng 3, chỳng ta cú th thỗy two-step LR cú hiu nëng dă báo tốc độ gió tốt hĄn bìng phỵng phỏp ang cho kt quõ tt nhỗt hin DL-STF, xem báo Ghaderi & cs (2017) Bảng Sai số phương pháp khác trạm ACK Method MAE (m/s) RMSE (m/s) NRMSE (%) Persistence Forecasting 2,14 2,83 16,86 AR of order 2,07 2,76 16,44 AR of order 2,07 2,76 16,40 WT-ANN 1,82 2,47 14,68 ANN-based ST 1,80 2,30 13,69 LS-based ST 1,72 2,20 13,08 DL-STF 1,63 2,19 13,08 Two-Step LR 1,40 1,93 11,48 Bảng Sai số trung bình tất trạm sử dụng DL-STF, two-step LR Method MAE (m/s) RMSE (m/s) NRMSE (%) DL-STF 1,18 1,62 16,28 Two-Step LR 1,09 1,44 14,32 Bảng Sai số trung bình DL-STF Two-Step LR trạm Bạch Long Vĩ 13 trạm Method DL-STF Two-Step LR Locations MAE (m/s) RMSE (m/s) NRMSE (%) Bach Long Vi 1,70 2,36 13,86 All Stations 0,82 1,16 19,09 Bach Long Vi 1,67 2,27 13,34 All Stations 0,82 1,07 18,04 449 Hướng tiếp cận hồi quy cho dự báo tốc độ gió Hình So sánh tốc độ gió thực tế dự báo liệu kiểm tra KẾT LUẬN Hiu suỗt cỷa hi quy tuyn tớnh b õnh hỵng bi s chiu giõi quyt vỗn ny, chỳng tụi gii thiu phỵng phỏp ỏp dýng hi quy tuyn tớnh hai bỵc, ỵc gi l twostep LR Hỵng tip cờn ny ỵc gi ý t twostep LDA v tớnh khõ tỏch cỷa ma trờn hip phỵng sai cỷa dĂ liệu tốc độ gió VĆi dĂ liệu tốc độ gió có số chiều cao trung bình, hiệu nëng cûa cỏch tip cờn ny tt hn cỏc phỵng phỏp mi nhỗt Ngy nay, cú nhiu phỵng phỏp iu chợnh hi quy tuyến tính cho dĂ liệu có số chiều cao nhỵ l hi quy Lasso v cỏc cõi tin cỷa Tuy nhiên, vĆi hiểu biết cûa tơi, tht toỏn ũ chỵa ỵc th nghim cho d bỏo tc giú Trong tỵng lai, hỵng tip cờn hai bỵc s dýng nhng thuờt toỏn ny nờn ỵc khõo sỏt tỵ mỵ TÀI LIỆU THAM KHẢO Bali V., Kumar A & Gangwar S (2019) Deep Learning based Wind Speed Forecasting-A Review 9th International Conference on Cloud Computing, Data Science & Engineering (Confluence) India pp 426-431 Bai Z., Li H & Pan G (2019) Central limit theorem for linear spectral statistics of large dimensional separable sample covariance matrices Bernoulli 25(3): 1838-1869 450 Bickel P.J & Levina E (2004) Some theory for Fisher’s linear discriminant function, ‘naive Bayes’, and some alternatives when there are many more variables than observations Bernoulli 10(6): 989-1010 Bickel P.J & Levina E (2008) Covariance regularization by thresholding The Annals of Statistics 36: 2577-2604 Cai T & Liu W (2011) A direct estimation approach to sparse linear discriminant analysis Journal of the American Statistical Association 106(496): 1566-1577 Cai T & Zhang L (2019) High dimensional linear discriminant analysis: optimality, adaptive algorithm and missing data Journal of the Royal Statistical Society: Series B (Statistical Methodology) 81(4): 675-705 Genton M.G (2007) Separable approximation of space-time covariance matrices Environmetrics 18: 681-695 Ghaderi A., Sanandaji B M & Ghaderi F (2017) Deep forecast: Deep learning-based spatiotemporal forecasting 34th ICML Time Series Workshop Sydney, Australia Hastie T., Tibshirani R & Friedman J (2009) The Elements of Statistical Learning: DataMining, Inference, and Prediction Springer Series in Statistics, Springer-Verlag Hastie T., Tibshirani R & Wainwright M (2015) Statistical Learning with Sparsity: The Lasso and Generalizations Chapman & Hall/CRC Press Nguyễn Hoàng Huy, Hoàng Thị Thanh Giang Huizenga H.M., De Munck J.C., Waldorp L.J & Grasman R.P.P.P (2002) Spatiotemporal EEG/MEG source analysis based on a parametric noise covariance model IEEE Transactions on Biomedical Engineering 49: 533-539 Huy N.H., Frenzel S & Bandt C (2014) Two-step linear discriminant analysis for classification of eeg data In M Spiliopoulou, L Schmidt-Thieme and R Janning, editors, Data Analysis, Machine Learning and Knowledge Discovery Springer, Cham pp 41-50 Lei M., Shiyan L., Chuanwen J., Hongling L & Yan Z (2009) A review on the forecasting of wind speed and generated power Renewable and Sustainable Energy Reviews 13: 915-920 Lei L., Bickel P.J., Karoui N.E (2018) Asymptotics for high dimensional regression M-estimates: fixed design results Probability Theory and Related Fields 172 (3-4): 983-1079 Leiva R & Roy A (2014) Classification of Higherorder Data with Separable Covariance and Structured Multiplicative or Additive Mean Models Communications in Statistics - Theory and Methods 43(5): 989-1012 Sanandaji B.M., Tascikaraoglu A., Poolla K & Varaiya P (2015) Low dimensional models in spatio-temporal wind speed forecasting American Control Conference Chicago, USA pp 4485-4490 Tascikaraoglu A & Uzunoglu M (2014) A review of combined approaches for prediction of short-term wind speed and power Renewable and Sustainable Energy Reviews 34: 243-254 Tascikaraoglu A., Sanandaji B M., Poolla K & Varaiya P (2016) Exploiting sparsity of interconnections in spatio-temporal wind speed forecasting using wavelet transform Applied Energy 165 (1): 735-747 Yu R., Gao J., Yu M., Lu W., Xu T., Zhao M., Zhang J., Zhang R & Zhang Z (2019) LSTM-EFG for wind power forecasting based on sequential correlation features Future Generation Computer Systems 93: 33-42 Wu Y.X., Wu Q B & Zhu J.Q (2019) Data-driven wind speed forecasting using deep feature extraction and LSTM IET Renewable Power Generation 13(12): 2062-2069 451 ... gi læn 447 Hướng tiếp cận hồi quy cho dự báo tốc độ gió Hình Vị trí trạm khí tượng đo tốc độ gió Trung tâm Dự báo khí tượng thủy văn quốc gia Việt Nam Hình Vị trí trạm đo liệu tốc độ gió METAR... 1,07 18,04 449 Hướng tiếp cận hồi quy cho dự báo tốc độ gió Hình So sánh tốc độ gió thực tế dự báo liệu kiểm tra KẾT LUN Hiu suỗt cỷa hi quy tuyn tớnh b õnh hỵng bi s chiu giõi quyt vỗn ny,... Để đĄn giân hóa, báo chúng 445 Hướng tiếp cận hồi quy cho dự báo tốc độ gió tơi thiết lêp p1 = „ = pq d = pq Sau ũ hi quy tuyn tớnh ỵc ỏp dýng cho mi tờp c trỵng xg ỵc hm hồi quy tuyến tính

Ngày đăng: 26/05/2021, 14:40

Tài liệu cùng người dùng

Tài liệu liên quan