In this study, the equations for estimating the number of tropical cyclones (TCs) at a 6- month lead-time in the Vietnam East Sea (VES) have been developed and tested. Three multivariate linear regression models in which regression coefficients were determined by different methods, including method of least squares (MLR), minimum absolute deviation method (LAD), minimax method (LMV).
VNU Journal of Science: Earth and Environmental Sciences, Vol 35, No (2019) 45-57 Original Article Seasonal Predictions of the Number of Tropical Cyclones in the Vietnam East Sea Using Statistical Models Dinh Ba Duy1, Ngo Duc Thanh2, Tran Quang Duc3, Phan Van Tan3,* Vietnam-Russia Tropical Center, 63 Nguyen Van Huyen, Nghia Do, Cau Giay, Hanoi, Vietnam University of Science and Technology of Hanoi, Vietnam Academy of Science and Technology, 18 Hoang Quoc Viet, Cau Giay, Hanoi, Vietnam VNU University of Science, 334 Nguyen Trai, Thanh Xuan, Hanoi, Vietnam Received 04 April 2019 Revised 19 April 2019; Accepted 19 May 2019 Abstract: In this study, the equations for estimating the number of tropical cyclones (TCs) at a 6month lead-time in the Vietnam East Sea (VES) have been developed and tested Three multivariate linear regression models in which regression coefficients were determined by different methods, including 1) method of least squares (MLR), 2) minimum absolute deviation method (LAD), 3) minimax method (LMV) The artificial neural network model (ANN) and some combinations of the above regression models were also used The VES was divided into the northern region above 15ºN (VES_N15) and the southern one below that latitude (VES_S15) The number of TCs was calculated from the data of the Japan Regional Specialized Meteorological Center (RMSC) for the period 19812017 Principal components of the 14 climate indicators were selected as predictors Results for the training period showed that the ANN model performed best in all 12 times of forecasts, following by the ANN-MLR combination The poorest result was obtained with the LMV model Results for the independent dataset showed that the number of adequate forecasts based on the MSSS scores decreased sharply compared to the training period and the models generated generally similar errors The MLR model tended to give out the best results Better-forecast results were obtained in the VES_N15 region followed by the VES and then the VES_S15 regions Keywords: Tropical cyclone, Seasonal prediction, Vietnam East Sea (VES) * * Corresponding author E-mail address: phanvantan@hus.edu.vn https://doi.org/10.25073/2588-1094/vnuees.4379 45 VNU Journal of Science: Earth and Environmental Sciences, Vol 35, No (2019) 45-57 Dự báo hạn mùa số lượng xoáy thuận nhiệt đới Biển Đơng mơ hình thống kê Đinh Bá Duy1, Ngô Đức Thành2, Trần Quang Đức3, Phan Văn Tân3,* Trung tâm Nhiệt đới Việt–Nga, 63 Nguyễn Văn Huyên, Nghĩa Đô,Cầu Giấy, Hà Nội, Việt Nam Trường Đại học Khoa học Công nghệ Hà Nội, Viện Hàn lâm Khoa học Cơng nghệ Việt Nam, 18 Hồng Quốc Việt, Cầu Giấy, Hà Nội, Việt Nam Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, 334 Nguyễn Trãi, Thanh Xuân, Hà Nội, Việt Nam Nhận ngày 04 tháng năm 2019 Chỉnh sửa ngày 19 tháng năm 2019; Chấp nhận đăng ngày 19 tháng năm 2019 Tóm tắt: Trong nghiên cứu phương trình dự báo số lượng xốy thuận nhiệt đới (XTNĐ) hạn tháng khu vực Biển Đông (VES) xây dựng thử nghiệm Ba mơ hình hồi quy tuyến tính đa biến hệ số hồi quy xác định phương pháp khác nhau, gồm 1) bình phương tối thiểu (MLR), 2) độ lệch tuyệt đối nhỏ (LAD), 3) minmax (LMV), mơ hình mạng thần kinh nhân tạo (ANN) cộng với số tổ hợp mơ hình với sử dụng Khu vực Biển Đông chia thành vùng phía bắc (VES_N15) phía nam (VES_S15) vĩ tuyến 15 độ Yếu tố dự báo tính từ tập số liệu XTNĐ Trung tâm Khí tượng chuyên vùng Nhật Bản giai đoạn 1981-2017 Các thành phần 14 số khí hậu lựa chọn làm nhân tố dự báo Kết đánh giá sai số dự báo số liệu phụ thuộc cho thấy mơ hình ANN cho kết dự báo tốt 12 thời điểm dự báo, tiếp kết tổ hợp với mơ hình ANN, MLR mơ hình LMV Kết thử nghiệm dự báo số liệu độc lập cho thấy số lượng sơ đồ dự báo “đạt” theo ngưỡng số MSSS giảm so với thời kỳ dự báo phụ thuộc nhìn chung sai số mơ hình có tương đồng Mơ hình MLR có xu hướng cho kết dự báo tốt Kết dự báo tốt nhận vùng VES_N15, vùng VES thấp vùng VES_S15 Keywords: Tropical cyclone, Seasonal prediction, Vietnam East Sea (VES) Mở đầu đới (gọi chung xoáy thuận nhiệt đới - XTNĐ) thực Hầu hết số tập trung vào hai ổ bão lớn giới ổ bão Tây bắc Đại Tây dương ổ bão Tây bắc Thái Bình Cho đến có nhiều cơng trình nghiên cứu dự báo hạn mùa bão, áp thấp nhiệt Tác giả liên hệ Địa email: phanvantan@hus.edu.vn https://doi.org/10.25073/2588-1094/vnuees.4379 https://doi.org/10.25073/2588-1094/vnuees.4379 46 D.B Duy et al / VNU Journal of Science: Earth and Environmental Sciences, Vol 35, No (2019) 45-57 dương có khu vực Biển Đơng Về phương pháp dự báo chia thành ba nhóm chính: 1) Nhóm phương pháp thống kê truyền thống hay thống kê kinh điển (TKTT); 2) Nhóm phương pháp thống kê - động lực 3) Nhóm phương pháp mơ hình động lực Dự báo phương pháp TKTT dựa mối quan hệ thống kê yếu tố dự báo tập nhân tố dự báo xây dựng từ tập số liệu phụ thuộc khứ, sau áp dụng mối quan hệ cho tương lai Các mơ hình TKTT sử dụng rộng rãi toán dự báo hoạt động XTNĐ [1-6] Trong cơng trình này, yếu tố dự báo số lượng số ngày hoạt động XTNĐ vùng khác nhau, chủ yếu Đại Tây Dương Tây Thái Bình Dương Các nhân tố dự báo nhân tố thuộc nhóm ENSO, dị thường nhiệt độ bề mặt biển (SSTA) vùng Niño1+2, 3, 4, 3.4, đặc trưng hồn lưu khí đại dương qui mô lớn số dao động tựa hai năm tầng bình lưu (QBO), số dao động nam (SOI), v.v Xuất phát từ sở hoạt động XTNĐ khu vực Tây Bắc Thái Bình Dương số tác giả quan tâm [79] Bên cạnh đó, phương pháp hồi quy bước nhiều biến sử dụng để lọc nhân tố dự báo nhằm dự báo hạn mùa hoạt động XTNĐ [10] Nhìn chung, tác giả không dự báo số lượng XTNĐ mà dự báo số lượng bão mạnh số “hoạt động bão chuẩn hoá” - NTA (Normalized Typhoon Activity) Các nhân tố dự báo lựa chọn theo nguyên tắc làm cực tiểu hoá sai số dự báo không đơn dựa phù hợp với số liệu khứ Kết nghiên cứu cho thấy xác suất dự báo dựa tổ hợp mơ hình thống kê hợp lý so với thực tế Ngồi ra, cịn kể đến cơng trình sử dụng mơ hình thống kê để dự báo tần suất hoạt động vùng hoạt động bão trình bày [12-16] v.v Đối với Việt Nam, cơng trình dự báo XTNĐ sớm thuộc lớp dự báo thời tiết chủ yếu nằm khoảng thập kỷ 1970-1980 thường tập trung vào mơ hình thống kê số thử nghiệm mơ hình số trị, đặc biệt sau mơ hình số bắt đầu ứng dụng, 47 mơ hình áp hai chiều mơ hình ba chiều đầy đủ Trong số cơng trình nghiên cứu XTNĐ Việt Nam, ảnh hưởng ENSO đến hoạt động XTNĐ Biển Đông chủ đề nhiều tác giả quan tâm [17] Xu hoạt động bão đề cập đến [18-23] Dự báo mùa hoạt động bão khu vực Tây Bắc Thái Bình Dương Biển Đơng Nguyễn Văn Tuyên (2008) trình bày chi tiết [24, 25] Trên sở công cụ thống kê với nhân tố dự báo số khí hậu tác giả khảo sát khả dự báo hạn mùa số lượng bão cho khu vực Biển Đơng Có thể nói cơng trình đáng ý dự báo mùa số lượng bão phương pháp thống kê Việc nghiên cứu dự báo hạn mùa số lượng XTNĐ đề cập chừng mực định thông qua việc tác giả mối quan hệ tăng nhiệt độ mặt nước biển trung bình mùa bão với hoạt động XTNĐ Biển Đông [26] Bài báo trình bày số kết dự báo số lượng XTNĐ hoạt động khu vực Biển Đơng mơ hình thống kê sử dụng số khí hậu làm nhân tố dự báo Phương pháp số liệu sử dụng báo trình bày mục Mục kết nghiên cứu Một vài kết luận đưa mục Số liệu phương pháp nghiên cứu 2.1 Nguồn số liệu Số lượng XTNĐ khu vực Biển Đông (VES) khai thác từ số liệu quỹ đạo bão Trung tâm Khí tượng chuyên vùng Nhật Bản (RSMC) [27] Toàn khu vực VES chia thành hai vùng phía bắc phía nam vĩ tuyến 15 độ, tương ứng ký hiệu VES_N15 VES_S15 Trên vùng, XTNĐ tổng hợp cho tháng làm yếu tố dự báo, theo yếu tố dự báo tháng tổng số XTNĐ đạt cường độ từ áp thấp nhiệt đới trở lên (tức tốc độ gió mạnh đạt từ cấp trở lên) tháng Chẳng hạn, VES_N15_01 tổng số XTNĐ từ tháng đến tháng 7, VES_N15_02 D.B Duy et al / VNU Journal of Science: Earth and Environmental Sciences, Vol 35, No (2019) 45-57 48 tổng số XTNĐ từ tháng đến tháng vùng Biển Đơng nằm phía bắc vĩ tuyến 15 độ, v.v Do việc phân vùng hoạt động nên bão xuất hai vùng phía bắc phía nam vĩ tuyến 15 độ tính hai Số liệu số khí hậu (ClimIDX) khai thác website Cơ quan quản lý biển khí Hoa Kỳ [28] Trong số số ClimIDX này, số có độ dài chuỗi từ khoảng 1979-1980 đến nay, số không cập nhật thường xuyên Với mục đích sử dụng số nhân tố dự báo nghiệp vụ, nghiên cứu 14 số lựa chọn thể Bảng Cả hai tập số liệu yếu tố dự báo 14 nhân tố dự báo chia làm hai giai đoạn: 1) tập số liệu phụ thuộc từ 1981-2010 (30 năm) 2) tập số liệu độc lập từ 2010-2017 (8 năm) Bảng Danh sách 14 số khí hậu lựa chọn làm nhân tố dự báo Chỉ số Mô tả ONI Chỉ số Niño đại dương (Oceanic Niño Index) SOI Nino3.4 Chỉ số dao động Nam (Southern Oscillation Index) Nhiệt độ bề mặt biển (SST) phía Đơng trung tâm Thái Bình Dương nhiệt đới (East Central Tropical Pacific SST) MEI RINDO_SLPA REQSOI BEST Chỉ số ENSO theo chuỗi thời gian (Bivariate ENSO Timeseries) PDO Dao động thập kỷ Thái Bình Dương (Pacific Decadal Oscillation) DMI Chỉ số dao động lưỡng cực (Dipole Mode Index) 10 TNI Chỉ số khuynh hướng Niño hay số Niño-chuyển dịch (Trans-Niño Index) 11 PNA Chỉ số Bắc Mỹ Thái Bình Dương (Pacific North American Index) 12 WHWP Vực nóng Bán cầu Tây (Western Hemisphere Warm Pool) 14 WP Chỉ số Tây Thái Bình Dương (Western Pacific Index) 14 QBO Dao động tựa năm (Quasi-Biennial Oscillation) TT Chỉ số ENSO đa biến (Multivariate ENSO Index) Dị thường khí áp mực biển vùng xích đạo gần khu vực Indonesia (Equatorial SOI Indonesia SLP (Standardized Anomalies) Dị thường dao động Nam vùng xích đạo (Equatorial SOI (Standardized Anomalies)) 2.2 Phương pháp nghiên cứu ∑𝑛𝑖=1(𝑦𝑖 − 𝑎0 − ∑𝑚 𝑗=1 𝑎𝑗 𝑥𝑖𝑗 ) ⟶ 𝑚𝑖𝑛 Mô hình thống kê truyền thống: Ba mơ hình TKTT sử dụng nghiên cứu mô hình hồi quy tuyến tính đa biến: Phương pháp độ lệch tuyệt đối nhỏ (LAD): 𝑦 = 𝑎0 + ∑𝑚 𝑗=1 𝑎𝑗 𝑥𝑗 (1) Trong y yếu tố dự báo, 𝑥𝑗 𝑣ớ𝑖 𝑗 = 1,2, … , 𝑚 nhân tố dự báo, hệ số hồi quy 𝑎0 , 𝑎1 , 𝑎2 , … , 𝑎𝑚 xác định theo ba phương pháp khác nhau: Phương pháp bình phương tối thiểu (MLR): ∑𝑛𝑖=1|𝑦𝑖 − 𝑎0 − ∑𝑚 𝑗=1 𝑎𝑗 𝑥𝑖𝑗 | ⟶ 𝑚𝑖𝑛 (2) (3) Phương pháp minimax (LMV): 𝑚𝑖𝑛(𝑚𝑎𝑥|𝑦𝑖 − 𝑎0 − ∑𝑚 𝑗=1 𝑎𝑗 𝑥𝑖𝑗 |, 𝑖 = 1, 2, … , 𝑛) (4) Trong công thức (2)-(4), 𝑦𝑖 , 𝑥𝑖𝑗 tương ứng giá trị quan trắc thứ i (i=1, 2, , n) yếu tố dự báo y nhân tố dự báo 𝑥𝑗 (j=1, 2, ,m) D.B Duy et al / VNU Journal of Science: Earth and Environmental Sciences, Vol 35, No (2019) 45-57 Mơ hình mạng thần kinh nhân tạo (ANN): Bên cạnh mơ hình TKTT kể trên, nghiên cứu thử nghiệm với mơ hình mạng thần kinh nhân tạo (ANN) ANN mô cấu trúc hoạt động não người, hình thành từ đơn vị riêng lẻ gọi tế bào thần kinh nhân tạo (hay neuron nhân tạo) Nghiên cứu sử dụng loại ANN phổ biến mạng feedforward với lớp ẩn, neuron thuộc lớp ẩn nhận hàm kích hoạt dạng sigma với hệ số a=1, neuron thuộc lớp đầu khơng sử dụng hàm kích hoạt Tổng sai số E tất neuron đầu xác định qua biểu thức: 𝐸(𝑤 ⃗⃗ ) = ∑ ∑ (𝑡 𝑑∈𝐷 𝑘∈𝑜𝑢𝑝𝑢𝑡𝑠 𝑘𝑑 − 𝑜𝑘𝑑 ) (5) Ở D tập số liệu luyện, tkd giá trị đích (giá trị mong muốn), okd giá trị đầu ví dụ luyện thứ d Mục đích nghiên cứu cực tiểu hóa E khơng gian 𝑤 ⃗⃗ Q trình cực tiểu hóa (cịn hiểu q trình học ANN) tiến hành theo thuật toán lan truyền ngược [30] Kết cuối tập trọng số w áp dụng mạng ANN thu vào dự báo Để giảm bớt số lượng nhân tố dự báo có mặt phương trình (1) bảo tồn lượng thơng tin cần thiết, kỹ thuật phân tích thành phần (PCA) áp dụng cho tập số liệu ClimIDX Ký hiệu X(n,m) ma trận số liệu phụ thuộc ClimIDX, n độ dài chuỗi thời gian, m số số ClimIDX (m=14) Có thể biểu diễn X(n,m) dạng: 𝑿(𝑛, 𝑚) ≈ 𝐸𝑂𝐹(𝑛, 𝑘) 𝑃𝐶(𝑘, 𝑚), 𝑘 ≪ 𝑚 (6) Trong EOF(n,k) k hàm trực giao thực nghiệm, PC(k,m) k thành phần giữ lại Khi thay m=14 số X ban đầu làm nhân tố dự báo k