Thiết lập mô hình dự báo hạn khí tượng, đề xuất mô hình dự báo phù hợp

Một phần của tài liệu Xây dựng mô hình cảnh báo sớm hạn khí tượng phục vụ công tác khai thác và quản lý tài nguyên nước vùng duyên hải miền trung (Trang 83 - 97)

CHƯƠNG 2 CƠ SỞ KHOA HỌC VÀ PHƯƠNG PHÁP DỰ BÁO HẠN KHÍ TƯỢNG CHO VÙNG DUYÊN HẢI MIỀN TRUNG

2.3 Phương pháp dự báo hạn khí tượng cho vùng nghiên cứu

2.3.4 Thiết lập mô hình dự báo hạn khí tượng, đề xuất mô hình dự báo phù hợp

Một đánh giá khách quan tình trạng hạn hán ở một khu vực cụ thể trong tương lai là bước đầu tiên cho kế hoạch tài nguyên nước, nhằm ngăn chặn và giảm thiểu tác động của hạn hán trong tương lai. Các đánh giá và dự báo hạn hán có thể được thực hiện bằng việc sử dụng các chỉ số hạn hán.

Như đã phân tích trong chương 1, để dự báo hạn hán thì có hai phương pháp đó là dự báo trực tiếp các chỉ số hạn bằng các mô hình dự báo thống kê thuần túy; và dự báo trên

71

cơ sở sản phẩm dự báo của các mô hình khí hậu, mô hình thủy văn. Trong luận án này sẽ sử dụng phương pháp dự báo trực tiếp các chỉ số hạn bằng mô hình thống kê thực nghiệm dựa trên cơ sở các nguồn số liệu khí hậu quá khứ. Đây là hướng nghiên cứu không mới, nhưng do tính đơn giản, dễ sử dụng, ít tốn kém, kết quả tương đối ổn định nên cho đến nay các mô hình thống kê vẫn đang được sử dụng khá phổ biến. Nhiều mô hình thống kê có vai trò chính trong việc dự báo hạn hán và lượng mưa mùa, đặc biệt là các quốc gia nằm trong vùng nhiệt đới, là nơi sự kiện ENSO tác động mạnh đến lượng mưa [84].

Các biến đầu vào (nhân tố dự báo) để dự báo hạn hán bằng phương pháp thống kê phụ thuộc vào các loại dự báo hạn hán khác nhau [85] (hình 2.10). Các biến và các thành phần liên quan đến dự báo hạn hán bao gồm: (i) lượng mưa để phân tích hạn hán khí tượng như là sự thiếu hụt lượng mưa dẫn đến hạn hán, (ii) số liệu dòng chảy, hồ chứa và mực nước hồ để phân tích hạn thủy văn, (iii) mực nước ngầm cho hạn nước ngầm và (iv) độ ẩm của đất và năng suất cây trồng cho hạn nông nghiệp (một số chỉ số hạn hán dựa trên sự kết hợp của lượng mưa, nhiệt độ và độ ẩm của đất, đã được đề xuất trong những thập kỷ gần đây để nghiên cứu hạn nông nghiệp có thể được sử dụng để dự báo).

Một số chỉ số hạn hán đã được dùng cho việc đánh giá ảnh hưởng của hạn hán và xác định các tham số hạn hán khác nhau, chẳng hạn như cường độ, thời gian, mức độ nghiêm trọng và phạm vi không gian. Ngoài ra, các chỉ số khí hậu như ENSO, SOI, SST và các trường khí hậu của các mô hình dự báo toàn cầu cũng đã được sử dụng ngoài các biến khí tượng thuỷ văn cho dự báo hạn hán dài hạn.

72

Hình 2.10 Các thành phần của mô hình dự báo thống kê đang được áp dụng trên thế giới [85]

2.3.4.1 Lựa chọn biến đầu ra (yếu tố dự báo)

Có một số chỉ số hạn hán thường được sử dụng trong công tác dự báo, chẳng hạn như chỉ số PDSI, độ ẩm cây trồng, SPI và SPEI. Chỉ số PDSI, SPI và SPEI là các chỉ số truyền thống và phổ biến nhất cho dự báo hạn hán do tiêu chuẩn của nó [86]. Từ những phân tích và đánh giá ở các phần trước về sự phù hợp và đặc điểm nổi trội của hai chỉ số hạn SPI và SPEI. Do đó, trong nghiên cứu này tác giả sẽ lựa chọn các yếu tố dự báo là các chỉ hạn SPI và SPEI với các thời đoạn là 1 và 3 tháng.

Kết quả đầu ra của các chỉ số hạn SPI, SPEI được thể hiện thông qua 3 yếu tố là thời gian dự báo (hạn ngắn, hạn dài), tính chất nghiêm trọng và khả năng phát sinh (độ lớn nhỏ theo phân cấp hạn hán của các chỉ số hạn).

2.3.4.2 Lựa chọn biến đầu vào (nhân tố dự báo)

Một trong những bước quan trọng nhất trong việc phát triển một mô hình dự báo đạt yêu

Chỉ số hạn

Chỉ số chuẩn hóa lượng mưa (SPI)

Chỉ số chuẩn hóa lượng mưa và bốc hơi (SPEI)

Chỉ số Palmer (PDSI) Chỉ số độ ẩm cây trồng (CMI) Chỉ số cung cấp nước mặt (SWSI)

Chỉ số khí hậu toàn cầu

El Nino and the Southern Oscillation (ENSO) Sea Surface Temperature (SST) Southern Oscillation Index (SOI)

………

Đầu ra Thời gian

dự báo Bắt đầu và

kết thúc Tính chất

nghiêm trọng Khả năng

phát sinh Biến khí tượng thủy văn

Lượng mưa, dòng chảy, nhiệt độ, bốc hơi, độ ẩm đất, mực nước ngầm, mực nước hồ chứa

Phương pháp luận Mô hình hồi quy Mô hình chuỗi thới gian

Mô hình xác suất

Mạng tần kinh nhân tạo (ANN) Mạng noron thích nghi mờ

(ANFIS) Mô hình hỗn hợp

73

cầu là lựa chọn của các biến đầu vào. Điều này là bởi vì các biến này xác định cấu trúc của các mô hình dự báo, và ảnh hưởng đến các hệ số trọng số và chất lượng của các mô hình dự báo.

Hiện nay trên thế giới thì một trong những biến đầu vào phổ biến hay được lựa chọn là ENSO, SST và SOI, đặc biệt là những nơi chịu sự tác động mạnh của ENSO [84, 85].

Còn ở Việt Nam, có Nguyễn Quang Kim [50] đã sử dụng các biến đầu vào là chỉ số SOI, SST) và độ cao địa thế vị mực 500mb để xây dựng mô hình dự báo chỉ số SPI cho vùng NTB và Tây Nguyên; Nguyễn Văn Thắng [41] đã sử dụng biến đầu vào là ENSO để xây dựng mô hình dự báo chỉ số hạn SPI cho 7 vùng khí hậu ở Việt Nam; Nguyễn Lương Bằng [53] cũng đã sử dụng biến đầu vào là SST ở các vùng Nino khác nhau để thiết lập các mô hình dự báo chỉ số SPI và SPEI cho tỉnh Khánh Hòa. Kết quả của các nghiên cứu này cho thấy các mô hình dự báo với các biến đầu vào là ENSO, SST, SOI đều có chất lượng dự báo tốt và đủ độ tin cậy.

Việc sử dụng các biến đầu vào chính là giá trị của các chỉ số hạn ở các bước thời gian trước đó cũng được nhiều nhà khoa học trên thế giới sử dụng để thiết lập các mô hình dự báo hạn. A. K. Mishra & V. R. Desai [87] áp dụng các mô hình mạng thần kinh và ARIMA để dự báo hạn hán với biến đầu vào là chỉ số SPI ở các bước thời gian trước đó; UlkerGuner Bacanli, và cộng sự [88] sử dụng các nhân tố dự báo là SPI và lượng mưa ở các bước thời gian trước đó trong việc xây dựng mô hình dự báo cho SPI. Kết quả của các nghiên cứu này cũng cho thấy chất lượng dự báo tốt và đủ độ tin cậy.

Vì thế, trong nghiên cứu này tác giả sẽ sử dụng các biến đầu vào là số liệu SSTA và SOI có hệ số tương quan cao với các chỉ số SPI, SPEI. Đồng thời kết hợp với chỉ số SPI, SPEI ở các bước thời gian trước đó để thiết lập các mô hình dự báo hạn khí tượng. Chi tiết về loại biến và số biến đầu vào của mô hình dự báo được trình bày ở phần thiết lập cấu trúc các mô hình dự báo phía sau.

2.3.4.3 Lựa chọn phương pháp dự báo

Có nhiều phương pháp truyền thống, chẳng hạn như mô hình phân tích hồi quy và tự hồi quy tích hợp di chuyển trung bình, thường được sử dụng trong dự báo các quá trình thủy văn. Các kỹ thuật mới như mạng thần kinh nhân tạo (ANN), Logic mờ (FL) và

74

Mạng noron thích nghi mờ (ANFIS) gần đây đã được chấp nhận như là một công cụ thay thế hiệu quả cho mô hình của hệ thống thủy văn phức tạp và sử dụng rộng rãi để dự báo. A. K. Mishra & V. R. Desai [87] áp dụng các mô hình mạng thần kinh và ARIMA để dự báo hạn hán với yếu tố dự báo là SPI. Các kết quả đã chứng minh rằng phương pháp mạng thần kinh có thể được áp dụng thành công cho dự báo hạn hán. Hơn nữa, Hiệp hội Kỹ sư Dân dụng Hoa Kỳ (American Society of Civil Engineers – ASCE) [89] đã làm một đánh giá toàn diện của các ứng dụng của ANN trong bối cảnh dự báo thủy văn. Mặt khác, một số nghiên cứu cũng đã được thực hiện bằng cách sử dụng FL trong thủy văn và quy hoạch tài nguyên nước [90-93]. Trong những năm gần đây Mạng noron thích nghi mờ (ANFIS) là sự kết hợp của phương pháp ANN và FL, đã được sử dụng trong các vấn đề về mô hình về kỹ thuật phi tuyến và tài nguyên nước [94-98].

ANFIS được đề xuất như là một thay thế cho các phương pháp truyền thống để dự báo hạn hán với yếu tố dự báo là SPI cho quy mô thời đoạn khác nhau bởi UlkerGuner Bacanli, và cộng sự [88]. Đóng góp chính của phương pháp ANFIS là nó giúp loại bỏ các vấn đề cơ bản trong mô hình fuzzy (xác định các thông số chức năng thành viên và thiết kế của quy tắc mờ nếu-thì) bằng cách sử dụng khả năng học tập của ANN cho tự động hệ quy tắc mờ và tối ưu hóa các thông số. UlkerGuner Bacanli, và cộng sự [88] sử dụng các nhân tố dự báo là SPI và lượng mưa ở các bước thời gian trước đó trong việc xây dựng mô hình dự báo cho SPI. Maryam Mokhtarzad, và cộng sự [99] đã sử dụng và so sánh các phương pháp ANN, ANFIS và SVM (support vector machine) để dự báo chỉ số SPI với các biến đầu vào nhiệt độ, độ ẩm và lượng mưa mùa. Kết quả của các nghiên cứu này cho thấy rằng chất lượng dự báo bằng phương pháp ANFIS cao hơn so với phương pháp ANN.

Vì vậy, trong luận án này, tác giả sẽ áp dụng phương pháp ANFIS để xây dựng mô hình dự báo các chỉ số SPI, SPEI với các nhân tố dự báo khác nhau để tìm ra mô hình dự báo phù hợp với vùng nghiên cứu.

Mô hình ANFIS được đề xuất bởi J. -S. R. Jang [100], J.-S.R. Jang, và cộng sự [101], và đã được áp dụng để nghiên cứu nhiều vấn đề. Mô hình ANFIS được dựa trên một hệ thống giao diện mờ, được đào tạo bởi một thuật toán bắt nguồn từ lý thuyết mạng nơron.

Một xử lý chi tiết của ANFIS được cung cấp bởi H. Ying [102]. Các hệ thống Sugeno-

75

type của ANFIS với ba yếu tố đầu vào và hai quy tắc, được sử dụng trong nghiên cứu này, được thể hiện trong hình 2.11. Các nút hình vuông và hình tròn được sử dụng để phản ánh đặc tính khác nhau của việc học thích nghi. Các nút vuông (các nút thích nghi) có các thông số, trong khi các nút tròn (nút cố định) thì không. Mỗi nút có chức năng nút riêng. Các chức năng nút khác nhau từ nút tới nút. Sự kết nối giữa hai nút cho biết hướng của tín hiệu. Không có trọng lượng là liên kết với các kết nối.

Hình 2.11 Cấu trúc mô hình ANFIS

Trong hình 2.11, mô hình ANFIS có thể có nhiều biến đầu vào khác nhau, trong luận án này tác giả mô tả cấu trúc của mô hình ANFIS có 3 biến đầu vào còn với những cấu trúc có số biến đầu vào khác thì cũng tương tự. Biến đầu vào 1 (được ký hiệu là biến x), biến đầu vào 2 (được ký hiệu là biến y), biến đầu vào 3 (được ký hiệu là biến z); biến đầu ra là yếu tố dự báo (chỉ số SPI, SPEI). Mỗi biến đầu vào có 3 hàm thuộc là (A1, A2), (B1, B2), (C1, C2) tương ứng.

Quy tắc mờ Nếu-Thì (if-then) kiểu Sugeno-type cho biến đầu ra tuyến tính được thiết lập như sau:

Quy tắc 1: Nếu x bằng A1, y bằng B1 , z bằng C1 thì:

1 1 1 1

1 p x q y rz s

f     (2-31)

Quy tắc 2: Nếu x bằng A2, y bằng B2 thì:

2 2 2 2

2 p x q y r z s

f     (2-32)

76

Trong công thức trên thì Ai, Bi, Ci là tập mờ (một tập mờ được xác định duy nhất bởi hàm thuộc của nó); fi là hàm đầu ra của vùng mới; và pi, qi, ri, si là các hệ số kết quả được xác định trong quá trình luyện mạng, i là biến chạy từ 1 đến 2.

Một hàm thuộc (membership function, MF) là một đường cong xác định độ mạnh của một điểm x'X thuộc về một tập hợp, bằng cách chỉ định mức độ thuộc giữa 0 và 1,

 0,1 :

) '

'(x X

z . Có thể có một dạng hình MF, chẳng hạn như hình chuông MF, Gaussian MF, hai mặt Gaussian MF, hình tam giác MF, hình thang MF, và hình dạng pi MF. Trong luận án này sử dụng hàm thuộc là Gaussian MF. Hàm thuộc Gaussian MF có dạng:

 

 2

'( ') ( ',) exp ' 

z xf x   xc (2-33)

Trong đó, x' là giá trị của đầu vào đến nút ith; c và  là chiều rộng trung tâm đường cong Gaussian của tập mờ Z' tương ứng. c và  được gọi là các tham số tiền đề.

Các nút trong cùng một lớp có chức năng như nhau, như mô tả dưới đây:

Lớp đầu tiên của hình 2.11 chứa các nút thích nghi được đại diện bởi i, mà các kết quả đầu ra được tính với hàm của nút là:

  ,

,

1 A x

O i   i i  1 , 2 (2-34)

 ,

2 ,

1 B y

O i   ii  3 , 4 (2-35)

  ,

4 ,

1 C z

O i   ii  5,6 (2-36)

Trong đó Ai, Bi2, và Ci4 là các nhãm ngôn ngữ (ví dụ như “nhỏ”, “trung bình”, hoặc

“cao”) gắn với nút đó,  là hàm thuộc. Như vậy, O1, i đại diện cho cấp thuộc của một tập mờ Z’(= A1, A2, B1, B2, C1, C2), và xác định mức độ cho mỗi đầu vào x, y, z thảo mãn tập mờ A.

Lớp thứ hai là lớp quy tắc. Mỗi nút trong lớp này có hình tròn, có nhãn là , được gọi là các nút quy tắc. Một đầu ra từ các nút quy tắc đại diện cho một sản phẩm của các tín hiệu đầu vào. Nghĩa là, nút cố định nhận các đầu vào từ các nút thích nghi tương ứng, và mỗi giá trị đầu ra của nút biểu diễn cường độ của một quy tắc đã cho:

77

     ,

,

2 w A x B y C z

O ii   iii (2-37)

Trong lớp thứ ba, mỗi nút là một nút cố định hình tròn có nhãn là N. Số lượng các nút trong lớp này là các nút số giống nhau trong lớp quy tắc. Nút thứ i trong lớp này được tính là tỷ lệ của cường độ quy tắc của nút thứ I so với tổng tất cả các cường độ của các quy tắc:

, ,

3

i i i

i w

w w

O    i  1 , 2 (2-38)

Trong lớp thứ tư, mỗi nút là một nút thích nghi hình vuông, có nhãn là Z. Số lượng các nút trong lớp này giống như số nút trong lớp thứ ba. Đầu ra từ mỗi nút là giá trị kết quả trọng số của một quy tắc nhất định:

),

, (

4 i i i i

i i i

i

i p x q y rz s

w f w

w

O   

 

i  1 , 2 (2-39)

Lớp thứ năm chỉ chứa một nút đầu ra, và được gọi là lớp tổng kết. Nút đơn này là một nút hình tròn và được biểu thị là . Nút này tính tổng sản lượng của ANFIS, là tổng của các đầu ra của tất cả các nút thích nghi trong lớp thứ tư:

 

    

 2

1 2

1 2

1 2

1 2

1 4, ,

5

i i

i i i

i i

i i i

i i

i w

f f w

w f w f w O

O (2-40)

Giá trị đầu ra của SPI hoặc SPEI được tính như sau:

SPI hoặc SPEI =   

 

2 1

2 2 1

, 1

, w w

f w f z w

y x f

   

x y z

w z y z w

z y x f z y x w z y x f z y x w

, , ) , , (

, , ) , , ( ,

, ) , , (

2 1

2 2

1

1 

 (2-41)

ANFIS sử dụng một thuật toán học lai để hiệu chỉnh mạng. Việc kết hợp thuật toán hồi phục lại với thuật toán xấp xỉ hoặc thuật toán truyền lại được sử dụng trong thuật toán học lai ghép để tối ưu hóa các tham số trong các lớp 1 và 4. Các chi tiết toán học của các thuật toán được đưa ra trong nghiên cứu của J.-S.R. Jang, và cộng sự [101], P. C.

Nayak, và cộng sự [95] và UlkerGuner Bacanli, và cộng sự [88]. Với thuật toán học lai

78

của mô hình ANFIS thì tập số liệu đầu vào được chia là hai bộ số liệu là bộ số liệu của quá trình luyện mạng và bộ số liệu của quá trình kiểm định, toàn bộ quá trình dự báo bằng mô hình ANFIS được mô tả như sơ đồ khối sau:

Hình 2.12 Sơ đồ khối của mô hình ANFIS 2.3.4.4 Thiết lập mô hình dự báo hạn khí tượng cho vùng nghiên cứu

79 (1) Cấu trúc của các mô hình dự báo

Biến đầu ra của các mô hình là SPI1, SPI3 và SPEI1, SPEI3 tại thời điểm t được ký là SPIi(t) và SPEIi(t). Các biến đầu vào là SOI1, SOI3 và SSTA1, SSTA3 ở trước các biến đầu ra SPIi(t) và SPEIi(t) là 2 và 3 bước thời được ký hiệu lần lượt là SOIi(t-2), SSTAi(t- 2) và SOIi(t-3), SSTAi(t-3); còn các biến đầu vào là SPI1, SPI3 và SPEI1, SPEI3 ở trước các biến đầu ra SPIi(t) và SPEIi(t) là 1 và 2 bước thời được ký hiệu lần lượt là SPIi(t-1), SPEIi(t-1) và SPIi(t-2), SPEIi(t-2). Trong đó chỉ số i biểu thị các thới đoạn tính toán khác nhau (i = 1 biểu thì thới đoạn tính toán là 1 tháng, i = 3 biểu thì thới đoạn tính toán là 3 tháng).

Trong nghiên cứu này, tác giả đã thiết lập ra 5 mô hình dự báo (M1 đến M5) với cấu trúc các biến đầu vào là SSTA, SOI và SPI, SPEI (1 và 3 tháng) khác nhau. Loại biến và số lượng biến đầu vào của các mô hình được thể hiện chi tiết ở hình sau:

Hình 2.13 Cấu trúc của các mô hình dự báo

Để tiến hành dự báo các chỉ số SPI, SPEI với 5 mô hình có cấu trúc như trên, các chuỗi

80

dữ liệu được chia thành hai tập con (tập dữ liệu luyện mạng và kiểm định), tập dữ liệu luyện mạng sử dụng số liệu từ năm 1985-2009. Để đạt được một sự đánh giá tin cậy hơn và để so sánh chất lượng dự báo thì cần có một bộ dữ liệu để kiểm định không được sử dụng trong quá trình luyện mạng, tập dữ liệu kiểm định sử dụng số liệu từ năm 2010- 2014.

Trong mỗi mô hình, mỗi biến đầu vào phải được nhóm vào một số giá trị trong lớp lớp 1, xây dựng các quy tắc mờ. Ngoài ra, mỗi quy tắc mờ sẽ được xây dựng thông qua một số thông số của các hàm thành viên trong lớp 2 (hình 2.11). Vì số lượng các thông số tăng lên cùng với quy luật thặng dư mờ, cấu trúc mô hình trở nên phức tạp hơn. Trong nghiên cứu này, các chức năng phân nhóm phép trừ mờ được sử dụng để thiết lập các quy tắc mờ, dựa trên các mối quan hệ giữa các biến số đầu vào-ra. Thủ tục đào tạo và xây dựng các quy tắc được được sử bởi thuật toán lai để xác định các thông số đầu vào và đầu ra tuyến tính phi tuyến.

(2) Đánh giá chất lượng dự báo, lựa chọn mô hình dự báo phù hợp cho vùng nghiên cứu của các mô hình

Việc đánh giá chất lượng dự báo của các mô hình cho quá trình luyện mạng và kiểm định các tập dữ liệu được đánh giá thông qua 3 thông số thống kê là:

 Hệ số RSR (RMSE -observations standard deviation ratio) là hệ số thống kê giữa sai số căn quân phương (Root mean square error, RMSE) và độ lệch chuẩn của chuỗi số liệu tính toán:

 

 

n G G

n G G RSR MRSE

n i

i i n i

i i

1

2 1

' 2

 (2-42)

 Hệ số tương quan CORR (Correlation Coefficient)

Một phần của tài liệu Xây dựng mô hình cảnh báo sớm hạn khí tượng phục vụ công tác khai thác và quản lý tài nguyên nước vùng duyên hải miền trung (Trang 83 - 97)

Tải bản đầy đủ (PDF)

(178 trang)