Xây dựng mô hình máy học phục vụ dự báo mực nước trạm thủy văn cao lãnh tỉnh Đồng tháp Xây dựng mô hình máy học phục vụ dự báo mực nước trạm thủy văn cao lãnh tỉnh Đồng tháp
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Lê Xuân Hòa
XÂY DỰNG MÔ HÌNH MÁY HỌC PHỤC VỤ DỰ BÁO
MỰC NƯỚC TRẠM THỦY VĂN CAO LÃNH TỈNH ĐỒNG THÁP
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – Năm 2022
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Lê Xuân Hòa
XÂY DỰNG MÔ HÌNH MÁY HỌC PHỤC VỤ DỰ BÁO
MỰC NƯỚC TRẠM THỦY VĂN CAO LÃNH TỈNH ĐỒNG THÁP
Chuyên ngành: Thủy văn học
Mã số: 8440224.01
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS TS Nguyễn Tiền Giang
2 TS Lê Vũ Việt Phong
Hà Nội – Năm 2022
Trang 3Mục lục
DANH MỤC BẢNG iii
DANH MỤC HÌNH iv
CHỮ VIẾT TẮT vii
LỜI CẢM ƠN 1
LỜI CAM ĐOAN 2
MỞ ĐẦU 2
Chương 1 TỔNG QUAN VỀ KHU VỰC NGHIÊN CỨU VÀ PHƯƠNG PHÁP DỰ BÁO 5
1.1 Tổng quan về khu vực nghiên cứu 5
1.1.1 Địa lý 5
1.1.2 Chế độ khí hậu 6
1.1.3 Chế độ thủy văn 9
1.1.4 Sự gia tăng bất thường của các loại thiên tai trong những năm gần đây ….……… 13
1.1.5 Dân số 17
1.1.6 Kinh tế - xã hội 17
1.2 Tổng quan về phương pháp dự báo 19
Chương 2 CƠ SỞ LÝ THUYẾT CÁC MƠ HÌNH MÁY HỌC 26
2.1 Sơ đồ nghiên cứu và chiến lược dự báo 26
2.2 Mơ hình Nạve 28
2.3 Mơ hình tự hồi quy trung bình trượt (ARIMA) 29
Trang 42.4 Mơ hình Support Vector Regression (SVR) 32
2.5 Các chỉ số đánh giá 34
Chương 3 XÂY DỰNG VÀ ĐÁNH GIÁ CHẤT LƯỢNG DỰ BÁO CÁC MƠ HÌNH 36
3.1 Cơ sở dữ liệu 36
3.2 Xử lý số liệu 37
3.3 Xây dựng mơ hình máy học 37
3.3.1 Mơ hình Nạve 37
3.3.2 Mơ hình Arima 40
3.3.3 Mơ hình Support Vector Regression 45
3.4 Đánh giá chất lượng dự báo các mơ hình với số liệu thực tế 48
3.4.1 Đánh giá chất lượng mơ hình Naive 48
3.3.2 Đánh giá chất lượng mơ hình Arima 55
3.3.3 Đánh giá chất lượng mơ hình SVR 58
Kết luận và kiến nghị 63
Tài liệu tham khảo 66
Phụ lục 69
Trang 5DANH MỤC BẢNG
Bảng 1: Số liệu mực nước dự báo tương lai và thực đo mô hình Naive 53
Bảng 2: Dự báo mực nước tương lai bằng mô hình Arima 57
Bảng 3: Sai số trung bình tuyệt đối giữa dự báo mực nước tương lai và thực đo 58
Bảng 4: Số liệu dự báo mực nước tương lai với số liệu thực tế 60
Bảng 5: Sai số trung bình tuyệt đối mô hình SVR 62
Bảng 6: Tổng hợp các chỉ số đánh giá của các mô hình 63
Bảng 7: Tổng hợp các chỉ số sai số trung bình tuyệt đối của các mô hình 64
Trang 6DANH MỤC HÌNH
Hình 1: Bản đồ hành chính tỉnh Đồng Tháp và khu vực nghiên cứu 6
Hình 2: Nhiệt độ trung bình nhiều năm 7
Hình 3: Lượng mưa trung bình tháng 9
Hình 4: Tổng quan về ML (nguồn researchgate.net) 20
Hình 5: Sơ đồ nghiên cứu 26
Hình 6: Cấu trúc của chiến lược lặp lại để dự báo trước nhiều bước 28
Hình 7: Biều đồ mực nước lớn nhất ngày trạm thủy văn Cao Lãnh từ ngày 01/1/ 2000 đến 31/12/ 2020 36
Hình 8: Sơ đồ thuật tốn mơ hình Naive 38
Hình 9: Chia chuỗi dữ liệu thành tập huấn luyện và kiểm tra trong mơ hình Nạve 38
Hình 10: Sơ đồ thuật tốn mơ hình ARIMA 40
Hình 11: Chia chuỗi dữ liệu thành tập huấn luyện và kiểm tra trong mơ hình Arima 41
Hình 12: Tự tương quan 42
Hình 13: Tương quan một phần 43
Hình 14: Kết quả trả về mơ hình Arima (2,0,1) 45
Hình 15: Sơ đồ thuật tốn SVR 46
Hình 16: Phân chia dữ liệu đầu vào trong mơ hình SVR 46 Hình 17: Kết quả dự báo liên tục hàng ngày của mơ hình Naive với số liệu mực nước cao nhất ngày thực đo trong gian đoạn kiểm tra từ ngày 27/12/2015
Trang 7và kết thúc vào ngày 21/12/2019 (chuỗi số liệu cuối của giai đoạn kiểm tra) 48 Hình 18: Kết quả dự báo liên tục hai tuần của mơ hình Naive với số liệu mực
nước cao nhất ngày thực đo trong gian đoạn kiểm tra từ ngày 27/12/2015 và
kết thúc vào ngày 21/12/2019 (chuỗi số liệu cuối của giai đoạn kiểm tra) 49 Hình 19: Kết quả dự báo liên tục hai tuần qua một năm trước của mơ hình Naive với số liệu mực nước cao nhất ngày thực đo trong gian đoạn kiểm tra từ ngày 27/12/2015 và kết thúc vào ngày 21/12/2019.( chuỗi số liệu cuối của giai đoạn kiểm tra) 49 Hình 20: Sai số giữa các phương pháp dự báo 50 Hình 21: Kết quả dự báo mực nước tương lai bằng phương pháp dự báo liên tục hàng ngày của mơ hình Nạve với số liệu thực đo 51 Hình 22: Kết quả dự báo mực nước tương lai bằng phương pháp dự báo liên tục hàng tuần của mơ hình Niave với số liệu thực đo 51 Hình 23: Kết quả dự báo mực nước tương lai bằng phương pháp dự báo liên tục hàng tuần theo năm trước của mơ hình Niave với số liệu thực đo 52 Hình 24: Kết quả sai số tuyệt đối giữa dự báo và thực đo trong mơ hình 54 Hình 25: Kết quả dự báo của mơ hình Arima với số liệu mực nước cao nhất ngày thực đo trong giai đoạn kiểm tra từ ngày 20/10/2016 tới 30/11/2020 55 Hình 26: Kết quả dự báo của mơ hình Arima với số liệu mực nước cao nhất ngày thực đo trong gian đoạn kiểm tra từ 20/10/2016 tới 30/11/2020 (100 số liệu cuối của giai đoạn kiểm tra) 56 Hình 27: Kết quả dự báo mực nước tương lai với số liệu thực đo 57
Trang 8Hình 28: Kết quả dự báo trong mô hình SVR với số liệu mực nước cao nhất ngày thực đo trong giai đoạn kiểm tra từ 06/11/2017 tới 30/11/2020 59 Hình 29: Kết quả dự báo của mô hình SVR với số liệu mực nước cao nhất ngày thực đo trong gian đoạn kiểm tra từ 20/10/2016 tới 30/11/2020.( 100 số liệu cuối của giai đoạn kiểm tra) 59 Hình 30: Kết quả dự báo mực nước 3 ngày tiếp theo với số liệu thực tế 61 Hình 31: Kết quả dự báo mực nước 5 ngày tiếp theo với số liệu thực tế 61
Trang 9CHỮ VIẾT TẮT
ATNĐ Áp thấp nhiệt đới
TKCN Tìm kiếm cứu nạn
GRDP Tốc độ tăng trưởng kinh tế
ARIMA Autoregressive Intergrated Moving Average SVR Support Vector Regression
ACF AutoCorrelation Function
PACF Partitial AutoCorrelation Function
AIC Akaike Information Criteria
NSE Nash–Sutcliffe Efficiency
RMSE Root Mean Square Error
MAE Mean absolute error
Trang 10và cho tôi nhiều kiến thức trong những thời gian qua
Tôi xin chân thành cảm ơn Giám đốc, cán bộ viên chức Đài Khí tượng Thủy văn tỉnh Đồng Tháp, Lãnh đạo Đài Khí tượng Thủy văn khu vực Nam
Bộ tạo điều kiện tốt nhất cho tôi
Ngoài ra, luận văn này có sự hỗ trợ về mặt dữ liệu và phương pháp luận
từ đề tài mã số NĐT.58.RU/19 do Bộ Khoa học và Công nghệ tài trợ
Trong quá trình làm luận văn, tôi đã được sự khích lệ và giúp đỡ của thầy cô, gia đình, bạn bè và nỗ lực của chính tôi, nhưng do giới hạn về thời gian cũng như hạn chế về kiến thức nên không tránh được những thiếu sót Chính vì vậy, tôi rất mong nhận được các ý kiến đóng góp quý báu từ các Thầy cô và những người quan tâm để tôi hoàn thiện hơn bài luận văn
Xin chân thành cảm ơn!
Tác giả
Lê Xuân Hòa
Trang 11LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu do cá nhân tôi thực hiện dưới sự hướng dẫn khoa học của PGS.TS Nguyễn Tiền Giang, TS
Lê Vũ Việt Phong không sao chép các công trình nghiên cứu của người khác Các số liệu, kết quả của luận văn là trung thực và chưa từng được công bố trong bất kì một công trình khoa học của người khác
Các thông tin thứ cấp sử dụng trong luận văn có nguồn gốc rõ ràng, được trích dẫn đầy đủ, trung thực và đúng quy cách
Tôi hoàn toàn chịu trách nhiệm về tính xác thực và nguyên bản luận văn của mình
TÁC GIẢ
Lê Xuân Hòa
Trang 12MỞ ĐẦU
1 Tính cấp thiết
Hiện nay, các nghiên cứu về dữ liệu chuỗi thời gian đem lại những ứng dụng rất quan trọng, đảm bảo tính thực tế cao trong các lĩnh vực: tài chính, thống kê, xử lý dữ liệu, dự báo các hiện tượng thiên tai, … Một số trong đó là bài toán về dự báo chuỗi thời gian kết hợp xây dựng các mô hình dự báo thích hợp
Trong các nghiên cứu về dự báo dòng chảy đều sử dụng các mô hình thủy văn phân bố hay bán phân bố khác nhau Các mô hình này được xây dựng để mô phỏng quá trình của dòng chảy do khả năng mô phỏng có độ chính xác cao các quá trình vật lý và phân tích độ nhạy cảm một cách toàn diện Ngoài ra các mô hình này rất tốt cho các nhà khoa học trong việc giải thích được toàn bộ quá trình ẩn đằng sau Chính vì vậy các mô hình này được
áp dụng nhiều và rộng rãi ở nhiều khu vực trên thế giới Tuy nhiên, việc sử dụng các mô hình này cần một số dữ liệu lớn về thông tin địa lý, mưa, dòng chảy… Bên cạch đó việc hiệu chỉnh và kiểm định mô hình còn khá phức tạp đòi hỏi phải có nhiều thời gian, kinh nghiệm và kiến thức của người xây dựng, chạy mô hình cho từng lưu vực Chính vì vậy việc sử dụng loại mô hình này ở nhiều khu vực và trong các bài toán dự báo thời đoạn ngắn vẫn còn bị hạn chế [1]
Từ những hạn chế của các mô hình truyền thống đã khuyến khích sự phát triển của các mô hình dựa vào chuỗi số liệu mà phát triển nhất đó là phương pháp máy học (Machine Learning - ML) Các mô hình ML là một trong những công cụ rất tiềm năng trong việc dự báo dòng chảy do các mô hình ML này có thể xây dựng một cách nhanh chóng, dễ dàng mà không cần đòi hỏi có sự hiểu biết về các quá trình vật lý ẩn đằng sau Ngoài ra, lượng dữ
Trang 13liệu yêu cầu tối thiểu, cùng với khả năng tính tốn, hiệu chỉnh và kiểm định nhanh hơn so với các mơ hình vật lý truyền thống, và cách sử dụng ít phức tạp hơn là những ưu điểm lớn mà các mơ hình dựa vào số liệu mang lại [18] Đồng Tháp là một trong những tỉnh cĩ nhiều hệ thống sơng ngịi dầy đặc, nằm ở đầu nguồn sơng Tiền thượng lưu thì bị ảnh hưởng bởi dịng chảy
từ bên Campuchia cịn hạ lưu thì ảnh hưởng bởi thủy triều, vì vậy việc dự báo mực nước cho tỉnh Đồng Tháp nĩi chung, Tp Cao Lãnh nĩi riêng gặp rất nhiều khĩ khăn, mất rất nhiều thời gian và độ chính xác cịn chưa cao Từ những khĩ khăn đĩ việc xây dựng một mơ hình máy học để phục vụ dự báo mực nước là rất cần thiết đối với các dự báo viên Vì vậy tác giả đã nghiên cứu xây dựng các mơ hình máy học phục vụ dự báo mực nước trạm thủy văn Cao Lãnh, tỉnh Đồng Tháp là rất cần thiết
2 Mục tiêu
Xây dựng được các mơ hình máy học: Nạve model; Autoregressive Intergrated Moving Average (ARIMA) và mơ hình Support vector Regression (SVR)
Hiệu chỉnh và đánh giá các mơ hình nhằm tìm ra phương pháp dự báo mực nước đảm bảo độ chính xác và tin cậy cao nhằm phục vụ cơng tác dự báo mực nước cho trạm thủy văn Cao Lãnh
3 Các phương pháp nghiên cứu
Phương pháp thống kê: Thống kê các dữ liệu về vị trí địa lý, điều kiện tự nhiên, chế độ khí tượng, thủy văn, kinh tế - xã hội …;
Phương pháp máy học, sử dụng các thuật tốn: Nạve model; ARIMA và SVR
Trang 144 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu là mực nước trạm thủy văn Cao Lãnh, tỉnh Đồng Tháp Thành phần được xem xét trong nghiên cứu bao gồm: chế độ thủy văn, mực nước
Nghiên cứu xây dựng mô hình máy học để dự báo mực nước trạm tại khu vực nghiên cứu Sử dụng các siêu tham số đã được hiệu chỉnh kiểm định của mô hình sau khi đã thiết lập để dự báo mực nước trạm thủy văn Cao Lãnh, tỉnh Đồng Tháp
Phạm vị nghiên cứu: trạm thủy văn Cao Lãnh nằm ở trên sông Tiền, tỉnh Đồng Tháp
5 Nội dung luận văn
Ngoài những phần: mở đầu, kết luận, kiến nghị và tài liệu tham khảo, luận văn bao gồm 3 chương:
Trang 15Chương 1 TỔNG QUAN VỀ KHU VỰC NGHIÊN CỨU VÀ PHƯƠNG
PHÁP DỰ BÁO 1.1 Tổng quan về khu vực nghiên cứu
1.1.1 Địa lý
- Vị trí địa lý
Đồng Tháp là một trong 13 tỉnh của vùng đồng bằng sông Cửu Long, nằm
ở đầu nguồn sông Tiền, lãnh thổ của tỉnh Đồng Tháp nằm trong giới hạn tọa
độ 10°07’ - 10°58’ vĩ độ Bắc và 105°12’ - 105°56’ kinh độ Đông Phía Bắc giáp với tỉnh Long An, phía tây bắc giáp tỉnh Preyveng thuộc Campuchia, phía nam giáp An Giang và Cần Thơ Tỉnh Đồng Tháp có đường biên giới quốc gia giáp với Campuchia với chiều dài khoảng 50 km từ Hồng Ngự đến Tân Hồng, với 4 cửa khẩu là Thông Bình, Dinh Bà, Mỹ Cân và Thường Phước Hệ thống đường quốc lộ 30, 80, 54 cùng với quốc lộ N1, N2 gắn kết Đồng Tháp với thành phố Hồ Chí Minh và các tỉnh trong khu vực (Hình 2) Trạm thủy văn Cao Lãnh được đặt tại phường 6, thành phố Cao Lãnh, tỉnh Đồng Tháp, có tọa độ 10°25’0.41” vĩ độ Bắc và 105°38’38.79” kinh độ Đông, phía bắc giáp với khu dân cư, phía nam hướng ra sông Tiền, phía Đông là bến phà đang hoạt động cách trạm gần 100 m, phía tây là bãi đất trống (Hình 2)
- Điều kiện địa hình, địa mạo
Địa hình vùng Đồng Tháp Mười của tỉnh Đồng Tháp có hướng dốc Tây Bắc - Đông Nam, nghĩa là cao ở vùng biên giới và vùng ven sông Tiền thấp dần về phía trung tâm Đồng Tháp Mười Vùng này có địa hình bằng phẳng, cao độ phổ biến từ 1,00 ÷ 2,00 mét, cao nhất là 4,10 mét, thấp nhất là 0,77 m Vùng kẹp giữa hai sông có địa hình lòng máng, cao ở ven sông Tiền, sông Hậu thấp vào giữa Cao độ phổ biến 0,90 ÷ 1,30 m, cao nhất 1,67 m, thấp nhất 0,67 m
Trang 16Dạng địa mạo không có gì đặc biệt trừ một số gò cao vùng Sa Rài giáp biên giới Việt Nam - Campuchia và hệ thống kênh rạch, đường giao thông và các khu dân cư chia cắt khu vực thành nhiều ô, vùng nhỏ hơn
Hình 1: Bản đồ hành chính tỉnh Đồng Tháp và khu vực nghiên cứu
1.1.2 Chế độ khí hậu
Tỉnh Đồng Tháp một tỉnh đông bằng sông Cửu Long, nằm trong vùng khí hậu nhiệt đới gió mùa, nhiệt độ cao quanh năm và ít biến đổi từ tháng này sang tháng khác Chế độ mưa - ẩm trong năm được chia thành hai mùa rõ rệt: mùa mưa và mùa khô Mùa mưa bắt đầu từ tháng V đến tháng XI, mùa khô bắt đầu từ tháng XII cho đến tháng IV năm sau, trùng với gió mùa Đông Bắc Thời tiết nóng, ẩm, mưa nhiều cùng với thời gian chiếu sáng dài là những điều kiện thuận lợi cho phát triển sản xuất nông nghiệp toàn diện của Đồng Tháp Tuy nhiên, trong một vài năm trở lại đây, những thay đổi của khí hậu
Trang 17đã làm xuất hiện một số hiện tượng thời tiết bất thường gây ảnh hưởng không nhỏ đến đời sống và sản xuất của người dân
1.1.2.1 Nhiệt độ
Nhiệt độ cao quanh năm và ít biến đổi từ tháng này sang tháng khác Nhiệt
độ trung bình tháng của tỉnh Đồng Tháp biến động từ 27,0 - 27,5oC, chênh lệch nhiệt độ giữa các tháng không lớn (khoảng 4oC) Tháng 4 có nhiệt độ trung bình cao nhất (gần 29oC) Tháng 1 có nhiệt độ trung bình thấp nhất (hơn
25oC) Nhiệt độ tối cao kỷ lục là 37,40C (tháng 4/1983), nhiệt độ tối thấp kỷ lục là 15,80C (tháng 3/1986)
Hình 2: Nhiệt độ trung bình nhiều năm
(Nguồn: Đài KTTV tỉnh Đồng Tháp) 1.1.2.2 Độ ẩm
Độ ẩm bình quân năm từ 82-85%, thay đổi theo mùa; Mùa mưa độ ẩm không khí cao cực đại vào tháng IX – X, khoảng 88%; Mùa khô độ ẩm thấp,
Trang 18đạt trị số cực tiểu vào tháng II - III bình quân thấp nhất là 50,3% và tháng III
có ẩm độ nhỏ nhất (32,0%)
1.1.2.3 Gió
Có hai hướng gió chính: gió mùa Đông Bắc (từ tháng XI đến tháng IV); gió mùa Tây Nam (từ tháng V đến tháng X) Tốc độ gió nhìn chung không cao (trung bình năm 1,0 ÷ 1,5 m/s, trung bình lớn nhất 17 m/s) Do nằm sâu trong đất liền, hướng gió mạnh thường là Tây đến Tây Nam
Tỉnh Đồng Tháp qua các năm không có các dạng khí hậu cực đoan mặc dù
ở một vài nơi có xuất hiện lốc xoáy, ngập lũ, sét đánh vào mùa mưa hoặc mưa trái mùa trên diện rộng, ảnh hưởng áp thấp nhiệt đới biển Đông gây mưa nhiều ngày
1.1.2.4 Bốc hơi
Lượng bốc hơi các năm dao động từ là 909,8 ÷ 1.037,8 mm, trung bình 983,7 mm thuộc loại trung bình ở đồng bằng sông Cửu Long Mùa mưa dao động từ 66,7 mm đến 79,9 mm, mùa khô lượng bốc hơi dao động từ 76,1 mm đến 108,5 mm
1.1.2.5 Nắng
Là vùng có số giờ nắng cao (208 giờ/tháng), tháng III có số giờ nắng cao nhất là 9,1 giờ/ngày
1.1.2.6 Mưa
Lượng mưa trung bình năm ở tỉnh Đồng Tháp dao động từ là 1.392 ÷ 2.388
mm, thuộc loại trung bình ở đồng bằng sông Cửu Long Lượng mưa phân bố không đồng đều theo các mùa trong năm Mùa mưa từ tháng V đến tháng XI, chiếm đến 90 ÷ 92% lượng mưa của cả năm và tập trung vào các tháng IX, X Tuy nhiên trong mùa mưa thường có thời gian ít mưa vào khoảng cuối tháng VII đến đầu tháng VIII, lượng mưa năm lớn nhất là 2005,2 mm (năm 2000), lượng mưa nhỏ nhất là 995 m (năm 1982) Lượng mưa bình quân mùa mưa
Trang 19chiếm 91,6% lượng mưa năm, lượng mưa bình quân mùa khô chiếm 8,4% lượng mưa năm; đặc biệt có năm từ tháng I-IV gần như không có mưa
Hình 3: Lượng mưa trung bình tháng
(Nguồn: Đài KTTV tỉnh Đồng Tháp)
1.1.3 Chế độ thủy văn
Chế độ thuỷ văn khu vực tỉnh Đồng Tháp chịu tác động của 3 yếu tố: lũ thượng nguồn, mưa nội đồng và thuỷ triều biển Đông, chia làm 2 mùa rõ rệt: mùa kiệt và mùa lũ
a Chế độ thủy văn mùa kiệt
Nhìn chung khá phức tạp Nó phụ thuộc chủ yếu vào chế độ thủy văn thượng nguồn sông Mê Công, chế độ thủy triều biển Đông (truyền trên sông Tiền, sông Hậu) và chế độ mưa Một cách khái quát thì mùa khô là những tháng có lưu lượng thượng nguồn về ít, lượng mưa lại không đáng kể nhưng nhu cầu sử dụng nước lại cao Tuy nhiên, do tỉnh nằm ở đầu nguồn sông Tiền
và sông Hậu, vì vậy không chịu ảnh hưởng của xâm nhập mặn
Trang 20Theo các chỉ tiêu phân định mùa thì mùa kiệt vùng hạ lưu ĐBSCL kéo dài hơn 5 tháng (từ cuối tháng XI đến trung tuần tháng V) hàng năm và cũng chính là mùa kiệt của tỉnh Đồng Tháp Lượng nước mùa kiệt của tỉnh phụ thuộc chủ yếu vào chế độ thủy văn sông Tiền và sông Hậu (khu vực giữa hai sông thuộc các huyện Lấp Vò, Lai Vung, Châu Thành và thị xã Sa Đéc là khu vực kẹp giữa hai sông) mà chế độ thủy văn mùa kiệt sông Tiền, sông Hậu lại chính là sự giao tranh ảnh hưởng giữa lưu lượng nước ngọt sông Mê Công và chế độ thủy triều Biển Đông giao động trên sông Tiền, sông Hậu
Cuối mùa lũ từ tháng XII trở đi nguồn nước của sông Tiền giảm dần Lượng nước ngọt của nội đồng được lấy trực tiếp từ sông chính thông qua các
hệ kênh rạch tự nhiên và nhân tạo nối với sông chính cũng giảm dần Thời kỳ kiệt nhất hàng năm trong nội đồng thường xảy ra vào trung tuần tháng IV Vào tháng V ở vùng thượng lưu đã có những trận mưa đầu mùa, tuy nhiên ảnh hưởng này lên lưu lượng vào đồng bằng phải đến những tuần cuối của tháng VII mới rõ nét
b Chế độ thủy văn mùa lũ
Cũng như mùa kiệt, chế độ thủy văn mùa lũ tỉnh Đồng Tháp phụ thuộc vào chế độ thủy văn lũ thượng nguồn sông Mê Công, chế độ thủy triều biển Đông thông qua hệ thống kênh rạch và đặc tính cục bộ vùng như ảnh hưởng tràn lũ của khu vực biên giới, ảnh hưởng của địa hình và chế độ mưa địa phương , Một cách tổng quát, dựa vào các chỉ tiêu phân mùa thì mùa lũ kéo dài hơn 5 tháng từ tháng VII đến tháng XI hàng năm Do ảnh hưởng của lượng mưa đầu nguồn sông Mê Công nên ngay từ cuối tháng V lưu lượng thượng nguồn đã gia tăng đáng kể Song nhờ có điều tiết tự nhiên của Biển Hồ nên phải tới đầu tháng VII lũ mới ảnh hưởng tới địa phận Viêt Nam Lưu lượng lũ về lớn, khả năng tải của hai sông Tiền và Hậu có hạn chế, đất đai đồng bằng lại khá bằng
Trang 21phẳng khó tiêu thoát, các cửa thoát lũ không đủ lại ảnh hưởng mạnh của thủy triều dẫn tới hiện tượng ngập lũ đáng kể với thời gian tương đối dài ngày
Lũ tỉnh Đồng Tháp lại phụ thuộc chủ yếu vào diễn biến lũ vùng ĐBSCL
Từ cuối tháng VII đến đầu tháng VIII hàng năm, khi lũ còn ở mức thấp, mực nước tại Tân Châu <3,0 m, nước chủ yếu chảy trong lòng kênh rạch Tuy nhiên khi gặp kỳ triều cường, nếu lũ sớm thì nước lũ bị dồn ứ và gây ra ngập úng cho những vùng thấp dọc sông chính như những trận lũ 1978, 1984,
2000, 2001, 2011 Thời kỳ này gọi là thời kỳ đầu của ảnh hưởng lũ, nước lũ thượng nguồn theo hai dòng chính là sông Tiền và sông Hậu ảnh hưởng đến các vùng ven biên giới của tỉnh Với tỉnh Đồng Tháp nước theo rạch Cái Cỏ, kênh Tân Thành - Lò Gạch, kênh Hồng Ngự làm ngập dần từ các khu trũng đến khu cao và tạo thành lớp nước đệm trước lũ Cuối tháng VIII, đầu tháng
IX khi mực nước lũ dâng cao, nước tràn qua các kênh Sở Thượng, Sở Hạ và sông TraBek (ngay cửa khẩu Thông Bình) chạy dọc theo biên giới với Cam
Pu Chia đổ dồn vào các kênh rạch của tỉnh Đồng Tháp Ngoài ra một phần nước lũ trở lại sông Tiền qua rạch Hồng Ngự, một phần đi vào các kênh rạch nội đồng của tỉnh theo rạch Sở Hạ
Đến cuối tháng IX, lượng lũ vào trong tỉnh không phải từ sông Tiền đổ vào chiếm ưu thế mà chủ yếu là do tràn qua biên giới Việt Nam-Căm Pu Chia Toàn bộ vùng phía Bắc Tân Thành-Lò Gạch đến kênh Cái Cái đều có mực nước cao hơn cả Tân Châu và có hiện tượng nước từ sông Sở Thượng được thoát ra sông Tiền qua rạch Hồng Ngự (ngày 2/X/1996 lưu lượng thực đo tại rạch Hồng Ngự là 1844 m3/s theo hướng đổ ra sông Tiền)
Mực nước lũ dâng nhanh, xu thế chảy mạnh từ Sở Thượng và tràn từ biên giới vào, gặp Quốc Lộ 30 (đoạn Hồng Ngự đi Tân Hồng) nước dềnh ứ lên ở phía thượng lưu và chảy rất mạnh qua các cầu Do bị khống chế bởi mặt cắt các cầu nên một phần dòng lũ tràn qua bờ rạch Cái Cái, chảy xuôi theo rạch
Trang 22vào vùng trung tâm của tỉnh, một phần vượt bờ tràn về đầu sông Vàm Cỏ Tây của tỉnh Long An
Vùng ngập sâu chủ yếu là phía Tây rạch Cái Cái, trung bình khoảng 3,5 m, tùy theo địa hình, cá biệt có chỗ cao trình thấp ngập tới 3,6-3,8 m Vào cuối mùa lũ (cuối tháng X đến giữa tháng XI), nước lũ tiêu mạnh về phía sông Tiền, nhất là đoạn từ Cao Lãnh trở xuống (còn ảnh hưởng mạnh thủy triều) một phần đáng kể được tiêu về phía hai sông Vàm Cỏ qua các kênh 28, kênh Hưng Điền, kênh 79 và lượng tràn bờ từ Vĩnh Hưng đi Tuyên Nhơn của tỉnh Long An Lượng lũ này được tiêu thoát qua sông Vàm Cỏ Tây và Vàm
3,0-Cỏ Đông
Thời gian truyền đỉnh lũ trong nội đồng từ biên giới xuống vùng Nam Nguyễn Văn Tiếp chừng 12-15 ngày (tại Tân Hồng ngày 3/X thì tại Mỹ An là 11/X, Mỹ Trung 15/X, Mỹ Phước Tây 16/X và Mỹ Phước ngày 17-18/X) Vùng Nam QL1 do ảnh hưởng mạnh của thủy triều nên thời gian đạt mực nước cao nhất lại vào những ngày cuối tháng X (ngày 30/X-1,2/XI)
Lưu lượng từ sông Tiền vào các cửa kênh từ Hồng Ngự đến An Bình biến đổi khá lớn theo thời gian và từng trận lũ Nếu như những năm trước đây, lưu lượng này vào khoảng 400-700 m3/s thì nay chỉ còn khoảng 100-200 m3/s, do
sự lấn át của dòng lũ từ biên giới về
Với năm lũ lớn như năm 2000, lưu lượng từ nội đồng thoát ra qua các cửa dọc QL30 từ thị xã Hồng Ngự đến thành phố Cao Lãnh từ 1.200 đến 1.500 m3/s, tổng lượng thoát ra qua cả QL30 và QL1 vào khoảng 4.300 đến 5.000 m3/S
Đoạn từ cửa Hồng Ngự đến Mười Sinh, Mương Lớn (cách Hồng Ngự 5 km) có xu thế nước chảy từ sông Tiền vào nội đồng Từ An Long (cửa kênh Đồng Tiến) xuống phía Nam nước chảy từ nội đồng ra sông Tiền Năm 1997
là năm lũ nhỏ, lưu lượng bình quân trong 7 ngày (05-12/X) chảy qua Ba Răng
Trang 23là 21,3 m3/s, cửa An Phong chảy kém hơn, xuống tới Đốc Vàng Hạ khá hơn với lưu lượng 121 m3/s, cửa Cần Lố 267 m3/s (Qmax là 439 m3/s)
Trong mùa lũ, vào thời kỳ lũ lớn nhất, ảnh hưởng của lượng lũ tràn biên giới chiếm ưu thế áp đảo dòng chảy ngang từ sông Tiền vào và hình thành một vùng có mực nước lớn hơn xung quanh
Vào giữa mùa, lượng lũ về càng lớn, lượng lũ tràn từ biên giới Campuchia
về bị QL30 đoạn từ thị xã Hồng Ngự đến huyện Tân Hồng chặn lại, chỉ có thể tiêu thoát qua các cầu, tạo sự chênh lệch mực nước đáng kể giữa thượng hạ các cầu (trước năm 1996 khoảng 0,40-0,60 m, sau năm 2000 do mặt cắt các cầu được mở chênh lệch giảm còn chừng 0,2-0,3m)
Lưu lượng bình quân nhiều năm tại trạm Tân Châu, Châu Đốc trên sông Tiền, sông Hậu trong khoảng 20 năm từ 1996 đến 2015 khoảng 12.591 m3/s
và lớn nhất 34.470 m3/s vào năm năm 2011 (theo tài liệu quan trắc năm 1961 tổng lượng là 36.740 m3/s) Ngoài sông Tiền và sông Hậu, còn có 2 nhánh sông nhỏ ảnh hưởng đến nguồn nước mặt vùng phía Bắc tỉnh đó là sông Trapek, sông Sở Hạ và sông Sở Thượng bắt nguồn từ Campuchia đổ ra sông Tiền và vào kênh Hồng Ngự
1.1.4 Sự gia tăng bất thường của các loại thiên tai trong những năm gần đây
Căn cứ mức độ thiệt hại, phạm vi ảnh hưởng và tần suất xuất hiện của từng loại hiểm họa thiên nhiên đã được xác định xếp các loại thiên tai ở Đồng Tháp theo thứ tự sau: Lũ lụt (1) - Sạt lở bờ sông (2) - Dịch bệnh (3) - Lốc tố (4) - Dông sét (5) - Ngập úng (6) - Cháy rừng (7) - Hạn hán (8) - Bão và áp thấp nhiệt đới (9)
1.1.4.1 Lũ lụt
Lũ lụt là một bộ phận của chu kỳ tự nhiên sông Mê Công và mang tính sống còn đối với hệ sinh thái Nguyên nhân sinh ra lũ lụt tại Đồng Tháp là do
Trang 24lũ thượng nguồn đổ về gây ra tình trạng ngập lụt là chính, nếu thời gian lũ lớn trùng với kỳ triều cường và lượng mưa tại chỗ nhiều thì mức độ ngập lụt sẽ nghiêm trọng hơn, ngoài ra còn kể đến những tác động bất hợp lý của con người trên lưu vực như chặt phá rừng khu vực thượng nguồn và việc xây dựng các công trình kết cấu hạ tầng không hợp lý ngăn cản việc thoát lũ Nước lũ vào chảy nội đồng theo 2 hướng, thời kỳ đầu nước lũ từ sông Cửu Long chảy theo các trục kênh rạch chính vào nội đồng, từ tháng VIII trở đi nước lũ tràn qua biên giới Campuchia-Việt Nam sang Tình hình ngập lụt cũng xảy ra trước tiên ở các huyện đầu nguồn sau đó kéo dần xuống các huyện phía Nam Nước lũ thoát theo 2 hướng: theo các kênh ngang qua phía Long An ra sông Vàm Cỏ và theo các kênh rạch chảy ngược ra sông Cửu Long
Thời gian ngập lụt (trên mức báo động cấp III) trong những năm lũ lớn kéo dài khoảng 3 tháng Mức độ ngập lụt trong trận lũ lịch sử năm 2000 như sau: khu vực phía bắc kênh Hồng Ngự (trừ gò cao) ngập sâu trên 3,0 m, khu vực huyện Tam Nông, Thanh Bình, phía Bắc 2 huyện Cao Lãnh và Tháp Mười ngập sâu từ 2,0-3,0 m, khu vực phía nam 2 huyện Cao Lãnh và Tháp Mười ngập sâu từ 1,5-2,0 m; khu vực các huyện Lấp Vò, Lai Vung, Châu Thành ngập sâu từ 0,8-1,5 m
Những năm lũ về sớm, lên nhanh và ở mức cao (đến trung tuần tháng VII
đã vượt mức báo động cấp II) đe dọa sản xuất lúa vụ Hè Thu Những năm lũ lớn (đỉnh lũ tại Tân Châu lớn hơn 4,50 m), ngập sâu và thời gian kéo dài sẽ ảnh hưởng đến sản xuất lúa vụ Thu Đông và vườn cây trái, cơ sở hạ tầng và hàng ngàn hộ dân vùng sâu, vùng xa phải kê kích nhà cửa hoặc di dời đến nơi
an toàn, cụ thể:
1.1.4.2 Sạt lở đất ven sông
Trang 25Sông Tiền chảy qua địa phận tỉnh Đồng Tháp dài 122,9 km và sông Hậu dài 34,4 km Trong mấy năm gần đây, sạt lỏ xảy tại 36-45 xã, phường, thị trấn thuộc 10/12 huyện, thị xã, thành phố
Nguyên nhân chủ yếu gây sạt lở đất bờ sông là do động lực dòng sông và
sự cấu tạo nền địa chất mềm yếu của lòng dẫn, ngoài ra cũng phải kể đến những hoạt động do con người gây ra Tình trạng sạt lở bờ sông sẽ tiếp tục diễn ra mạnh trong thời gian tới
1.1.4.3 Lốc tố
Lốc tố xảy ra từ tháng IV đến tháng XII hàng năm ở hầu hết các nơi trong tỉnh, đặc biệt tại các huyện Lai Vung, Lấp Vò, Châu Thành, Cao Lãnh, Tam Nông, Thanh Bình, Tân Hồng và thị xã Sa Đéc Lốc tố là một loại dạng gió xoáy rất mạnh, xảy ra trong phạm vi nhỏ hẹp, tồn tại trong thời gian ngắn nên rất khó dự báo, cảnh báo sớm Lốc tố gây sập đổ sập, tốc mái nhà dân, trường học, trụ sở cơ quan và gây đổ ngã hàng ngàn ha lúa vụ Hè Thu, Thu Đông và Vườn cây ăn trái
1.1.4.4 Dông sét
Sấm sét xảy ra từ tháng IV đến tháng XII hàng năm ở tất cả các nơi trong tỉnh, đặc biệt Sấm sét gây ra thiệt hại về người và các công trình về điện, thông tin liên lạc Đặc biệt ngày 31/3/2006 sét đánh chết 5 người và bị thương
6 người tại ấp 3 xã Hưng Thạnh - huyện Tháp Mười đang gặt lúa ngoài đồng
Để hạn chế thiệt hại do sấm sét gây ra, Ban Chỉ huy Phòng chống lụt bão & TKCN tỉnh hướng dẫn phòng chống sét trên phương tiện thông tin đại chúng; khuyến nghị các nhân dân, cơ quan, đơn vị khi xây dựng nhà ở các công trình kết cấu hạ tầng cần bố trí các thiết bị phòng chống sét
1.1.4.5 Ngập úng
Ngập úng do mưa to xảy ra từ tháng VIII đến tháng X hàng năm, ảnh hưởng đến vụ sản xuất Thu Đông, Vườn cây ăn trái và đời sống của nhân dân
Trang 26trong đê bao, vì thời gian này mực nước lũ phía ngoài đê bao cao hơn trong đê bao nên phải bơm tiêu úng rất tốn kém, năng suất và chất lượng sản phẩm giảm đáng kể Ngập úng do triều cường và mưa to trái mùa xảy thời gian cuối mùa lũ, gây ngập úng cho lúa Đông Xuân mới xuống giống ở khu vực các huyện, thị xã phía nam tỉnh
1.1.4.6 Cháy rừng
Toàn tỉnh hiện có 15.577,2 ha đất lâm nghiệp, trong đó diện tích có rừng
là 8.974,9 ha và 6.602,3 rừng theo qui hoạch lâm nghiệp Rừng được phân loại như sau: Rừng đặc dụng 3.088,6 ha (Vườn quốc gia Tràm Chim, Khu di tích Xẻo Quýt và Khu di tích Gò Tháp), rừng phòng hộ 1.266,6 ha (rừng phòng hộ biên giới, rừng phòng hộ môi sinh Bắc Tháp Mười và rừng phòng
hộ Phú Cường) và rừng sản xuất 4.619,6 ha
Rừng tràm chiếm phần lớn diện tích, phân bố xen giữa đất sản xuất nông nghiệp và tiếp giáp khu dân cư, nên người dân thường xuyên xâm nhập trái phép rừng săn bắt, bẫy động vật hoang dã, đánh bắt thủy sản, lấy củi, khai thác mật ong Về mùa khô, mực nước xuống thấp, không khí khô hanh thường chảy ra cháy do người dân xâm nhập vào rừng gây ra
1.1.4.7 Hạn hán
Tình trạng khô hạn nghiêm trọng trong mùa khô tại Đồng Tháp Nguyên nhân chủ yếu là do mực nước trên kênh rạch xuống thấp hơn trung bình nhiều năm từ 0,20-0,45m, lượng mưa từ tháng I-IV không đáng kể, không khí khô hanh và kinh phí nạo vét kênh rạch bị bồi lắng cạn kiệt hạn chế, gây nên tình trạng thiếu nước trong sản xuất và sinh hoạt của nhân dân, đặc biệt ở các vùng sâu, vùng xa
1.1.4.8 Bão và áp thấp nhiệt đới
Tỉnh Đồng Tháp nằm sâu trong lục địa ít bị ảnh hưởng trực tiếp của bão
và ATNĐ, nhưng cũng bị ảnh hưởng của hoàn lưu những cơn bão và ATNĐ
Trang 27đổ bộ vào các tỉnh Nam Trung Bộ và Nam Bộ, trong thời gian bão và ATNĐ thường có mạnh, dông lốc xoáy, mfưa to trên diện rộng Tuy nhiên, ngày 04/12/2006 bão số 9 (Bão Durian) đổ bộ đồng bằng sông Cửu Long và đi qua khu vực các huyện phía Nam tỉnh với sức gió cấp 8, 9 làm sập và tốc mái hư hỏng nặng 437 căn nhà, 26 phòng học, 4 trụ sở cơ quan và gây đổ ngã 6,7 ha vườn cây ăn trái, đây là điều hiếm thấy trong mấy chục năm qua tại tỉnh Đồng Tháp
1.1.5 Dân số
Tính đến ngày 1 tháng 4 năm 2019, dân số toàn tỉnh Đồng Tháp đạt 1.599.504 người, mật độ dân số đạt 495 người/km² Trong đó dân số sống tại thành thị đạt 290.201 người, chiếm 18,1% dân số toàn tỉnh, dân số sống tại nông thôn đạt 1.309.303 người, chiếm 81,9% dân số Dân số nam đạt 799.230 người, trong khi đó nữ đạt 800.274 người Tỷ lệ tăng tự nhiên dân số phân theo địa phương giảm 0,41 ‰ Tỷ lệ đô thị hóa tính đến năm 2022 đạt 38%
1.1.6 Kinh tế - xã hội
Tình hình kinh tế - xã hội 9 tháng đầu năm 2022 tiếp tục phục hồi và phát triển, dịch bệnh Covid-19 tiếp tục được kiểm soát tốt, hầu hết chỉ tiêu trong tháng đều tăng trưởng so với cùng kỳ năm 2021, các tác động của chính sách, giải pháp phục hồi kinh tế - xã hội ngày càng mạnh mẽ hơn Kinh tế chuyển biến tích cực với mức tăng trưởng cao trong Quý II và Quý III (GRDP lần lượt tăng 7,85% và 18,99%) Tốc độ tăng trưởng kinh tế (GRDP) 9 tháng năm 2022 ước đạt 9,37% xếp thứ 6/13 tỉnh, thành phố vùng đồng bằng sông Cửu Long Trong đó:
- Trên lĩnh vực sản xuất nông nghiệp, nông thôn, xu hướng chuyển đổi canh tác lúa kém hiệu quả sang cây ăn trái tiếp tục lan rộng Tình hình tiêu thụ thuỷ sản ổn định, tăng trưởng tốt, chăn nuôi phục hồi đã duy trì mức tăng
Trang 28trưởng khá Nông thôn mới và Chương trình OCOP tiếp tục đạt được kết quả tích cực
- Môi trường đầu tư kinh doanh thuận lợi, năng lực sản xuất công nghiệp gia tăng tạo ra nguồn cung hàng hóa và nguyên liệu khá dồi dào đáp ứng nhu cầu thị trường Việc triển khai kịp thời các chính sách hỗ trợ lãi suất, miễn giảm thuế giá trị gia tăng cho doanh nghiệp, hỗ trợ thuê nhà cho người lao động… từ Chương trình phục hồi và phát triển kinh tế xã hội, đã giúp cho các hoạt động sản xuất, kinh doanh tiếp tục chuyển biến tích cực, khởi sắc
- Các chính sách an sinh xã hội, chăm lo người có công và các đối tượng chính sách được quan tâm thực hiện, đời sống vật chất và tinh thần của người dân từng bước khôi phục và nâng lên, số người được giải quyết việc làm gia tăng
- Chất lượng giáo dục các cấp học cơ bản được đảm bảo Các chỉ tiêu văn hóa, xã hội, môi trường được chú trọng thực hiện, đạt kết quả nhất định, đặc biệt đã tổ chức thành công nhiều sự kiện quan trọng của tỉnh giúp hoạt động
du lịch khôi phục nhanh, công tác quảng bá hình ảnh, con người Đồng Tháp tiếp tục có nhiều bước tiến mới
Trang 291.2 Tổng quan về phương pháp dự báo
Mô hình dự báo chuỗi thời gian là một lớp mô hình quan trọng trong thống kê, kinh tế lượng và machine learning Sở dĩ chúng ta gọi lớp mô hình này là chuỗi thời gian là vì mô hình được áp dụng trên các chuỗi đặc thù có yếu tố thời gian
Dự báo chuỗi thời gian rất khó Không giống như các vấn đề đơn giản về phân loại và hồi quy, các vấn đề về chuỗi thời gian làm tăng thêm sự phức tạp của thứ tự hoặc sự phụ thuộc vào thời gian giữa các lần quan sát Điều này có thể khó khăn vì cần phải xử lý chuyên biệt dữ liệu khi điều chỉnh và đánh giá các mô hình Cấu trúc thời gian này cũng có thể hỗ trợ trong việc lập mô hình, cung cấp cấu trúc bổ sung như xu hướng và tính thời vụ có thể được tận dụng
để cải thiện kỹ năng mô hình
Phương pháp học máy có thể hiệu quả đối với các vấn đề dự báo chuỗi thời gian phức tạp hơn với nhiều biến đầu vào, các mối quan hệ phi tuyến phức tạp và dữ liệu bị thiếu Để hoạt động tốt, các phương pháp này thường yêu cầu các tính năng được kiểm tra bằng tay được chuẩn bị bởi các chuyên gia lĩnh vực hoặc những người thực hành có kiến thức nền tảng về xử lý tín hiệu
Một số nghiên cứu ngoài nước về máy học
Trong các nghiên cứu, phát triển và ứng dụng AI hay máy học là một khái niệm thường xuyên được sử dụng đến ML là một lĩnh vực con của AI Nguyên tắc cốt lõi của ML là các máy tiếp nhận dữ liệu và tự học ML là một phương pháp phân tích dữ liệu mà sẽ tự động hóa việc xây dựng mô hình phân tích Sử dụng các thuật toán lặp để học từ dữ liệu, ML cho phép máy tính tìm thấy những thông tin giá trị ẩn sâu mà không được lập trình một cách
rõ ràng nơi để tìm Khía cạnh lặp lại của ML là quan trọng bởi vì khi các mô
Trang 30hình này được tiếp xúc với dữ liệu mới thì chúng có thể thích ứng một cách độc lập Chúng học từ các tính toán trước đó để tạo ra những quyết định cũng như kết quả lặp lại và đáng tin cậy
Trong ML các thuật toán được chia làm hai nhóm chính là Supervised learning (học có giám sát) và Unsupervised learning (học không có giám sát) Các nhóm thuật toán này được áp dụng vào các bài toán phân loại (classification) và hồi quy (regression) khác nhau (Hình 4) Trong lĩnh vực tài nguyên nước nói chung, và dự báo lưu lượng dòng chảy nói riêng, các thuật toán ML được sử dụng hầu hết nằm trong nhóm hồi quy
Hình 4: Tổng quan về ML (nguồn researchgate.net)
Trang 31Trong những năm gần đây nhiều mô hình, phương pháp được đề xuất để cải thiện kết quả, tăng độ chính xác cho dự báo dữ liệu chuỗi thời gian nhưng nhìn chung các mô hình, phương pháp dự báo dữ liệu chuỗi thời gian tập trung vào các hướng nghiên cứu chính là:
- Các mô hình dự báo dựa trên các mô hình xác suất, thống kê như mô hình hồi quy (Auto Regression - AR), mô hình trung bình động (Moving Average - MA), mô hình tự hồi quy và trung bình động (Auto Regression Move Average - ARMA), mô hình tự hồi quy kết hợp với trung bình động (Auto Regression Integrated Move Average-ARIMA) [15,21]
- Hướng nghiên cứu thứ hai trong khai thác dữ liệu là hướng nghiên cứu tập trung vào các mô hình máy học (Machine Learning) như mô hình mạng neural (Neural Network) [19], thuật giải SVM/SVR (Support Vector Machine/ Regression)
- Một hướng nghiên cứu khác có nền tảng dựa trên lý thuyết logic mờ của Lotfi Zadeh, đó là các phương pháp dự báo trên chuỗi thời gian mờ [5] Ngay từ đầu mô hình ARIMA đã được sử dụng phổ biến trong nhiều lĩnh vực như thống kê, ước lượng và dự báo (Thomas, 1983), cũng như dự báo dòng chảy (Adamowski và nnk, 2012; Samir và nnk, 2012) vì người ta nhận thấy mô hình có nhiều ưu điểm (Box, 1970; Jarrett, 1991) Tính chính xác cao khi dự báo đồng thời loại bỏ được hiện tượng đa cộng tuyến trong mô hình là
ưu điểm lớn nhất của ARIMA
Trong các bài toán về mô phỏng, dự báo dòng chảy, các mô hình trí tuệ nhân tạo như Artificial Neural Network (ANN) đã được ứng dụng từ những năm 90 [12,16] Nhưng những năm trở lại đây, với tiến bộ vượt bậc của các ngành khoa học máy tính cùng với sự quan tâm của cộng đồng khoa học tới các vấn đề liên quan đến dữ liệu lớn (big data), các mô hình trí tuệ nhân tạo, máy học ngày càng được sử dụng rộng rãi hơn và đa dạng hơn Các thuật toán
Trang 32ANN, Random Forest (RF) và Support Vector Machine (SVM) là ba thuật toán ML được sử dụng khá rộng rãi trong các nghiên cứu về dự báo dòng chảy [17] SVM, một thuật toán học máy có giám sát được đề xuất bởi Vapnik (1963), là một mô hình được sử dụng phổ biến trong dự báo dòng chảy Mô hình này cho thấy tiềm năng cao trong dự báo dòng chảy ngắn hạn
và dài hạn [4,15] Khi so sánh với các phương pháp khác, mô hình SVM với các biến thể LS-SVR hay SVR cho kết quả tốt hơn và cho thấy khả năng dự báo dòng chảy chính xác với nhiều loại dữ liệu khác nhau [2,3]
Asefa và nnk (2006) đã sử dụng cách tiếp cận SVM để dự báo dòng chảy vào hồ, thí điểm tại lưu vực sông Sevier, bang Utah, Mỹ Nghiên cứu thực hiện dự báo dòng chảy ở hai khung thời gian là ngắn hạn và dài hạn: dòng chảy theo giờ và dòng chảy theo mùa Các kết quả thu được cho thấy tiềm năng cao của mô hình SVM trong dự báo dòng chảy ngắn hạn và dài hạn cho các khu vực nhất định Ngoài ra, việc sử dụng SVM cũng yêu cầu ít số liệu khí tượng thủy văn hơn so với mô hình vật lý truyền thống Theo nhóm nghiên cứu, dự báo lượng dòng chảy theo mùa đã được cải thiện đáng kể bằng việc tích hợp các chỉ số hoàn lưu khí quyển (atmospheric circulation indicators), đặc biệt là North Pacific Sea Surface Temperature Anomalies (SSTA)
Londhe và Gavraskar (2018) ứng dụng phương pháp Least Square Support Vector Regression (LS-SVR) để dự báo dòng chảy trước một ngày sử dụng các số liệu mưa, dòng chảy tại hai trạm đo Nighoje, Budhwad ở lưu vực sông Krishma và trạm đo Mandaleshwar ở lưu vực sông Narmada, Ản Độ Dữ liệu đầu vào được xử lý bằng các phương pháp thông tin trung bình chung (Average Mutual Information - AMI), phân tích tương quan (Correlation analysis) và thử sai (trial and errors) Nhóm tác giả đã xây dựng 1248 mô hình thông qua việc kết hợp các kernel và cách sắp xếp dữ liệu đầu vào khác nhau
Trang 33Bên cạnh đó, việc sử dụng độ dài dữ liệu đầu vào khác nhau cũng được nhóm tác giả thử nghiệm Kết quả cho thấy, RBF kernel có kết quả mô phỏng tốt nhất trong số các kernel SVR được thử nghiệm, và từ các thông số thống kê,
mô hình SVR cũng cho thấy tiềm năng trong việc dự báo dòng chảy tại các lưu vực trong nghiên cứu mặc dù mô hình này vẫn còn hạn chế trong việc dự báo đỉnh do sự dao động lớn trong diễn biến dòng chảy tại các lưu vực Khi lựa chọn dữ liệu đầu vào cho mô hình, phương pháp AMI thường cho kết quả tốt hơn rất nhiều so với các phương pháp khác
Việc áp dụng mô hình SVM/SVR cho dự báo dòng chảy, dòng xả lũ của
hồ cũng được nghiên cứu ở trên nhiều lưu vực ở Trung Quốc ví dụ như nghiên cứu của Lin et al., (2006) về dự báo dòng xả thời đoạn dài của hồ thủy điện Manwan; Hay nghiên cứu của Guo và nnk (2011) về dự báo dòng chảy tới khu vực đập Tam Hiệp trên sông Dương Tử [22] Các nghiên cứu này đều đưa ra kết luận rằng mô hình SVR có khả năng dự báo chính xác dòng chảy, đặc biệt là khi áp dụng các biện pháp làm giảm nhiễu số liệu đầu vào Ngoài
ra, khi so sánh với một số các phương pháp khác, mô hình SVR/SVM cũng cho kết quả tốt hơn (Maity và nnk 2010; Rafidah và Suhaila, 2013)
Từ tổng quan các nghiên cứu trên thế giới, có thể thấy mô hình AI/ML đang rất được quan tâm và ứng dụng bởi nhiều nhà khoa học trong lĩnh vực tài nguyên nước trên thế giới Các nghiên cứu đã áp dụng rất nhiều các mô hình, thuật toán khác nhau và đều cho kết quả khả quan nhất Điều này mang lại nhiều sự lựa chọn cho các nghiên cứu tương tự ở các lưu vực khác nói chung hay ở Việt Nam nói riêng Có thể thấy SVR và ARIMA là hai mô hình
ML có khả năng dự báo dòng chảy có độ chính xác cao
Các nghiên cứu trong nước
Xây dựng các phương án nhận định hạn dài đỉnh lũ năm các sông chính
ở Việt Nam (TS Nguyễn Lan Châu-2001) Đề tài đã xây dựng được công
Trang 34nghệ dự báo đỉnh lũ tại 22 trạm chính trên các sông Hồng, sông Mã, Cả, La, Gianh, Thạch Hãn, Hương, Thu Bồn, Trà Khúc, Kôn, Đà Rằng, Tiền, Hậu dựa trên các phương pháp hồi từng bước, thống kê khách quan, nhận dạng với các yếu tố mưa, nhiệt độ, bốc hơi, ENSO, áp cao Thái Bình Dương… Mô hình đang được ứng dụng tại Phòng Dự báo Thủy văn Bắc Bộ, Trung tâm Dự báo Khí tượng Thủy văn Trung ương Nhưng nhược điểm của đề tài là chưa
có công nghệ dự báo dòng chảy tháng, dòng chảy nhỏ nhất, đánh giá tiềm năng tài nguyên nước
“Nghiên cứu dự báo lũ trung hạn lưu vực sông Cả” của nhóm nghiên cứu NCS Hoàng Thanh Tùng, PGS.TS Vũ Minh Cát, GS Robeto Ranzi, KS Trương Tùng Hoa, trong nghiên cứu đã lựa chọn các mô hình lai ghép giữa tất định và ngẫu nhiên như HEC-HMS lai ghép với ARIMA(p,d,q) và EANN (mô hình mạng nơ ron theo thuyết tiến hóa) lai ghép với ARIMA(p,d,q) để xây dựng phương án dự báo lũ trung hạn phù hợp cho lưu vực sông Cả Việc lai ghép các mô hình trên cho phép tận dụng được những ưu điểm của các phương pháp dự báo trung hạn truyền thống với các phương pháp hiện đại Kết quả áp dụng cho lưu vực sông Cả là khá tốt và hoàn toàn có thể mở rộng
để áp dụng cho các lưu vực sông khác ở Miền Trung
Năm 2017, Trịnh Thu Phương đã thực hiện đề tài cấp Bộ về “Nghiên cứu công nghệ nhận định lũ lớn và dòng chảy mùa cạn trên lưu vực sông Hồng nhằm nâng cao hiệu quả vận hành liên hồ chứa” Kết quả đạt được: Đề tài đã xây dựng được bộ công cụ nhận dạng lũ lớn đến hồ trước 5, 10 ngày
Sử dụng mô hình mạng thần kinh nhân tạo ANN và mô hình hồi quy trên môi trường Matlab theo thời hạn trước 5, 10 ngày (đối với lũ) dự báo 1 tháng, 3 tháng Đề tài này đã tính toán dòng chảy đến hồ chứa lớn trên lưu vực sông Hồng, với kết quả dự báo thử nghiệm dự báo lũ và dòng chảy mùa cạn theo
Trang 35thời hạn vừa 5-10 ngày bằng mơ hình NAM từ năm 2015-2016 tị các vị trí phổ biến đều cho mức sai số từ 10-20% về tổng lượng nước và đỉnh lũ
Các nghiên cứu về dự báo dịng chảy ở Việt Nam chủ yếu áp dụng các
mơ hình vật lý truyền thống Các mơ hình sử dụng trí tuệ nhân tạo chỉ dừng lại ở áp dụng mạng thần kinh nhân tạo ANN, chứ chưa áp dụng các thuật tốn mới Vì vậy, việc áp dụng các thuật tốn hay mơ hình trí tuệ nhân tạo mới hứa hẹn sẽ mang lại một cách tiếp cận mới cho bài tốn dự báo dịng chảy ở nước
ta
Nhận xét: Từ tổng quan nghiên cứu ngồi nước ta nhận thấy rằng mơ hình SVR và ARIMA là hai mơ hình ML cĩ khả năng dự báo dịng chảy tốt, cho kết quả tối ưu và cĩ thể áp dụng được ở Việt Nam
Ngồi ra trong luận văn này tác giả cịn sử dụng thuật tốn Nạve (Nạve model) lập ra để làm cơ sở đối sánh với các mơ hình học máy khác được xây dựng
Mơ hình Nạve là các mơ hình đơn giản sử dụng số liệu quan sát trước
đĩ để dự báo mà khơng cĩ bất kỳ thay đổi nào
Chính vì vậy luận văn này đã sử dụng các thuật tốn: ARIMA, Nạve model và SVR để xây dựng các mơ hình máy học phục vụ dự báo mực nước trạm thủy văn Cao Lãnh tỉnh Đồng Tháp
Trang 36Chương 2 CƠ SỞ LÝ THUYẾT CÁC MÔ HÌNH MÁY HỌC
2.1 Sơ đồ nghiên cứu và chiến lược dự báo
Sơ đồ nghiên cứu
Việc xây dựng các mô hình máy học để dự báo mực nước trạm thủy văn Cao Lãnh, tỉnh Đồng Tháp được thể hiện rõ ở sơ đồ dưới đây:
Hình 5: Sơ đồ nghiên cứu
Chiến lược dự báo
Trong luận văn này tác giả sử dụng chiến lược dự báo nhiều bước về dòng thời gian để xây dựng các mô hình máy học
Việc dự báo chuỗi thời gian nhiều bước bao gồm dự đoán các giá trị H tiếp theo [𝑦𝑁+1, … , 𝑦𝑁+𝐻] của chuỗi thời gian lịch sử [𝑦1, … , 𝑦𝑁] bao gồm N các quan sát, trong đó H > 1 biểu thị bước tiếp theo
Trang 37Tác giả sử dụng một ký hiệu chung với f và F biểu thị sự phụ thuộc hàm
số giữa các quan trắc trong quá khứ và tương lai, d biểu thị thứ nguyên nhúng của chuỗi thời gian và w biểu thị thuật ngữ bao gồm lỗi mô hình hóa, nhiễu Trong luận văn này tác giả sử dụng chiến lược lặp đi lặp lại để dự báo mực nước trạm thủy văn Cao Lãnh, tỉnh Đồng Tháp
Chiến lược lặp đi lặp lại
Chiến lược dự báo lâu đời nhất và trực quan nhất là chiến lược Lặp lại (còn gọi là chiến lược Đệ quy) ([7], [8], [19], [20]) Trong chiến lược này, một mô hình duy nhất f được đào tạo để thực hiện dự báo trước một bước, tức là:
𝑦𝑡+1 = 𝑓(𝑦𝑡, … , 𝑦𝑡−𝑑+1) + 𝑤 Với 𝑡 ∈ {𝑑, … , 𝑁 − 1}, khi dự báo H bước trước, trước hết ta dự báo bước đầu bằng cách áp dụng mô hình Sau đó, tác giả sử dụng giá trị vừa được dự báo như một phần của các biến đầu vào để dự báo cho các bước tiếp theo (sử dụng cùng một mô hình đi trước một bước Tác giả tiếp tục sử dụng cách này cho đến khi đã dự báo toàn bộ bước thời gian dự báo
Đặt mô hình đi trước một bước được đào tạo là 𝑓̂ Sau đó, các dự báo được đưa ra bởi:
Trang 38Hình 6: Cấu trúc của chiến lược lặp lại để dự báo trước nhiều bước Mối quan tâm chính của chiến lược lặp lại là liệu nĩ cĩ thể tạo ra một chuỗi các dự đốn thành cơng để ngăn lỗi lan truyền hay khơng Hình 6 cho
thấy cấu trúc của chiến lược lặp đi lặp lại để dự báo trước nhiều bước
2.2 Mơ hình Nạve
Một dự báo đơn giản bao gồm việc sử dụng quan sát trước đĩ trực tiếp làm dự báo mà khơng cĩ bất kỳ thay đổi nào Nĩ thường được gọi là dự báo bền vững vì quan sát trước đĩ vẫn tồn tại Cách tiếp cận đơn giản này cĩ thể được điều chỉnh một chút đối với dữ liệu theo mùa Trong trường hợp này, việc quan sát tại cùng thời điểm trong chu kỳ trước đĩ cĩ thể được duy trì Điều này cĩ thể được tổng quát hĩa hơn nữa để kiểm tra từng phần bù đắp cĩ thể cĩ vào dữ liệu lịch sử cĩ thể được sử dụng để duy trì một giá trị cho một
dự báo [23]
Mơ hình Nạve cĩ thể phân thành hai nhĩm Một nhĩm bao gồm các mơ hình chiếu đơn giản Các mơ hình này yêu cầu đầu vào của dữ liệu từ quan sát gần đây, nhưng khơng cĩ phân tích thống kê nào được thực hiện Nhĩm thứ hai được tạo thành từ các mơ hình tuy đơn giản nhưng lại đủ phức tạp để yêu
Trang 39cầu máy tính Các phương pháp truyền thống như mơ hình phân rã cổ điển, trung bình động và làm mịn theo cấp số nhân là một số ví dụ
Ưu điểm của mơ hình Nạve là khơng tốn kém để phát triển, lưu trữ dữ liệu và vận hành
Nhược điểm là nĩ khơng xem xét bất kỳ các yếu tố nào làm cơ sở cho biến dự báo
Ví dụ với chuỗi mực nước quan trắc thực tế của kỳ hiện tại làm dự báo cho kỳ tiếp theo Mơ hình Nạve cĩ dạng
𝑌′𝑡+1 = 𝑌𝑡 (2.2.1) Trong đĩ 𝑦𝑡 là giá trị mực nước quan trắc thực tế; 𝑌′𝑡+1 là giá trị mực nước dự báo
Và nếu chuỗi mực nước cĩ xu hướng thì phương trình (2.2.1) trở thành
𝑌′𝑡+1 = 𝑌𝑡+ (𝑌𝑡− 𝑌𝑡−1)
2.3 Mơ hình tự hồi quy trung bình trượt (ARIMA)
Mơ hình ARIMA là một loại mơ hình thống kê để phân tích và dự báo
dữ liệu chuỗi thời gian ARIMA là từ viết tắt của AutoRegressive Integrated Moving Average Nĩ là sự tổng quát của đường trung bình động tự động hồi quy hoặc ARMA đơn giản hơn và thêm vào khái niệm tích hợp Từ viết tắt này mang tính mơ tả, nắm bắt các khía cạnh chính của chính mơ hình Tĩm lại, chúng là:
Auto regression: Kí hiệu là AR Đây là thành phần tự hồi qui bao gồm tợp hợp các độ trễ của biến hiện tại Độ trễ bậc 𝑝 chính là giá trị lùi về quá khứ 𝑝 bước thời gian của chuỗi Độ trễ dài hoặc ngắn trong quá trình AR phụ thuộc vào tham số trễ 𝑝 Cụ thể, quá trình AR(𝑝) của chuỗi 𝑦𝑡 được biểu diễn như bên dưới [13,14]:
𝐴𝑅(𝑝) = 𝜙0 + 𝜙1𝑥𝑡−1 + 𝜙2𝑥𝑡−2 + ⋯ + 𝜙𝑝𝑥𝑡−𝑝
Trang 40Trong đó: 𝑝 là độ trễ
𝜙 là hằng số
Intergrated: Kí hiệu là I Là quá trình đồng tích hợp hoặc lấy sai phân Yêu cầu chung của các thuật toán trong chuỗi thời gian là chuỗi phải đảm bảo tính dừng Hầu hết các chuỗi đều tăng hoặc giảm theo thời gian Do đó yếu tố tương quan giữa chúng chưa chắc là thực sự mà là do chúng cùng tương quan theo thời gian Khi biến đổi sang chuỗi dừng, các nhân tố ảnh hưởng thời gian được loại bỏ và chuỗi sẽ dễ dự báo hơn Để tạo thành chuỗi dừng, một phương pháp đơn giản nhất là lấy sai phân Một số chuỗi tài chính còn qui đổi sang logarit hoặc lợi suất Bậc của sai phân để tạo thành chuỗi dừng còn gọi là bậc của quá trình đồng tích hợp (order of intergration) Quá trình sai phân bậc
𝑑 của chuỗi được thực hiện như sau [13,14]:
Moving average: ký hiệu là MA, quá trình trung bình trượt được hiểu là quá trình dịch chuyển hoặc thay đổi giá trị trung bình của chuổi theo thời gian Do chuỗi của tác giả được giả định là dừng nên quá trình thay đổi trung bình dường như là một chuỗi nhiễu trắng Qúa trình moving average sẽ tìm mối liên hệ về mặt tuyến tính giữa các phần tử ngẫu nhiên є𝑡 (stochastic