Xây dựng mô hình máy học phục vụ dự báo xâm nhập mặn tại trạm Đo mặn Đại ngãi, tỉnh sóc trăng Xây dựng mô hình máy học phục vụ dự báo xâm nhập mặn tại trạm Đo mặn Đại ngãi, tỉnh sóc trăng
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Nguyễn Công Thành
XÂY DỰNG MÔ HÌNH MÁY HỌC PHỤC VỤ DỰ BÁO
XÂM NHẬP MẶN TẠI TRẠM ĐO MẶN ĐẠI NGÃI, TỈNH SÓC TRĂNG
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – Năm 2022
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Nguyễn Công Thành
XÂY DỰNG MÔ HÌNH MÁY HỌC PHỤC VỤ DỰ BÁO
XÂM NHẬP MẶN TẠI TRẠM ĐO MẶN ĐẠI NGÃI, TỈNH SÓC TRĂNG
Chuyên ngành: Thủy văn học
Mã số: 80440224.01
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS.TS Nguyễn Tiền Giang
2 TS Nguyễn Hữu Duy
Hà Nội – Năm 2022
Trang 3i
MỤC LỤC
DANH MỤC BẢNG iii
DANH MỤC HÌNH iv
CHỮ VIẾT TẮT vi
LỜI CẢM ƠN vii
LỜI CAM ĐOAN viii
MỞ ĐẦU 1
CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP VÀ KHU VỰC NGHIÊN CỨU 3
1.1 Tổng quan phương pháp nghiên cứu 3
1.1.1 Dự báo thủy văn 3
1.1.2 Dự báo xâm nhập mặn 4
1.1.3 Dự báo chuỗi thời gian 8
1.1.4 Máy học 9
1.2 Tổng quan khu vực nghiên cứu 15
1.2.1 Vị trí địa lý 15
1.2.2 Điều kiện tự nhiên 17
1.2.3 Điều kiện xã hội 26
1.2.4 Tài nguyên thiên nhiên 28
1.2.5 Tác động của XNM, thiên tai và BĐKH trên địa bàn tỉnh 35
CHƯƠNG II: PHƯƠNG PHÁP VÀ DỮ LIỆU SỬ DỤNG 42
2.1 Tổng quan các thuật toán được sử dụng 42
2.2 Mô hình rừng ngẫu nhiên (Random Forest) 43
2.3 Mạng bộ nhớ dài-ngắn (Long-Short Term Memory) 48
Trang 4ii
2.4 Mô hình Bidirection LSTM (BiLSTM) 52
2.5 Phép biến đổi Wavelet rời rạc 53
2.6 Cơ sở dữ liệu 55
2.7 Sơ đồ cấu trúc nghiên cứu 56
CHƯƠNG III: XÂY DỰNG VÀ ĐÁNH GIÁ CÁC MÔ HÌNH 57
3.1 Xử lý dữ liệu 57
3.2 Xây dựng các mô hình máy học 61
3.2.1 Mô hình RF 61
3.2.2 Mô hình LSTM 62
3.2.3 Mô hình BiLSTM 63
3.3 Đánh giá các mô hình 65
3.3.1 Các chỉ số đánh giá 65
3.3.2 Đánh giá chất lượng dự báo của mô hình RF 67
3.3.3 Đánh giá chất lượng dự báo của mô hình LSTM 70
3.3.4 Đánh giá chất lượng dự báo của mô hình BiLSTM 73
KẾT LUẬN VÀ KIẾN NGHỊ 76
TÀI LIỆU THAM KHẢO 78
Trang 5iii
DANH MỤC BẢNG
Bảng 1 Thống kê các loại đất chính tỉnh Sóc Trăng 29
Bảng 2 Mức biến đổi nhiệt độ trung bình năm và theo mùa tại Sóc Trăng 40
Bảng 3 Mức biến đổi lƣợng mƣa năm và theo mùa (%) tại Sóc Trăng 40
Bảng 4 Chi tiết tập số liệu theo từng năm 57
Bảng 5 Ngƣỡng các siêu tham số tối ƣu cho mô hình RF 61
Bảng 6 Các siêu tham số đã đƣợc tối ƣu cho mô hình RF 62
Bảng 7 Ngƣỡng các siêu tham số sử dụng cho mô hình LSTM 62
Bảng 8 Các siêu tham số đã đƣợc tối ƣu cho mô hình LSTM 63
Bảng 9 Ngƣỡng các siêu tham số sử dụng cho mô hình BiLSTM 64
Bảng 10 Các siêu tham số đã đƣợc tối ƣu cho mô hình BiLSTM 64
Bảng 11 Tổng hợp chỉ số đánh giá của các mô hình ở quá trình huấn luyện 67
Bảng 12 Tổng hợp chỉ số đánh giá của các mô hình ở quá trình kiểm tra 67
Bảng 13 Sai số của mô hình RF ở các thời đoạn 70
Bảng 14 Sai số của mô hình LSTM ở các thời đoạn 72
Bảng 15 Sai số của mô hình BiLSTM ở các thời đoạn 75
Bảng 16 Sai số tuyệt đối của mô hình ở các thời đoạn 76
Bảng 17 Sai số của các mô hình theo phần trăm 76
Trang 6iv
DANH MỤC HÌNH
Hình 1 Phân loại các thuật toán trong ML 11
Hình 2 Quá trình xử lý thông tin trong RNN 14
Hình 3 Bản đồ hành chính tỉnh Sóc Trăng và vị trí nghiên cứu 16
Hình 4 Bản đồ địa hình tỉnh Sóc Trăng 18
Hình 5 Nhiệt độ trung bình tháng và số giờ nắng tỉnh Sóc Trăng năm 2020 21
Hình 6 Biểu đồ lượng mưa trung bình năm đo được tại các trạm quan trắc 23
Hình 7 Biểu lượng độ ẩm của tỉnh Sóc Trăng năm 2015 và 2020 24
Hình 8 Mực nước sông Hậu tại trạm quan trắc Đại Ngãi 26
Hình 9 Dân số tỉnh Sóc Trăng năm 2020 trong vùng ĐBSCL 27
Hình 10 Diễn biến diện tích rừng giai đoạn 2016-2020 tỉnh Sóc Trăng 32
Hình 11 Vùng ven biển Mê Công và các ngư trường đánh bắt xa bờ 33
Hình 12 Xâm nhập mặn ở ĐBSCL 38
Hình 13 Bản đồ nguy cơ ngập ứng với mực nước biển dâng 100 cm 41
Hình 14 Cấu trúc cây quyết định 44
Hình 15 Cấu trúc và sơ đồ hoạt động của mô hình rừng cây 46
Hình 16 Cấu trúc bên trong một nút mạng LSTM 48
Hình 17 Cell state của LSTM giống như băng chuyền 49
Hình 18 Cổng trạng thái LSTM 49
Hình 19 Tầng cổng quên (forget gate layer) 50
Hình 20 Tầng cổng vào (input gate layer) 51
Hình 21 Cập nhật trạng thái nhớ C tại thời điểm t 51
Hình 22 Xử lý thông tin đầu ra 52
Hình 23 Cấu trúc mạng BiLSTM 53
Hình 24 Phân tích đa phân giải sử dụng biến đổi wavelet rời rạc 54
Hình 25 Biểu đồ độ mặn cao nhất theo ngày tại trạm Đại Ngãi 56
Hình 26 Tập dữ liệu sau khi được biến đổi logarit hóa 58
Hình 27 Hàm biến đổi wavelet rời rạc 58
Trang 7v
Hình 28 Dữ liệu được cắt thành 2 nhóm: nhóm hệ số xấp xỉ (đồ thị trên cùng)
và nhóm hệ số chi tiết (2 đồ thị bên dưới) 59
Hình 29 Tín hiệu nhiễu được loại bỏ sau khi sử dụng phép biến đổi Wavelet rời rạc (500 mẫu cuối) 60
Hình 30 Xây dựng cấu trúc mô hình LSTM 62
Hình 31 Xây dựng cấu trúc mô hình BiLSTM 64
Hình 32 Kết quả của mô hình RF trong giai đoạn huấn luyện 68
Hình 33 Kết quả dự báo của mô hình RF trong giai đoạn kiểm tra 68
Hình 34 Kết quả dự báo của mô hình RF với thời đoạn 3 ngày 68
Hình 35 Kết quả dự báo của mô hình RF với thời đoạn 5 ngày 69
Hình 36 Kết quả dự báo của mô hình RF với thời đoạn 7 ngày 69
Hình 37 Kết quả của mô hình LSTM ở giai đoạn huấn luyện 70
Hình 38 Kết quả dự báo của mô hình LSTM ở giai đoạn kiểm tra 71
Hình 39 Kết quả dự báo của mô hình LSTM với thời đoạn 3 ngày 71
Hình 40 Kết quả dự báo của mô hình LSTM với thời đoạn 5 ngày 72
Hình 41 Kết quả dự báo của mô hình LSTM với thời đoạn 7 ngày 72
Hình 42 Kết quả của mô hình BiLSTM ở giai đoạn huấn luyện 73
Hình 43 Kết quả dự báo của mô hình BiLSTM ở giai đoạn kiểm tra 73
Hình 44 Kết quả dự báo của mô hình BiLSTM với thời đoạn 3 ngày 74
Hình 45 Kết quả dự báo của mô hình BiLSTM với thời đoạn 5 ngày 74
Hình 46 Kết quả dự báo của mô hình BiLSTM với thời đoạn 7 ngày 75
Trang 8ATNĐ Áp thấp nhiệt đới
ARIMA Autoregressive Intergrated Moving Average
RNN Recurrent neural network
LSTM Long-Short Term Memory
BiLSTM Bidirectional LSTM
WT Wavelet Transform
NSE Nash–Sutcliffe Efficiency
RMSE Root Mean Square Error
MAE Mean absolute error
Trang 9vii
LỜI CẢM ƠN
Lời đầu tiên, tôi xin trân trọng được gửi lời cảm ơn chân thành đến các thầy hướng dẫn: PGS.TS Nguyễn Tiền Giang và TS Nguyễn Hữu Duy đã tận tình giúp đỡ, hướng dẫn trong suốt quá trình thực hiện luận văn Nhờ những kiến thức, sự quan tâm và góp ý quý báu của các thầy đã giúp cho tôi có thể hoàn thành luận văn “Xây dựng mô hình máy học phục vụ dự báo xâm nhập mặn tại trạm đo mặn Đại Ngãi, tỉnh Sóc Trăng” cả về mặt nội dung và hình thức Các thầy cũng đã luôn quan tâm, động viên, nhắc nhở để em có thể hoàn thành đúng tiến độ
Tôi cũng vô cùng biết ơn các thầy cô, cán bộ trong Khoa Khí tượng, Thủy văn và Hải Dương học nói riêng và trong Trường Đại học Khoa học Tự nhiên, ĐHQGHN nói chung đã nhiệt tình giảng dạy, trau dồi kiến thức và tạo mọi điều kiện tốt nhất cho tôi trong suốt quá trình học tập
Tôi xin chân thành cảm ơn Lãnh đạo, cán bộ viên chức Đài Khí tượng Thủy văn khu vực Nam Bộ đã tạo điều kiện tốt nhất cho tôi
Luận văn này được sự hỗ trợ về mặt dữ liệu và phương pháp luận từ đề tài mã số ĐTĐL.CN–50/18 do Bộ Khoa học và Công nghệ tài trợ
Do hạn chế về kiến thức, kinh nghiệm, thời gian tìm hiểu và thực hiện nên luận văn chắc chắn còn nhiều thiếu sót, tôi rất mong sẽ nhận được nhiều ý kiến đóng góp của thầy, cô và các bạn để tôi có thể hoàn thiện hơn luận văn này
Tác giả
Nguyễn Công Thành
Trang 10viii
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu do cá nhân tôi thực hiện được sự hướng dẫn khoa học của PGS.TS Nguyễn Tiền Giang và TS Nguyễn Hữu Duy, không sao chép công trình nghiên cứu của người khác Các
số liệu, kết quả trong luận văn là trung thực và chưa từng được công bố trong bất kì một công trình khoa học nào khác
Các thông tin thứ cấp sử dụng trong luận văn có nguồn gốc rõ ràng, được trích dẫn đầy đủ, trung thực và đúng quy cách
Tôi hoàn toàn chịu trách nhiệm về tính xác thực và nguyên bản luận văn của mình
Tác giả
Nguyễn Công Thành
Trang 111
MỞ ĐẦU
Trong những năm gần đây, cùng với sự phát triển của phần cứng máy tính, các thuật toán máy học hay còn được biết đến với tên Machine Learning (ML), là một nhánh nhỏ của ngành Trí tuệ nhân tạo (Artificial Intelligence - AI), ngày càng được cải tiến có khả năng xử lý các nguồn dữ liệu lớn hơn, phức tạp hơn và hoàn thiện về tốc độ tính toán lẫn độ chính xác Máy học đang được
áp dụng vào rất nhiều lĩnh vực trong đời sống như công nghệ thông tin, tài chính, kinh doanh, khai phá dữ liệu và khí tượng thủy văn là một trong số đó
Lĩnh vực máy học được chia làm hai nhóm chính là học có giám sát (Supervised learning) và học không có giám sát (Unsupervised learning) được
áp dụng cho các bài toán phân loại (classification) và hồi quy (regression) Trong lĩnh vực dự báo thủy văn nói chung và dự báo xâm nhập mặn nói riêng thì các thuật toán máy học đa phần thuộc nhóm hồi quy
Cho đến nay, các nghiên cứu dự báo xâm nhập mặn thường sử dụng bộ
mô hình MIKE đã thu được các kết quả tương đối tốt [1, 3, 4, 5, 9] Tuy nhiên, các mô hình này cần dữ liệu đầu vào nhiều (dữ liệu địa hình, mặt cắt, công trình thủy lợi, ) Bên cạnh đó việc hiệu chỉnh kiểm định cũng rất phức tạp và yêu cầu năng lực tính toán lớn Với những hạn chế nêu trên, các mô hình dựa vào số liệu (data-driven models) đã được phát triển So với các mô hình tính toán dựa vào vật lý, các mô hình thống kê số liệu như ARIMA cũng đã được áp dụng nhiều vào bài toán dự báo xâm nhập mặn cho thấy hiệu suất tính toán cao hơn Tuy nhiên, hạn chế của mô hình này là dự báo trong thời đoạn ngắn và đối với chuỗi số liệu phi tuyến tính (nonlinearity) như độ mặn thì độ chính xác chưa cao [34] Một phương hướng tiếp cận mới nhằm khắc phục những nhược điểm trên
là các phương pháp máy học Các mô hình ML có khả năng xử lý chuỗi số liệu phức tạp, nhiễu và phi tuyến tính mà không đòi hỏi phải có sự hiểu biết về các quá trình vật lý ẩn đằng sau Bên cạnh đó, lượng dữ liệu đầu vào cho các mô
Trang 122
hình, khả năng tính toán, hiệu chỉnh và kiểm định cũng yêu cầu ở mức tối thiểu
đã mang lại những kết quả khả quan
Tại Đồng bằng sông Cửu Long (ĐBSCL), trong những năm gần đây, dưới tác động của việc xây dựng các đập thủy điện ở thượng nguồn sông Mê Công, chế độ dòng chảy trong hệ thống sông suối, kênh rạch tại ĐBSCL đã có những thay đổi Đồng thời, nước biển dâng do biến đổi khí hậu (BĐKH) tại các cửa sông Cửu Long, sự hạ thấp đáy sông do khai thác cát, sụt giảm bùn cát đến
do hồ chứa thượng nguồn trữ lại, gia tăng sử dụng nước nội vùng đã và đang làm xâm nhập mặn (XNM) ngày càng lấn sâu vào trong nội đồng ảnh hưởng lớn đến đời sống sinh hoạt và sản xuất của người dân Tỉnh Sóc Trăng cũng không nằm ngoài những ảnh hưởng đó Chính vì vậy, việc xây dựng mô hình máy học
để dự báo xâm nhập mặn tại trạm đo Đại Ngãi, tỉnh Sóc Trăng là nhu cầu rất cần thiết nhằm giảm thiểu những tác động tiêu cực do XNM gây ra
Trang 133
CHƯƠNG I: TỔNG QUAN VỀ PHƯƠNG PHÁP VÀ KHU VỰC
NGHIÊN CỨU
1.1 Tổng quan phương pháp nghiên cứu
1.1.1 Dự báo thủy văn
1.1.1.2 Phân loại dự báo thủy văn
Tuỳ theo tiêu chí đánh giá mà dự báo thủy văn được phân ra nhiều loại Căn cứ vào yếu tố dự báo, thời gian dự kiến, đối tượng phục vụ, tính chất của
dự báo hay khu vực dự báo thường phân dự báo thủy văn theo các cách sau:
a) Phân loại theo thời gian dự kiến:
- Dự báo hạn cực ngắn (1-6 giờ): dự báo, cảnh báo khẩn cấp các hiện tượng thủy văn nguy hiểm (lũ quét, lũ lưu vực nhỏ, )
- Dự báo thủy văn hạn ngắn: (ít hơn 5 ngày, tuỳ thuộc khu vực sông, ví
dụ các sông miền Bắc: Sông Hồng 48 giờ, các sông khác 24 giờ, các sông miền Trung 3-24 giờ, sông Cửu Long 3-5 ngày)
- Dự báo thủy văn hạn vừa (5-10 ngày) (hiện nay thường gọi là dự báo hạn ngắn mở rộng)
- Dự báo thủy văn hạn dài (t ≥ 1 tháng đến 1 năm)
Trang 144
- Dự báo thủy văn hạn siêu dài có thời gian dự báo trước trên 1 năm Thường loại này được sử dụng trong dự báo, nhận định về TNN theo các kịch bản BĐKH
b) Phân loại theo yếu tố dự báo: Ví dụ dự báo mực nước, lưu lượng, tổng
lượng lũ, mặn, triều, nước dâng do bão, Trong đó mực nước, lưu lượng, tổng lượng, độ mặn là yếu tố cần dự báo
c) Phân loại theo đối tượng phục vụ: Dự báo thủy văn phục vụ phòng
tránh thiên tai hoặc khai thác hồ chứa (thủy điện, nuôi trồng thủy sản, ), giao thông thuỷ, quốc phòng, xây dựng, tưới tiêu,
d) Phân loại theo khu vực được dự báo: Dự báo thủy văn cho các sông
miền núi, các sông vùng đồng bằng; Dự báo thủy văn tại một điểm (tại trạm); Lưu vực sông; Khu vực (Nam Bộ hay Tây Nguyên),
e) Phân loại theo tính chất dự báo: Dự báo định tính (Cao, Trung bình,
thấp, xu thế tăng, giảm của các đặc trưng thuỷ văn) và dự báo định lượng (có trị
có mưa và nước sông bị bốc hơi do nắng nóng khiến lượng nước ngọt không đủ đẩy, làm hiện tượng xâm nhập diễn ra Ngoài ra, còn có yếu tố gió chướng với triều cường làm mặn xâm nhập sâu và nồng độ cao
Trang 155
Một trong các lý do khác khiến mức độ xâm nhập mặn diễn ra với mức
độ nghiêm trọng là do việc xây dựng các công trình thủy lợi ở thượng nguồn được thực hiện dày đặc Ngoài ra có hiện tượng nóng lên toàn cầu tác động tiêu cực đến biến đổi khí hậu gây ra các thiên tai nước biển dâng cao, kéo theo hậu quả mức độ xâm nhập mặn diễn ra mạnh mẽ hơn
Trong dự báo, cảnh báo xâm nhập mặn bao gồm các yếu tố:
- Độ mặn cao nhất (lớn nhất)
- Thời gian xuất hiện độ mặn cao nhất
- Phạm vi chịu ảnh hưởng độ mặn 4‰ trở lên
Một số nghiên cứu về XNM trong nước và ngoài nước:
Trong thời gian gần đây, việc ứng dụng khoa học công nghệ trong giám sát và đánh giá xâm nhập mặn được các nhà khoa học trong nước tiến hành nghiên cứu dưới nhiều phương pháp khác nhau
Trên thế giới, ảnh hưởng của tình trạng XNM cũng là vấn đề được nhiều nhà khoa học quan tâm, nghiên cứu
Bingjun Liu và cộng sự đã áp dụng mạng thần kinh nhân tạo (ANN - artificial neural network) cùng phép biến đổi wavelet để dự báo độ mặn vùng cửa sông Châu Giang, tỉnh Quảng Đông, Trung Quốc [11] với các chỉ số đánh giá rất tốt Nghiên cứu đã áp dụng mô hình học máy để dự báo mặn hạn ngắn 1 – 3 ngày cho các chỉ số đánh giá RMSE và NSE tốt
Ngoài các thuật toán thống kê và máy học, ảnh viễn thám cũng đang được nghiên cứu ứng dụng rất nhiều trong đánh giá và dự báo XNM như: Nhóm ba tác giả Mahmoud A Abdelfattah, Shabbir A Shahid và Yasser R Othman đã tiến hành nghiên cứu ứng dụng công nghệ GIS (Hệ thống thông tin địa lý) và Viễn thám vào xây dựng mô hình thành lập bản đồ đất nhiễm mặn tại Abu Dhabi, Ả Rập [25] Sử dụng sản phẩm Viễn thám mà cụ thể là ảnh Landsat-7
Trang 166
ETM và mẫu đất thu thập dùng để xây dựng song song hai mô hình Kết quả so sánh thực tế có độ tin cậy là 91,2%, cho thấy khả năng ứng dụng kết hợp GIS và Viễn thám cho hiệu quả rất cao
Xâm nhập mặn có xu hướng ngày càng trầm trọng hơn là do rất nhiều nguyên nhân Nhóm tác giả Trần Quốc Đạt, Nguyễn Hiếu Trung và Kanchit Likitdecharote thuộc trường Đại học Cần Thơ và Đại học Chulalongkorn - Thái Lan [4] đã tiến hành nghiên cứu mô phỏng xâm nhập mặn đồng bằng sông Cửu Long dưới tác động của nước biển dâng và sự suy giảm lưu lượng nước từ thượng nguồn Trong nghiên cứu này, xâm nhập mặn ở đồng bằng sông Cửu Long được mô phỏng cho những kịch bản khác nhau của mực nước biển dâng
và lưu lượng thượng nguồn giảm bằng mô hình MIKE11 Mô hình được xây dựng dựa trên cở sỡ dữ liệu của hai năm 1998 và 2005 Kết quả mô phỏng xâm nhập mặn năm 1998 được chọn kịch gốc so sánh với bốn kịch bản xâm nhập mặn vào các năm 2020 và 2030 Bốn kịch bản này được xây dựng dựa trên kịch bản CRES B2, kịch bản tăng diện tích nông nghiệp và kịch bản diện tích nông nghiệp không đổi Hai kịch bản đầu là khi mực nước biển dâng 14 cm và lưu lượng thượng nguồn giảm 11% và 22% Kịch bản số ba và bốn là khi mực nước biển dâng 20cm và lưu lượng thượng nguồn giảm 15% Kết quả mô phỏng cho thấy rằng độ mặn 2,5g/l xâm nhập 14 km sâu hơn kịch bản gốc năm 1998 Ngoài ra xâm nhập mặn cũng tác động hầu hết các dự án ngăn mặn ở đồng bằng sông Cửu Long
Năm 2009, nhóm nghiên cứu thủy văn và môi trường gồm các chuyên gia Trần Ngọc Anh, Nguyễn Tiền Giang và cộng sự [1] thuộc trường Đại học khoa học tự nhiên, ĐHQGHN đã áp dụng mô hình MIKE 11 để đánh giá tình hình xâm nhập mặn trên hệ thống sông Bến Hải và Thạch Hãn cho kết quả tốt Việc hiệu chỉnh và kiểm định mô hình thủy lực và lan truyền chất được thực hiện với
bộ số liệu đo đạc quan trắc tháng 8 năm 2007 Để dự báo tính hình xâm nhập mặn đến năm 2020, các điều kiện biên được kết hợp giữa việc dự báo tình hình
Trang 177
sử dụng nước thượng nguồn kết hợp với các kịch bản nước biển dâng Kết quả
mô phỏng bằng mô hình cho thấy, đến năm 2020 mặn có thể xâm nhập khá sâu vào đồng bằng
Năm 2018, nhóm tác giả Đặng Văn Dũng, Trần Đình Phương, Lê Thị Oanh và Trần Thành Công thuộc Đài Khí tượng Thủy văn Nam bộ công bố nghiên cứu “Khai thác mô hình MIKE 11 trong dự báo, cảnh báo xâm nhập mặn vùng Đồng bằng sông Cửu Long” [3] Nghiên cứu đã xây dựng được bộ công
cụ dự báo XNM theo độ mặn cao nhất, thấp nhất và trung bình, thống kê diễn biến mặn phục vụ sinh hoạt và tưới nước nông nghiệp
Trong nghiên cứu “Xây dựng mô hình MIKE 11 phục vụ công tác dự báo thủy văn và xâm nhập mặn tỉnh Bến Tre” (Đặng Hoàng Lam, Nguyễn Huy Phương, Nguyễn Đình Đạt, Nguyễn Tiền Giang, 2022) [5] cũng đã ứng dụng
mô hình MIKE 11 vào dự báo XNM cho các kết quả đánh giá tham khảo tốt, hỗ trợ công tác dự báo của Đài Khí tượng Thủy văn tỉnh Bến Tre góp phần giảm thiểu tối đa thiệt hại do triều cường và xâm nhập mặn gây ra cho tỉnh
Bên cạnh mô hình MIKE thì phương pháp dự báo XNM bằng mô hình ARIMA (Autoregressive Integrated Moving Average) cũng được áp dụng rộng rãi Điển hình gần đây là nghiên cứu “Performance evaluation of Auto-Regressive Integrated Moving Average models for forecasting saltwater intrusion into Mekong river estuaries of Vietnam” (Trần Thành Thái và cộng sự, 2021) [7] ứng dụng mô hình ARIMA vào việc dự báo XNM trên các cửa sông chính sông Cửu Long Với dữ liệu độ mặn đo được tại 12 trạm từ 2012 đến
2020, nghiên cứu đã dự báo và xây dựng bản đồ dự báo XNM tại tỉnh Bến Tre
Gần đây, là nghiên cứu của nhóm nhà khoa học Nguyễn Tiền Giang, Trần Ngọc Anh, Nguyễn Hữu Duy và các cộng sự (Trường Đại học khoa học tự nhiên Đại học quốc gia Hà Nội) [17] trong việc ứng dụng máy học và ảnh viễn thám vào dự báo XNM ở những vùng thiếu dữ liệu quan trắc ở vùng ĐBSCL
Trang 188
Các nhà khoa học đã thành lập được bản đồ thể hiện mức độ mặn của đất đưa hướng tiếp cận mới để quản lý đánh giá tình hình XNM bao quát hơn
1.1.3 Dự báo chuỗi thời gian
Chuỗi thời gian (time series) trong thống kê, xử lý tín hiệu, kinh tế lượng
và toán tài chính, khí tượng thủy văn là một chuỗi các điểm dữ liệu, được đo theo từng khoảng khắc thời gian liền nhau theo một tần suất thời gian thống nhất
Chuỗi thời gian bao gồm một số đặc trưng chính, có thể kể đến:
- Xu hướng dài hạn: Xu hướng dài hạn là hướng tổng thể chung của dữ liệu thu được khi bỏ qua bất kỳ tác động ngắn hạn nào như biến động theo mùa hoặc nhiễu
- Tính thời vụ: Tính thời vụ đề cập đến các biến động định kỳ được lặp lại trong tất cả các khoảng thời gian
- Tính dừng: Tính dừng là một đặc tính quan trọng của chuỗi thời gian Chuỗi thời gian được cho là cố định nếu giá trị trung bình, phương sai
và hiệp phương sai của nó không thay đổi đáng kể theo thời gian
- Nhiễu: Mọi tập dữ liệu đều có nhiễu, điều đó đề cập đến các dao động hoặc biến thể ngẫu nhiên do các yếu tố không thể kiểm soát gây nên
- Tự tương quan: Đây là mối tương quan giữa chuỗi thời gian và phiên bản trễ của chính nó Tự tương quan được sử dụng để xác định tính thời vụ và xu hướng trong dữ liệu chuỗi thời gian
Ưu điểm của chuỗi thời gian là nó có thể lưu trữ được trạng thái của một trường dữ liệu theo thời gian
Trang 19Cho đến nay, nhiều mô hình, phương pháp được đề xuất để cải thiện kết quả, tăng độ chính xác trong dự báo XMN như:
Mô hình tính toán dựa vào vật lý: Các mô hình này được xây dựng để mô phỏng đặc tính vật lý và các quá trình thủy văn, rất hữu ích cho các nhà khoa học trong việc giải thích được toàn bộ quá trình ẩn đằng sau [35], nên các mô hình loại này được áp dụng khá rộng rãi ở nhiều khu vực trên thế giới (phổ biến
là bộ mô hình MIKE) Tuy nhiên, việc sử dụng các mô hình này thường yêu cầu một lượng dữ liệu lớn về dữ liệu (đặc biệt là việc cập nhật dữ liệu địa hình, mặt cắt, công trình thủy lợi ), bên cạnh nó việc hiệu chỉnh và kiểm định mô hình cũng rất phức tạp, đòi hỏi nhiều thời gian và kinh nghiệm của người chạy mô hình Vì vậy, khả năng áp dụng loại mô hình này ở nhiều khu vực và trong các bài toán dự báo thời đoạn ngắn vẫn còn bị hạn chế [28]
Bên cạnh các mô hình tính toán dựa vào vật lý, các mô hình thống kê dựa trên chuỗi thời gian như ARMA, ARIMA cũng được sử dụng nhiều trong các bài toán dự báo chuỗi số liệu [34] So với các mô hình tính toán dựa vào vật lý, các mô hình thống kê cho thấy hiệu quả cao hơn nếu xét về thời gian tính toán
và sự khái quát hóa các quá trình Mặc dù cũng đã đạt được một số kết quả khả quan nhưng đối với dự báo thời đoạn ngắn thì độ chính xác chưa cao Bên cạnh
đó là sự phức tạp trong việc sử dụng cũng là những nhược điểm
Trang 2010
Những hạn chế của các mô hình truyền thống nêu trên đã khuyến khích
sự phát triển của các mô hình dựa vào số liệu (data-driven models), mà phổ biến nhất gần đây có thể kể đến là phương pháp máy học (Machine Learning - ML) Các mô hình ML là công cụ tiềm năng trong việc dự báo dòng chảy do các mô hình này có thể được xây dựng nhanh chóng, dễ dàng, không đòi hỏi phải có sự hiểu biết về các quá trình vật lý ẩn đằng sau Ngoài ra, lượng dữ liệu yêu cầu tối thiểu, cùng với khả năng tính toán, hiệu chỉnh và kiểm định nhanh hơn so với các mô hình tính toán dựa vào vật lý truyền thống, và cách sử dụng ít phức tạp hơn là những ưu điểm lớn mà các mô hình dựa vào số liệu mang lại
Trong ML các thuật toán được chia làm hai nhóm chính là học có giám sát (Supervised learning) và học không có giám sát (Unsupervised learning) (Hình 9) Các nhóm thuật toán này được áp dụng vào các bài toán phân loại (classification) và hồi quy (regression) khác nhau Trong lĩnh vực dự báo khí tượng thủy văn, các thuật toán ML được sử dụng hầu hết nằm trong nhóm hồi quy
Trong giới hạn của đề tài này, chúng ta sẽ chỉ tìm hiểu về các thuật toán thuộc nhóm học có giám sát (Supervised learning) Học có giám sát là các thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước Cặp dữ liệu này còn được gọi là (data, label), tức (dữ liệu, nhãn) Học có giám sát là nhóm phổ biến nhất trong các thuật toán ML Chi tiết hơn, học có giám sát là khi chúng ra có một tập hợp biến đầu vào X={x1, x2, , xN} và một tập hợp nhãn tương ứng Y={y1, y2, …, yN}, trong đó xi, yi là các vector Các cặp dữ liệu biết trước (xi, yi)∈X×Y được gọi là
tập training data (dữ liệu huấn luyện) Từ tập huấn luyện này, chúng ta cần tạo
ra một hàm số f ánh xạ mỗi phần tử từ tập X sang một phần tử tương ứng xấp xỉ của tập Y:
Yi ≈ f(xi), ∀i = 1, 2, …, N
Trang 2111
Mục đích là tìm hàm số f thật tốt để khi có một dữ liệu x mới, chúng ta có
thể tính được nhãn tương ứng của nó y=f(x)
Hình 1 Phân loại các thuật toán trong ML
(Nguồn: MathWorks)
Hiện nay, các thuật toán/mô hình thuộc nhóm này đang tăng trưởng nhanh chóng về số lượng các nghiên cứu sử dụng như RNN, Decision Tree/Random Forest/CART, SVM/SVR, Long short-term memory (LSTM)
Trong đó, RNN là một trong những mô hình ML được áp dụng từ rất sớm trong lĩnh vực thủy văn và tài nguyên nước để dự báo dòng chảy lũ ở các lưu vực sông Cho tới thời điểm hiện tại, RNN được coi là mô hình data-driven phổ
Trang 2212
biến nhất trong các mô hình ML Trong lĩnh vực thủy văn và XNM, so với các
mô hình truyền thống, RNN có những ưu điểm đó là:
1) Được xây dựng dựa trên dữ liệu (data - driven) thay vì dựa trên các phương trình vi phân/tích phân với các tham số cần hiệu chỉnh;
2) Có thể xử lý lượng dữ liệu lớn phức tạp (đa chiều), dữ liệu có nhiễu, phi cấu trúc, thường có trong các bài toán thủy văn (Ghumman và cộng sự, 2011; Wang và cộng sự, 2006) Kiến trúc chung của một RNN gồm 3 thành phần chính là Input Layer (lớp đầu vào), Hidden Layer (lớp ẩn) và Ouput Layer (lớp đầu ra) Trong đó lớp ẩn gồm các Neuron nhận dữ liệu từ các Neuron ở lớp trước và chuyển đổi cho các lớp tiếp theo để xử lý Một RNN có thể có nhiều lớp ẩn với kiến trúc phức tạp (Deep neural network) nhưng với các bài toán hồi quy có giá trị thực đơn giản, thông thường kiến trúc RNN với một lớp ẩn kết nối hoàn toàn thường được sử dụng
1.1.4.2 Thư viện TensorFlow và Keras
TensorFlow [26], một nền tảng trí tuệ nhân tạo được Google phát hành theo giấy phép mã nguồn mở Apache 2.0 vào ngày 09/11/2015 Nền tảng này sử dụng kỹ thuật Machine Learning để học hỏi, nhận biết hình ảnh, giọng nói và các dấu viết dữ liệu Hiện TensorFlow đang được sử dụng cho chức năng điều khiển giọng nói trong các ứng dụng Google, tìm hình ảnh trong Photos, và mới đây nhất là chức năng trả lời tự động Smart Reply của app email Inbox Trước TensorFlow, Google cũng từng thiết lập một hệ thống Machine Learning thế hệ thứ 1 mang tên DistBelief Tuy nhiên, DistBelief bị trói buộc nhiều vào hạ tầng
kĩ thuật của Google, lại khá nặng nề và khó mở rộng Trong khi đó, TensorFlow thì không còn bị ràng buộc gì về mặt hạ tầng nữa, và nó có khả năng chạy trên hầu hết mọi thứ, từ các app smartphone cho đến phần mềm trên server siêu mạnh Nếu so với hệ thống DistBelief, TensorFlow là một khái niệm xa hơn bằng cách sử dụng công nghệ máy học sâu (Deep Learning) và mạng nơ-ron hồi
Trang 2313
quy (Recurrent Neural Network) gồm nhiều lớp Về cơ bản, TensorFlow chứa tất cả các lớp dữ liệu, gọi là nút (Node), để tìm hiểu và xác minh một vấn đề Lớp đầu tiên sẽ yêu cầu hệ thống tìm kiếm một cái gì đó như xác định mẫu chung của vấn đề Hệ thống sau đó di chuyển để tập hợp các dữ liệu tiếp theo, chẳng hạn như tìm kiếm và xác minh một phần của vấn đề đó Việc di chuyển
hệ thống từ nút tới nút được thực hiện để biên dịch đầy đủ thông tin được đưa ra
để xác minh và khẳng định vấn đề đó “Dòng chảy” tensor như vậy đã tạo nên cái tên TensorFlow Cũng chính Google đã phải nhận định: “TensorFlow nhanh hơn, thông minh hơn và linh hoạt hơn hệ thống cũ của chúng tôi (DistBelief), do
đó nó có thể được điều chỉnh dễ dàng hơn với các sản phẩm mới và giúp quá trình nghiên cứu diễn ra thuận lợi hơn.” [16]
Keras là một thư viện mã nguồn mở cho mạng nơ-ron viết trên ngôn ngữ Python Được phát triển vào năm 2015 bởi Francois Chollet, là một kỹ sư nghiên cứu về học sâu (Deep Learning) Keras tận dụng các kỹ thuật tối ưu hóa khác nhau để làm cho việc lập trình máy học dễ dàng tiếp cận hơn Có thể hiểu, TensorFlow như một bộ máy tính còn Keras được xem như bàn phím và chuột
để chúng ta có thể giao tiếp dễ dàng với máy tính hơn
Các ưu điểm của Keras:
Dễ sử dụng, dùng đơn giản hơn Tensor, xây dựng mô hình nhanh
Chạy được trên cả CPU và GPU
Hỗ trợ xây dựng nhiều mô hình học máy phổ biến (LSTM, BiLSTM )
1.1.4.3 Mạng nơ-ron hồi quy RNN
Mạng nơ-ron hồi quy (RNN - Recurrent Neural Network) là một trong những mô hình Deep Learning được đánh giá có nhiều ưu điểm trong các tác vụ
dự báo Ý tưởng của RNN đó là thiết kế một mạng nơ-ron sao cho có khả năng
xử lý được thông tin dạng chuỗi Recurrent có nghĩa là thực hiện lặp lại cùng
Trang 2414
một tác vụ cho mỗi thành phần trong chuỗi Trong đó, kết quả đầu ra tại thời điểm hiện tại phụ thuộc vào kết quả tính toán của các thành phần ở những thời điểm trước đó Nói cách khác, RNNs là một mô hình có trí nhớ, có khả năng nhớ được thông tin đã tính toán trước đó, không như các mạng nơ-ron truyền thống đó là thông tin đầu vào (input) hoàn toàn độc lập với thông tin đầu ra (output) Về lý thuyết, RNNs có thể nhớ được thông tin của chuỗi có chiều dài bất kì, nhưng trong thực tế mô hình này chỉ nhớ được thông tin ở vài bước trước
𝑆 𝑥
Trang 2515
𝑆t-1 là hidden state được khởi tạo là một vector không 𝑂𝑡 là output tại thời
điểm thứ t, là một vector chứa xác suất của toàn bộ các mẫu số liệu
RNN chỉ sử dụng một bộ tham số (U, V, W) cho toàn bộ các bước Trên
lý thuyết, xây dựng một RNN có thể nhớ được thông tin của một chuỗi số liệu dài vô tận là có thể, nhưng thực tế xây dựng được như vậy là khó thực hiện vì điều kiện phần cứng và thuật toán chưa cho phép Trong vài năm qua, các nhà nghiên cứu đã phát triển nhiều loại RNN ngày càng tinh vi để giải quyết các mặt hạn chế của RNN:
- Long short-term memory (LSTM): mô hình này có cấu trúc tương tự như RNN nhưng có cách tính toán khác đối với các lớp ẩn (hidden layer) Bộ nhớ của LSTM được gọi là hạt nhân (cell) Ta có thể xem đây là một hộp đen nhận thông tin đầu vào gồm trạng thái ẩn (hidden state) trước đó và giá trị 𝑥 Bên trong các hạt nhân này, sẽ quyết định thông tin nào cần lưu lại và thông tin nào cần xóa đi, nhờ vậy mà mô hình này có thể lưu trữ được thông tin dài hạn
- Bidirectional RNN: dựa trên ý tưởng output tại thời điểm t không chỉ phụ thuộc vào các thành phần trước đó mà còn phụ thuộc vào các thành phần trong tương lai Mô hình này gồm hai lớp LSTM nạp chồng lên nhau Trong đó, các hidden state được tính toán dựa trên cả hai thành phần bên trái và bên phải của mạng
1.2 Tổng quan khu vực nghiên cứu
Trang 2616
Đông ở phía Đông và Đông Nam Tỉnh Sóc Trăng có diện tích tự nhiên là 3311,8 km2, chiếm 8,3% diện tích toàn ĐBSCL và diện tích mặt nước và bãi bồi ven biển Toàn tỉnh được chia thành 11 đơn vị hành chính gồm một thành phố, hai thị xã và tám huyện, trong đó có ba huyện tiếp giáp Biển Đông (Hình 3) [2]
Hình 3 Bản đồ hành chính tỉnh Sóc Trăng và vị trí nghiên cứu (Nguồn:
Trang 2717
Tiền Giang Đối với tuyến giao thông ngang, Sóc Trăng có vai trò quan trọng tuyến hành lang đông tây, bắt đầu từ cảng Trần Đề đến cửa khẩu Khánh Bình (tỉnh An Giang) Tính theo đường bộ thì từ cửa khẩu Khánh Bình đi thủ đô Phnom Penh của Campuchia là đường gần nhất từ Việt Nam đi sang Phnom Penh, nên cảng biển Trần Đề tạo điều kiện tốt cho giao thương trong nội vùng ĐBSCL và với Campuchia Ngoài ra, Sóc Trăng còn có nhiều tiềm năng du lịch với các tuyến, điểm và hình thức du lịch đa dạng với hệ thống kênh rạch chằng chịt, và một số cù lao, đặc biệt là Cù Lao Dung, xen vào đó là các dải vườn cây trái, hoặc các dải rừng đước rộng lớn là những tuyến du lịch sinh thái thu hút nhiều khách du lịch [10]
Như vậy, tỉnh Sóc Trăng có một lợi thế so sánh khá tốt so với các tỉnh trong khu vực ĐBSCL về phát triển kinh tế tổng hợp, đặc biệt là về phát triển kinh tế biển và ven biển: khai thác và nuôi trồng thủy hải sản, nông lâm nghiệp biển, công nghiệp hướng biển, thương cảng, cảng cá, dịch vụ cảng biển, xuất nhập khẩu, du lịch biển, vận tải biển; đồng thời tỉnh Sóc Trăng là một đầu mút giao thông quan trọng trong vùng ĐBSCL; Tỉnh có điều kiện thuận lợi để giao lưu, buôn bán và phát triển kinh tế, xã hội với các tỉnh khác trong vùng
1.2.2 Điều kiện tự nhiên [2, 10]
1.2.2.1 Địa hình
Tỉnh Sóc Trăng là địa phương cuối nguồn sông Hậu được hình thành qua một quá trình địa chất lâu dài, chủ yếu do phù sa sông Mê Công bồi đắp, có 3 cửa sông lớn là Định An, Trần Đề, Mỹ Thanh đổ ra Biển Đông Địa hình tỉnh tương đối bằng phẳng chia cắt bởi nhiều sông, rạch và các giồng cát Về địa mạo, tỉnh có dạng địa hình lòng chảo, cao ở các giồng cát ven biển và bờ sông Hậu, thấp dần về phía nội đồng tây và tây nam tỉnh, cao độ địa hình thay đổi trong khoảng 0,2 - 2 m so với mực nước biển, vùng nội đồng có cao độ trung bình từ 0,5 - 1,0 m (Hình 2)
Trang 2818
Hình 4 Bản đồ địa hình tỉnh Sóc Trăng
(Nguồn: trích từ tài liệu của Sở Tài nguyên và Môi trường tỉnh Sóc Trăng)
Tỉnh Sóc Trăng nhìn chung có địa hình trũng thấp bao gồm 3 dạng:
- Đồng bằng tích tụ ven sông: Chiếm phần lớn diện tích tỉnh Sóc Trăng,
độ cao địa hình phổ biến trong khoảng 0,5 - 1,5m
- Đồng bằng tích tụ ven biển: chiếm phần nhỏ diện tích từ Lịch Hội Thượng đến thị xã Vĩnh Châu, độ cao địa hình phổ biến trong khoảng 0,5 - 2,0m
- Các giồng cát cổ: Phân bố thành từng dải hình cánh cung kéo dài theo hướng song song bờ biển, độ cao địa hình phổ biến trong khoảng 1,5 - 2,0 m
Với địa hình thấp, bị phân cắt nhiều bởi hệ thống các sông rạch và kênh mương thủy lợi, lại tiếp giáp với biển nên dễ bị nước biển xâm nhập (nhiễm
Trang 29- Độ sâu từ 10- 20 m nước: Địa hình có dạng sườn dốc Địa hình khu vực cửa sông (phía Đông Bắc) dốc hơn phía Tây Nam Đây là giới hạn ngoài của khu vực lắng đọng trầm tích hiện đại và vì thế địa hình thường thay đổi theo thời gian
- Độ sâu 20-30 m nước: Địa hình khá thoải và rộng, có nhiều sóng cát, một số khu vực phân bố các cồn ngầm thoải
1.2.2.2 Hệ thống sông ngòi, kênh rạch
Hệ thống sông ngòi và kênh rạch tại địa bàn tỉnh lớn ở tỉnh Sóc Trăng đều được bắt nguồn từ sông Hậu, chằng chịt và đan xen nhau chịu ảnh hưởng của chế độ thủy triều ngày lên xuống 2 lần, mực triều dao động trung bình từ 0,4 m đến 1 m Tỉnh có ba hệ thống sông, kênh, rạch lớn:
- Hệ thống sông Mỹ Thanh:
Sông Mỹ Thanh là con sông tự nhiên lớn nhất tỉnh và là một trong những con kênh lớn trong khu vực Đồng bằng sông Cửu Long Nó gần như nằm trọn trong địa phận tình Sóc Trăng, tuy ngắn nhưng khá rộng, chiều rộng trung bình khoảng 200 m, đoạn cửa sông khoảng 100 – 400 m, chiều sâu trung bình 8m Sông Mỹ Thanh có 2 nhánh lớn, nhánh cổ Cò - Nhu Gia - Mỹ Phước nhánh Bạc Liêu Nhánh Bạc Liêu trước đây có tên gọi là sông Cà Mau, có 2 chi lưu là rạch Bạc Liêu và rạch Cà Mau Nhánh cổ Cò có 5 chi lưu là Nhu Gia - Mỹ Phước,
Mỹ Phước - Tân Lập - Long Hưng, Nhu Gia - Chàng Ré, Cái Trầu - Ngã Năm
và cổ Cò - Mỹ Xuyên; 4 chi lưu đầu đều nối vào kênh Quản Lộ - Phụng Hiệp
Trang 3020
- Hệ thống sông Cái Côn bao gồm:
Sông Cái Côn cũ chạy từ Cái Côn về Mang Cá, xã Đại Hải, sau nối vào kênh Ba Rinh, phụ lưu của rạch Nhu Gia, dài khoảng hơn 30 km, rộng khoảng
20 m, sâu khoảng 6 – 7 m Ngoài nhiệm vụ là đường giao thông thủy, sông Cái Côn cũ có nhiệm vụ cung cấp nước tưới cho một phần diện tích nằm ở phía tây huyện Kế Sách Sông Cái Côn mới bắt đầu từ Cái Côn chạy dài khoảng 16 – 17
km, rộng 100 – 120 m, sâu 12 – 15 m gắn với hệ thống kênh Ngã Bảy tại thị xã Phụng Hiệp, tỉnh Hậu Giang trong đó có kênh Quản Lộ - Phụng Hiệp chạy đến
Cà Mau, dài hơn 80 km, rộng trung bình 70 m, sâu trung bình 5,5 m, là nguồn chủ yếu đưa nước ngọt về phía tây của tỉnh Sóc Trăng các huyện Mỹ Tú, Ngã Năm và các tỉnh: Bạc Liêu, Cà Mau Đây là hệ thống kênh đào lớn nhất ở Nam
Bộ, là đường giao thông thủy quốc gia, cửa ngõ đi vào bán đảo Cà Mau và là nguồn nước ngọt lớn nhất đưa nước từ sông Hậu vào khu vực này
- Sông Ba Xuyên - kênh Saintard:
Sông Ba Xuyên nguyên là một con sông cũ, khởi đầu từ Đại Ngãi chạy vào thương cảng Bãi Xàu đổ vào rạch Cổ Cò thuộc huyện Mỹ Xuyên trước đây; sông dài khoảng 35 km, quanh co gấp khúc, đi lại khó khăn Đầu thế kỷ XX, nhà cầm quyền cho đào kênh Saintard dài khoảng hơn 20 km, rộng 25 – 30 m, sâu 7 – 8 m thay thế cho sông Ba Xuyên Đây cũng là tuyến đường giao thông thủy quốc gia đi vào bán đảo Cà Mau
1.2.2.3 Khí hậu
Tỉnh Sóc Trăng nằm hoàn toàn trong vành đai khí hậu nhiệt đới cận xích đạo và là một trong những khu vực chịu ảnh huởng rõ rệt nhất của gió mùa Huớng gió mùa đông và huớng gió mùa hè hoàn toàn đối lập nhau, tương ứng với hai mùa gió là hai mùa: khô và mưa rõ rệt Trung bình mùa mưa từ tháng 5 đến tháng 10, mùa khô từ tháng 11 năm trước đến tháng 4 năm sau Giữa hai
Trang 31Hình 5 Nhiệt độ trung bình tháng và số giờ nắng tỉnh Sóc Trăng năm 2020
(Nguồn: Quy hoạch tỉnh Sóc Trăng giai đoạn 2021 - 2030)
Số giờ nắng: Tổng số giờ nắng trong năm 2020 là 2.286,5 giờ, cao nhất vào tháng 4 (278,9 giờ), thấp nhất vào tháng 1 (137,5 giờ) Tổng lƣợng bức xạ trung bình trong năm 140 - 150 kcal/cm2/năm
Trang 3222
b) Độ ẩm
Đặc điểm thứ hai là tính chất ẩm, mưa nhiều Độ ẩm không khí trung bình năm của Sóc Trăng là 84%, không có tháng nào độ ẩm không khí trung bình dưới 75% Sở dĩ khí hậu Sóc Trăng có độ ẩm cao như vậy là do chế độ mưa phong phú
c) Mưa
Trong khi nhiệt độ tương đối ổn định quanh năm thì lượng mưa có sự phân hóa rõ rệt (cả về không gian và thời gian) Tổng lượng mưa trung bình hằng năm của các địa phương trên địa bàn tỉnh Sóc Trăng khoảng 1.500 - 2.000
mm Dựa theo sự phân hóa mưa theo thời gian, có thể chia khí hậu Sóc Trăng thành hai mùa trong một năm: mùa khô và mùa mưa
- Mùa khô - từ tháng 12 năm trước đến hết tháng 4 năm sau:
Thông thường đây là mùa đông của Bắc bán cầu Mặt trời đi dần về phía nam bán cầu, phần lớn lãnh thổ Âu, Á bị lạnh đi do không nhận được nhiều bức
xạ mặt trời nữa Cao áp lạnh (trung tâm của nó thường ở vùng Xibia, Mông cổ) khống chế toàn bộ châu Á, và từ đó những luồng gió đông bắc thổi xuống phía nam mang theo không khí lạnh và khô Khối khí lạnh, khô này khi xuống đến miền Nam nước ta đã bị biến tính thành nóng ấm và khô Do vậy, trong thời gian này ở Sóc Trăng nói riêng và Nam Bộ nói chung có một mùa khô điển hình: không mưa kéo dài trong 4 - 5 tháng, ngoài biển gió mạnh (có thể đến cấp
7, cấp 8), sóng cao (4 – 6 m) Loại hình khí hậu này ảnh hưởng lớn đến sinh hoạt, sản xuất của nhân dân Dân gian còn gọi loại gió đông bắc này là gió chướng Trong thời kỳ mùa khô này cũng có thể có mưa do nhiễu động trong trường gió đông bắc, nhưng mưa không lớn và cũng ít khi xảy ra
- Mùa mưa - từ tháng 5 đến tháng 11:
Trang 3323
Mặt trời vượt qua xích đạo đi lên phía bắc làm cho hệ thống khí áp khống chế châu Á hoàn toàn thay đổi Gió tây nam do sự chi phối (gần như tuyệt đối) của những luồng không khí nguồn gốc biển xích đạo và nhiệt đới mang nhiều hơi nước, cùng với sự xuất hiện thường xuyên của các nhân tố nhiễu động tạo điều kiện cho mưa ở Nam Bộ và Sóc Trăng cũng có một mùa mưa điển hình trong thời gian này Trong một tháng các địa phương trong tỉnh Sóc Trăng có từ
15 - 22 ngày mưa Tổng lượng mưa của mùa mưa chiếm đến trên 90% lượng mưa cả năm Chênh lệch trung bình của từng tháng cụ thể so với trung bình nhiều năm khoảng 50 – 70 mm, có tháng lên đến 500 mm Trong mùa mưa cũng
có thể xuất hiện những đợt không mưa liên tục dài ngày gây bất lợi cho sinh hoạt và sản xuất
Trong mùa mưa, mặt đất tỉnh Sóc Trăng được bao phủ bằng nước ngọt từ sông Mê Công và mưa tại chỗ Trong mùa khô, có một vành đai xâm nhập mặn
tự nhiên hàng năm ven biển Do biến đổi khí hậu và hoạt động của các đập thủy điện trên sông Mê Công, vào những năm cực đoan như năm 2016 và 2020, xâm nhập mặn lấn sâu bất thường vào đất liền
Hình 6 Biểu đồ lượng mưa trung bình năm đo được tại các trạm quan trắc
(Nguồn: Quy hoạch tỉnh Sóc Trăng giai đoạn 2021 - 2030)
d) Độ ẩm
Độ ẩm không khí trung bình cả năm 2020 thấp hơn năm 2015 khoảng 3%, phù hợp với nhận xét chung về BĐKH
Trang 3424
Hình 7 Biểu lượng độ ẩm của tỉnh Sóc Trăng năm 2015 và 2020
(Nguồn: Quy hoạch tỉnh Sóc Trăng giai đoạn 2021 - 2030)
e) Bốc hơi
Vì có một mùa khô khá dài nên lượng bốc hơi nước ở Sóc Trăng tương
đối lớn, trung bình một năm khoảng 950 - 1.000 mm
sự phân hóa theo hướng tăng dần về phía biển Sâu trong đất liền tốc độ gió có
sự khác biệt không đáng kể: ở giáp Cần Thơ tốc độ gió trung bình năm khoảng l,5 m/s, tốc độ gió trung bình năm tại thành phố Sóc Trăng là l,6 m/s, nhưng ra đến vùng ven biển thuộc huyện Vĩnh Châu tốc độ gió trung bình năm tăng lên trên 2 m/s, và ở ngoài khơi của vùng biển Sóc Trăng tốc độ gió trung bình năm lên đến 3,4 m/s
g) Bão, dông lốc
Thống kê các cơn bão đổ bộ vào khu vực bờ biển Nam Bộ từ Bình Thuận đến Cà Mau nhiều năm, thì tần suất bão đổ bộ vào khu vực này chỉ chiếm 6,3%
Trang 3525
tổng số các cơn bão ảnh hưởng đến vùng biển nước ta Trong 53 năm quan trắc gần đây, chỉ có 3 cơn bão có cường độ gió từ cấp 10 trở lên đổ bộ vào khu vực, trong đó chỉ có 1 cơn bão tốc độ gió trên cấp 12 Nơi có nhiều dông bão nhất là khu vực Bình Thuận, trong 1 năm có khoảng 57 ngày có dông, các tháng có dông từ 3 ngày trở lên là tháng 5 đến tháng 11 trong đó, tháng 5 có dông nhiều nhất (11,3 ngày) Tại khu vực tỉnh Sóc Trăng tần suất ngày có bão, dông lốc thấp hơn nhiều so với Bình Thuận
1.2.2.4 Thủy văn
Tỉnh Sóc Trăng được chi phối bởi 3 hệ thống sông, kênh chính là sông
Mỹ Thanh ở phía nam, sông Hậu ở phía đông và kênh Quản Lộ - Phụng Hiệp ở phía tây bắc Do nằm tiếp giáp với biển Đông nên hệ thống sông, rạch của Sóc Trăng chịu ảnh hưởng của chế độ thủy triều bán nhật triều không đều, mỗi ngày
có 2 lần nước lên và 2 lần nước xuống (2 chân, 2 đỉnh) Trong một tháng có 2 đỉnh triều cường (thường vào ngày 2 và ngày 17 hằng tháng - tính theo âm lịch)
và 2 chân triều (thường vào ngày 10 và ngày 25 hằng tháng - tính theo âm lịch) Nước chảy lên, chảy xuống mạnh (lưu lượng lớn) vào các kỳ triều cường và chảy lên, chảy xuống yếu (lưu lượng nhỏ) vào các kỳ triều kém Trong một năm, mực nước triều lên cao nhất vào tháng 10, 11 và xuống thấp nhất vào tháng 6 Vào tháng 10, 11 do ảnh hưởng kết hợp của triều cường biển Đông và nước lũ từ đầu nguồn sông Cửu Long đổ về làm mực nước các sông, rạch trong tỉnh lên cao gây ngập úng và làm tràn hoặc bể bờ bao của các xã trên cù lao hoặc các xã ven sông Hậu Biên độ triều năm (giữa mực nước cao nhất và mực nước thấp nhất năm) ở vùng ven biển và hai cửa sông chính có độ chênh lệch thuộc loại lớn nhất nước ta (khoảng 4,2 m); càng vào sâu trong sông chính và trong nội đồng biên độ triều càng giảm dần
Vào mùa kiệt, ảnh hưởng của triều trong hệ thống sông rất lớn Trong mùa lũ ảnh hưởng của triều yếu đi, nhưng nó cũng là một yếu tố làm mực nước
Trang 3626
lũ dâng cao
Chế độ dòng chảy sông Hậu: Từ tháng 7 đến tháng 12, dòng chảy sông Hậu chịu tác động mạnh của dòng chảy thượng nguồn Từ cuối tháng 11, đầu tháng 12 đến tháng 5, lưu lượng thượng nguồn giảm, thủy triều biển Đông tác động mạnh mẽ trên toàn hệ thống kênh rạch trong tỉnh Mực nước đỉnh triều xuống thấp nhất vào cuối tháng 4 trung bình khoảng 100 cm, mực nước chân triều xuống thấp nhất vào cuối tháng 4 đầu tháng 5 ở trong khoảng cao trình –
80 cm so với mực nước biển
Nhìn chung, chế độ thủy văn trên địa bàn Sóc Trăng bị chi phối bởi 3 yếu
tố chính: Bán nhật triều biển Đông, mưa nội vùng, dòng chảy sông Hậu Hầu hết các dòng chảy trên kênh rạch là dòng chảy hai chiều Mực nước trung bình năm 2020 cao hơn năm 2015 là xu thế NBD-BĐKH
Hình 8 Mực nước sông Hậu tại trạm quan trắc Đại Ngãi
(Nguồn: Quy hoạch tỉnh Sóc Trăng giai đoạn 2021 – 2030)
1.2.3 Điều kiện xã hội
Năm 2020, dân số trung bình tỉnh Sóc Trăng là 1.195,7 nghìn người, chiếm 1,4% dân số cả nước, đứng thứ 6 trong khu vực ĐBSCL sau các tỉnh Long An, Tiền Giang, Đồng Tháp, An Giang và Kiên Giang Trong đó, dân số
đô thị chiếm 32,3% dân số toàn tỉnh, đứng thứ 3 so với các tỉnh vùng ĐBSCL,
Trang 3727
sau An Giang và Cần Thơ nhưng vẫn thấp hơn tỷ lệ đô thị hóa của cả nước Trong giai đoạn 2011-2020, tỷ lệ tăng dân số tự nhiên là 0,54%/năm, song do di dân, dẫn đến dân số quy mô dân số của tỉnh giảm bình quân 0,75%/năm
Hình 9 Dân số tỉnh Sóc Trăng năm 2020 trong vùng ĐBSCL
(Nguồn: Niên giám thống kê các tỉnh vùng ĐBSCL (2011-2020))
Sóc Trăng là vùng đất giàu truyền thống cách mạng, bản sắc văn hoá đa dạng Đây là một trong các thế mạnh của tỉnh Sóc Trăng Nó được hội tụ từ ba yếu tố chính:
- Lối sống của người dân thích ứng với sự đa dạng về điều kiện tự nhiên, tạo thành văn hoá vùng nước ngọt, văn hóa vùng nước lợ và vùng ven biển;
- Sự đa dạng về sắc tộc, tôn giáo tín ngưỡng: Với các dân tộc chính là người Kinh, người Khmer, người Hoa với các tín ngưỡng chính là Phật giáo và đạo Thiên chúa giáo Toàn tỉnh có gần 400 đình, chùa, miếu mạo (văn hóa vật thể) với những công trình kiến trúc đa sắc, đa màu, hài hòa, tạo nên nét độc đáo riêng ở vùng đất này;
- Sự đa dạng về hoạt động sinh kế sản xuất: nông, ngư, thủ công nghiệp và diêm nghiệp
Đa dạng về sắc tộc gồm người Kinh chiếm 64,9%, người Khmer chiếm
Trang 3828
32,2% và người Hoa chiếm 2,8% và dân tộc khác chiếm 0,03%
Đối với thành thị và nông thôn có sự phân bố dân cư như sau: a) Toàn Vùng đồng bằng sông Cửu Long: Năm 2020, có khoảng 25,5% dân cư đô thị với tốc độ đô thị hóa trong giai đoạn 2009-2020 đạt gần 3% Tuy nhiên, dân cư
đô thị ở ĐBSCL sẽ tăng thêm 507.000 người vào năm 2030, chiếm 28,2% năm
2030 b) Tỉnh Sóc Trăng: Năm 2020, dân cư đô thị là 386,608 người (chiếm 32,33% tổng dân số cả tỉnh) Dự kiến đến năm 2030, dân cư đô thị tỉnh Sóc Trăng chiếm khoảng 43-50% tổng dân số cả tỉnh
Phân bố dân số theo các tiểu vùng trên địa bàn tỉnh: Tiểu vùng kinh tế biển, năm 2020 dân số của vùng là: 414.526 người, chiếm 34,7% diện tích toàn tỉnh Tỷ lệ đô thị hóa của vùng là: 57,6% Vùng kinh tế ven sông Hậu, năm
2020, dân số của vùng là: 336.878 người, chiếm 28,17% diện tích toàn tỉnh Tỷ
lệ đô thị hóa của vùng là: 15,78% Vùng kinh tế nội địa: Năm 2020, dân số của vùng là 386.329 người, chiếm 32,31% diện tích toàn tỉnh Tỷ lệ đô thị hóa của vùng là 22,95%
1.2.4 Tài nguyên thiên nhiên
1.2.4.1 Tài nguyên đất
Tổng diện tích đất tự nhiên toàn tỉnh là 3.298,20 km2 gồm 6 nhóm chính:
- Nhóm đất cát: Diện tích 8.419 ha (2,55% diện tích tự nhiên), bao gồm các giồng cát chạy dọc ven biển thuộc Vĩnh Châu, Mỹ Xuyên Đất có thành phần cơ giới nhẹ, thích hợp với trồng rau, màu
- Nhóm đất phù sa: Diện tích 6.372 ha (1,93% diện tích tự nhiên) tập trung
ở các huyện Kế Sách, Mỹ Tú Đất có thành phần cơ giới từ thịt pha sét đến sét pha thịt, thích hợp cho trồng lúa tăng vụ và cây ăn trái đặc sản
Trang 3929
- Nhóm đất gley: Diện tích 1.076 ha (0,33% diện tích tự nhiên) phân bố một số xã vùng trũng phía Bắc huyện Kế Sách; có thành phần cơ giới lớp mặt là sét, lớp dưới là thịt pha sét; hiện được trồng lúa một vụ và nuôi thả thuỷ sản
- Nhóm đất mặn: Diện tích 158.547 ha, chiếm 48,07% diện tích đất tự nhiên, phù hợp trồng lúa, rau màu, cây ăn trái và nuôi trồng thuỷ sản; phân bố nhiều ở thị xã Vĩnh Châu, huyện Mỹ Xuyên, huyện Long Phú, huyện Cù Lao Dung, rải rác ở huyện Thạnh Trị, ngoại thị thành phố Sóc Trăng Trong đó đất
có độ mặn ít: 75.016 ha (22,74%) tập trung ở Mỹ Xuyên, Kế Sách, thành phố Sóc Trăng Mặn vừa: 57.790 ha (17,52%) tập trung ở Vĩnh Châu, Mỹ Xuyên, Long Phú, Cù Lao Dung Mặn nhiều: 23.587 ha tại ven bờ biển, cửa sông Hậu Mặn bị ngập triều là 515 ha (0,16%)
- Nhóm đất phèn: Diện tích 75.823 ha, chiếm 22,99% diện tích đất tự nhiên, phân bố rải rác ở các huyện, tập trung nhiều ở các huyện Thạnh Trị, Mỹ
Tú, Tây - Bắc QL 1 chịu ảnh hưởng hệ thống thủy văn Quản Lộ - Phụng Hiệp
và rải rác tại các lung bàu thị xã Vĩnh Châu, huyện Mỹ Xuyên Đất có hàm lượng mùn thấp, thành phần cơ giới trung bình đều nặng Hiện được sử dụng chủ yếu để trồng lúa, cây ăn trái và nuôi trồng thuỷ hải sản
- Nhóm đất nhân tác: Diện tích 46.146 ha, chiếm 13,99% diện tích tự nhiên, tập trung nhiều ở huyện Kế Sách, Long Phú và Mỹ Tú Phần lớn diện tích đất này được sử dụng trồng lúa 2 - 3 vụ và rau màu (đất phù sa bạc màu do canh tác lâu đời)
Bảng 1 Thống kê các loại đất chính tỉnh Sóc Trăng
Trang 405 Đất phèn 75.823 22,99
Tập trung thành diện tích lớn ở huyện Mỹ Tú, TX Ngã Năm, huyện Mỹ Xuyên và một phần ở Thạnh Trị, TX Vĩnh Châu
6 Đất nhân tác 46.146 13,99 Tập trung nhiều nhất ở huyện Kế
Sách và Long Phú
Nhìn chung, đất đai trong tỉnh Sóc Trăng thuộc loại trầm tích hỗn hợp sông biển, có hàm lượng sét cao, chứa nhiều chất hữu cơ Do nằm trong vùng ảnh hưởng mặn, có nhiều vùng trũng, khó tiêu thoát, nên phần lớn đất đai bị nhiễm mặn và chua phèn Diện tích đất mặn và phèn không những ảnh hưởng đến việc phát triển sản xuất nông nghiệp, mà còn ảnh hưởng đến nguồn nước sử dụng cho tưới tiêu cũng như cung cấp cho ăn uống và sinh hoạt (đất phèn hoạt động và đất phèn tiềm tàng là nguồn gốc gây ra nước chua), đặc biệt là thời kỳ đầu mùa mưa
1.2.4.2 Tài nguyên nước
Tài nguyên nước trên địa phận tỉnh Sóc Trăng gồm: Tài nguyên nước mặt
và tài nguyên nước ngầm Do tiếp giáp với biển nên tài nguyên nước ở đây được phân chia thành 3 loại nước: nước ngọt, nước lợ, nước mặn