Phương pháp xây dựng mô hình tính nhạy cảm lũ lụt sử dụng trong đề tài này được chia làm 4 bước chính: Thu thập và xử lý số liệu; xây dựng mô hình tính nhạy cảm lũ lụt; đánh giá và so sánh hiệu suất của các mô hình đề xuất và phân tích, so sánh bản đồ tính nhạy cảm lũ lụt qua các thời ky.
i) Thu thập và xử lý dữ liệu đầu vào: Dữ liệu đầu vào của mô hình học máy/học sâu gồm 2 dữ liệu chính: dữ liệu lịch sử lũ lụt và các yếu tố ảnh hưởng. Trong đề tài
58 này, dữ liệu lịch sử lũ lụt được thu thập từ nhiều nguồn khác nhau: Sở Tài nguyên và Môi trường tỉnh Quảng bình, các đợt đo đạc thực địa vào năm 2021 và trích xuất từ ảnh vệ tinh. Tổng cộng có 1964 điểm lũ lụt và không lũ lụt được thu thập, sử dụng để xây dựng mô hình tính nhạy cảm lũ lụt. Các yếu tố ảnh hưởng bao gồm Độ cao, hướng phơi sườn, độ cong, độ dốc, Chỉ số Độ ẩm Địa hình (TWI), Chỉ số Thực vật khác biệt chuẩn hóa (NDVI), Chỉ số Xây dựng chênh lệch chuẩn hóa (NDBI), Chỉ số Nước chênh lệch chuẩn hóa (NDWI), lượng mưa 2005, 2020, 2035 và 2050, sử dụng đất
2005, 2020, 2035 và 2050, thổ nhương, khoảng cách đến đường, khoảng cách đến sông và hướng dòng chảy, chỉ số vận chuyển trầm tích. Trong đó lượng mưa 2035 và 2050 được tính toán theo kịch bản biến đổi khí hậu RCP 8.5. Trong khi đó, sử dụng đất năm 2035 và 2050 được dự báo bằng cách sử dụng mô hình Markov CA. Cuối cùng, 1964 điểm lũ lụt lịch sử được gán giá trị của 21 yếu tố ảnh hưởng được sử dụng làm dữ liệu đầu vào của mô hình nhạy cảm lũ lụt.
ii) Xây dựng mô hình học máy/ học sâu: Cấu trúc mô hình MLP bao gồm nhiều lớp, với lớp đầu tiên là lớp đầu vào, được xác định bởi 1964 điểm lũ lụt và không lũ lụt và 21 yếu tố điều hòa (Độ cao, hướng phơi sườn, độ cong, độ dốc, Chỉ số Độ ẩm Địa hình (TWI), Chỉ số Thực vật khác biệt chuẩn hóa (NDVI), Chỉ số Xây dựng chênh lệch chuẩn hóa (NDBI), Chỉ số Nước chênh lệch chuẩn hóa (NDWI), lượng mưa 2005,
2020, 2035 và 2050, sử dụng đất 2005, 2020, 2035 và 2050, thổ nhương, khoảng cách đến đường, khoảng cách đến sông và hướng dòng chảy, chỉ số vận chuyển trầm tích) và lớp cuối cùng là lớp đầu ra, gồm hai phân lớp: lũ lụt và không lũ lụt.
Sự đặc trưng của MLP là khác biệt về số lượng lớp ẩn và số lượng nơ-ron trong mỗi lớp. Từ tổng quan tài liệu có thể thấy, hiện tại chưa có hướng dẫn nào hoặc kết luận
nào về số lượng lớp ẩn và số lượng nơ-ron trong mỗi lớp. Do đó, phương pháp thử và sai được áp dụng để xác định số tối ưu của các lớp ẩn, trong đó thử nghiệm một, hai và ba lớp đã được tiến hành, với ba lớp ẩn được cho là mang lại độ chính xác tốt nhất.
Theo tài liệu (Bui et al., 2020b; Nguyen, 2022), số lượng nơ-ron trong mỗi lớp cần ít hơn số lượng biến đầu vào và lớn hơn số lượng biến đầu ra, trong khoảng từ 3 đến 21.
Dựa vào các nghiên cứu trước đây, 13 nơ-ron trong mỗi lớp được lựa chọn để tính toán khả năng xảy ra ngập lụt tại khu vực nghiên cứu.
59 Mô hình MLP được đặc trưng bởi bốn ma trận trọng số: [n × 13], [n x n], [n x n], và [n
× 1]. Do MLP sử dụng công nghệ học máy "hộp đen," quá trình kích hoạt và độ chính xác của mô hình bị ảnh hưởng bởi các siêu tham số như số lớp ẩn, tốc độ học và trọng số. Tối ưu hóa thuật toán làm tăng độ chính xác và tốc độ hội tụ bằng cách điều chỉnh các siêu tham số. Trong nghiên cứu này, chúng tôi sử dụng 4 thuật toán tối ưu hóa để tối ưu hóa trọng số và độ lệch, bao gồm AOA, WCA, WOA và ACO.
Trong quá trình chạy mô hình MLP, mỗi lần chạy 500 lần lặp, và mỗi lần lặp tính toán một giá trị RMSE. Trong mỗi lần lặp, mô hình MLP được huấn luyện bằng cách sử dụng các trọng số được tạo bởi thuật toán tối ưu hóa. Các tham số thay đổi sau mỗi lần lặp, với giá trị ban đầu của mỗi thuật toán được thiết lập giống nhau để đảm bảo sự đồng nhất ở vòng lặp đầu tiên. Cuối cùng, các tham số được chọn sao cho RMSE đạt giá trị tối thiểu.
iii) Đánh giá và so sánh hiệu suất của các mô hình đề xuất: Các mô hình đề xuất (MLP-AOA, MLP-ACO, MLP-WCA, MLP-WOA, SVM và RF được đánh giá sử dụng các chỉ số thống kê như RMSE, MAE, AUC, R2. Sau khi đánh giá các mô hình đề xuất, các mô hình được so sánh với nhau để chọn ra mô hình có độ chính xác cao nhất nhằm thiết lập bản đồ tính nhạy cảm lũ lụt năm 2005, 2020, 2035 và 2050.
iv) Sau khi thiết lập mô hình, các bản đồ tính nhạy cảm năm 2005, 2020, 2035 và 2050 được thành lập.
Table 2: Các tham số của mô hình
Tham số MLP - AOA MLP - WCA MLP - WOA MLP - ACO
Hidden layer 3 3 3 3
Neuron of each layer
13 13 13 13
Action funcion
sigmoid sigmoid sigmoid sigmoid
Max_iter 500 500 500 500
Problem size 573 573 573 573
Pop_size 50 50 50 50
Specific Ib=-2 Ib=-2 Ib=-2 Ib=-2
60 parameters Ub=2
C1=2 C2=6 C3=2 C4=0.5 Obj_func=rmse Acc_upper=0.9 Acc_low=0.1
Ub=2 Nsr=4 C=2 Dmax=1e-6 Obj_func=rmse
Ub=2 Obj_func=rmse
Ub=2 Obj_func=rmse
Q=0.5 Zeta=1
Sau khi hoàn thành việc xây dựng mô hình học máy, tất cả các pixel trong khu vực
nghiên cứu được ánh xạ giá trị của các yếu tố điều hòa vào các năm 2005, 2020, 2035 và 2050 để tạo ra các bản đồ nhạy cảm lũ lụt tương ứng với từng năm