Bài viết này trình bày kết quả nghiên cứu, ứng dụng kỹ thuật phân rã không gian mục tiêu nhằm tìm lời giải tối ưu toàn cục cho các thông số trong mô hình thủy văn phân bố. Các kết quả đạt được trên bài toán thử nghiệm đã cho thấy, kỹ thuật phân rã không gian mục tiêu dựa trên tập hướng tham chiếu đã giúp bài toán có khả năng tìm kiếm trên toàn bộ POF (front tối ưu Pareto), đảm bảo sự đa dạng về mẫu trong không gian mục tiêu. Mời các bạn cùng tham khảo!
BÀI BÁO KHOA HỌC ỨNG DỤNG KỸ THUẬT PHÂN RÃ KHƠNG GIAN MỤC TIÊU GIẢI BÀI TỐN ƯỚC TÍNH THƠNG SỐ TRONG MƠ HÌNH THỦY VĂN THƠNG SỐ PHÂN BỐ Bùi Đình Lập1, Trần Hồng Thái2, Phạm Thị Hương Lan3 Tóm tắt: Việc xác định tập thơng số tối ưu hệ thống mơ hình thủy văn thơng số phân bố cần thiết nhằm giải toán thực tiễn lĩnh vực thủy văn tài nguyên nước Bài báo trình bày kết nghiên cứu, ứng dụng kỹ thuật phân rã không gian mục tiêu nhằm tìm lời giải tối ưu tồn cục cho thơng số mơ hình thủy văn phân bố Các kết đạt toán thử nghiệm cho thấy, kỹ thuật phân rã không gian mục tiêu dựa tập hướng tham chiếu giúp tốn có khả tìm kiếm tồn POF (front tối ưu Pareto), đảm bảo đa dạng mẫu khơng gian mục tiêu Từ khóa: Tối ưu đa mục tiêu, mơ hình thủy văn phân bố, ước tính thơng số MỞ ĐẦU * Mơ hình thủy văn thông số phân bố hệ thống có cấu trúc phức tạp, hầu hết thành phần tham gia vào hệ thống mưa, thấm, bốc hơi…, thành phần phi tuyến biểu diễn phương trình vi phân chứa biến không gian thời gian Số lượng thông số cần xác định hệ thống lớn khó xác định Đặc biệt tốn ước tính thơng số cho hệ thống trở lên phức tạp địi hỏi khối lượng tính tốn gia tăng theo cấp số nhân số chiều không gian thông số cần tìm khơng gian mục tiêu gia tăng Mặc dù tốn ước tính thơng số đơn mục tiêu (hàm mục tiêu vô hướng), người hiệu chỉnh hệ thống tìm tập thông số chấp nhận dựa phương pháp thử sai (phương pháp sử dụng phổ biến nước ta nay) Tuy nhiên chất lượng thông số tìm theo phương pháp thử sai lại phụ thuộc lớn vào mức độ hiểu biết hệ thống thực mơ hình người hiệu chỉnh, thường mang nặng tính chủ quan chất lượng Trung tâm Dự báo khí tượng thủy văn quốc gia Tổng cục Khí tượng Thủy văn Trường Đại học Thủy lợi thấp, đặc biệt phải nhiều thời gian q trình hiệu chỉnh Để giải tốn ước tính tối ưu thơng số mơ hình thủy văn có nhiều cơng trình nghiên cứu ngồi nước thực thập kỷ vừa qua nhằm xây dựng giải thuật tối ưu phương pháp hiệu chỉnh mơ hình tự động nhanh hiệu hơn, giải thuật đạt từ cơng trình điển hình kể đến như: Giải thuật tiến hóa sáo trộn phức hợp trường đại học Arizona (shuffled complexevolution-SCE-UA) (Duan, et al 1994), thuật toán MOCOM-UA (Yapo, et al 1998); thuật toán MOSCEM-UA (Vrugt, et al 2003) Các thành tựu đạt lĩnh vực nghiên cứu, ứng dụng lý thuyết toán tối ưu vào toán thủy văn thập kỷ qua lớn, nhiên báo cáo kết nghiên ứu ứng dụng từ cơng trình nghiên cứu kể cho thấy tồn nhiều vấn đề cần phải tiếp tục nghiên cứu hoàn thiện để nâng cao hiệu của thuật toán như: thời gian hiệu chỉnh lớn (đặc biệt áp dụng cho mơ hình thủy văn thơng số phân bố); tốn có xu hướng hội tụ nhanh số lượng thơng số cần tìm lớn hàm mục KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 73 (3/2021) 11 tiêu có tương quan cao; thuật tốn thường có hiệu khơng cao mục tiêu hiệu chỉnh lớn;…Bài báo trình bày kết nghiên cứu, ứng dụng kỹ thuật phân rã không gian mục tiêu nhằm tìm lời giải tối ưu tồn cục cho thơng số mơ hình thủy văn thơng số phân bố PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Nội dung phương pháp a) Bài tốn tối ưu thơng số Theo (Trần Hồng Thái, 2005) hệ thống cần hiệu chỉnh phù hợp với thực tế thông qua số liệu quan trắc trước ứng dụng vào thực tế Nếu PDIFF, DRMS,…) biết đến hàm mục tiêu hiệu chỉnh ký hiệu F(X) Đối với toán hiệu chỉnh thông số tối ưu đa mục tiêu (MOP), tốn mơ tả sau: ký hiệu hệ thống w,p) số liệu quan trắc với k ( không gian biến trạng thái, biến mà số liệu quan trắc sử dụng để ước lượng thông số), biến quan trắc mực nước lưu lượng có trạm đo theo thời gian tj với j=1, …, nm Khi biến quan trắc mơ tả sau: gian biến định), Trong không gian biến trạng thái hệ thống; X không gian véc tơ thông số hệ thống; lỗi quan trắc với giả thiết tuân theo luật phân phối chuẩn ,ở độ lệch chuẩn biến quan trắc Bài tốn ước tính thơng số hệ thống mơ q trình mưa, dịng chảy xác định sau: xác định tập giá trị thông số X(X1,… ) với điều kiện ràng buộc (2) để hàm tối ưu (1) đạt giá trị cực tiểu Mục tiêu tốn hiệu chỉnh thơng số mơ hình tìm tập véctơ thơng số X cho chuỗi thời gian E(X) đạt cực tiểu, thực tế chuỗi E(X) thường thay nhiều tiêu thống kê (như số SLS, Nash, 12 (3) Trong đó: J K số bất phương trình phương trình ràng buộc tương ứng không gian thông số (không véc tơ thông số F: Ω -> Rm hàm ánh xạ từ không gian thông số Ω sang không gian Euclid m chiều Rm gọi không gian mục tiêu Lựa chọn tốt để giải toán phát triển thuật toán theo hướng tiến hóa đa mục tiêu (MOEAs) Khi hàm mục tiêu mâu thuẫn nhau, không tồn điểm không gian để hàm mục tiêu đồng thời đạt cực trị, cách phải cân hàm mục tiêu, vấn đề giải điều kiện tối ưu Pareto Khi tập lời giải toán tối ưu đa mục tiêu chứa đựng tất véctơ định mà véctơ mục tiêu tương ứng chúng cải thiện tốt chiều mà không làm suy giảm chiều khác b) Giải toán theo phương pháp phân rã không gian mục tiêu Các tiếp cận để giải toán tối ưu đa mục tiêu báo thực dựa tảng kết hợp thành tựu đạt thuật toán tối ưu đơn mục tiêu lĩnh vực thủy văn tài nguyên nước SCE_UA (Duan, et al 1994) thuật toán tối ưu đa mục tiêu SPEA/R (Jiang, et al 2017) Không gian mục tiêu toán chia thành vùng nhỏ độc lập dựa tập hướng tham chiếu (W), cách làm giúp KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MƠI TRƯỜNG - SỐ 73 (3/2021) tốn có khả tìm kiếm tồn POF (front tối ưu Pareto), đảm bảo đa dạng mẫu không gian mục tiêu Việc xây dựng tập tham chiếu W thực sau: Đầu tiên tâm hướng tham chiếu C xác định qua số hàm mục tiêu M C(1/M, …, 1/M), sau tọa độ điểm Bi (điểm cắt trục thứ i không gian mục tiêu) xác định = ( ,…, ) cho =1 =0 cho tất { j ≠ i | ≤ j ≤ M, ≤ j ≤ M } Như đơn vị đơn hình chia tới M đơn hình nhỏ ký hiệu Simp(i) , biên Simp(i) xác định điểm C, (xem Hình 1) Trên Simp(i), điểm cạnh C C sinh trước dựa theo công thức k số lớp từ đỉnh C tới cạnh , r {1,…, k), sau điểm lớp tao theo công thức với t {1,…, r), r số tham chiếu cho lớp rth Simp(i) Hình Các giao điểm hướng tham chiếu đơn vị đơn hình (a) hướng tham chiếu Simp(i) (b) hướng không gian mục tiêu (28 hướng sinh lớp) (Jiang, et al 2017) Như nhận thấy với k-lớp tổng số hướng tham chiếu cho tốn tối ưu M mục tiêu xác định theo công thức sau: Tại hướng tham chiếu , , thuật toán xác định không gian mục tiêu tương ứng nghĩa sau: thông qua định Trong , , véctơ mục tiêu chuẩn hóa x, góc nhọn tạo Sử dụng định nghĩa dễ dàng xác định số cá thể có khơng gian Bài tốn mã hóa thành chương trình tính tốn tối ưu đa mục tiêu với tên gọi MSCE_UA có khả hoạt động song song nhiều Server hoạt động môi trường hệ điều hành Linux hệ điều hành máy tính hiệu cao Cray XC 40 Series (Bùi Đình Lập, 2021) 2.2 Thử nghiệm giải thuật Để đảm bảo giải thuật hoạt động hiệu quả, xác trước mã hóa triển khai ứng dụng thực tế Trong nội dung tiến hành thử nghiệm giải thuật thơng qua tốn test mẫu đề xuất (Zitzler, et al 2000) (Deb, et al 2002) Bốn tốn test với độ khó KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 73 (3/2021) 13 khác lựa chọn để tham gia đánh giá mức độ hiệu tính ổn định giải thuật, đó: tốn ZDT1, ZDT6 thực điều kiện tối ưu đồng thời hàm mục tiêu với tập tối ưu Pareto front hàm lồi hàm phân bố không Pareto front; toán DTLZ1, DTLZ5 thực điều kiện tối ưu đồng thời hàm mục tiêu Mô tả tốn học tốn test trình bày Bảng Bảng Các toán tham gia thử nghiệm Bài toán thử nghiệm hàm mục tiêu Giới hạn Lời giải tối ưu biến Bài toán ZDT1: x1 [0,1] [0,1] xi = i = 2, , m Bài toán ZDT6: x1 [0,1] [0,1] xi = i = 2, , m Bài toán DTLZ1: xi = 0.5 [0,1] Bài toán DTLZ5: xi = 0.5 [0,1] Công cụ MatLab sử dụng để mô đánh giá mức độ hiệu giải thuật 14 đề xuất thông qua toán test mẫu đề xuất bảng Trong nội dung thử nghiệm KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 73 (3/2021) này, lựa chọn số biến định 4, số hàm mục tiêu cho toán ZDT1, ZDT6 cho toán DTLZ1, DTLZ5 Các tốn kiểm thử thực với kích cỡ mẫu 250 cho toán ZDT1, ZDT6 1000 cho toán DTLZ1, DTLZ5, biến dừng thuật toán 10000 lần Các số sử dụng để đánh giá hiệu giải thuật đề xuất: 1-Chỉ số IGD (Inverted Generational Distance): Sử dụng để đánh giá chất lượng tập lời giải P toán kiểm thử Giả thiết P* tập hợp điểm phân phối Pareto front không gian mục tiêu, P xấp xỉ Pareto front khơng gian mục tiêu tìm Khoảng cách P* P xác định sau: Trong d(v, P) khoảng cách Euclidean nhỏ từ điểm v tới P Như vây thấy giá trị IGĐ nhỏ hiệu thuật tốn tốt 2- Chỉ số HV (Hypervolume): sử dụng để quan sát độ lớn lời giải xấp xỉ trội S không gian mục tiêu biên tạo điểm tham chiếu R = (R1, , RM)T tất điểm mặt tối ưu Pareto KẾT QUẢ VÀ THẢO LUẬN Kết mô tập Pareto front toán kiểm tra ZDT1 ZDT6 xem Hình 2, tốn kiểm tra DTLZ1 ZDT5 xem Hình Kết thử nghiệm giải thuật tốn kiểm tra Hình Hình cho thấy rõ ràng, thuật tốn đề xuất đạt phân bố tốt điểm (lời giải) tập Pareto front Không gian lời giải tính đa dạng lời giải hàm mục tiêu cạnh tranh tập Pareto front Bảng cho thấy số đánh giá mức độ hiệu giải thuật IGD, HV tốt, toàn số IGD có giá trị nhỏ 0.1, số HV nhỏ 0.8 a) Tập Pareto front toán ZDT1 b) Tập Pareto front tốn ZDT6 Hình Kết mơ tập Pareto front qua toán kiểm tra a) ZDT1 b) ZDT6 KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 73 (3/2021) 15 a) Tập Pareto front toán DTLZ1 b) Tập Pareto front toán ZDT5 Hình Kết mơ tập Pareto front qua toán kiểm tra a) DTLZ1 b) DTLZ5 Bảng Kết số đánh giá mức độ hiệu giải thuật IGD, HV (trung bình độ lệch chuẩn) đạt qua toán kiểm tra ZDT1 ZDT6 DTLZ1 DTLZ5 IGD HV IGD HV IGD HV IGD HV 4.9621e-3 7.1880e-1 6.9891e-2 3.1083e-1 4.6169e-2 7.6382e-1 2.9604e-2 7.6382e-1 (4.33e-4) (7.32e-4) (5.30e-2) (6.19e-2) (2.31e-2) (8.01e-2) (4.50e-3) (8.01e-2) KẾT LUẬN Các kết thử nghiệm đạt toán thử nghiệm cho thấy, kỹ thuật phân rã không gian mục tiêu dựa tập hướng tham chiếu giúp tốn có khả tìm kiếm toàn POF (front tối ưu Pareto), đảm bảo đa dạng mẫu không gian mục tiêu Giải thuật đề xuất MSCE_UA ứng dụng để tối ưu thơng số cho mơ hình thủy văn thông số phân bố Sự thành công cơng trình nghiên cứu làm giảm lượng lớn thời gian, công sức loại bỏ tính chủ quan người hiệu chỉnh mơ hình so với phương pháp hiệu chỉnh thử sai TÀI LIỆU THAM KHẢO Đình Lập, B (2021) Nghiên cứu phát triển mơ hình thủy văn thơng số phân bố dự báo lũ cho lưu vực sông Việt Nam A.Vrugt, J., V.Gupta, H., A.Bastidas, L., Bouten, W., & Sorooshian, S (2003) Effective and efficient algorithm for multiobjective optimization of hydrologic models Water Resources research, 39 Deb, K., Thiele, L., Laumanns, M., & Zitzler, E (2002) Scalable multi-objective optimization test problems Evolutionary Computation, Duan, Q., Sorooshian, S., & Gupta, V K (1994) Optimal use of the SCE-UA global optimization method for calibrating watershed models Journal of Hydrology 16 KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 73 (3/2021) Hồng Thái, T (2005) Numerical Methods for Parameter Estimation and Optimal Control of the Red River Network Heidelberg university Jiang, S., & Yang, S (2017) A Strength Pareto Evolutionary Algorithm Based on Reference Direction for Multiobjective and Many-Objective Optimization IEEE TRANSACTIONS ON EVOLUTIONARY COMPUTATION, 21 Yapo, P O., Gupta, H V., & Sorooshian, S (1998) Multi-objective global optimization for hydrologic models Journal of Hydrology, 204, 83-97 Zitzler, E., Deb, K., & Thiele, L (2000) Comparison of Multiobjective Evolutionary Algorithms: Empirical Results Evolutionary Computation, 8, 173-195 Abstract: APPLICATION OF OBJECTIVES SPACE DECOMPOSITION TECHNIQUE SOLVE THE PARAMETER ESTIMATION PROBLEM IN THE DISTRIBUTED HYDROLOGICAL MODEL Determining an optimal parameter set in distributed-hydrological model is very essential to solve practical issues in the hydrology and water resources This article presents the results of application of spatial decomposition technique to find the globally optimal model parameters in the distributed hydrological model The results achieved on the basin and the experimental problem have shown that the spatial decomposition technique based on the reference direction has helped the problem to be searchable on the entire POF (Pareto-Optimal Front), ensuring diversity of sample in objective space Keywords: Multiobjective optimization, distributed hydrological model, parameter estimation Ngày nhận bài: 22/12/2020 Ngày chấp nhận đăng: 23/2/2021 KHOA HỌC KỸ THUẬT THỦY LỢI VÀ MÔI TRƯỜNG - SỐ 73 (3/2021) 17 ... tương ứng không gian thông số (không véc tơ thông số F: Ω -> Rm hàm ánh xạ từ không gian thông số Ω sang không gian Euclid m chiều Rm gọi không gian mục tiêu Lựa chọn tốt để giải toán. . .tiêu có tương quan cao; thuật tốn thường có hiệu không cao mục tiêu hiệu chỉnh lớn;? ?Bài báo trình bày kết nghiên cứu, ứng dụng kỹ thuật phân rã không gian mục tiêu nhằm tìm lời giải tối... giải toán tối ưu đa mục tiêu chứa đựng tất véctơ định mà véctơ mục tiêu tương ứng chúng cải thiện tốt chiều mà không làm suy giảm chiều khác b) Giải toán theo phương pháp phân rã không gian mục