Nghiên cứu này sử dụng một tập hợp các cây quyết định RF như thuật toán ML, GCM với tham số hóa đối lưu dựa trên ML chạy ổn định và nắm bắt chính xác các thông số.. Sử dụng học máy để mô
Trang 1Paul A O'Gorman, John G Dwyer
Phân tích bài báo
Sử dụng học máy để tham số hóa đối lưu ẩm: Tiềm năng mô hình hóa khí hậu, biến đổi khí
hậu và các hiện tượng cực
đoanNhóm 1: Vũ Quang Anh 20216045
Ngô Đức Anh 20216037Ngô Đức Anh 20205529Nguyễn Mậu Bắc 20205541
Trang 2Các tiêu đề bài báo
Trang 3Giới thiệu tác dụng của học máy (ML)
Kết quả của ML có thể áp dụng một cách hiệu quả vào mô hình hoàn lưu chung (GCM)
Nghiên cứu này sử dụng một tập hợp các cây quyết định (RF) như thuật toán ML, GCM với tham số hóa đối lưu dựa trên ML chạy ổn định và nắm bắt chính xác các thông số.
Các tham số hóa ML có thể được kết hợp để cung cấp chẩn đoán về tương tác giữa đối
lưu và môi trường quy mô lớn.
Sử dụng học máy để mô phỏng các hiện tượng quy mô nhỏ trong mô hình khí hậu có thể cải thiện độ chính xác.
Trang 4Định nghĩa các mô hình hoàn lưu chung ( GCM)
Các mô hình hoàn lưu chung (GCM) của khí quyển và đại dương là công cụ quan trọng để mô phỏng khí hậu và dự báo thời tiết bằng số GCM dựa trên các phương trình mô tả động lực học đã được giải quyết (sử dụng các định luật bảo toàn năng lượng, động lượng và khối lượng) và các sơ đồ tham số hóa đại diện cho các quá trình lưới điện con.
Định nghĩa về học máy ( ML)
Tạo ra các sơ đồ tham số hóa mới bằng cách điều chỉnh mô hình thống kê
phù hợp với đầu ra của các mô hình vật lý, thể hiện chân thực hơn động lực học của lưới điện con.
Nội dung phần giới thiệu
1.1 So sánh việc tham số hóa dựa trên học máy và tham số hóa thông
thường
1.2 Đối tượng của tham số hóa dựa trên học máy
1.3 So sánh việc tham số hóa dựa trên học máy trong các mô phỏng bằng GCM được lý tưởng hóa với các mô phỏng bằng RAS ( tham số hóa RF)
1 Introduction
( giới thiệu)
Trang 5- Đưa ra khái niệm, ưu nhược điểm của việc sử dụng thuật toán RF
RF là một công cụ ước tính ML bao gồm một tập hợp các cây quyết định.
RF được sử dụng rộng rãi vì chúng không yêu cầu tiền xử lý nhiều và chúng thường hoạt động tốt trên nhiều loại siêu tham số
Ưu điểm chính của việc sử dụng RF là các dự đoán có ý nghĩa đối với các tập hợp con của dữ liệu huấn luyện và điều này dẫn đến sự bảo toàn năng lượng và tính không âm của lượng mưa bề mặt bằng cách tham số hóa RF.
Nhược điểm của RF là phải có sẵn bộ nhớ đáng kể khi chạy GCM để lưu trữ cấu trúc cây và các giá trị dự đoán.
2 Thuật toán RF
Trang 6Cấu hình mô hình khí hậu toàn cầu lý tưởng (GCM)
Sử dụng mô hình đối lưu (RAS) như trong mô hình AM2 của GFDL.
GCM lý tưởng không bao gồm các yếu tố phức tạp như chu kỳ ngày đêm và tương tác mây-bức xạ.
Mô phỏng số
Mô phỏng được thực hiện với RAS và không có RAS để so sánh.
Mô phỏng được đưa đến trạng thái cân bằng thống kê trong 700 ngày, sau đó tiếp tục chạy để thu thập dữ liệu huấn luyện cho học máy.
Xem xét hai khí hậu: kiểm soát (288 K) và ấm (295 K).
3 Sơ đồ đối lưu và mô phỏng GCM(mô hình lưu
thông chung) lý tưởng hóa
Trang 7Mô hình khí quyển dựa trên mô hình lõi động quang phổ GFDL với đại dương lớp hỗn hợp nông
Không có đất, băng, mùa hay ngày
Bức xạ mặt và dài được đại diện đơn giản hóa
GCM lý tưởng
Độ phân giải: T42 (30 mức sigma dọc)
Bước thời gian: 10 phút
Trang 8SLIDE
Thực hiện mô phỏng với sơ đồ RAS và RF trên 700 ngày để đạt trạng thái cân bằng thống kê.
Sau đó chạy 3.300 ngày (RAS) hoặc 900 ngày (RF) để thu thập dữ liệu huấn luyện cho ML.
So sánh với các mô phỏng không có đối lưu.
Mô phỏng
Xét hai loại khí hậu: kiểm soát và ấm áp.
Trang 9Phần 4 nêu cách thức đào tạo và xác nhận thông số của thuật toán RF, cụ thể:
Phần 4 nêu cách thức lựa chọn môi trường và phương pháp đào tạo thuật toán từ
dữ liệu đó
Từ kết quả đào tạo xác nhận về tính đúng đắn của thuật toán
Rút ra kết luận của thuật toán đối với môi trường
4 Đào tạo và xác nhận RF
4.1 Vai trò của phần 4 trong bài báo
Trang 114.2.2 Huấn luyện và kiểm tra dữ liệu
4 Đào tạo và xác nhận RF
Lưu dữ liệu hồ sơ nhiệt độ, độ ẩm và áp suất bề mặtTính xu hướng đối lưu của nhiệt độ và độ ẩm do RAS đưa ra
Lưu 70% mẫu để huấn luyện, 30% còn lại làm tập dữ liệu kiểm tra
Ngẫu nhiên chọn mẫu để số lượng mẫu theo vĩ độ tỷ lệ với cosin vĩ độ Tổng hợp và trộn lại các mẫu huấn luyện
4.2 Nội dung của phần 4
Trang 124.2.3 Huấn luyện RF và chọn tham số
+ n_estimators = 10; min_sample_leaf = 10; n_train = 700.000
Kích thước mẫu huấn luyện:
+ Tương đương với khoảng 5 năm dữ liệu mô hình; Có thể giảm bằng cáchlấy mẫu thường xuyên hơn hàng ngày
Kết quả:
+ RF huấn luyện trên mô phỏng kiểm soát có 62.250 nút mỗi cây
4.2 Nội dung của phần 4
Trang 134.2.4 Xác thực trên tập dữ liệu thử nghiệm
4 Đào tạo và xác nhận RF
4.2 Nội dung của phần 4
Trang 144.2.5 Bảo toàn năng lượng và lượng mưa không âm
Trang 15Sau khi xác nhận tính chất của RF, phần 5 sẽ dùng thuật toán RF để áp
dụng vào GCM và mô phỏng và chứng minh được hiệu quả của RF thông
qua kết quả:
RF tái tạo chính xác thống kê khí hậu
RF có làm tăng tốc GCM gấp 3
So với RAS, RF mô phỏng thống kê khí hậu có hiệu quả tốt hơn
5 Triển khai trong GCM và Mô phỏng khí hậu kiểm soát
5.1 Vai trò của phần 5 trong bài báo
Trang 165 Triển khai trong GCM và Mô phỏng khí hậu kiểm
soát
5.2 Nội dung của phần 5
Kết quả của môphỏng chứngminh tính hiệuquả của RF
Trang 17ĐÀO TẠO Ở CÁC VÙNG KHÍ HẬU KHÁC NHAU PHẦN 6
Trang 18Vị trí
Là một đoạn trong phần
kết quả
Đưa ra các biểu đồ, thông số
cụ thể về đào tạo máy ở các điều kiện khác nhau
Nội dung
Trang 19CÁCH TIẾP CẬN
Trong môi trường khí
hậu kiểm soát Trong môi trường khí hậu ẩm
Nội dung
Trang 20Dữ liệu đo áp suất bề mặt
Trang 21Dữ liệu đo thông số nhiệt độ
Trang 22Dữ liệu đo thông số lượng mưa
Trang 23Những dữ liệu được đào tạo sẽ được gộp lại để làm dữ liệu cho một máy
2 3
Ý chính
Đưa ra các thông số cụ thể về đào tạo máy trong các môi trường khác nhau Phân tích dữ liệu, sai số trong thực tế, đưa ra dữ liệu chính xác hơn
Trang 24ĐỘ NHẠY CẢM VỚI NHIỄU LOẠN
PHẦN 7
Trang 26HÀM PHẢN HỒI TRẠNG THÁI
Phản hồi các thông tin đo lường nhiệt
độ, độ ẩm và áp suất bề mặt, lượng
mưa
Từ đó các thông tin được xử lý bằng cách
tính trung bình hiệu số các thông tin ấy,
giảm răng cưa của biểu đồ, giảm sự nhiễu
loạn
Cách giải quyết
Trang 278 Thay thế cả sơ đồ ngưng tụ và đối lưu quy mô lớn
Sử dụng thuật toán ML thay cho quy trình đối lưu ẩm, giữ nguyên các lược đồ thông thường đối với ngưng tụ quy mô lớn, bức xạ và ranh giới lớp
Có thể dùng ML để biểu diễn tất cả các lược đồ hoặc chỉ một số lược đồ trong mô hình khí hậu toàn cầu (GCM)
Thử nghiệm cũng thay thế tổng khuynh hướng của lược đồ đối lưu ẩm và lược đồ ngưng tụ quy mô lớn bằng một khu rừng ngẫu nhiên (RF) cho kết quả tệ với độ ẩm tương đối, đặc biệt ở tầng đối lưu trên của vùng ôn đới ngoài nhiệt đới
Sau khi điều chỉnh cách đào tạo để tính đến các tính chất của lược đồ ngưng tụ quy
mô lớn, thì vấn đề độ ẩm tương đối đã được loại bỏ phần lớn
RF với sự lựa chọn về lấy mẫu, các đặc trưng và tỷ lệ đầu ra này dự đoán chính xác các khuynh hướng ngưng tụ đối lưu kết hợp và ngưng tụ quy mô lớn cùng lượng mưa trên bề mặt.
Trang 28Quyết định thay thế mô
8 Thay thế cả sơ đồ ngưng tụ và đối lưu quy mô lớn
Huấn luyện trên đầu ra của các mô hình độ phân giải cao cho phép
ML đại diện cho tất cả hoặc một số mô hình trong một GCM.
Thử thay thế tổng của các xu hướng từ mô hình hấp thụ ẩm và mô hình kích thước lớn của hiện tượng kết tủa bằng một RF.
Sử dụng RF trong GCM
đối với độ ẩm tương
đối gặp khó khăn, đặc
biệt ở tầng cao phân
nửa quảng đại.
Điều chỉnh phương pháp huấn luyện để giải quyết vấn đề với
độ ẩm tương đối trong RF
Chuyển sang sử dụng
độ ẩm tương đối như đặc điểm đầu vào cho hiện tượng kết tủa kích thước lớn.
Trang 29- Bài viết đã nghiên cứu cách hoạt động của tham số hóa đối lưu ẩm dựa trên RF khi được triển khai trong GCM trong môi trường lý tưởng hóa.
Tham số hóa RF làm mô phỏng khí hậu kiểm soát chính xác, dễ đảm bảo các ràng buộc vật lý (như bảo toàn năng lượng).
RF hoạt động tốt trong GCM để mô phỏng lượng mưa cực đoan mà không cần đào tạo chuyên biệt.
RF được đào tạo trong khí hậu kiểm soát không thể khái quát hóa được khí hậu ấm áp sau một vĩ
Trang 30REFERENCES
Trang 31THANK YOU
FOR WATCHING