Báo cáo cải thiện mô hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Nhóm 11: Các thành viên Nguyễn Văn Tú 19021381 Phạm Thanh Vĩnh 19021396 Bùi Văn Toán 19021372 Nguyễn Mạnh Tuấn 19021384 Giới thiệu và xem xét vấn đề Giới thiệu Các cách tiếp cận trước đó Cách tiếp cận cải tiến Nghiên cứu Khu vực nghiên cứu Dữ liệu khảo sát Nồng độ PM2.5 Khí tượng Mô hình Tổng quan Xây dựng mô hình 1. Tiền xử lý 2. MLP tạo PM2.5 có trọng số cho K khu vực lân cận 3. LSTM để trích xuất đặc trưng không thời gian 4. MLP dự đoán nồng độ PM2.5 vùng trung tâm trong ngày tiếp theo 5. Đánh giá, kết quả và thảo luận Mở rộng vấn đề Tham khảo Từ khóa quan trọng Nhóm 11: Các thành viên Báo cáo cải thiện mô hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5
🗞 Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Nhóm 11: Các thành viên Nguyễn Văn Tú - 19021381 Phạm Thanh Vĩnh - 19021396 Bùi Văn Toán - 19021372 Nguyễn Mạnh Tuấn - 19021384 Giới thiệu xem xét vấn đề Giới thiệu Các cách tiếp cận trước Cách tiếp cận cải tiến Nghiên cứu Khu vực nghiên cứu Dữ liệu khảo sát Nồng độ PM2.5 Khí tượng Mơ hình Tổng quan Xây dựng mơ hình Tiền xử lý MLP tạo PM2.5 có trọng số cho K khu vực lân cận LSTM để trích xuất đặc trưng khơng - thời gian MLP dự đốn nồng độ PM2.5 vùng trung tâm ngày Đánh giá, kết thảo luận Mở rộng vấn đề Tham khảo Từ khóa quan trọng Nhóm 11: Các thành viên Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Nguyễn Văn Tú - 19021381 Phạm Thanh Vĩnh - 19021396 Bùi Văn Toán - 19021372 Nguyễn Mạnh Tuấn - 19021384 Giới thiệu xem xét vấn đề Giới thiệu Tốc độ tăng trưởng kinh tế nhanh chóng tồn giới gây tình trạng nhiễm khơng khí nghiêm trọng Một thành phần quan trọng tạo nên nhiễm khơng khí mà quan tâm gần bụi mịn PM2.5 Loại bụi mịn có đường kính 2.5μm nên dễ dàng thâm nhập vào phổi từ gây bệnh hơ hấp, tim mạch Việc dự đốn nồng độ PM2.5 địa phương giúp ích nhiều cho việc kiểm soát đưa khuyến cáo, hướng giải kịp thời, nhằm nâng cao đời sống, sức khỏe người Để đạt mục đích này, nghiên cứu đề xuất mơ hình mở rộng mạng LSTM có trọng số (WLSTME) Các cách tiếp cận trước Sử dụng mơ hình lý-hóa để mơ lại tương khuếch đại khơng khí nhiễm ⟶ Phụ thuộc vào kiến thức chuyên gia ⟶ Dễ mắc phải thiếu sót Sử dụng mơ hình học từ liệu thực tế Mơ hình hóa mối quan hệ tuyến tính đặc trưng liệu quan sát nồng độ PM2.5 trạm trung tâm ⟶ Quá đơn giản dẫn đến underfit Biểu diễn mối quan hệ phi tuyến thông qua MLP, SVR, RNN, LSTM LSTM dùng biểu diễn phụ thuộc thời gian tập liệu khứ liệu Dựa vào liệu trạm hàng xóm có mối quan hệ mật thiết để đưa dự đốn (KNN) Dữ liệu trạm hàng xóm đánh trọng số dựa Báo cáo cải thiện mô hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 khoảng cách hướng gió, tốc độ gió liệu thu lịch sử so với liệu trạm trung tâm ⟹ Sử dụng đặc trưng khoảng cách địa lý đặc điểm hướng, tốc độ gió đại lượng đánh giá tương quan không gian tốt Tuy nhiên tương quan mô tả qua quan hệ tuyến tính → Có thể cải tiến Cách tiếp cận cải tiến Trên thực tế, mối tương quan trạm trung tâm trạm lân cận không đơn mối quan hệ tuyến tính khoảng cách địa lý đặc điểm gió, mà bị ảnh hưởng phụ thuộc mật độ trạm, phân bố trạm không đồng Cần mơ hình phức tạp để có ⇒ thể mơ đặc điểm mật độ trạm TUYẾN Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 ⇒ MƠ HÌNH PHI Đề xuất mơ hình mở rộng mạng LSTM có trọng số (WLSTME), giải vấn đề làm để xem xét ảnh hưởng mật độ phân bố trạm điều kiện gió lên mối tương quan mặt khơng gian ô nhiễm không khí Đầu tiên, chọn K trạm lân cận xung quanh trạm trung tâm Đánh trọng số dựa khoảng cách, nồng độ ô nhiễm đặc trưng gió Trọng số sinh mạng MLP ⟶ Tạo tương quan không gian trạm trung tâm trạm lân cận Sau đó, kết hợp với lịch sử nồng độ PM2.5 trạm trung tâm chuỗi liệu PM2.5 có trọng số K trạm lân cận để làm đầu vào cho mạng LSTM ⟶ Tạo thành đặc trưng không - thời gian tốt Cuối cùng, MLP khác sử dụng để tích hợp đặc trưng khơng - thời gian trích xuất với đặc trưng phụ khác trạm trung tâm (dự báo điều kiện khí tượng hơm sau) ⟶ Tạo dự báo nồng độ PM2.5 tương lai khu vực trung tâm Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 💡 Cách tiếp cận gọi Weighted Long - Short Term Memory neuron network extended model (WLSTM) Nghiên cứu Khu vực nghiên cứu Khu vực Bắc Kinh – Thiên Tân – Hà Bắc (BTH) Trung Quốc khu vực kinh tế động Trung Quốc, bao gồm Bắc Kinh, Thiên Tân 11 thành phố tỉnh Hà Bắc Theo Bộ Bảo vệ Môi trường (MEP) (2018), số 20 thành phố nhiễm nhất, có thành phố thuộc tỉnh Hà Bắc, Thiên Tân Bắc Kinh xếp thứ 15 19 Do đó, nghiên cứu sử dụng vùng BTH làm vùng nghiên cứu để xây dựng mơ hình dự báo nồng độ PM2.5 Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Vị trí trạm chất lượng khơng khí vùng BTH Màu sắc đại diện cho thứ hạng nồng độ PM2.5 trung bình hàng ngày thời gian từ ngày tháng năm 2015 đến ngày 31 tháng 12 năm 2017 Dữ liệu khảo sát Nồng độ PM2.5 Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Khảo sát 110 trạm quan trắc nhiễm khơng khí phân bố khu vực nghiên cứu, giúp thu thập: Nồng độ hàng PM2.5, PM10, CO, NO2, O3 SO2 Vĩ độ kinh độ trạm, tháng tuần quan sát Khí tượng Ta quan sát thêm biến khí tượng như: Độ ẩm tuyệt đối (Absolute humidity): khối lượng nước thể tích khí giữ nhiệt độ định Tổng cột nước (Total column water vapor): tổng nước cột khí lấy khí Hơi nước giữ nhiệt tốt CO2, di chuyển có ảnh hưởng đến chuyển đổi nhiệt khu vực khác ảnh hưởng đến lượng mưa (Thời tiết ẩm nhiễm khơng khí) Nhiệt độ điểm sương (Dew point temperature): nhiệt độ nước chuyển sang thể lỏng Nhiệt độ (MOD11A1 - liệu vệ tinh ECMWF) Áp suất khí Tốc độ gió, hướng gió toˊ ˆc độ gioˊ = hướng gioˊ = u2 + v2 π v − tan−1 u u, v : tốc độ gió địa đới kinh tuyến Mơ hình Tổng quan Khung tổng thể mơ hình WLSTME đề xuất mơ hình kết hợp tích hợp ba mạng nơ-ron: Một mạng MLP để tạo PM2.5 có trọng số cách kết hợp tốc độ hướng gió, khoảng cách địa lý với nồng độ PM2.5 lịch sử Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Một mạng LSTM để giải đồng thời phụ thuộc không gian thời gian trích xuất đặc trưng khơng - thời gian Một mạng MLP khác để tối ưu hóa dự đốn cách tích hợp tính cơng nghệ khơng gian liệu dự báo thời tiết Xây dựng mơ hình Tiền xử lý Loại bỏ trạm lân cận thiếu 10% liệu nồng độ PM2.5 Chuẩn hóa liệu đầu vào μ = 0, σ = Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Sử dụng liệu nhiệt độ (MOD11A1 - liệu vệ tinh ECMWF) cung cấp liệu vệ tinh có độ phân giải khơng gian cao hơn, sử dụng phép nội suy từ ECMWF cho trạm khơng có liệu vệ tinh (R2 = 0.91) csM = 0.953842 ∗ csE − 0.074635 Cuối cùng, liệu nhiệt độ thu thập từ tập liệu MOD11A1 ECMWF hợp với để nâng cao độ tin cậy MLP tạo PM2.5 có trọng số cho K khu vực lân cận Các chất ô nhiễm vận chuyển khu vực dựa vào gió, nhiễm khơng khí khu vực trung tâm có mối tương quan mặt không gian với khu vực lân cận Nhưng, trạm quan trắc có phân bố khơng đồng đều, khoảng cách vị trí lân cận vị trí trung tâm khác vị trí trung tâm khác 💡 MLP ba lớp tích hợp khoảng cách gió vị trí lân cận với PM2.5 để tạo liệu PM2.5 có trọng số cho vị trí lân cận j vị trí trung tâm i Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Các liệu ta đưa vào mơ hình: PM2.5jt : biểu diễn tập trung PM2.5 vùng lân cận j thời điểm t vjt : tốc gió vùng lân cận j thời điểm t dij : khoảng cách vùng trung tâm i lân cận j θijt : góc hướng gió từ vùng lân cận j với cạnh ij thời điểm t Những đại lương có liên quan đến tương quan khơng gian trạm trung tâm trạm lân cận: Theo dõi nồng độ PM2.5 giúp xem xét tương quan nồng độ bụi trạm giống trọng số lớn Khoảng cách địa lý ô nhiễm không khí lan sang nơi khác dựa vào gió cần xem xét vận tốc gió hướng gió trạm địa phương Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 10 Khi xây dựng mơ hình, ta thu số liệu bụi PM2.5 cho K khu vực lân cận đánh trọng số theo mức độ tương quan không gian LSTM để trích xuất đặc trưng khơng - thời gian LSTM mạng nơ-ron hồi quy đặc biệt (RNN), có khả nắm bắt đồng thời phụ thuộc dài ngắn liệu chuỗi thời gian Mơ hình LSTM sử dụng LSTM trạng thái hai lớp, sử dụng trạng thái lô mẫu LSTM làm trạng thái ban đầu lô mẫu Mơ hình LSTM hai lớp Kết hợp liệu lịch sử PM2.5 có trọng số từ MLP liệu ô nhiễm vùng trung tâm lân cận để đưa vào LSTM với mục đích trích xuất đặc điểm khơng gian - thời gian Dữ liệu hợp thành ma trận r × (K + 1): K số vùng lân cận, r chuỗi thời gian tương ứng giá trị cột nồng độ vùng trung tâm lân cận Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 11 MLP dự đoán nồng độ PM2.5 vùng trung tâm ngày Các biến phụ trợ: nhiệt độ, tốc độ gió, nhiệt độ điểm sương, áp suất khí quyển, tổng cột nước, liệu thời gian (ngày tuần tháng năm), vĩ độ trạm trung tâm thời điểm t Kết hợp biến phụ trợ với đặc trưng không thời gian từ LSTM đưa vào MLP ta có dự đoạn nồng độ PM2.5 ngày hơm sau vị trí trung tâm Đánh giá, kết thảo luận Ba tiêu chí dùng để đánh giá hiệu mơ hình: Sai số tuyệt đối trung bình (MAE) Sai số bình phương trung bình (RMSE) Chỉ số độ xác tổng (p) Vì nồng độ PM2.5 theo mùa khác nhau, nên việc chia tập liệu theo năm thiết yếu Ta lấy liệu năm 2015 2016 để đào tạo xây dựng mơ hình năm 2017 để đánh giá hiệu suất mơ hình Biểu đồ so sánh mơ hình theo mùa Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 12 Biểu đồ sai số bình phương trung bình theo khơng gian Vị trí trạm chất lượng khơng khí vùng BTH Màu sắc đại diện cho thứ hạng nồng độ PM2.5 trung bình hàng ngày thời gian từ ngày tháng năm 2015 đến ngày 31 tháng 12 năm 2017 Mở rộng vấn đề Trong tương lai, nên tập trung vào dự đoán gia tăng đột ngột PM2.5, đặc biệt vào mùa đông tất mơ hình hoạt động Ảnh hưởng sách phủ số lượng nhà máy khu vực Các phương pháp phức tạp để xem xét mật độ địa điểm Tham khảo An improved deep learning model for predicting daily PM2.5 concentration Từ khóa quan trọng MLP, RNN, LSTM, WLSTM, zontal and meridional, R2 − value, RMSE, MAE, partial autocorrelation, inverse distance weight method, interpolate, ECMWF, MOD11A1, KNN, spatialtemporal correlation, RSMprop optimizer Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 13 ... xây dựng mơ hình dự báo nồng độ PM2 .5 Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Vị trí trạm chất lượng khơng khí vùng BTH Màu sắc đại diện cho thứ hạng nồng độ PM2 .5... cột nồng độ vùng trung tâm lân cận Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 11 MLP dự đoán nồng độ PM2 .5 vùng trung tâm ngày Các biến phụ trợ: nhiệt độ, tốc độ. .. sát Nồng độ PM2 .5 Báo cáo cải thiện mơ hình học sâu cho việc dự báo nồng độ bụi mịn PM 2.5 Khảo sát 110 trạm quan trắc nhiễm khơng khí phân bố khu vực nghiên cứu, giúp thu thập: Nồng độ hàng PM2 .5,