Xây dựng mô hình dự báo chất lượng không khí

66 1 0
Xây dựng mô hình dự báo chất lượng không khí

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP.HCM TRƢỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC XÂY DỰNG MƠ HÌNH DỰ BÁO CHẤT LƢỢNG KHƠNG KHÍ Ngành: KHOA HỌC MÁY TÍNH HỘI ĐỒNG : KHOA HỌC MÁY TÍNH GVHD : TS LÊ THANH VÂN GVPB : TS LÊ TRỌNG NHÂN -o0o SVTH : NGUYỄN HỮU NGHĨA - 1927027 TP HỒ CHÍ MINH, THÁNG 02/2022 LỜI CAM ĐOAN Em xin cam đoan cơng trình nghiên cứu dƣới hƣớng dẫn cô Lê Thanh Vân Các số liệu đƣợc sử dụng cho phân tích, nhận xét đƣợc thu thập từ nhiều nguồn khác đƣợc ghi rõ phần tài liệu tham khảo Kết nghiên cứu đƣợc trình bày luận văn em thực hoàn toàn trung thực Nếu phát có gian lận nào, em xin hoàn toàn chịu trách nhiệm nội dung luận văn trƣớc Ban chủ nhiệm Khoa Ban giám hiệu nhà trƣờng TP Hồ Chí Minh, tháng 02 năm 2022 Sinh viên thực Nguyễn Hữu Nghĩa LỜI CẢM ƠN Em xin gửi lời cảm ơn chân thành đến cô Lê Thanh Vân, khoa Khoa học Kỹ thuật máy tính – Trƣờng Đại học Bách Khoa thành phố Hồ Chí Minh Cơ trực tiếp bảo hƣớng dẫn em suốt trình thực luận văn Sự giúp đỡ tận tình động lực to lớn để em hoàn thiện đề tài Em xin cảm ơn đến thầy, cô công tác Khoa Khoa Học Kỹ Thuật Máy Tính – Trƣờng Đại học Bách Khoa thành phố Hồ Chí Minh, ngƣời hết lòng truyền đạt kiến thức, kỹ quý báu suốt thời gian vừa qua Đó kiến thức tảng vô quan trọng, không q trình thực luận văn mà cịn hành trang thiếu để tiếp tục nghiệp sau TP Hồ Chí Minh, tháng 02 năm 2022 Sinh viên thực Nguyễn Hữu Nghĩa TÓM TẮT ĐỀ TÀI Ơ nhiễm mơi trƣờng ln vấn đề đáng quan tâm đến sức khỏe ngƣời Quá trình phát triển thị cơng nghiệp hóa quốc gia kéo theo vấn đề ô nhiễm môi trƣờng, có ô nhiễm không khí Các phƣơng tiện giao thơng giới sử dụng nhiên liệu hóa thạch nhƣ xăng, dầu diesel sản sinh nhiều loại khí thải SO2, NO2, CO, PM10/PM2.5 trình đốt nhiên liệu Các chất nhiễm khơng khí xâm nhập sâu vào phổi, hệ thống tim mạch gây nhiều bệnh từ nhẹ nhƣ ho, kích ứng hơ hấp đến bệnh chí nặng nhƣ đột quỵ, ung thƣ phổi Tại Việt Nam, việc tiếp cận số đánh giá chất lƣợng khơng khí cịn nhiều hạn chế nên việc sử dụng liệu có để đánh giá tác động đến sức khỏe tƣơng lai gần cần thiết Trong khuôn khổ luận văn này, nhiều phƣơng pháp đánh giá chất lƣợng môi trƣờng khác đƣợc đề cập đến Mặc khác liệu thực tế đƣợc truy vấn, đánh giá sử dụng để thực số mơ hình đánh giá chất lƣợng khơng khí mức độ đánh giá ảnh hƣởng đến sức khỏe ngƣời Các mơ hình khác đƣợc khảo sát luận văn bao gồm: mơ hình dự báo truyền thống (Tự hồi quy, ARIMA, Holt-Winters) mơ hình mạng nhân tạo (mạng nơ ron ANN, mạng nơ ron RNN, mạng nơ ron LSTM) Kết thử nghiệm luận văn cho thấy mơ hình nơ ron nhân tạo có khả dự báo số chất lƣợng khơng khí với sai lệch thấp tốt nhiều so với mô hình dự báo truyền thống Ngồi ra, mơ hình mạng nhân tạo luận văn đƣợc cải tiến để sử dụng nhiều liệu khác cho phù hợp với thực tiễn Kết đƣợc áp dụng để cải tiến mơ hình dự báo chất lƣợng khơng khí Từ khóa: Dự báo chất lƣợng khơng khí, Air Quality Index, Học máy, Mơ hình mạng nơ ron nhân tạo MỤC LỤC TĨM TẮT ĐỀ TÀI DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH ẢNH CHƢƠNG - GIỚI THIỆU ĐỀ TÀI 1.1 Đặt vấn đề 1.2 Mục tiêu, đối tƣợng phạm vi nghiên cứu 11 1.2.1 Mục tiêu nghiên cứu 11 1.2.2 Đối tƣợng phạm vi nghiên cứu 11 1.3 Ý nghĩa thực tiễn đề tài 11 1.4 Cấu trúc luận văn 12 CHƢƠNG - CƠ SỞ LÝ THUYẾT 13 2.1 Các tiêu chất lƣợng khơng khí phƣơng thức tính 13 2.1.1 Các tiêu chất lƣợng khơng khí 13 2.1.2 Tiêu chí đánh giá chất lƣợng khơng khí 15 2.2 Chuỗi thời gian số tính chất chuỗi thời gian 19 2.2.1 Khái niệm 19 2.2.2 Tính chất chuỗi thời gian 19 2.2.3 Chuỗi dừng 20 2.2.4 Tự tƣơng quan tự tƣơng quan bán phần 20 2.2.5 Nhiễu trắng bƣớc ngẫu nhiên 20 2.3 Đánh giá chất lƣợng không khí phƣơng pháp thống kê 21 2.3.1 Mơ hình tự hồi quy 21 2.3.2 Mô hình ARIMA 21 2.3.3 Mơ hình làm mƣợt lũy thừa 22 2.4 Đánh giá chất lƣợng khơng khí học máy 24 2.4.1 Mạng nơ ron nhân tạo (Artificial Neural Network - ANN): 24 2.4.2 Mạng nơ ron hồi quy (Recurrent Neural Network - RNN) 26 2.4.3 Mạng nơ ron LSTM (Long Short Term Memory) 26 2.4.4 Một số hàm tối ƣu học máy 27 2.5 Các công trình liên quan 29 CHƢƠNG – MƠ HÌNH DỰ BÁO CHẤT LƢỢNG KHƠNG KHÍ 34 3.1 Lƣợc đồ nghiên cứu 34 3.2 Thu thập liệu 35 3.3 Chuẩn bị liệu đầu vào 36 3.4 Kiểm định liệu 37 3.5 Tạo tập huấn luyện 38 3.6 Xây dựng mơ hình 39 3.6.1 Mô hình tự hồi quy 39 3.6.2 Mơ hình ARIMA 40 3.6.3 Mơ hình Holt-Winters 41 3.6.4 Mơ hình Mạng nhân tạo 41 3.7 Xây dựng thí nghiệm đánh giá mơ hình 42 3.7.1 Xây dựng thí nghiệm 42 3.7.2 Đánh giá mơ hình 43 3.8 Tối ƣu mở rộng mơ hình 43 3.8.1 Xác định thông số tối ƣu 43 3.8.2 Mở rộng mô hình với tập đầu vào liệu thơ 44 3.8.3 Mở rộng mơ hình với tập đầu vào liệu trạm lân cận 45 CHƢƠNG – KẾT QUẢ VÀ THẢO LUẬN 46 4.1 Đánh giá liệu 46 4.2 Xây dựng đánh giá mơ hình 48 4.2.1 Thí nghiệm 48 4.2.2 Thí nghiệm 50 4.2.3 Thí nghiệm 51 4.3 Xác định thông số tối ƣu 51 4.4 Mở rộng với tập đầu vào liệu thô 52 4.5 Mở rộng với tập đầu vào liệu trạm lân cận 54 4.6 Thảo luận chung 55 CHƢƠNG - TỔNG KẾT 57 5.1 Đánh giá kết đạt đƣợc 57 5.2 Hƣớng phát triển tƣơng lai 58 TÀI LIỆU THAM KHẢO 59 PHỤ LỤC 61 độ lệch chuẩn thay đổi liên tục theo thời gian Ngoài ra, biểu đồ giá trị tự hồi quy ACF cho thấy có liên hệ giá trị thời gian t với lag thời gian trƣớc Do kết luận chuỗi giá trị main AQI trạm s1090 không chuỗi giá trị nhiễu trắng Tiếp đến, biểu đồ ACF sai phân bậc giá trị main AQI cho thấy có liên hệ giá trị sai phân thời điểm t với lag thời gian trƣớc Do vậy, chuỗi xét khơng phải chuỗi bƣớc ngẫu nhiên nên xây dựng mơ hình dự báo giá trị chuỗi xét Trong biểu đồ PACF, ta thấy có khoảng điểm lag nằm ngồi khoảng tin cậy (95% confidence interval), chuỗi giá trị main AQI có xuất chu trình MA Quan sát thêm biểu đồ phân rã chu kỳ (Hình 4.3), ta nhận thấy biểu đồ xu hƣớng khơng thể rõ tính tăng hay giảm liên tục, nhiên có lặp lại tuần hoàn giá trị chuỗi liệu theo chu kỳ cho 24 Nhƣ vậy, với mơ hình có tham số lựa chọn chu kỳ, giá trị chu kỳ đƣợc đặt mức 24 hợp lý a b c d Hình 4.3 Biểu đồ phân rã chu kỳ giá trị main AQI a) Biểu đồ gốc; b) Biểu đồ xu hướng; c) Biểu đồ chu kỳ; d) Biểu đồ phần dư 4.2 Xây dựng đánh giá mơ hình 4.2.1 Thí nghiệm Trong Thí nghiệm 1, mơ hình Tự hồi quy, ARIMA, Holt-Winters, ANN, RNN LSTM sử dụng 24 giá trị ban đầu để dự báo cho 12 giá trị Độ lệch sai số trung bình mơ hình dự báo số chất lƣợng khơng khí đƣợc miêu tả Bảng 4.2 Bảng 4.2 Sai số dự báo trung bình mơ hình - Thí nghiệm RMSE RMSE50 RMSEadj MAE MAE50 MAEadj Tự hồi quy 24.91 19.78 22.85 17.82 21.38 17.06 ARIMA 26.89 21.73 23.43 18.88 23.65 19.28 Holt-Winters 64.06 52.30 54.16 44.89 52.55 44.17 ANN 20.11 15.43 18.74 14.55 16.74 12.75 RNN 19.31 14.87 18.33 14.13 16.60 12.56 LSTM 21.17 16.36 20.51 15.68 17.30 13.21 48 a b c d e f Hình 4.4 Biểu đồ dự báo giá trị main AQI mơ hình – Thí nghiệm a) Tự hồi quy; b) ARIMA; c)Holt-Winters; d) ANN; e) RNN; f) LSTM 49 * Nhận xét: Ba thí nghiệm sử dụng thông số giá trị cutoff, thời gian lặp lại chu kỳ nhƣ tập liệu, khác số lƣợng giá trị đầu vào số lƣợng giá trị đầu Mục đích việc thiết kế nhằm mục đích khách quan hóa q trình đánh giá mơ hình, tồn mơ hình cho kết tập liệu đầu vào/đầu nhƣng lại cho kết tốt tập giá trị đầu vào/đầu khác Nhìn chung, số RMSE điều chỉnh số MAE điều chỉnh thấp số thô tƣơng ứng, điều phù hợp số điều chỉnh, giá trị tập hợp đƣợc lấy trung bình trƣớc so sánh nên làm giảm sai khác liệu Trong thí nghiệm 1, mơ hình Tự hồi quy đơn giản cho kết khả quan mơ hình dự báo sử dụng phƣơng pháp truyền thống, riêng mơ hình Holt-Winters cho kết sai khác nhiều Các mơ hình sử dụng mạng nhân tạo cho kết đồng tốt so với mơ hình Tự hồi quy Quan sát hình thái biểu đồ trung bình giá trị dự báo so với giá trị gốc, ta thấy mô hình mạng nhân tạo cho kết khớp với hình dạng giá trị gốc Các mơ hình cịn lại có hình dạng gần giống, nhiên giá trị đỉnh chu kỳ thấp rõ rệt so với giá trị gốc 4.2.2 Thí nghiệm Trong thí nghiệm 2, mơ hình Tự hồi quy, ARIMA, Holt-Winters, ANN, RNN LSTM sử dụng 24 giá trị ban đầu để dự báo cho 24 giá trị Độ lệch sai số trung bình mơ hình đƣợc miêu tả Bảng 4.3 Biểu đồ dự báo giá trị main AQI mơ hình đƣợc đặt phần Phụ lục Bảng 4.3 Sai số dự báo trung bình mơ hình - Thí nghiệm RMSE RMSE50 RMSEadj MAE MAE50 MAEadj Tự hồi quy 26.58 21.39 25.99 20.78 24.31 19.90 ARIMA 26.10 20.85 27.41 22.18 23.40 18.93 Holt-Winters 76.80 60.90 64.72 52.93 59.82 46.70 ANN 21.69 16.72 21.74 16.55 19.21 14.64 RNN 22.47 17.93 23.10 18.50 19.93 15.83 LSTM 23.76 18.80 21.98 17.41 20.06 15.99 * Nhận xét: Ở thí nghiệm 2, dù cần dự báo nhiều giá trị đầu so với Thí nghiệm 1, mơ hình ARIMA lại cho kết tốt so với thí nghiệm 1: số đánh giá sai khác (RMSE, MAE ) giảm Với mơ hình cịn lại, số đánh giá sai khác tăng so với thí nghiệm Điều phù hợp số lƣợng giá trị cần dự báo nhiều, khả sai khác với giá trị thực cao 50 4.2.3 Thí nghiệm Trong thí nghiệm 3, mơ hình Tự hồi quy, ARIMA, Holt-Winters, ANN, RNN LSTM sử dụng 24 giá trị ban đầu để dự báo cho 48 giá trị Độ lệch sai số trung bình mơ hình đƣợc miêu tả Bảng 4.4 Biểu đồ dự báo giá trị main AQI mơ hình đƣợc đặt phần Phụ lục Bảng 4.4 Sai số dự báo trung bình mơ hình - Thí nghiệm RMSE RMSE50 RMSEadj MAE MAE50 Tự hồi quy 32.79 26.69 26.58 21.46 30.26 ARIMA 28.11 22.45 26.04 20.69 25.48 Holt-Winters 106.29 78.83 79.84 65.12 64.35 ANN 26.41 20.78 23.91 18.79 23.36 RNN 26.33 20.73 23.89 18.96 23.34 LSTM 27.00 21.38 25.14 20.18 24.40 MAEadj 25.29 20.27 52.11 18.33 17.91 19.20 * Nhận xét: Tất mơ hình có số đánh giá sai lệch (RMSE, MAE ) cao so với thí nghiệm trƣớc Đặc biệt, mơ hình Holt-Winter cho kết sai khác lớn Mơ hình ARIMA mơ hình Tự hồi quy cho sai lệch xấp xỉ Với ba mơ hình mạng nơ ron nhân tạo, kết sai khác thấp so với mơ hình dự báo cịn lại Các số RMSE50 MAE50 thấp số RMSE thơ MAE thơ điều đƣợc mong đợi chuỗi dự báo dài, sai lệch so với giá trị gốc tăng Điểm lƣu ý thí nghiệm so sánh cặp (RMSE50 | MAE50) thí nghiệm với (RMSE | MAE) thí nghiệm 2, cặp (RMSE50 | MAE50) thí nghiệm với (RMSE | MAE) thí nghiệm ta thấy số tƣơng đối xấp xỉ Đánh giá chung qua thí nghiệm, kết cho thấy mơ hình sử dụng mạng nơ ron nhân tạo cho kết tốt so với mơ hình truyền thống Do mơ hình mạng nơ ron nhân tạo đƣợc tối ƣu để sử dụng cho thí nghiệm sau Xác định thơng số tối ƣu Trong Thí nghiệm thực so sánh số đánh giá sai lệch ba kiến trúc mạng nơ ron khác nhau, mạng nơ ron ANN, RNN LSTM, kết đƣợc trình bày Hình 4.5 Trong kiến trúc mơ hình giữ ngun lớp đƣợc sử dụng thí nghiệm 1, thí nghiệm Kiến trúc tăng gấp đôi số đơn vị tầng fully connected Kiến trúc có thiết kế nhƣ kiến trúc nhƣng bổ sung thêm tầng fully connected trƣớc lớp đầu Trung bình thời gian 100 lần chạy (bao gồm khởi tạo kiểm tra mơ hình) mạng ANN, RNN LSTM tƣơng ứng lần lƣợt 28 phút, 32 phút 33 phút 4.3 51 Hình 4.5 Biểu đồ so sánh số đo sai lệch kiến trúc khác * Nhận xét: Tại tất kiến trúc thử nghiệm, độ sai lệch mạng ANN đơn giản không khác biệt nhiều so với hai mạng RNN LSTM (đều nằm khoảng tin cậy) Tăng số nút vào lớp fully-connected (kiến trúc 2) hay việc tăng số lớp lớp fullyconnected khơng giúp mơ hình cho kết tốt hơn, mà ngƣợc lại làm tăng độ sai khác dự báo mơ hình Vì mạng nơ ron ANN cho kết thực thi nhanh có hiệu so với hai mạng nơ ron lại nên mạng ANN đƣợc sử dụng cho thí nghiệm mở rộng sau 4.4 Mở rộng với tập đầu vào liệu thơ Ở thí nghiệm này, đầu vào mơ hình khơng phải số AQI mà số quan trắc thô Các số đánh giá sai lệch dự báo mơ hình đƣợc trình bày Bảng 4.5 Hình 4.6 biểu thị kết dự báo giá trị AQI từ số Bảng 4.5 Sai số dự báo trung bình mơ hình sử dụng đầu vào liệu thô PM2.5 PM10 CO PM2.5, PM10, CO RMSE 22.25 22.99 49.28 21.19 RMSE50 17.61 18.31 42.07 16.86 RMSEadj 20.84 21.62 49.13 20.65 52 MAE 16.65 17.11 41.63 16.58 MAE50 17.23 18.48 49.09 17.31 MAEadj 13.29 14.64 42.19 13.62 a b c d Hình 4.6 Biểu đồ dự báo giá trị main AQI mơ hình – Thí nghiệm a) Đầu vào PM2.5; b) Đầu vào PM10; c) Đầu vào CO; d) Đầu vào tổ hợp (PM2.5, PM10, CO) * Nhận xét: Kết cho thấy mơ hình sử dụng số CO để dự báo giá trị AQI cho kết xấu có số đánh giá sai khác ln mức cao (RMSE 49.28, MAE 41.63) Ngƣợc lại, mơ hình sử dụng số PM2.5 PM10 cho kết tốt so với mơ hình sử dụng giá trị CO để dự báo, có sai lệch nhỏ so với mơ hình sử dụng đầu vào giá trị AQI (mơ hình ngun thủy sử dụng Thí nghiệm 1, với RMSE MAE tƣơng ứng 20.11 14.55) Khi kết hợp giá trị thơ làm đầu vào cho mơ hình, kết thu đƣợc tốt với số RMSE MAE lần lƣợt 21.19 16.58, gần với mơ hình sử dụng đầu vào giá trị AQI (mơ hình ngun thủy sử dụng Thí nghiệm 1) 53 4.5 Mở rộng với tập đầu vào liệu trạm lân cận Trong thí nghiệm 6, giá trị main AQI trạm s1046 đƣợc sử dụng làm đầu vào để dự báo cho giá trị main AQI trạm khác Dựa vào biểu đồ Hình 4.7 ta thấy, ba trạm s1046, s1037 s1081 có sai lệch nhƣng hình dạng biểu đồ giống Các trạm có vị trí quan trắc gần nằm vùng bán kính km Trạm s1090 có hình dạng biểu đồ khác biệt so với ba trạm cịn lại, có hình dạng chung, thời điểm tạo peak giá trị đỉnh giá trị đáy giống, nhƣng độ cao peak tƣơng đối khác biệt Sự sai khác hình dạng biểu đồ chấp nhận đƣợc vị trí trạm s1090 cách xa so với ba trạm lại (khoảng cách đến trạm gần 15 Km) Hình 4.7 Biểu đồ giá trị main AQI trạm quan sát Có mơ hình dự báo khác đƣợc xây dựng từ giá trị đầu vào main AQI trạm s1046 Kết đánh giá độ sai khác biểu đồ dự báo đƣợc trình bày Bảng 4.6 Hình 4.8 Bảng 4.6 Sai số dự báo trung bình dùng liệu trạm lân cận Chỉ số đầu vào sử dụng giá trị main AQI trạm s1046 Trạm đƣợc dự báo s1046 s1037 s1081 s1090 RMSE RMSE50 RMSEadj MAE MAE50 MAEadj 23.51 27.83 29.67 33.84 18.78 22.85 23.09 26.39 19.52 23.01 26.47 32.72 15.41 18.38 20.61 25.79 21.43 27.66 27.45 33.66 17.62 23.04 21.12 26.02 *Nhận xét: Từ kết sai số cho thấy: mơ hình sử dụng giá trị đầu vào liệu AQI trạm s1046 để dự báo cho trạm s1090 cho kết sai lệch nhất, cao so với sử dụng trạm để dự báo trạm gần s1037 s1081 Phân tích hình ảnh có đƣợc từ biểu đồ dự báo (Hình 4.8), ta thấy mơ hình dự báo cho trạm s1037 s1081 có hình dạng giống tốt so với mơ hình dự báo cho trạm s1090 Các kết phù hợp ba trạm s1046, s1037 s1081 đƣợc đặt vị trí gần có giá trị main AQI giống 54 a b c Hình 4.8 Biểu đồ dự báo giá trị main AQI dùng liệu trạm s1046 a) Trạm đƣợc dự báo:1037; b) Trạm đƣợc dự báo:s1081; c) Trạm đƣợc dự báo: s1090 4.6 Thảo luận chung Việc sử dụng mơ hình dự báo chất lƣợng khơng khí mơ hình thống kê tốn học lẫn mơ hình sử dụng mạng trí tuệ nhân tạo cho nhìn khách quan lịch sử phát triển mơ hình dự báo Khơng có mơ hình phù hợp hồn tồn với tập liệu, khơng có mơ hình sai khác hồn tồn với tập liệu Sử dụng mơ hình thích hợp cho đối tƣợng khác lựa chọn tốt Trong đề tài này, với tập liệu giá trị chất lƣợng khơng khí đo đạt khách quan trạm Hà Nội cho thấy mơ hình dự báo sử dụng mạng trí tuệ nhân tạo có ƣu mơ hình Tự hồi quy, ARIMA Holt-Winters có số đánh giá mức độ sai khác với giá trị dự báo tốt mơ hình truyền thống Tuy vậy, việc sử dụng mạng trí tuệ nhân tạo địi hỏi cấu hình phần cứng cao cần làm việc tập liệu lớn Kết báo RMSE thu đƣợc từ mạng ANN Thí nghiệm 20.11 cho thấy mơ hình dự báo có kết tốt, thân giá trị main AQI trạm quan sát ban đầu có chênh lệch lớn (giá trị quan sát tối đa gấp 26 lần giá trị quan sát tối thiểu, độ lệch chuẩn số lên đến 58.4) 55 Trung bình giá trị sai khác RMSE mơ hình nhằm để đánh giá 12 giá trị main AQI trạm s1090 trƣờng hợp: - sử dụng main AQI làm đầu vào mơ hình mạng nơ ron (Thí nghiệm 1), - tổ hợp giá trị thô làm đầu vào mơ hình mạng nơ ron (Thí nghiệm 5), - giá trị main AQI trạm khác làm đầu vào mơ hình mạng nơ ron (Thí nghiệm 6), có kết lần lƣợt là: 20.11, 21.19 33.84 Các giá trị cho thấy: sử dụng giá trị main AQI trạm cần dự báo để dự báo cho trạm cho kết tốt Tuy nhiên, trƣờng hợp sử dụng giá trị main AQI trạm để dự báo, ta sử dụng giá trị quan trắc thơ trạm giá trị main AQI trạm khác gần để sử dụng Ngồi ra, Thí nghiệm cho thấy triển vọng đánh giá đƣợc chất lƣợng khơng khí vị trí lân cận nơi có đặt trạm quan trắc Từ phát triển mạng lƣới dự báo chất lƣợng khơng khí cho tồn quốc, độ bao phủ trạm quan trắc đủ lớn Với kết tƣơng đối giống lặp lại thí nghiệm, thời gian thực thi nhanh sau huấn luyện mơ hình khả mở rộng cao, mơ hình sử dụng mạng nơ ron cho nhìn đầy hứa hẹn thực tiễn mơ hình mạng nhân tạo đƣợc sử dụng dự báo thời gian thực, phục vụ cho lợi ích thực tiễn sống 56 CHƢƠNG - TỔNG KẾT 5.1 Đánh giá kết đạt đƣợc Luận văn thực bƣớc để xây dựng mơ hình dự báo chất lƣợng khơng khí Dữ liệu đầu vào sử dụng đề tài chuỗi liệu thời gian thu thập theo từ trạm quan trắc khu vực Hà Nội Các liệu đƣợc đánh giá dựa biểu đồ, phân tích thống kê nhằm tìm hiểu đặc trƣng Các mơ hình dự báo khác đƣợc tìm hiểu thực đề tài bao gồm: mơ hình Tự hồi quy, mơ hình ARIMA, mơ hình Holt-Winters, mơ hình mạng nơ ron ANN, mơ hình mạng nơ ron RNN mơ hình mạng nơ ron LSTM Dữ liệu sử dụng đề tài có tính chu kỳ, lặp lại sau 24 điểm thời gian có mức độ dao động giá trị biên lớn biên nhỏ lớn Dữ liệu sau thực kiểm định để đảm bảo có khả xây dựng mơ hình dự báo (dữ liệu không chuỗi trắng không chuỗi bƣớc ngẫu nhiên), đƣợc phân tách thành tập huấn luyện tập kiểm tra dùng làm tập đầu vào tập so sánh đầu cho mơ hình Các thí nghiệm khác đƣợc thực đề tài để xác định mức độ dự báo sai khác mơ hình nhƣ: 24 giá trị đầu vào cho 12 giá trị đầu ra, 24 giá trị đầu vào cho 24 giá trị đầu ra, 24 giá trị đầu vào cho 48 giá trị đầu Kết cho thấy, nhìn chung mơ hình dự đoán nhiều giá trị làm tăng độ sai lệch so với tập giá trị kiểm tra Tuy nhiên, mơ hình mạng nhân tạo cho kết sai lệch không lớn, cho kết tốt so với mơ hình thống kê truyền thống (mơ hình tự tƣơng quan, mơ hình ARIMA mơ hình Holt-Winters) Ngồi ra, mơ hình sử dụng mạng nhân tạo cho thấy tiềm mở rộng mà mơ hình truyền thống khơng thực đƣợc: sử dụng giá trị đầu vào khác với giá trị đầu cần dự báo (sử dụng giá trị thô để dự báo main aqi, hay sử dụng giá trị trạm để dự báo cho trạm khác), sử dụng nhiều tập liệu đầu vào khác để tăng mức độ xác mơ hình dự báo Nhƣ luận văn đạt đƣợc kết sau đây: - Đề xuất đƣợc chiến lƣợc thu thập xử lý tập liệu chuỗi thời gốc thành tập thử nghiệm tập kiểm tra để phù hợp cho việc so sánh mô hình truyền thống lẫn mơ hình sử dụng mạng nhân tạo - Hồn thiện đề xuất kiến trúc mơ hình dự báo chất lƣợng khơng khí có thời gian tính tốn tối ƣu 57 - Xây dựng thành cơng mơ hình dự báo chất lƣợng khơng khí sử dụng mạng nhân tạo có khả sử dụng nhiều liệu đầu vào khác nhau, với độ sai lệch dự báo chấp nhận đƣợc 5.2 Hƣớng phát triển tƣơng lai Trong luận văn này, giới hạn số lƣợng trạm quan trắc nên chƣa đủ điều kiện để xây dựng đồ dự báo chất lƣợng không khí khu vực rộng lớn Trong tƣơng lai, luận văn mở rộng để xây dựng đồ dự báo dựa vị trí trạm diện, mật độ trạm quan trắc phù hợp đủ nhiều Đồng thời dự báo luồng dịch chuyển tác nhân nhiễm khơng khí, từ cung cấp nhìn tồn cảnh thực trạng nhiễm khơng khí cho khu vực rộng lớn Các mạng nhân tạo có khả cải tiến để sử dụng linh hoạt giá trị đầu vào giá trị đầu Các mơ hình luận văn kết hợp thêm liệu khác nhƣ hƣớng gió, nhiệt độ, độ ẩm, lƣợng mƣa kết dự báo bám sát với giá trị thực tế Trong tƣơng lai, nguồn liệu mở ngày nhiều, việc sử dụng mơ hình nhân tạo để dự báo hƣớng phát triển mạnh góp phục phục vụ lợi ích ngƣời 58 TÀI LIỆU THAM KHẢO 10 11 12 13 14 15 16 WHO out of 10 people worldwide breathe polluted air, but more countries are taking action 2021 18/07/2021]; Available from: https://www.who.int/news/item/02-05-2018-9-out-of-10-people-worldwidebreathe-polluted-air-but-more-countries-are-taking-action IEA Greenhouse Gas Emissions from Energy Data Explorer 2019; Available from: https://www.iea.org/articles/greenhouse-gas-emissions-from-energy-dataexplorer Fontes, T., et al., Exposure to BTEX in buses: The influence of vehicle fuel type Environ Pollut, 2019 255(Pt 1): p 113100 MONRE Thực trạng ô nhiễm khơng khí Việt Nam 2020; Available from: https://monre.gov.vn/Pages/thuc-trang-o-nhiem-khong-khi-o-viet-nam.aspx Zhang, L., et al., Short-term and long-term effects of PM(2.5) on acute nasopharyngitis in 10 communities of Guangdong, China Sci Total Environ, 2019 688: p 136-142 VAST Dự báo chất lượng khơng khí Hà Nội khu vực phía Bắc Việt Nam 2018; Available from: https://previous.iiasa.ac.at/web/home/research/researchPrograms/air/news/Du_bao _chat_luong_khong_khi_Ha_Noi_VN.pdf Quy chuẩn kỹ thuật quốc gia chất lượng khơng khí xung quanh, in QCVN 05:2013/BTNMT Chen, T.M., et al., Outdoor air pollution: nitrogen dioxide, sulfur dioxide, and carbon monoxide health effects Am J Med Sci, 2007 333(4): p 249-56 Manisalidis, I., et al., Environmental and Health Impacts of Air Pollution: A Review Front Public Health, 2020 8: p 14 Mehta, S.R., S Das, and S.K Singh, Carbon Monoxide Poisoning Med J Armed Forces India, 2007 63(4): p 362-5 Richmond-Bryant, J., et al., Estimation of on-road NO(2) concentrations, NO(2)/NO(X) ratios, and related roadway gradients from near-road monitoring data Air Qual Atmos Health, 2017 10(5): p 611-625 Zhang, J.J., Y Wei, and Z Fang, Ozone Pollution: A Major Health Hazard Worldwide Front Immunol, 2019 10: p 2518 Assi, M.A., et al., The detrimental effects of lead on human and animal health Vet World, 2016 9(6): p 660-71 Về việc ban hành hướng dẫn kỹ thuật tính tốn cơng bố số chất lượng khơng khí Việt Nam (VN_AQI), in 1459/QĐ-TCMT Malkiel, B.G., A Random Walk Down Wall Street Twelfth Edition ed Gourav, et al Forecasting Air Quality of Delhi Using ARIMA Model 2020 Singapore: Springer Singapore 59 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 Gocheva-Ilieva, S.G., et al., Time series analysis and forecasting for air pollution in small urban area: an SARIMA and factor analysis approach Stochastic Environmental Research and Risk Assessment, 2014 28(4): p 1045-1060 Chang, Y.-S., et al., An LSTM-based aggregated model for air pollution forecasting Atmospheric Pollution Research, 2020 11(8): p 1451-1463 Krishan, M., et al., Air quality modelling using long short-term memory (LSTM) over NCT-Delhi, India Air Quality, Atmosphere & Health, 2019 12(8): p 899908 Glendening, D.J.W.J How Does a Meteorological Model Work ? 2007; Available from: http://www.drjack.info/INFO/model_basics.html Saide, P.E., et al., Forecasting urban PM10 and PM2.5 pollution episodes in very stable nocturnal conditions and complex terrain using WRF–Chem CO tracer model Atmospheric Environment, 2011 45(16): p 2769-2780 Do, T.N.N., et al., Application of WRF-Chem to simulate air quality over Northern Vietnam Environmental Science and Pollution Research, 2021 28(10): p 1206712081 Ma, J., et al., Improving air quality prediction accuracy at larger temporal resolutions using deep learning and transfer learning techniques Atmospheric Environment, 2019 214: p 116885 Raey, E., Z.F Ghatass, and H.S Marey TIME SERIES ANALYSIS OF AMBIENT AIR CONCENTRATIONS IN ALEXANDRIA AND NILE DELTA REGION, EGYPT 2006 Guarnaccia, C., et al., ARIMA models application to air pollution data in Monterrey, Mexico AIP Conference Proceedings, 2018 1982(1): p 020041 Sethi, J.K and M Mittal Analysis of Air Quality using Univariate and Multivariate Time Series Models in 2020 10th International Conference on Cloud Computing, Data Science & Engineering (Confluence) 2020 Hyndman, R.J., & Athanasopoulos, G Forecasting: principles and practice, 2nd edition - Chapter ARIMA models 2018; Available from: https://otexts.com/fpp2/ Ventura, L.M.B., et al., Forecast of daily PM2.5 concentrations applying artificial neural networks and Holt–Winters models Air Quality, Atmosphere & Health, 2019 12(3): p 317-325 Wu, L., et al., Using grey Holt–Winters model to predict the air quality index for cities in China Natural Hazards, 2017 88(2): p 1003-1012 Rubal and D Kumar, Evolving Differential evolution method with random forest for prediction of Air Pollution Procedia Computer Science, 2018 132: p 824-833 Liu, B., et al., Multi-level air quality classification in China using information gain and support vector machine hybrid model Nature Environment and Pollution Technology, 2019 18(3): p 697-708 Cabaneros, S.M., J.K Calautit, and B.R Hughes, A review of artificial neural network models for ambient air pollution prediction Environmental Modelling & Software, 2019 119: p 285-304 60 PHỤ LỤC Phụ lục 1: Biểu đồ dự báo giá trị main AQI mơ hình – Thí nghiệm a b c d e f a) Tự hồi quy; b) ARIMA; c)Holt-Winters; d) ANN; e) RNN; f) LSTM 61 Phụ lục 2: Biểu đồ dự báo giá trị main AQI mơ hình – Thí nghiệm a b c d e f a) Tự hồi quy; b) ARIMA; c)Holt-Winters; d) ANN; e) RNN; f) LSTM 62

Ngày đăng: 13/07/2023, 22:34

Tài liệu cùng người dùng

Tài liệu liên quan