Xây dựng mô hình dự báo chất lượng không khí

85 0 0
Xây dựng mô hình dự báo chất lượng không khí

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC XÂY DỰNG MƠ HÌNH DỰ BÁO CHẤT LƯỢNG KHƠNG KHÍ Ngành: KHOA HỌC MÁY TÍNH HỘI ĐỒNG: GVHD: GVPB: SVTH: Khoa học máy tính 11 Ts Lê Thanh Vân Ts Lê Trọng Nhân Lê Hiếu Thiện - 1613318 TP HỒ CHÍ MINH, THÁNG 12/2022 ĐẠI HỌC QUỐC GIA TP.HCM -TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA:KH & KT Máy tính BỘ MÔN:KHMT CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN ÁN TỐT NGHIỆP Chú ý: Sinh viên phải dán tờ vào trang thuyết trình HỌ VÀ TÊN: LÊ HIẾU THIỆN NGÀNH: KHOA HỌC MÁY TÍNH MSSV: 1613318 LỚP: MT16KH01 Đầu đề luận án: Xây dựng mơ hình dự báo chất lượng khơng khí Building an air quality prediction model Nhiệm vụ (yêu cầu nội dung số liệu ban đầu): - Tìm hiểu đặc điểm tốn dự báo chất lượng khơng khí - Tìm hiểu nghiên cứu mơ hình dự báo chất lượng khơng khí thực - Nghiên cứu đề xuất số mơ hình dự báo chất lượng khơng khí - Thu thập liệu, huấn luyện đánh giá mơ hình - Xây dựng ứng dụng theo dõi quản lý chất lượng khơng khí Ngày giao nhiệm vụ luận án: 03/08/2022 Ngày hoàn thành nhiệm vụ: 11/12/2022 Họ tên giảng viên hướng dẫn: Phần hướng dẫn: 100% 1) TS Lê Thanh Vân Nội dung yêu cầu LVTN thông qua Bộ môn Ngày tháng năm CHỦ NHIỆM BỘ MÔN GIẢNG VIÊN HƯỚNG DẪN CHÍNH (Ký ghi rõ họ tên) (Ký ghi rõ họ tên) PHẦN DÀNH CHO KHOA, BỘ MÔN: Người duyệt (chấm sơ bộ): Đơn vị: _ Ngày bảo vệ: Điểm tổng kết: _ Nơi lưu trữ luận án: _ TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KH & KT MÁY TÍNH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc -Ngày 26 tháng 12 năm 2022 PHIẾU CHẤM BẢO VỆ LVTN (Dành cho người hướng dẫn) Họ tên SV: Lê Hiếu Thiện MSSV: 1613318 Ngành (chuyên ngành): Khoa học Máy tính Đề tài: Xây dựng mơ hình dự báo chất lượng khơng khí Họ tên người phản biện: Lê Thanh Vân Tổng quát thuyết minh: Số trang: 83 Số chương: Số bảng số liệu: 47 Số hình vẽ: 51 Số tài liệu tham khảo: Phần mềm tính tốn: Hiện vật (sản phẩm) Tổng quát vẽ: - Số vẽ: Bản A1: Bản A2: Khổ khác: - Số vẽ vẽ tay Số vẽ máy tính: Những ưu điểm LVTN: Luận văn hướng tới việc đề xuất mơ hình dự báo chất lượng khơng khí khoảng thời gian ngắn hạn Sinh viên thực tốt nội dung sau để thực mục tiêu đặt đề tài: - Tìm hiểu yếu tố đánh giá chất lượng khơng khí PM2.5, TSP, CO,… - Tìm hiểu cơng trình nghiên cứu liên quan, phương pháp sử dụng có hiệu tốn dự báo chất lượng khơng khí - Tập liệu sử dụng đề tài thu thập thực tế trạm quan trắc đặt khu vực có tính chất khác TP Hồ Chí Minh: khu vực dân sinh, khu vực cơng nghiệp, khu vực có mật độ cao giao thông Sinh viên đánh giá liệu sơ thống kê để tìm hiểu vấn đề tương quan biến, nhiễu, histogram phân bố liệu - Xây dựng mơ hình dự báo ANN, RNN, ESN, CFNN, LSTM, CNN-LSTM, 2LSTM mơ hình hybrid Thực thực nghiệm với kịch khác trạm nhằm đánh giá mơ hình thu mơ hình cho kết dự báo tốt phù hợp với đặt trưng liệu có - Xây dựng ứng dụng mobile để dự báo chất lượng khơng khí khoảng thời gian Những thiếu sót LVTN: - Cần cung cấp đầy đủ thông tin tài liệu tham khảo Đề nghị: Được bảo vệ  Bổ sung thêm để bảo vệ  Không bảo vệ  câu hỏi SV phải trả lời trước Hội đồng: 10 Đánh giá chung (bằng chữ: giỏi, khá, TB): Giỏi Điểm : 9.5/10 Ký tên (ghi rõ họ tên) TS Lê Thanh Vân TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KH & KT MÁY TÍNH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc -Ngày 09 tháng 01 năm 2023 PHIẾU CHẤM BẢO VỆ LVTN (Dành cho người phản biện) Họ tên SV: Lê Hiếu Thiện MSSV: 1613318 Ngành (chuyên ngành): Khoa học Máy tính Đề tài: Xây dựng mơ hình dự báo chất lượng khơng khí Họ tên người phản biện: Lê Trọng Nhân Tổng quát thuyết minh: Số trang: 83 Số chương: Số bảng số liệu: 47 Số hình vẽ: 51 Số tài liệu tham khảo: Phần mềm tính tốn: Hiện vật (sản phẩm) Tổng quát vẽ: - Số vẽ: Bản A1: Bản A2: Khổ khác: - Số vẽ vẽ tay Số vẽ máy tính: Những ưu điểm LVTN: • Sinh viên xây dựng mơ hình dự báo chất lượng khơng khí hợp lý • Sinh viên thử nghiệm nhiều mơ hình dự báo khơng khí khác • Sinh viên phân tích liệu đề xuất hướng tiếp cận việc dự báo Trong đề tài luận văn việc sử dụng liệu trạm để dự báo qua lại Những thiếu sót LVTN: • Việc trình bày kết thực nghiệm chưa ấn tượng, đa phần kết dạng số Kết nên biểu diễn dạng đồ thị ấn tượng • Chưa làm bật đặc trung mơ hình dự đốn Đề nghị: Được bảo vệ  Bổ sung thêm để bảo vệ  Không bảo vệ  câu hỏi SV phải trả lời trước Hội đồng: a Sinh viên sử dụng bảng liệu, chẳng hạn bảng 4.16 báo cáo (sai số mô hình cho số PM2.5 trạm 6) để giải thích B-LSTM lại có sai số tốt b Sinh viên trình bày vài đặc điểm thống kê liệu O3, có tính chất tuần hồn hay khơng, O3 thường cao vào lúc thấp vào lúc nào? 10 Đánh giá chung (bằng chữ: giỏi, khá, TB): Giỏi Điểm : 9/10 Ký tên (ghi rõ họ tên) TS Lê Trọng Nhân LỜI CAM ĐOAN Em xin cam kết luận văn "Xây dựng mơ hình dự báo chất lượng khơng khí" thân em thực hiện, hướng dẫn cô Lê Thanh Vân Tất nguồn liệu thu thập, tài liệu tham khảo ghi rõ phần tài liệu tham khảo Các công việc, kết thực luận văn em tự thực Nếu có gian lận bị phát hiện, em xin chịu hình phạt từ Ban chủ nhiệm Khoa Ban giám hiệu nhà trường LỜI CẢM ƠN Em xin gửi lời làm cảm ơn đến cô Lê Thanh Vân, người trực tiếp hướng dẫn bảo em suốt trình nghiên cứu thực luận văn Sự hướng dẫn tận tình yếu tố quan trọng để em thực thành công đề tài luận văn Em xin cảm ơn đến thầy cô công tác giảng dạy Khoa Khoa Học Kỹ Thuật Máy Tính - Trường Đại học Bách Khoa thành phố Hồ Chí Minh Các thầy tận tình dạy bảo, truyền đạt kiến thức, kỹ cần thiết hữu ích đến bao hệ sinh viên Góp phần tạo nguồn nhân lực dồi dào, có kỹ năng, đóng góp vào phát triển nhà trường xã hội TĨM TẮT ĐỀ TÀI Ơ nhiễm khơng khí mối đe dọa lớn môi trường, xã hội sức khỏe người Theo thống kê Tổ chức Y tế giới (WHO), năm, giới có khoảng triệu người tử vong bệnh liên quan tới nhiễm khơng khí Ở Việt Nam, năm gần đây, tình trạng mơi trường khơng khí bị nhiễm ngày trở nên nghiêm trọng Trước thực trạng số chất lượng khơng khí ngày đáng lo ngại, việc xây dựng hệ thống thông tin việc thống kê dự báo số chất lượng khơng khí u cầu cấp thiết Thơng qua giúp người dân doanh nghiệp nắm bắt thông tin chất lượng khơng khí, từ chủ động việc lên kế hoạch cho hoạt động sinh hoạt sản xuất, đồng thời có biện pháp bảo vệ ngồi điều kiện chất lượng khơng khí xấu Các mơ hình dự báo thực mơ hình mạng neural CFNN, ESN, ANN, RNN, LSTM, CNN-LSTM, LSTM-LSTM, Hybrid Với số chất lượng khơng khí, ta phân tích đặc tính liệu, hệ số tương quan số lựa chọn input features khác để huấn luyện mơ hình Kết cho thấy hai mơ hình mạng LSTM-LSTM ESN cho sai số thấp hầu hết thí nghiệm Mơ hình hybrid kết hợp kết từ mơ hình mạng neural khác cho kết tương đối tốt, giúp cải thiện sai số so với số mơ hình mạng Bên cạnh đó, ta phát triển ứng dụng giúp quản lý theo dõi số nhiễm khơng khí Các mơ hình dự báo tốt sử dụng để xây dựng api server cho dự báo phục vụ cho ứng dụng Mục lục GIỚI THIỆU ĐỀ TÀI 1.1 Đặt vấn đề 1.2 Mục tiêu, đối tượng phạm vi nghiên cứu 1.3 Cấu trúc luận văn CƠ SỞ LÝ THUYẾT 2.1 Bài tốn dự báo chất lượng khơng khí 2.2 Các số chất lượng khơng khí phương thức tính 2.3 Xây dựng mơ hình dự báo chất lượng khơng khí học sâu 12 CÁC NGHIÊN CỨU LIÊN QUAN 21 3.1 Xây dựng mô hình dự báo chất lượng khơng khí học sâu 21 3.2 Xây dựng mơ hình dự báo chất lượng khơng khí học máy 26 XÂY DỰNG MƠ HÌNH DỰ BÁO CHẤT LƯỢNG KHƠNG KHÍ 29 4.1 Lược đồ nghiên cứu 29 4.2 Thu thập liệu 31 4.3 Tiền xử lý chuẩn hóa liệu 31 4.4 Xây dựng mơ hình dự báo 34 4.5 Tạo tập huấn luyện đánh giá mơ hình 39 4.6 Các thí nghiệm 39 4.7 Kết thực nghiệm thảo luận 42 ỨNG DỤNG QUẢN LÝ VÀ THEO DÕI CHẤT LƯỢNG KHƠNG KHÍ 66 5.1 Xây dựng api server 66 5.2 Ứng dụng quản lý theo dõi chất lượng khơng khí 67 TỔNG KẾT 69 6.1 Đánh giá kết đạt 69 6.2 Các hạn chế 70 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính 6.3 Hướng phát triển tương lai 70 Luận văn tốt nghiệp Trang 8/72 Danh sách bảng 4.1 Thông tin trạm thu thập liệu 31 4.2 Thống kê số lượng records thu thập trạm 32 4.3 Ma trận khoảng cách trạm 32 4.4 Mơ hình mạng CFNN 4.5 Mơ hình mạng ANN 35 4.6 Mơ hình mạng ANN 36 4.7 Mơ hình mạng ESN 36 4.8 Mơ hình mạng LSTM 37 4.9 Mơ hình mạng LSTM-LSTM 37 35 4.10 Mơ hình mạng CNN-LSTM 38 4.11 Mơ hình mạng hybrid 38 4.12 Số lượng liệu huấn luyện đánh giá mơ hình 39 4.13 Kích thước tập train tập test mạng neural 39 4.14 Bảng input features cho số trạm 40 4.15 Bảng input features cho số nhiễm khơng khí trạm kết hợp với số khí tượng 41 4.16 Sai số dự báo mơ hình cho số PM2.5 trạm 43 4.17 Sai số dự báo mơ hình cho số O3 trạm 44 4.18 Sai số dự báo mơ hình cho số NO2 trạm 45 4.19 Sai số dự báo mơ hình cho số TSP trạm 46 4.20 Sai số dự báo mô hình cho số PM2.5 trạm 47 4.21 Sai số dự báo mơ hình cho số TSP trạm 48 4.22 Sai số dự báo mơ hình cho số NO2 trạm 48 4.23 Sai số dự báo mơ hình cho số CO trạm 49 4.24 Sai số dự báo mơ hình cho số PM2.5 trạm 50 4.25 Sai số dự báo mơ hình cho số TSP trạm 50 4.26 Sai số dự báo mơ hình cho số O3 trạm 51 4.27 Sai số dự báo mơ hình cho số NO2 trạm 52 4.28 Sai số dự báo mơ hình cho số PM2.5 trạm 53 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Hình 4.27: Biểu đồ giá trị dự đoán thực tế mạng LSTM-LSTM số TSP (time step = 4) Trạm Với số PM2.5, tử bảng kết sai số 4.35 cho thấy, mạng RNN cho sai số thấp mơ hình dự báo giá trị tương lai với MAE = 5.56 Cịn với mơ hình dự báo giá trị tương lai, mạng ESN cho sai số thấp với MAE = 6.38 Hình 4.28 mơ tả biểu đồ giá trị dự đốn thực tế mạng RNN với time step = 4, ta thấy hình dạng biểu đồ giá trị dự đoán thực tế tương đồng Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features PM2.5 PM2.5 PM2.5 PM2.5 PM2.5 PM2.5 PM2.5 PM2.5 MAE_4 5.96 5.65 5.56 5.62 5.62 6.20 5.66 5.62 MSE_4 61.76 55.96 55.12 56.87 56.64 68.11 57.59 56.86 MAE_8 6.93 6.38 6.46 6.43 6.43 7.02 6.87 7.11 MSE_8 80.05 69.26 72.60 71.82 72.21 85.24 83.49 86.98 Bảng 4.35: Sai số dự báo mơ hình cho số PM2.5 trạm Hình 4.28: Biểu đồ giá trị dự đốn thực tế mạng RNN số PM2.5 trạm (time step = 4) Với số TSP, từ bảng kết sai số 4.36 cho thấy, mơ hình mạng LSTM-LSTM cho sai số thấp hai mơ hình dự báo giá trị tương lai với MAE 16.54, 18.78 Mơ hình hybrid có sai số lớn với MAE 24.96 23.81 Hình Luận văn tốt nghiệp Trang 58/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính 29 mơ tả biểu đồ giá trị dự đoán thực tế mạng LSTM-LSTM với time step = 4, ta thấy hình dạng biểu đồ giá trị dự đốn thực tế tương đồng Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features TSP TSP TSP TSP TSP TSP TSP TSP MAE_4 17.45 16.91 16.93 16.77 16.79 18 16.54 24.96 MSE_4 526.89 504.83 522.92 498.23 502.09 578.74 486.59 1094.36 MAE_8 20.66 18.88 20.09 18.95 19.04 20.15 18.78 23.81 MSE_8 715.54 617.79 706.27 613.09 630.11 704.05 607.68 984.72 Bảng 4.36: Sai số dự báo mô hình cho số TSP trạm Hình 4.29: Biểu đồ giá trị dự đoán thực tế mạng LSTM-LSTM số TSP trạm (time step = 4) Với số CO, tử bảng kết sai số 4.37 cho thấy, mạng ESN cho sai số thấp mơ hình dự báo giá trị tương lai với MAE = 30.64 Còn với mơ hình dự báo giá trị tương lai, mạng LSTM-LSTM cho sai số thấp với MAE = 33.33 Hình 4.30 mơ tả biểu đồ giá trị dự đoán thực tế mạng ESN với time step = 4, ta thấy hình dạng biểu đồ giá trị dự đoán thực tế tương đồng Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features CO CO CO CO CO CO CO CO MAE_4 33.13 30.64 41.31 38.22 34.22 31.69 36.03 38.64 MSE_4 4591.24 5673.00 4815.20 5109.80 5013.97 4808.57 5927.22 9348.67 MAE_8 38.55 33.59 51.21 35.65 33.95 37.29 33.33 38.53 MSE_8 5914.53 6135.24 6138.03 6576.74 6157.96 5491.67 4647.31 9272.13 Bảng 4.37: Sai số dự báo mơ hình cho số CO trạm Luận văn tốt nghiệp Trang 59/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Hình 4.30: Biểu đồ giá trị dự đốn thực tế mạng ESN số CO trạm (time step = 4) Kết luận Từ kết cho thấy, hai mơ hình mạng LSTM-LSTM ESN cho kết sai số thấp hầu hết mơ hình Mơ hình mạng CNN-LSTM hybrid cho kết sai số tương đối tốt số mơ hình Mơ hình mạng CFNN có sai số lớn hầu hết mơ hình Các mơ hình mạng cịn lại nhìn chung cho sai số tốt số mơ hình, nhiên có sai số lớn số mơ hình khác Luận văn tốt nghiệp Trang 60/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính 4.7.2 Thí nghiệm Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features PM2.5-5 PM2.5-5 PM2.5-5 PM2.5-5 PM2.5-5 PM2.5-5 PM2.5-5 PM2.5-5 MAE_4 11.25 7.01 7.18 7.9 7.23 7.45 6.88 7.23 MSE_4 189.31 81.29 89.47 107.62 89.39 97.37 87.19 96.2 MAE_8 12.94 8.31 8.48 9.04 8.45 8.55 8.21 8.49 MSE_8 241.57 121.16 130.93 146.01 121.49 129.81 123.34 132.01 Bảng 4.38: Sai số dự báo mơ hình cho số PM2.5 trạm Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features PM2.5-6 PM2.5-6 PM2.5-6 PM2.5-6 PM2.5-6 PM2.5-6 PM2.5-6 PM2.5-6 MAE_4 12.94 6.01 5.18 5.97 5.32 5.21 5.19 5.55 MSE_4 236.35 48.9 45.93 65.39 53.36 45.07 51.33 58.05 MAE_8 15.94 8.38 8.46 9.09 8.42 8.55 8.21 8.45 MSE_8 231.57 121.16 129.93 146.02 127.49 129.81 117.34 132.01 Bảng 4.39: Sai số dự báo mơ hình cho số PM2.5 trạm Với số PM2.5, bảng 4.38 bảng 4.39 thể chi tiết giá trị sai số ta sử dụng giá trị PM2.5 trạm để dự báo cho trạm ngược lại Kết cho thấy giá trị sai số tăng nhẹ sử dụng giá trị trạm khác để dự báo Với mơ hình dự báo giá trị tương lai, trạm ta sử dụng input features số PM2.5, mô hình mạng LSTM-LSTM cho sai số thấp với MAE=5.89, sử dụng input features số PM2.5 trạm 5, giá trị MAE=6.88 (tăng 0.99) Đối với trạm 5, với mơ hình trên, mơ hình mạng LSTM-LSTM có giá trị MAE tăng từ 4.04 lên 5.19 Các số mơ hình cịn lại có gia tăng sai số khơng đáng kể Điều cho thấy việc sử dụng số PM2.5 trạm khác để dự báo cho trạm mang lại hiệu cao Với số NO2, từ bảng sai số 4.40 4.41 cho thấy, tương tự số PM2.5 Có thể thấy sử dụng giá trị NO2 trạm để dự báo cho trạm ngược lại, giá trị sai số mơ hình mạng tăng khơng đáng kể Điều cho thấy việc sử dụng số NO2 trạm khác để dự báo cho trạm mang lại hiệu cao Luận văn tốt nghiệp Trang 61/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features NO2-5 NO2-5 NO2-5 NO2-5 NO2-5 NO2-5 NO2-5 NO2-5 MAE_4 22.02 21.29 22.01 24.11 18.84 21.81 21.31 21.08 MSE_4 801.57 745.77 745.36 859.09 642.24 762.1 873.4 877.15 MAE_8 22.89 25.01 23.71 25.12 22.02 25.09 24.85 22.59 MSE_8 898.59 946.28 846.32 927.65 801.98 1144.62 1224.62 999.21 Bảng 4.40: Sai số dự báo mơ hình cho số NO2 trạm Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features NO2-6 NO2-6 NO2-6 NO2-6 NO2-6 NO2-6 NO2-6 NO2-6 MAE_4 10.29 4.91 15.01 18.01 13.81 4.67 8.34 10.68 MSE_4 667.89 159.51 294.69 834.04 256.75 106.01 167.22 201.95 MAE_8 12.84 5.64 17.01 20.53 13.71 7.59 8.61 13.29 MSE_8 589.74 155.82 381.21 358.61 270.85 152.97 165.36 230.28 Bảng 4.41: Sai số dự báo mơ hình cho số NO2 trạm Vởi số TSP, từ bảng kết sai số 4.42 4.43 cho thấy Các giá trị sai số mơ hình khơng có gia tăng đáng kể Ở trạm 6, mơ hình mạng LSTM-LSTM cho sai số thấp hai mơ hình dự báo giá trị tương lai, với MAE 18.05 (tăng 1.02) 21.23 (tăng 0.99) Ở trạm 5, mơ hình mạng ESN cho sai số thấp hai mơ hình dự báo, với MAE 11.91 (tăng 0.95) 13.88 (tăng 0.95) Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features TSP-5 TSP-5 TSP-5 TSP-5 TSP-5 TSP-5 TSP-5 TSP-5 MAE_4 26.16 18.21 18.49 19.01 18.92 20.31 18.05 18.31 MSE_4 1057.69 583.42 598.82 617.46 626.68 723.31 569.72 591.34 MAE_8 28.03 21.25 21.98 21.61 21.51 23.51 21.23 21.43 MSE_8 1299.67 780.21 849.51 803.11 850.41 973.92 720.65 826.93 Bảng 4.42: Sai số dự báo mơ hình cho số TSP trạm Luận văn tốt nghiệp Trang 62/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features TSP-6 TSP-6 TSP-6 TSP-6 TSP-6 TSP-6 TSP-6 TSP-6 MAE_4 17.51 11.91 12.11 14.55 12.29 12.81 12.11 12.16 MSE_4 562.38 278.83 296.39 420.55 285.68 312.86 303.71 304.44 MAE_8 19.51 13.88 13.91 14.21 14.21 14.71 14.02 14.14 MSE_8 648.84 364.61 397.25 405.45 398.99 415.48 400.67 406.13 Bảng 4.43: Sai số dự báo mơ hình cho số TSP trạm 4.7.3 Thí nghiệm Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint PM2.5,dewPoint PM2.5,TSP,dewPoint MAE_4 12.01 14.81 6.26 6.27 6.33 6.32 6.39 6.35 6.81 6.89 6.32 6.62 6.25 6.11 6.41 6.17 MSE_4 241.60 361.64 78.36 80.8 81.50 82.68 85.12 85.05 90.65 94.57 83.52 85.88 84.78 79.5 88.72 80.71 MAE_8 14.08 15.73 7.53 7.59 7.29 8.63 7.3 7.28 7.54 7.74 7.49 7.67 7.60 7.57 7.57 7.56 MSE_8 331.77 416.72 109.03 109.7 111.58 150.79 104.67 103.82 115.08 117.19 112.98 115.41 119.55 121.15 117.88 118.48 Bảng 4.44: Sai số dự báo mô hình cho số PM2.5 trạm Với số PM2.5, ta kết hợp thêm số điểm sương (dew point) vào input features Có thể thấy tử bảng kết 4.44, hầu hết giá trị sai mơ hình tăng, ngoại trừ mạng CNN-LSTM có MAE giảm mơ hình MAE_4 = 6.32 (giảm 0.09), MAE_8 = 7.49 (giảm 0.06) Ở mơ hình dự báo giá trị tương lai, mơ hình mạng LSTM-LSTM có sai số thấp (MAE = 6.11) với input features PM2.5, TSP, số dew point Ở mô hình dự báo giá trị tương lai, mơ hình mạng LSTM cho sai số thấp (MAE = 7.28) với input features PM2.5, TSP, số dew point Luận văn tốt nghiệp Trang 63/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Mạng Features TSP,ozone CFNN PM2.5,TSP,ozone TSP,ozone ESN PM2.5,TSP,ozone TSP,ozone RNN PM2.5,TSP,ozone TSP,ozone LSTM PM2.5,TSP,ozone TSP,ozone ANN PM2.5,TSP,ozone TSP,ozone CNN-LSTM PM2.5,TSP,ozone TSP,ozone LSTM-LSTM PM2.5,TSP,ozone TSP,ozone Hybrid PM2.5,TSP,ozone MAE_4 49.83 75.11 18.55 17.61 33.00 17.86 18.88 19.26 19.21 18.44 19.17 18.19 17.72 17.82 27.91 27.97 MSE_4 4125.70 9459.72 608.60 584.79 2002.59 17.86 659.74 719.13 667.67 647.19 697.52 644.41 595.71 632.32 27.91 1558.58 MAE_8 56.81 89.95 20.62 20.65 22.90 21.40 23.88 22.16 21.24 21.04 22.85 21.42 21.91 22.04 59.29 28.28 MSE_8 5278.32 13601.21 754.79 758.95 1029.25 873.93 23.88 920.45 827.44 861.20 965.16 870.46 884.24 906.39 5090.17 1587.69 Bảng 4.45: Sai số dự báo mơ hình cho số TSP trạm Với số TSP, ta kết hợp thêm số khí tượng ozone vào mơ hình dự báo Từ bảng kết sai số 4.45 cho thấy, số mơ hình mạng có sai số MAE tăng lên cao kết hợp thêm số ozone, mạng RNN có MAE_4 tăng từ 17.41 lên 33, mạng CFNN có MAE_4 tăng từ 24.56 lên 49.83, mơ hình hybrid có MAE_4 tăng từ 17.32 lên 27.91 Các mơ hình mạng cịn lại có MAE tăng nhẹ Mạng LSTM-LSTM có sai số thấp (MAE = 17.72) mơ hình dự báo giá trị tương lai với input features TSP ozone, mơ hình dự báo giá trị tương lai mạng ESN cho sai số thấp (MAE = 20.62) với input features TSP ozone Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features NO2,humidity NO2,humidity NO2,humidity NO2,humidity NO2,humidity NO2,humidity NO2,humidity NO2,humidity MAE_4 37.87 23.36 31.83 24.29 21.82 27.76 30.22 26.64 MSE_4 2698.15 1273.56 31.83 1418.47 1087.87 1601.58 1845.54 1580.25 MAE_8 40.30 26.63 30.50 30.62 26.42 34.32 34.21 53.43 MSE_8 2977.39 1572.09 2197.75 2063.30 1603.20 2652.29 2747.93 6509.09 Bảng 4.46: Sai số dự báo mơ hình cho số NO2 trạm Với số NO2, ta kết hợp thêm số khí tượng humidity vào cá mơ hình dự báo Từ bảng kết sai số 4.46 cho thấy, tất giá trị sai số mơ hình tăng đáng kể Mơ hình mạng ANN cho sai số thấp hai mơ hình dự báo giá trị tương lai với MAE 21.82, 26.42 Luận văn tốt nghiệp Trang 64/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Mạng CFNN ESN RNN LSTM ANN CNN-LSTM LSTM-LSTM Hybrid Features O3,ozone O3,ozone O3,ozone O3,ozone O3,ozone O3,ozone O3,ozone O3,ozone MAE_4 30.49 20.28 25.00 21.81 23.53 22.47 19.25 22.52 MSE_4 1618.19 912.31 1226.32 1017.89 1148.51 1063.35 872.41 1078.93 MAE_8 39.12 27.44 34.03 30.61 27.23 38.44 39.42 37.95 MSE_8 2860.63 1672.36 2539.48 2072.84 1643.31 3253.79 4205.45 3167.91 Bảng 4.47: Sai số dự báo mơ hình cho số O3 trạm Với số O3, ta kết hợp thêm số khí tượng ozone vào mơ hình dự báo Từ bảng kết sai số 4.47 cho thấy, hầu hết giá trị sai số tăng Mơ hình LSTM-LSTM có sai số thấp mơ hình dự báo giá trị tương lai (MAE=19.25), mơ hình ESN có sai số thấp mơ hình dự báo giá trị tương lai (MAE=27.44) Luận văn tốt nghiệp Trang 65/72 Chương ỨNG DỤNG QUẢN LÝ VÀ THEO DÕI CHẤT LƯỢNG KHƠNG KHÍ Sau xây dựng mơ hình dự báo cho số chất lượng khơng khí trạm Ta chọn mơ hình có sai số thấp ứng với số trạm, từ phát triển ứng dụng để dự báo cho số ô nhiễm khơng khí tương lai Bảng 5.1 trình bày mơ hình sử dụng để dự báo số trạm: Trạm PM2.5 LSTM-LSTM LSTM-LSTM Hybrid LSTM-LSTM LSTM-LSTM ESN TSP CNN-LSTM ESN – CNN-LSTM LSTM-LSTM LSTM-LSTM CO LSTM-LSTM – ESN – Hybrid – O3 – LSTM-LSTM – LSTM-LSTM – Hybrid NO2 – LSTM-LSTM LSTM-LSTM ANN ESN LSTM-LSTM Bảng 5.1: Các mô hình mạng chọn cho số 5.1 Xây dựng api server Ở bước này, ta xây dựng api server để phục vụ cho việc dự báo giá trị số chất lượng khơng khí Ta sử dụng FastApi framework để xây dựng server FastApi web framework dùng để build API có hiệu cao, code dễ dàng, đơn giản hỗ trợ tốt cho việc làm sản phẩm Đặc điểm: • Fast: Hiệu suất cao ngang với NodeJS Go • Intuitive: hỗ trợ code dễ với tự động gợi ý, debug cần thời gian so với trước • Easy: thiết kế cho dễ dùng dễ học Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính • Short: Tối thiểu việc lặp code Các tham số truyền vào có nhiều tính • Robust: hiệu mạnh mẽ, tương tác API qua docs Server có endpoint: /predict/stationId, với stationId số trạm muốn lấy kết dự báo Dữ liệu truyền có dạng sau: { "list": [ { "main": { "aqi": }, "components": { "co": 0, "tsp": 0, 10 "no2": 0, 11 "o3": 0, 12 "pm2_5": 0, }, 13 "dt": 14 } 15 ] 16 17 } Với phần tử "list" tương ứng với giá trị dự báo cho số chất lượng khơng khí 5.2 Ứng dụng quản lý theo dõi chất lượng khơng khí Sau xây dựng api server cho việc dự báo số chất lượng không khí từ mơ hình mạng neural, ta phát triển ứng dụng để theo dõi xem thông tin dự báo số trạm nghiên cứu Hình 5.1 mơ tả thiết kế ứng dụng quản lý chất lượng khơng khí phát triển Màn hình thể vị trí trạm thông tin số nhiễm khơng khí trạm Màn hình thứ hai thể chi tiết thơng tin số nhiễm khơng khí tại, dự báo giá trị số Bên cạnh cịn hiển thị thêm thông tin thời tiết, nhiệt độ, khuyến nghị sức khỏe mức độ ô nhiễm khơng khí Ứng dụng phát triển Android viết ngơn ngữ lập trình Kotlin Luận văn tốt nghiệp Trang 67/72 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính Hình 5.1: Thiết kế ứng dựng quản lý theo dõi chất lượng khơng khí Luận văn tốt nghiệp Trang 68/72 Chương TỔNG KẾT 6.1 Đánh giá kết đạt Luận văn thực bước để xây dựng mơ hình dự báo số chất lượng khơng khí trạm thành phố Hồ Chí Minh Các mơ hình dự báo thực mơ hình mạng neural CFNN, ESN, ANN, RNN, LSTM, CNN-LSTM, LSTM-LSTM, Hybrid Ở số mơ hình mạng, ta phân tích đặc tính liệu, hệ số tương quan số lựa chọn input features khác để huấn luyện mơ hình Các mơ hình mạng sử dụng giá trị 24 điểm liệu khứ để dự báo cho lần giá trị tương lai Kết cho thấy hai mơ hình mạng LSTM-LSTM ESN cho sai số thấp hầu hết thí nghiệm Mơ hình hybrid kết hợp kết từ mơ hình mạng neural khác cho kết tương đối tốt, giúp cải thiện sai số so với số mơ hình mạng Mơ hình mạng CFNN cho sai số lớn hầu hết mơ hình Bên cạnh đó, ta phát triển ứng dụng giúp quản lý theo dõi số nhiễm khơng khí Các mơ hình dự báo tốt sử dụng để xây dựng api server cho dự báo phục vụ cho ứng dụng Như vậy, luận văn đạt kết sau: • Thu thập xử lý liệu số chất lượng không khí PM2.5, CO, NO2, O3, TSP • Nghiên cứu mơ hình mạng neural ứng dụng dự báo chất lượng khơng khí • Xây dựng huấn luyện mơ hình mạng nerual tập liệu thu thập • Phát triển ứng dụng dựa mơ hình mạng huấn luyện, giúp ích việc quản lý theo dõi số chất lương khơng khí Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính 6.2 Các hạn chế Do liệu số số chất lượng khơng khí trạm bị mát nhiều, nên ta phải loại bỏ số khỏi mơ hình Với số bị mát liệu ít, ta phải thực kĩ thuật để điền lại liệu cho số Tuy nhiên, điều dẫn đến mơ hình khơng phản ánh chất liệu, dễ bị bias sử dụng liệu từ trạm khác Ngồi ra, cịn có số hạn chế mặt kĩ thuật môi trường huấn luyện, môi trường deploy api server Ta sử dụng Google Colab để huấn luyện mơ hình, nhiên miễn phí bị hạn chế hiệu GPU, CPU Còn api server deploy lên Heroku, miễn phí bị giới hạn thời gian server sử dụng tháng 6.3 Hướng phát triển tương lai Trong tương lai, mô hình dự báo thực luận văn áp dụng để phát triển mơ hình dự báo cho trạm số ô nhiễm khơng khí khác Với ứng dụng theo dõi phát triển khơng khí, phát triển thêm số tính đồ theo dõi số nhiễm khơng khí, khuyến nghị cảnh báo thực chi tiết Đồng thời, ta thu thập thêm liệu tích hợp thêm số yếu tố khác vào mơ hình dự báo, để đạt kết tối ưu so với Luận văn tốt nghiệp Trang 70/72 Tài liệu tham khảo [1] https://benhvienducgiang.com/truyen-thong-suc-khoe/tac-dong-cua-o-nhiemkhong-khi-voi-suc-khoe-con-nguoi/144-677-846.aspx [2] http://tapchimoitruong.vn/dien-dan–trao-doi-21/dien-bien-chat-luong-khong-khitai-mot-so-do-thi-2-thang-dau-nam-2021-23099 [3] http://tapchimoitruong.vn/dien-dan–trao-doi-21/thuc-trang-chat-luong-moitruong-khong-khi-viet-nam-giai-doan-2016–2020-xac-dinh-cac-thach-thuc-va-dexuat-cac-giai-phap-cai-thien-trong-5-nam-toi-26305 [4] http://cem.gov.vn/tin-tuc-moi-truong/tong-cuc-moi-truong-ban-hanh-huong-danky-thuat-tinh-toan-va-cong-bo-chi-so-chat-luong-khong-khi-viet-nam [5] Deep learning (part 1) - feedforward neural networks (fnn) - galaxyproject [6] R J Kuo, Brahman Prasetyo, and B S Wibowo v Deep learning-based approach for air quality forecasting by using recurrent neural network with gaussian process in taiwan 2019 IEEE 6th International Conference on Insutrial Engineering and Applications, 2019 [7] Budi Warsito, Rukun Santoso, Suparti, and Hasbi Yasin Cascade forward neural network for time series prediction Journal of Physics: Conference Series, 2018 [8] Taehwan Kim and Brian R King Time series prediction using deep echo state networks Neural Computing and Applications, 2020 [9] Heidar Maleki, Armin Sorooshian, Gholamreza Goudarzi, Zeynab Baboli, Yaser Tahmasebi Birgani, and Mojtaba Rahmati Air pollution prediction by using an artifcial neural network model Clean Technologies and Environmental Policy, 2019 [10] Zhili Zhao, Jian Qin, Zhaoshuang He, Huan Li, Yi Yang, and Ruisheng Zhang Combining forward with recurrent neural networks for hourly air quality prediction in northwest of china Environmental Science and Pollution Research, 2020 Đại học quốc gia thành phố Hồ Chí Minh - Trường Đại học Bách Khoa Khoa Khoa Học Kỹ Thuật Máy Tính [11] W.C.Leong, R.O.Kelani, and Z.Ahmad Prediction of air pollution index (api) using support vector machine (svm) Journal of Environmental Chemical Engineering, 2020 [12] Usha Mahalingam, Kirthiga Elangovan, Himanshu Dobhal, Chocko Valliappa, Sindhu Shrestha, and Giriprasad Kedam A machine learning model for air quality predictions for smart cities 2019 International Conference on Wireless Communications Signal Processing and Networking (WiSPNET), 2020 [13] Python-based reinforcement learning, artificial intelligence and neural network library [14] Keras: the python deep learning api [15] Google colab [16] Python library for reservoir computing using echo state networks [17] Cnn-lstm-based models for multiple parallel input and multi-step forecast Luận văn tốt nghiệp Trang 72/72

Ngày đăng: 20/06/2023, 20:41

Tài liệu cùng người dùng

Tài liệu liên quan