Luận án tiến sĩ nghiên cứu ứng dụng trí tuệ nhân tạo trong dự báo chất lượng không khí (tt)

MỞ ĐẦU Sự cần thiết đề tài Theo Rob George [1], thuật ngữ dự báo nói chung đề cập đến thực tiễn dự đoán kiện tương lai cách xác dựa thơng tin sẵn có bao gồm liệu kiện khứ thông tin kiến thức kiện khác ảnh hưởng đến kiện dự báo Mặt khác, thuật ngữ chất lượng khơng khí (CLKK) dùng để tình trạng hóa học khí thời điểm địa điểm định Cũng thời tiết, CLKK ảnh hưởng trực tiếp đến sức khỏe người nồng độ chất ô nhiễm khơng khí vượt q mức cho phép, tiếp xúc với thời gian ngắn gây phản ứng cấp tính cay mắt, khó thở Khi tiếp xúc với thời gian dài gây bệnh mãn tính hệ hơ hấp, tim mạch ung thư đặc biệt người già trẻ em Ngồi ra, nhiễm khơng khí cịn gây ảnh hưởng xấu đến hệ sinh thái tự nhiên suy giảm chất lượng khơng khí (giảm tầm nhìn, gây mưa axit…), biến đổi khí hậu, giảm chất lượng nước đất [2] Chính vậy, bên cạnh cơng tác quan trắc dự báo giám sát diễn biến tác nhân gây nhiễm có vai trị quan trọng công tác quản lý CLKK Hiện nay, mô hình dự báo diễn biến nồng độ chất nhiễm khơng khí phát triển mạnh trở thành công cụ hữu hiệu đánh giá quản lý chất lượng khơng khí Trong cơng tác đánh giá CLKK, mơ hình hỗ trợ tối ưu hóa mạng lưới quan trắc CLKK, cung cấp thơng tin cách tồn diện tình trạng chất lượng khơng khí thơng tin mức độ hoạt động nguồn gây ô nhiễm [1] Về mặt quản lý, dự báo CLKK tương lai quan hữu trách cảnh báo đưa chiến lược kiểm soát tốt [3, 4] Trong thập kỷ vừa qua, mô hình dự báo thống kê CLKK sử dụng mạng nơron nhân tạo nghiên cứu ứng dụng thành cơng nhiều quốc gia Thế giới [2], kể đến dự báo nồng độ bụi PM10 [5], dự báo nồng độ ôzôn [6-8], số chất ô nhiễm khác SO2, NOx, VOC… [9-13] sử dụng kiến trúc mạng nơron kết nối đầy đủ - FN với cấu trúc truyền thuận (FFNN) đặc biệt MLP hay số mơ hình ứng dụng mạng nơron hồi quy thông thường (RNN) mạng tự hồi quy phi tuyến với biến ngoại sinh (NARX) [9] Vanilla RNN [14] Trong năm gần đây, kỹ thuật học sâu phát triển mạnh giúp giảm thời gian huấn luyện, giảm tiêu tốn tài nguyên máy tăng độ xác đặc biệt kể đến mạng nơron tích chập (CNN) [15-16], mạng nhớ dài – ngắn (LSTM) [15-17] Tuy nhiên, dự báo thống kê CLKK Việt Nam nói chung đặc biệt dự báo thống kê ứng dụng kỹ thuật trí tuệ nhân tạo mẻ theo hiểu biết tác giả có nghiên cứu liên quan đến lĩnh vực Xuất phát từ thực tế đó, đề tài “Nghiên cứu ứng dụng trí tuệ nhân tạo dự báo chất lượng khơng khí” lựa chọn nhằm khởi động thúc đẩy hướng nghiên cứu Việt Nam, góp phần vào công tác quản lý bảo vệ môi trường khơng khí nước ta Mục đích nghiên cứu - Ứng dụng kỹ thuật trí tuệ nhân tạo để giải toán bổ khuyết liệu quan trắc chất lượng khơng khí bị trống - Nghiên cứu thử nghiệm mơ hình dự báo thống kê chất lượng khơng khí ứng dụng kỹ thuật trí tuệ nhân tạo Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: - Các thơng số chất lượng khơng khí gồm 09 thơng số: + Nhóm thơng số ô nhiễm dạng bụi: PM10, PM2.5 PM1 + Nhóm thơng số nhiễm dạng khí: NO, NO2, NOx, CO, SO2 O3 - Một số kỹ thuật học máy để xây dựng mơ hình dự báo thống kê chất lượng khơng khí, tập trung vào hai kỹ thuật trí tuệ nhân tạo gồm mạng nơron tích chập (CNN) mạng nhớ dài – ngắn (LSTM) Phạm vi nghiên cứu: Các thông số chất lượng khơng khí trạm quan trắc số 556, phường Gia Thụy, quận Long Biên, Hà Nội thời gian từ 2010 đến 2018 thời gian từ 2010 đến 2018 Các đóng góp luận án  Về phương pháp - Bổ khuyết liệu quan trắc CLKK cách tiếp cận sử dụng công cụ máy học (machine learning), mà cụ thể mơ hình ARIMA - Một cách tiếp cận tích hợp ba phương pháp bao gồm xử lý liệu ngoại vi biểu đồ hộp, bổ khuyết liệu công cụ máy học ARIMA xác định luật phân bố liệu quan trắc CLKK sử dụng để trích xuất thông tin CLKK từ liệu CLKK Đây cách tiếp cận khả thi để trích xuất thông tin CLKK từ liệu quan trắc CLKK phục vụ cho công tác nghiên cứu quản lý chất lượng khơng khí  Về kết cụ thể - Mơ hình dự báo chất lượng khơng khí ứng dụng mạng nơron tích chập (CNN) kết hợp với khối nhớ dài – ngắn (LSTM) nghiên cứu thử nghiệm - Cung cấp liệu đầy đủ, đồng liên tục cho quãng thời gian dài (9 năm) nồng độ trung bình chất nhiễm khơng khí Hà Nội để phục vụ công tác nghiên cứu quản lý chất lượng khơng khí - Thơng tin thay đổi nồng độ chất ô nhiễm khơng khí theo thời gian (bao gồm biến trình ngày,diễn biến theo mùa xu hướng diễn biến chất lượng khơng khí dài hạn (trend)); mối tương quan chúng với mối tương quan chúng với yếu tố khí tượng giai đoạn 2010 - 2018 trạm Nguyễn Văn Cừ, Gia Lâm, Hà Nội Bố cục luận án Mở đầu Chương Tổng quan Chương 2: Phương pháp nghiên cứu Chương 3: Kết thảo luận Kết luận kiến nghị CHƯƠNG TỔNG QUAN 1.1 Chất lượng không khí vấn đề dự báo 1.1.1 Chất lượng khơng khí ảnh hưởng đến sức khỏe Chất lượng khơng khí đề quan tâm quốc gia giới, có Việt Nam, mức độ rủi ro tiềm ẩn đến sức khỏe người dân hệ sinh thái Theo tổ chức Y tế Thế giới – WHO, ước tính năm 2012, nhiễm khơng khí ngun nhân gây gần triệu ca tử vong, chiếm 10% số ca tử vong tất nguyên nhân [18] Trong đó, theo ước tính có khoảng 9% ngun nhân ung thư phổi, 17% bệnh phổi mạn tính, 30% nguyên nhân bệnh tim, thiếu máu cục đột quỵ liên quan đến ô nhiễm khơng khí, 9% nhiễm trùng đường hơ hấp [18] Điều cho thấy, công tác dự báo CLKK thực tốt dự báo khí tượng giúp người dân chủ động với hoạt động giảm thiểu mức độ ảnh hưởng tiêu cực nhiễm khơng khí đến sức khỏe, nâng cao hiểu biết ý thức bảo vệ mơi trường, đặc biệt khơng khí Ngồi ra, dựa vào đó, quan có sách chiến lược quản lý CLKK kịp thời 1.1.2 Dự báo chất lượng khơng khí Các mơ hình dự báo CLKK chia thành ba loại dựa vào phương pháp tiếp cận chúng gồm phương pháp tiếp cận thực nghiệm đơn giản, phương pháp thống kê tham số phi tham số phương pháp tiếp cận dự sở vật lý nâng cao Phương pháp tiếp cận theo thực nghiệm đơn giản [2]: Một số mơ hình bật nhóm kể đến đây, mơ hình dự báo CLKK tiếp cận theo phương pháp quán tính (Persistence), mơ hình khí hậu (Climatology) cách tiếp cận khác dựa vào lý thuyết kinh nghiệm (empiricism) Phương pháp tiếp cận dựa sở vật lý nâng cao [2]: cịn gọi mơ hình số trị mơ hình lan truyền hóa học (CTMs AQMs), mơ tả rõ ràng q trình khí tượng, vật lý hóa học dẫn đến hình thành tích tụ chất nhiễm khơng khí sở mối tương quan định luật bảo tồn khối lượng chất nhiễm khơng khí với nhau, mối quan hệ hóa học (phản ứng hóa học) chúng khơng khí trạng thái vật lý chất ô nhiễm thời điểm cần dự báo Phương pháp tiếp cận thống kê tham số phi tham số [2]: mơ hình dự báo thống kê dựa thực tế thơng số khí tượng thơng số CLKK có mối liên hệ chặt chẽ với mặt thống kê Chính vậy, sử dụng mơ hình thống kê khác từ đơn giản hồi quy tuyến tính – LR, phân lớp hồi quy – CART, công cụ phức tạp lọc Kalman (KF), mạng nơron nhân tạo – ANN, máy véctơ hỗ trợ – SVM, lơ-gíc mờ - FL, … Tình hình nghiên cứu ứng dụng trí tuệ nhân tạo dự báo chất lượng khơng khí nước 1.2 Ứng dụng trí tuệ nhân tạo dự báo chất lượng khơng khí 1.3 Phương pháp tiền xử lý liệu cho mô hình dự báo thống kê 1.3.1 Các phương pháp xử lý liệu ngoại vi + Phương pháp phát liệu ngoại vi theo độ lệch chuẩn (SD) + Phương pháp phát liệu ngoại vi theo độ lệch tuyệt đối trung bình (MAD) + Phương pháp phát liệu ngoại vi biểu đồ hộp (Box Whisker) 1.3.2 Phương pháp bổ khuyết liệu Trên thực tế liệu ghi nhận trạm quan trắc CLKK tồn lượng không nhỏ liệu trống lỗi nhiều nguyên nhân (mất điện, bảo trì, lỗi thiết bị ) [71], gây ảnh hưởng không nhỏ đến công tác khai thác liệu CLKK vào mục đích nghiên cứu quản lý CLKK Để giải vấn đề này, có nhiều phương pháp để dự đốn điền (bù) lại giá trị phổ biến hồi quy tuyến tính, nội suy Spline, hồi quy phi tuyến [78-79] 1.4 Mơ hình trí tuệ nhân tạo 1.4.1 Mơ hình ARIMA Mơ hình ARIMA Box Jenkins đề xuất năm 1970 [80, 81], mơ hình phân tích liệu theo chuỗi thời gian kết hợp hai thành phần (mơ hình con) gồm mơ hình tự hồi quy (Autoregressive - AR) mơ hình trung bình trượt (Moving average – MA), mơ tả tóm tắt đây: + Mơ hình tự hồi quy (Autoregressive – AR): yt  1yt 1   yt 2    p yt  p  zt (1.1) + Mơ hình trung bình trượt (Moving average – MA yt   yt  1yt 1    q yt q (1.2) Kết hợp hai mơ hình thành mơ hình có tham số (p, q) gọi ARMA, p tham số mơ hình AR q tham số mơ hình MA, trình bày phương trình (1.4) đây: yt  1yt 1    p yt  p  zt  1zt 1    q zt q (1.4) 1.4.2 Mạng nơron nhân tạo (ANN) Mạng nơron nhân tạo (ANN) giới thiệu lần đầu McCulloch Pitt (1943), cấu trúc tốn học mơ tả lại hệ thần kinh sinh học Chúng tạo thành từ phần tử xử lý thông tin gọi nơron (tế bào thần kinh) [83] Mỗi nơron nhận tín hiệu từ nơron khác từ bên ngồi thơng qua synape Tại đây, thơng tin xử lý thông qua hàm truyền (transfer function) để tạo thành tín hiệu truyền đến nơron khác dựa kinh nghiệm học tập trước Mơ hình tốn ANN thể Hình 1.1 Hình 1.1 Mơ hình tốn tế bào thần kinh (Nguồn [83]) 1.4.3 Máy hỗ trợ véc tơ (SVM) Thuật toán SVMs phát triển Vapnik (1995) [33] dựa lý thuyết thống kê, ban đầu sử dụng toán phân lớp liệu Thuật toán SVMs sử dụng mơ hình tuyến tính để phân chia ranh giới lớp phi tuyến cách mô tả liệu đầu vào ánh xạ phi tuyến, nói cách khác biến đổi khơng gian ban đầu thành không gian SVMs thuật tốn sở mơ hình tuyến tính đặc biệt: Lề tối đa siêu phẳng Trong đó, lề siêu phẳng ranh giới phân chia lớp liệu Mục tiêu tốn hồi quy gần hàm g(x) N từ mẫu G  x    xi , yi i 1 1.4.4 Mạng nơron tích chập (CNN) Mạng nơron tích chập (convolutional neural network) loại mạng nơron nhân tạo chứng minh tính hiệu nhiều lĩnh vực phức tạp xe tự hành, nhận dạng sinh trắc học, dự báo kinh tế, điều khiển rô bốt Được giới thiệu phát triển thập niên 90 kỷ XX, kiến trúc LeNet đề xuất Yann LeCun coi mạng nơron tích chập thiết kế mơ hình nhận dạng chữ in viết tay gọi LeNet5 giúp thúc đẩy phát triển mạnh mẽ lĩnh vực học sâu (deeplearning) Một số kiến trúc mạng tích chập đề xuất năm gần đây, nhiên tất chúng sử dụng khái niệm phương pháp tiếp cận từ LeNet [42] 1.4.5 Khối nhớ dài – ngắn (LSTM) Khối nhớ dài – ngắn (long-short term memory – LSTM) đề xuất Sepp Hochreiter Jürgen Schmidhuber năm 1997, ban đầu LSTM bao gồm tế bào hai cổng đầu vào đầu ra, sau cấu trúc LSTM hoàn thiện Gers Felix [94] thêm cổng quên (foget gate) kết nối giám sát (peephole conections) LSTM chứa cổng vào (input gate), cổng đầu (output gate) cổng quên (foget gate), tương tác qua lại ba cổng giúp LSTM có đủ khả phân tích phụ thuộc liệu thời gian dài, điều mà RNN thông thường giải Ngoài ra, vấn đề gặp phải phổ biến mạng nơron sâu (nhiều lớp) gọi độ dốc (gradient descent), tức là, tốc độ học lớp ẩn phía trước chậm lớp ẩn sâu Hiện tượng thường làm giảm độ xác số lớp ẩn tăng lên Tuy nhiên, với cấu trúc nhớ LSTM giải hiệu vấn đề suy giảm độ dốc q trình lan truyền ngược (backpropagation) [15] phân tích chuỗi liệu đầu vào với bước thời gian dài Do đó, LSTM thường sử dụng để giải vấn đề phân tích liệu theo chuỗi thời gian CHƯƠNG PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Quy trình nghiên cứu Để đạt mục tiêu đề ra, nghiên cứu thực theo bước tóm tắt đây: Bước Thu thập liệu từ trạm quan trắc CLKK Bước Làm chuẩn bị liệu: - Xử lý liệu ngoại vi - Bổ khuyết liệu - Kiểm tra độ tin cậy liệu bổ khuyết Bước Xây dựng đánh giá mơ hình nghiên cứu - Xây dựng kiến trúc mơ hình CNN-LSTM - Huấn luyện mơ hình - Đánh giá độ tin cậy mơ hình Bước Thực mơ hình 2.2 Thu thập liệu 2.2.1 Địa điểm thời gian thu thập liệu a Địa điểm thu thập liệu Bộ liệu quan trắc CLKK sử dụng nghiên cứu nồng độ trung bình thơng số CLKK đo trạm quan trắc CLKK tự động thuộc quyền quản lý Trung tâm quan trắc Môi trường Miền Bắc (CEM), Tổng cục Môi trường đặt số 556, Nguyễn Văn Cừ, Gia Lâm, Hà Nội, tương ứng với tọa độ 21°02'55.6"N 105°52'57.4"E (Hình 2.1 thuyết minh luận án) b Thời gian thu thập liệu Bộ liệu thu thập quan trắc đặt số 556, Nguyễn Văn Cừ, Gia Lâm, Hà Nội 09 năm từ tháng năm 2010 đến 31 tháng 12 năm 2018 Bộ liệu bao gồm 23 thơng số, trình bày chi tiết Bảng II.1 phần Phụ lục II (quyển thuyết minh luận án) 2.2.2 Thông số kỹ thuật phương pháp đo đạc trạm quan trắc Được trình bày Bảng 2.1 (quyển thuyết minh luận án) 2.3 Làm chuẩn bị liệu 2.3.1 Xử lý liệu ngoại vi Các bước thực trình xử lý liệu ngoại vi trình bày Hình 2.2 (quyển thuyết minh luận án) 2.3.2 Bổ khuyết liệu Trong luận án này, mơ hình ARIMA lựa chọn sử dụng để bổ khuyết giá trị bị khuyết thiếu (trống) liệu nghiên cứu 2.3.3 Kiểm tra độ tin cậy liệu sau bổ khuyết - Xác định kiểm tra tính đồng luật phân bố xác suất liệu - So sánh, đánh giá giá diễn biến nồng độ thông số CLKK nghiên cứu trước sau bổ khuyết 2.3.4 Chuẩn hóa liệu đầu vào cho mơ hình dự báo Được thực qua hai bước: Bước Chia tỷ lệ thuộc tính (feature scaling): Trong bước này, giá trị (nồng độ) thông số nghiên cứu liệu chuẩn hóa khoảng giá trị từ đến theo công thức (2.6) (quyển thuyết minh luận án) Bộ liệu sau chuẩn hóa khoảng giá trị 0;1 , liệu đầu vào mô hình cài đặt theo mẫu sau: target  Yt 1   Xt     X t 1    input          X t n  (2.7) Bước 2: Bộ liệu sau chuẩn hóa bước chia thành hai phần, phần dùng để huấn luyện (training) mơ hình phần lại dùng đề hiệu chỉnh kiểm tra độc lập (testing) mơ hình Tỷ lệ số lượng thời gian hai liệu phân chia sau: - Bộ liệu huấn luyện (training): 90% tổng số 78.888 quan trắc, tương ứng với đoạn liệu liên tục từ 0h00 ngày 01/01/2010 đến 6h00 ngày 6/02/2018 - Bộ liệu hiệu chỉnh kiểm tra: 10% tổng số liệu, tương ứng với đoạn liệu từ 7h00 ngày 06/02/2018 đến 23h00 ngày 31/12/2018 2.4 Xây dựng mơ hình dự báo thống kê chất lượng khơng khí Trong luận án này, với thơng số nghiên cứu, mạng nơron tích chập (Convolutional neuron network – CNN) kết hợp với hỗ trợ việc ghi nhớ lại hành vi (thông tin) thơng số quan trắc CLKK nghiên cứu, thông số phụ thuộc khứ theo thời gian khối mạng nhớ dài-ngắn (long-short term memory – LSTM) nghiên cứu Qua nghiên cứu, luận án đề xuất sử dụng mơ hình CNN-LSTM (Hình 2.3) CNN trích xuất đặc trưng Đầu TimeDist–FC (1,sigm.) TimeDist–FC (100,ReLu) LSTM (200,tanh) Flaten Reapeat vector (1) Nồng độ thông số cần dự báo thời điểm t+1 Max pooling (2x2) Batch Norm Conv.1D (32,3x3,ReLu) Max pooling (2x2) Batch Norm Conv.1D (32,3x3,ReLu) Đầu vào (NO, NO 2, NO x,CO, O3, SO2, PM10, PM2.5, PM1, WS, RH, T, Rad) từ t-7 đến t LSTM Mơ hình CNN – LSTM Hình 2.3 Kiến trúc mơ hình dự báo CLKK đề xuất 2.5 Tiến trình thực thi mơ hình Tiến trình thực thi mơ hình nghiên cứu mơ tả tóm tắt theo sơ đồ Hình 2.7 Dữ liệu đầu vào Chuẩn hóa DL (Normalization) DL huấn luyện DL kiểm tra Khởi tạo tham số mơ hình CNN-LSTM Epoch=1 Mơ hình CNN-LSTM huấn luyện (MAE, MSE≤ mong muốn) (epoch≥max-epoch) Tối ưu ADAM Tính MAE, MSE MAPE Epoch=Epoch+1 Sai Hiệu chỉnh tham số (tốc độ học, trọng số,…) Huấn luyện mơ hình CNN-LSTM Tính giá trị dự báo Tính hiệu suất (MAE, RMSE, R2) Kết thúc Đúng Kết thúc huấn luyện Lưu mơ hình CNN-LSTM Hình 2.7 Sơ đồ bước làm việc mơ hình đề xuất 10 2.6 Đánh giá hiệu suất mơ hình nghiên cứu Hiệu suất mơ hình đánh giá thơng qua số số thống kê gồm MAE, RMSE, r R2 2.7 Nền tảng thông số kỹ thuật máy tính Các mơ hình nghiên cứu xây dựng thực thi hệ thống Colaboratory công ty Google Thông số kỹ thuật tảng tài nguyên máy sử dụng luận án từ hệ thống Colaboratory trình bày đây: - Ngơn ngữ sử dụng: Python phiên 3.6.9 - Môi trường tích hợp (Integrated Development Environment – IDE): Colaboratory Notebook online hệ thống Colab - Thư viện AI sử dụng: Tensorflow.Keras phiên 2.2.0 - Thông số GPU sử dụng để huấn luyện mơ hình nghiên cứu: Google Colab GPU Tesla T4, RAM 16GB CHƯƠNG KẾT QUẢ VÀ THẢO LUẬN 3.1 Kết phân tích xử lý liệu đầu vào 3.1.1 Tình trạng liệu xử lý sơ 3.1.1.1 Tình trạng liệu thu thập Tỷ lệ liệu trống thông số quan trắc liệu nguồn Hình 3.1 100 Hà Nội 60 56.8 56.8 53 49.2 49.1 40 Tỷ lệ liệu trống (%) 80 83.2 81.9 82.1 20 22.2 16.8 16.5 13.3 13.4 7.4 6.7 N EN LE YL OXY N EN ZE N MP -X TO LU E ET HY L-B TH C NZ EN BE HC NM CH 2.5 PM PM 10 O PM CO x SO NO NO NO 7.4 8.1 Hình 3.1 Tỷ lệ liệu trống thông số quan trắc liệu nguồn 11 3.1.1.2 Kết xử lý liệu hỏng liệu ngoại vi Bảng 3.2 Thống kê tỷ lệ liệu trống trước sau xử lý liệu ngoại vi Tỷ lệ liệu trống thông số quan trắc CLKK (%) O3 SO2 NO NO2 NOx CO PM10 PM25 PM1 Trước 22,17 16,85 7,44 8,08 7,44 6,70 13,26 13,43 22,1 Sau 28,67 23,80 8,92 9,09 7,96 11,82 17,39 16,70 28,7 Số DLXL 5037 5411 1139 766 391 4002 3206 2532 2744 Ghi chú: Số DLXL – số liệu xác định ngoại vi (bất thường lỗi) 3.1.2 Kết bổ khuyết liệu 3.1.3 Kết bù liệu Mơ hình ARIMA lựa chọn sử dụng luận án thử nghiệm liệu quan trắc NO nồng độ trung bình gồm 2000 điểm (giờ) liên tục từ ngày 01/01/2011 đến ngày 25/03/2011 (đoạn liệu liên tục đủ dài) Với giả định tỷ lệ liệu trống 5%, 10%, 20%, 30%, 40%, 50%, 60% 80% vị trí liệu trống xác định cách ngẫu nhiên, số lượng chúng tương ứng theo tỷ lệ liệu trống xác định Để đánh giá độ tin cậy mơ hình ARIMA chọn, ba phương pháp gồm tự động hồi quy (Autoregressive - AR), hồi quy tuyến tính (Linear regression, LR) hồi quy spline tương ứng với 05 mơ hình AR, LR, Spline bậc 3, Spline bậc Spline bậc sử dụng để so sánh đánh giá độ tin cậy chúng với Các giá trị nồng độ NO tính tốn (dự đốn) từ 06 mơ hình so sánh với giá trị thực liệu gốc Kết trình bày Bảng 3.3 (trong thuyết minh luận án) 3.1.4 Luật phân bố mật độ xác suất liệu Như trình bày phần trên, việc bù liệu làm chất phân bố liệu, vậy, việc so sánh phân bố mật độ xác suất trước sau bù liệu điều cần thiết cách khác để kiểm tra độ tin cậy liệu bù 12 Bảng 3.4 Phân bố xác suất chất nhiễm nhiễm khơng khí từ 2010 đến 2018 Năm 2010 2011 2012 2013 2014 2015 2016 2017 2018 PM10 Phân bố xác suất phù hợp PM2.5 SO2 NO2 O3 CO Lognormal Weibull Lognormal Weibull Lognormal Weibull Weibull Gamma Lognormal Weibull Lognormal Gamma Gamma Lognormal Gamma Weibull Gamma Gamma Weibull Gamma Gamma Weibull Gamma Gamma Gamma Lognormal Gamma Weibull Lognormal Gamma Gamma Lognormal Gamma Lognormal Lognormal Lognormal Weibull Lognormal Gamma Lognormal Lognormal Lognormal Gamma Lognormal Gamma Gamma Weibull Gamma Weibull Weibull Weibull Gamma Lognormal Lognormal Từ kết phân tích trình bày Bảng 3.4, Bảng I.2 Bảng I.3 phần Phụ lục I, cho thấy, thông số quan trắc khác nhau, thông số quan trắc có phân bố xác suất khơng giống theo năm, điều tương đồng với nghiên cứu Ismail cộng [108] tổng hợp từ nhiều nghiên cứu nhiều liệu khác nghiên cứu [95, 96] liệu quan trắc CLKK thành phố New Delhi, Ấn Độ SO2 O3 40 60 80 NOx 100 120 140 NO2 NO 20 NO;NO2;NOx ;SO2;O3 (g/m ) 3.1.5 Xu hướng diễn biến theo thời gian tương quan mối tương quan thông số 2012 PM10 2013 2014 PM2.5 2015 2016 PM1 2017 2018 4000 CO 150 3000 100 2000 50 1000 3 PM10; PM2.5; PM1(g/m ) 200 2011 CO (g/m ) 2010 0 2010 2011 2012 2013 2014 2015 2016 2017 2018 Hình 3.7 Xu hướng diễn biến chất lượng khơng khí trạm quan trắc Nguyễn Văn Cừ, Gia Lâm, Hà Nội từ 2010 đến 2018 13 SO2 O3 40 60 80 NOx 100 120 140 NO2 NO 20 NO;NO2;NOx ;SO2;O3 (g/m ) Xu hướng diễn biến nồng độ trung bình năm thơng số gây nhiễm khơng khí thấy Hình 3.7 Nhìn chung, nồng độ trung bình năm thơng số có xu hướng giảm nhẹ thời gian nghiên cứu từ 2010 đến 2018 ngoại trừ SO2 2012 PM10 2013 2014 PM2.5 2015 2016 PM1 2017 2018 4000 CO 150 3000 100 2000 50 1000 3 PM10; PM2.5; PM1(g/m ) 200 2011 CO (g/m ) 2010 0 2010 2011 2012 2013 2014 2015 2016 2017 2018 Hình 3.8 Biến trình nồng độ ngày thông số CLKK trạm Nguyễn Văn Cừ, Gia Lâm, Hà Nội Diễn biến nồng độ trung bình ngày NO, CO, NO2 O3 luận án trình bày Hình 3.8 tương tự với diễn biến chất ô nhiễm nghiên cứu Cohen cộng năm 2010 [111] thực Hà Nội giai đoạn từ 2001 đến 2008 và Sakamoto cộng năm 2018 [112] giai đoạn 2015 – 2016 Diễn biến nồng độ trung bình ngày nghiên cứu tương tự CO, NO NO2 thành phố Hồ Chí Minh báo cáo nghiên cứu To Thi Hien năm 2019 [113] Thêm nữa, diễn biến nồng độ trung bình ngày PM10, CO, NO, NO2 O3 tương đồng với diễn biến thông số Bangkok, Thái Lan báo cáo nghiên cứu Watcharavitoon cộng năm 2013 [114] Tất kết cho thấy, trình bày Mục 3.1 lượng liệu trống liệu nguồn lớn, nhiên, mơ hình bù liệu ARIMA sử dụng ý nghĩa định đáp ứng phần việc bảo tồn diễn biến thông số CLKK nghiên cứu Dữ liệu sau xử lý, bước lựa chọn thông số đầu vào cho mơ hình Để đạt điều tìm mối liên hệ định thông số (biến đầu vào mơ hình dự báo) với nhau, hệ số tương quan thông số trình bày Bảng 3.5 (quyển thuyết minh luận án) 14 cho thấy mối tương quan thông số nghiên cứu luận án Như trình bày trên, diễn biến nồng độ chất ô nhiễm (thông số quan trắc CLKK) không phụ thuộc vào chất hóa học mà cịn phụ thuộc vào yếu tố khí tượng thời điểm gồm (tốc độ gió, hướng gió, xạ mặt trời, lượng mưa ) Dựa vào kết trên, ngồi thơng số quan trắc CLKK nghiên cứu thơng số khí tượng có mối tương quan bao gồm WS, Temp, Rad RH lựa chọn thơng số đầu vào cho mơ hình dự báo ứng dụng kỹ thuật dụng kỹ thuật học máy (machine learning) 3.2 Lựa chọn mơ hình dự báo Trong luận án này, để lựa chọn mơ hình nghiên cứu phù hợp với điều kiện chất lượng liệu có luận án, số mơ hình học máy thơng thường số mơ hình học sâu – mơ hình ứng dụng thành cơng cơng tác dự báo chất lượng khơng khí giới, lựa chọn để nghiên cứu thử nghiệm Các mơ hình nghiên cứu thử nghiệm bao gồm MLP, SVM, CNN, LSTM, GRU CNN-LSTM Kết trình bày Bảng 3.6 (quyển thuyết minh luận án) Từ Bảng 3.6 thấy, hiệu suất mơ hình mạng nơron túy gồm MLP, CNN RNN LSTM GRU liệu nghiên cứu cho kết Cụ thể, hệ số xác định R2 mơ hình dự liệu kiểm tra độc lập 0,1 (R2 mơ hình MLP, CNN, LSTM GRU 0,05; 0,01; 0,01 0,01) với tỷ lệ sai lệch trung bình giá trị dự báo với giá trị thực MAPE (100*MAE/CTB) tính theo MAE tương ứng 42,8%; 44,0%; 42,6% 42,8% Kết nhiều so với hiệu suất mơ hình loại báo cáo giới Điều số nguyên nhân sau Từ kết này, bước đầu kết luận, với đặc trưng chất lượng liệu có, mạng nơron đơn lẻ khơng thích hợp để xây dựng mơ hình dự báo thống kê CLKK cho trạm quan trắc Nguyễn Văn Cừ, Long Biên, Hà Nội Ở chiều ngược lại, mơ hình SVM lại cho kết tương đối khả quan với hệ số xác định R2 liệu kiểm tra độc lập đạt đến 0,63, tương ứng với tỷ lệ sai số 100*MAE/CTB 23,6% tiệm cận với hiệu suất mơ hình SVM Kuo-Ping Lin (2011) với 100*MAE/CTB mơ hình dự báo nồng độ PM10 24,4% [93], mơ hình loại Một kết thú vị thể Bảng 3.6 Đó là, hiệu suất mơ hình CNN LSTM đơn lẻ thấp, nhiên, kết hợp hai kiến trúc mạng CNN 15 với LSTM với hiệu suất thu đáng ngạc nhiên, hiệu suất mô hình kết hợp CNN-LSTM khơng cải thiện mà chí cịn vượt qua mơ hình SVM Cụ thể R2 mơ hình CNN-LSTM đạt đến 0,78 với 100*MAE/CTB 13,27% Kết cho thấy, việc kết hợp CNN LSTM phát huy điểm mạnh hai loại kiến trúc mạng Trong CNN có nhiệm vụ trích xuất đặc trưng liệu sở giữ lại đặc trưng quan trọng, đó, liệu đầu vào cho LSTM gần loại bỏ đặc trưng gây nhiễu, nguyên nhân làm cho mơ hình mạng nơron đơn lẻ có hiệu suất thấp Các đặc trưng LSTM ghi nhớ phân tích diễn biến chúng theo thời gian để đựa giá trị dự báo, điều giúp mơ hình dự báo xác Dựa vào tất kết trên, mơ hình có đạt hiệu suất vượt trội mơ hình CNN-LSTM kết hợp hai kiến trúc mạng nơron đơn lẻ CNN LSTM lựa chọn để nghiên cứu xây dựng thử nghiệm mơ hình dự báo CLKK cho trạm quan trắc Nguyễn Văn Cừ, Long Biên, Hà Nội 3.3 Dự báo nồng độ trung bình Để xác định độ trễ thời gian thích hợp cho mơ hình, số độ trễ thời gian thử nghiệm tương ứng 24, 12, 8, Từ kết thu luận án lựa chọn độ trễ thời gian cho mẫu liệu đầu vào Chi tiết cấu trúc tham số mơ hình CNN-LSTM đề xuất trình bày Hình III.1 phần Phụ lục III (Bản thuyết minh luận án) Hầu hết mơ hình bắt đầu hội tụ epochs thứ 90 (Hình 3.9 thuyết minh luận án) Do đó, dựa kết tốc độ hội tụ mơ hình, khuyến nghị số epochs sử dụng để huấn luyện cho mô hình CNNLSTM đề xuất 100 cho trường hợp cần sử dụng mơ hình nhanh tái huấn luyện mơ hình 3.3.1 Thơng số chất lượng khơng khí dạng bụi a Huấn luyện mơ hình Kết thống kê hiệu suất thông số ô nhiễm dạng bụi trình bày Bảng 3.7 Hình 3.10 – 3.11 (quyển thuyết minh luận án) cho thấy, sau trình huấn luyện với 2000 epochs cài đặt luận án này, ba mơ hình PM10, PM2.5 PM1 cho kết ấn tượng Cụ thể, số đánh giá tương quan diễn biến R2 giá trị dự báo từ mô hình nghiên cứu giá trị thực ghi nhận liệu nghiên cứu đạt 0,99, cụ thể 0,996; 0,997 0,998 tương ứng với mơ hình dự báo 16 PM10, PM2.5 PM1 tương ứng Tỷ lệ phần trăm giá trị sai số nồng độ trung bình MAE/CTB (RMSE/CTB) thơng số 1,7% (2,4%); 1,7% (2,2%) 1,2% (1,8%) Điều bước đầu cho thấy, kiến trúc kết hợp mạng nơron tích chập khối nhớ dài ngắn (CNN-LSTM) đáp ứng tốt với yêu cầu tốn đặt Hình 3.11 So sánh diễn biến nồng độ trung bình chất nhiễm dạng bụi dự báo từ mơ hình CNN-LSTM nồng độ thực liệu huấn luyện b Kiểm tra độc lập mơ hình Kết kiểm định mơ hình CNN-LSTM cho thơng số nhiễm dạng bụi gồm PM10, PM2.5 PM1 liệu kiểm tra độc lập trình bày Bảng 3.8 Hình 3.12 – 3.13 (trong thuyết minh luận án) Từ Hình 3.12 Bảng 3.8 thấy, độ xác mơ hình dự báo nồng độ trung bình chất nhiễm dạng bụi liệu kiểm tra thấp so với kết thử nghiệm liệu huấn luyện Điều do, kinh nghiệm diễn biến thông số theo thời gian mối liên hệ thông số cần dự báo thơng số khí tượng tiền chất mơ hình “học” từ liệu huấn luyện, vậy, mơ hình dự báo tốt với liệu huấn luyện Tuy nhiên, kết cho thấy tín hiệu tốt từ mơ hình CNN-LSTM đề xuất luận án Cụ thể, R2 mơ hình PM10, PM2.5 PM1 0,77; 0,85 0,83, tương ứng với tỷ lệ sai số 100*MAE/CTB (100*RMSE/CTB) 13,27% (20,49%); 12,06% (18,35%) 14,83% (22,71%) Diễn biến nồng độ chất ô nhiễm dự báo từ mô hình trình bày Hình 3.13 có độ phù hợp tốt với liệu thực ghi nhận trạm quan trắc 17 Hình 3.13 So sánh diễn biến nồng độ trung bình chất nhiễm dạng bụi dự báo từ mơ hình CNN-LSTM nồng độ thực liệu kiểm tra 3.3.2 Nhóm thơng số nhiễm dạng khí a Huấn luyện mơ hình Tương tự kết thơng số ô nhiễm dạng bụi báo cáo Mục 3.3.1, kết mơ hình dự báo thơng số nhiễm dạng khí liệu huấn luyện lý tưởng Cụ thể, Độ lệch (sai số) giá trị nồng độ dự báo từ mơ hình liệu thực tế ghi nhận tương đối nhỏ cụ thể tỷ lệ phần trăm giá trị sai số nồng độ trung bình 100*MAE/CTB (100*RMSE/CTB) thơng số 4,2% (5,9%); 2,1% (3,0%); 3,5% (4,9%); 4,5% (6,3%); 3,9% (5,2%) 2,2% (3,2%) tương ứng thông số O3, SO2, NO, NO2, NOx CO Hình 3.15 So sánh diễn biến nồng độ trung bình chất nhiễm dạng khí dự báo từ mơ hình CNN-LSTM nồng độ thực liệu huấn luyện Với chất lượng liệu đầu vào với lượng liệu khuyết thiếu lớn trình bày Mục 3.1.1, hiệu suất mơ hình đề xuất luận án 18 liệu huấn luyện vượt mong đợi Kết quả, trình bày Hình 3.14 (trong thuyết minh luận án) Hình 3.15 giúp làm rõ hiệu suất mơ hình dự báo xác định hàm tuyến tính tương ứng mối tương quan giá trị dự báo từ mơ hình giá trị thực ghi nhận b Kiểm tra độc lập mơ hình Có thể thấy ngoại trừ SO2 hiệu suất mơ hình CNN-LSTM 05 thơng số cịn lại đạt kết khả quan, hệ số xác định R2 05 thông số đạt 0,63, cụ thể 0,632; 0,755; 0,66; 0,694 0,786 Một kết khác trình bày Bảng 3.2 cho thấy tỷ lệ liệu trống SO2 tương đối lớn (chiếm 23,8% tổng số quan trắc), nữa, số liệu trống tập trung giai đoạn từ năm 2017 đến 2018, đoạn liệu sử dụng để làm liệu kiểm tra trình bày Mục 2.3.4 Mặc dù bổ khuyết liệu mô hình ARIMA, nhiên, điều chưa đủ làm sai lệch phán đốn mơ hình dẫn đến hiệu suất mơ hình SO2 nghiên cứu ko đạt hiệu suất mong muốn Điều cho thấy, dự báo thông số SO2 mơ hình dự báo thống kê nói chung mơ hình CNN-LSTM đề xuất luận án với chất lượng liệu SO2 có liệu thu thập Hình 3.18 So sánh diễn biến nồng độ trung bình chất nhiễm dạng khí dự báo từ mơ hình CNN-LSTM nồng độ thực liệu huấn luyện kiểm tra 3.4 Dự báo nồng độ trung bình ngày 3.4.1 Nhóm thơng số chất lượng khơng khí dạng bụi a Huấn luyện mơ hình Kết thống kê hiệu suất mơ hình dự báo thơng số CLKK dạng bụi trình bày Bảng 3.11 Hình 3.18 Hình 3.29 (bản 19 thuyết minh luận án) lần cho thấy mơ hình CNN-LSTM đề xuất có khả “học” phân tích tốt thông tin ẩn liệu Cụ thể, R2 03 mơ hình PM10, PM2.5 PM1 0,993; 0,994 0,993 tương ứng với tỷ lệ sai số 100*MAE/CTB (100*RMSE/CTB) tương ứng 5,4% (7,2%); 4,2% (5,6%) 4,4% (6,2%) b Kiểm tra độc lập mơ hình Khơng giống mơ hình dự báo nồng độ trung bình giờ, mơ hình dự báo nồng độ trung bình ngày liệu kiểm tra cho kết không tốt mô hình dự báo nồng độ trung bình trình bày Mục 3.3.1 Thống kê chi tiết hiệu suất mơ hình trình bày Bảng 3.12 Hình 3.20 (trong thuyết minh luận án) Hình 3.21 So sánh diễn biến nồng độ trung bình ngày chất ô nhiễm dạng bụi dự báo từ mơ hình CNN-LSTM nồng độ thực liệu kiểm tra Có thể thấy hiệu suất mơ hình dự báo nồng độ trung bình ngày thông số dạng bụi thấp so với hiệu suất mơ hình dự báo nồng độ trung bình tương ứng Như trình bày độ tin cậy mơ hình dự báo thống kê nói chung mơ hình CNN-LSTM đề xuất luận án phụ thuộc lớn vào độ lớn liệu huấn luyện chất lượng liệu, vậy, liệu nghiên cứu thử nghiệm luận án thu thập 09 năm từ 2010 đến 2018, tổng số điểm liệu nồng độ trung bình 3287 Tuy nhiên, kết so sánh diễn biến nồng độ dự báo từ mơ hình CNN-LSTM đề xuất nồng độ thực tế (Hình 3.21) đáp ứng tương đối tốt với diễn biến thực tế 20 3.4.2 Nhóm thơng số chất lượng khơng khí dạng khí a Huấn luyện mơ hình Như trình bày trên, việc dự báo thông số ô nhiễm dạng khí khó khăn so với thơng số dạng bụi, đặc biệt O3 Tuy nhiên, hiệu suất mơ hình liệu huấn luyện bước đầu cho thấy mơ hình CNN-LSTM đề xuất tốt (Bảng 3.13 Hình 3.22 – 3.23 thuyết minh luận án) Cụ thể, hệ số xác định R2 mơ hình NO, NO2, NOx, SO2, CO O3 trình bày Bảng 3.12 có giá trị 0,996; 0,998; 0,995; 0,992; 0,995 0,995 tương ứng với tỷ lệ sai số 100*MAE/CTB (100*RMSE/CTB) mơ hình 4,6% (6,0%); 1,5% (2,0%); 2,7% (3,7%); 5,8% (7,8%); 2,0% (2,7%) 3,4% (4,6%) Tuy nhiên, thấy, hiệu suất mơ hình CNN-LSTM để dự báo nồng độ trung bình ngày bao gồm mơ hình cho thơng số dạng bụi thấp chút so với mơ hình dự báo nồng độ trung bình trình bày Mục 3.2 Hình 3.24 So sánh diễn biến nồng độ trung bình ngày chất nhiễm dạng khí dự báo từ mơ hình CNN-LSTM nồng độ thực liệu huấn luyện b Kiểm tra độc lập Kết thống kê hiệu suất mơ hình dự báo nồng độ trung bình ngày thơng số dạng khí trình bày Bảng 3.14 Hình 3.24 (trong thuyết minh luận án), cho thấy, hiệu suất mơ hình liệu huấn luyện tốt, nhiên, liệu kiểm tra độc lập, hầu hết mơ hình trừ NO2 NOx cho kết thấp Trong đó, giống mơ hình dự báo nồng độ trung bình giờ, độ tin cậy mơ hình SO2 dự báo nồng độ trung bình ngày thấp (R2 đạt 0,122), điều lần củng cố thêm nhận định độ tin cậy thấp liệu giai đoạn năm 2018 thơng số 21 Hình 3.25 So sánh diễn biến nồng độ trung bình ngày chất nhiễm dạng khí dự báo từ mơ hình CNN-LSTM nồng độ thực liệu kiểm tra KẾT LUẬN VÀ KIẾN NGHỊ Kết luận: Luận án ứng dụng mơ hình ARIMA để xây dựng mơ hình bù liệu CLKK bị khuyết thiếu với số đóng góp sau:  Bù liệu bị khuyết thiếu mơ hình ARIMA thay sử dụng phương pháp truyền thống bình phương tối thiểu, hồi quy tuyến tính, hồi quy spline … nghiên cứu khác  Thu liệu CLKK trạm quan trắc Nguyễn Văn Cừ, quận Long Biên, Hà Nội hoàn chỉnh, liên tục theo thời gian dài có độ tin cậy định góp phần giúp nhà quản lý, nhà nghiên cứu dễ dàng công tác quản lý hoạt động nghiên cứu Đã xác định luật phân bố xác suất liệu nồng độ chất ô nhiễm PM10, PM2.5, SO2, NO, NO2, O3 CO không khí khu vực trạm quan trắc Nguyễn Văn Cừ, quận Long Biên, Hà Nội nói riêng Hà Nội nói chung Kết cho thấy, liệu nồng độ trung bình chất ô nhiễm không khí quan trắc trạm quan trắc Nguyễn Văn Cừ, quận Long Biên, Hà Nội tuân theo luật phân bố Weibull, gamma lognormal Một mặt, luật phân bố xác suất thông số quan trắc địa điểm khác năm khác Mặt khác, luật phân phối thông số khác khác chúng quan trắc thời gian địa điểm 22 Đã xác định đặc trưng diễn biến nồng độ chất ô nhiễm PM10, PM2.5, SO2, NO, NO2, O3 CO theo thời gian ngày, năm (theo mùa) khu vực quan trắc Hà Nội Đồng thời, xác định xu hướng diễn biến (trend) dài hạn nồng độ chất ô nhiễm khu vực nghiên cứu giai đoạn 2010 đến 2018 Luận án lựa chọn ứng dụng mạng nơron tích chập (CNN) kết hợp với khối nhớ dài – ngắn (LSTM) để xây dựng thử nghiệm mơ hình dự báo CLKK sử dụng liệu quan trắc trạm quan trắc CLKK tự động, cố định, với số đóng góp mặt phương pháp sau:  Đã đề xuất xây dựng kiến trúc mạng nơron tích chập kết hợp với khối nhớ dài – ngắn để xây dựng mơ hình dự báo thống kê CLKK  Hiệu suất tương ứng mơ hình dự báo nồng độ trung bình liệu kiểm tra độc lập đánh giá thông qua 03 thông số thống kê gồm MAE, RMSE MAE thông số cụ thể tương ứng sau: - NO : MAE = 12,17 μg/m3; RMSE = 17,25 μg/m3; R2 = 0,632 - NO2 : MAE = 7,93 μg/m3; RMSE = 11,34 μg/m3; R2 = 0,755 - NOx : MAE = 17,10 μg/m3; RMSE = 23,03 μg/m3; R2 = 0,694 - SO2 : MAE = 5,46 μg/m3; RMSE = 7,28 μg/m3; R2 = 0,357 - CO : MAE = 779,91 μg/m3; RMSE = 1082,97 μg/m3; R2 = 0,694 - O3 : MAE = 12,43 μg/m3; RMSE = 17,64 μg/m3; R2 = 0,786 - PM10 : MAE = 9,39 μg/m3; RMSE = 14,5 μg/m3; R2 = 0,7776 - PM2.5: MAE = 5,33 μg/m3; RMSE = 8,11 μg/m3; R2 = 0,849 - PM1 : MAE = 5,14 μg/m3; RMSE = 7,87 μg/m3; R2 = 0,826  Hiệu suất tương ứng mơ hình dự báo nồng độ trung bình ngày liệu kiểm tra độc lập thông số cụ thể tương ứng sau: - NO : MAE = 1,82 μg/m3; RMSE = 3,35 μg/m3; R2 = 0,302 - NO2 : MAE = 3,52 μg/m3; RMSE = 5,18 μg/m3; R2 = 0,877 - NOx : MAE = 3,57 μg/m3; RMSE = 5,50 μg/m3; R2 = 0,679 - SO2 : MAE = 0,96 μg/m3; RMSE = 1,71 μg/m3; R2 = 0,122 - CO : MAE = 212,06 μg/m3; RMSE = 310,55 μg/m3; R2 = 0,393 23 - O3 : MAE = 1,20 μg/m3; RMSE = 2,21 μg/m3; R2 = 0,343 - PM10 : MAE = 11,44 μg/m3; RMSE = 15,36 μg/m3; R2 = 0,702 - PM2.5: MAE = 5,96 μg/m3; RMSE = 9,09 μg/m3; R2 = 0,652 - PM1 : MAE = 4,80 μg/m3; RMSE = 7,55 μg/m3; R2 = 0,635  Trong phạm vi nghiên cứu luận án, đặc trưng chất lượng liệu thu thập trạm quan trắc Nguyễn Văn Cừ, Hà Nội, việc ứng dụng kiến trúc mạng nơron CNN-LSTM để xây dựng mơ hình dự báo nồng độ trung bình tốt so với mơ hình dự báo nồng độ trung bình ngày Dự báo thơng số ô nhiễm dạng bụi tốt so với thông số nhiễm dạng khí Luận án đề xuất cách tiếp cận tích hợp phương pháp, gồm xử lý liệu ngoại vi biểu đồ hộp, bù liệu khuyết thiếu công cụ học máy sử dụng luật phân bố xác suất liệu quan trắc CLKK để trích xuất thơng tin phục vụ cơng tác quản lý chất lượng khơng khí Phương pháp khai thác liệu tích hợp, mơ hình ARIMA để bổ khuyết liệu mơ hình CNN-LSTM để dự báo CLKK đề xuất luận án sử dụng cho cơng tác quản lý tổng hợp chất lượng khơng khí Kiến nghị: Có thể áp dụng phương pháp luận luận án số liệu trạm quan trắc CLKK khác nhằm đánh giá cách tổng quát khả ứng dụng mơ hình nghiên cứu để dự báo CLKK nói riêng quản lý chất lượng khơng khí nói chung Cụ thể sau: Ứng dụng mơ hình ARIMA để xây dựng mơ hình bù liệu CLKK trạm quan trắc chất lượng khơng khí tự động, cố định khác Ứng dụng mạng nơron tích chập (CNN) kết hợp với khối nhớ dài – ngắn (LSTM) để nghiên cứu xây dựng thử nghiệm mơ hình dự báo CLKK trạm quan trắc khác 24 ... Tình hình nghiên cứu ứng dụng trí tuệ nhân tạo dự báo chất lượng khơng khí nước 1.2 Ứng dụng trí tuệ nhân tạo dự báo chất lượng khơng khí 1.3 Phương pháp tiền xử lý liệu cho mơ hình dự báo thống... đích nghiên cứu - Ứng dụng kỹ thuật trí tuệ nhân tạo để giải toán bổ khuyết liệu quan trắc chất lượng khơng khí bị trống - Nghiên cứu thử nghiệm mơ hình dự báo thống kê chất lượng khơng khí ứng dụng. .. tài ? ?Nghiên cứu ứng dụng trí tuệ nhân tạo dự báo chất lượng khơng khí? ?? lựa chọn nhằm khởi động thúc đẩy hướng nghiên cứu Việt Nam, góp phần vào cơng tác quản lý bảo vệ mơi trường khơng khí nước

Định dạng
Số trang	24
Dung lượng	1,18 MB