1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Khoa học máy tính: Xây dựng mô hình dự báo chất lượng không khí

66 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA

KHOA KHOA HỌC & KỸ THUẬT MÁY TÍNH

LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC

XÂY DỰNG MÔ HÌNH

DỰ BÁO CHẤT LƯỢNG KHÔNG KHÍ Ngành: KHOA HỌC MÁY TÍNH

HỘI ĐỒNG : KHOA HỌC MÁY TÍNH 2

-o0o -

TP HỒ CHÍ MINH, THÁNG 02/2022

Trang 5

LỜI CAM ĐOAN

Em xin cam đoan đây là công trình nghiên cứu dưới sự hướng dẫn của cô Lê Thanh Vân Các số liệu được sử dụng cho phân tích, nhận xét được thu thập từ nhiều nguồn khác nhau và được ghi rõ tại phần tài liệu tham khảo Kết quả nghiên cứu được trình bày trong luận văn là do chính em thực hiện và hoàn toàn trung thực

Nếu phát hiện có bất kỳ sự gian lận nào, em xin hoàn toàn chịu trách nhiệm về nội dung luận văn trước Ban chủ nhiệm Khoa và Ban giám hiệu nhà trường

TP Hồ Chí Minh, tháng 02 năm 2022 Sinh viên thực hiện

Nguyễn Hữu Nghĩa

Trang 6

LỜI CẢM ƠN

Em xin gửi lời cảm ơn chân thành đến cô Lê Thanh Vân, khoa Khoa học và Kỹ thuật máy tính – Trường Đại học Bách Khoa thành phố Hồ Chí Minh Cô đã trực tiếp chỉ bảo và hướng dẫn em trong suốt quá trình thực hiện luận văn Sự giúp đỡ tận tình của cô là động lực to lớn để em hoàn thiện đề tài này

Em xin cảm ơn đến các thầy, cô công tác tại Khoa Khoa Học và Kỹ Thuật Máy Tính – Trường Đại học Bách Khoa thành phố Hồ Chí Minh, những người đã hết lòng truyền đạt kiến thức, kỹ năng quý báu trong suốt thời gian vừa qua Đó là những kiến thức nền tảng vô cùng quan trọng, không chỉ trong quá trình thực hiện luận văn mà còn là hành trang không thể thiếu để tiếp tục sự nghiệp sau này

TP Hồ Chí Minh, tháng 02 năm 2022 Sinh viên thực hiện

Nguyễn Hữu Nghĩa

Trang 7

TÓM TẮT ĐỀ TÀI

Ô nhiễm môi trường luôn là vấn đề đáng quan tâm đến sức khỏe con người Quá trình phát triển đô thị và công nghiệp hóa ở các quốc gia đều kéo theo các vấn đề về ô nhiễm môi trường, trong đó có ô nhiễm không khí Các phương tiện giao thông cơ giới sử dụng nhiên liệu hóa thạch như xăng, dầu diesel sản sinh nhiều loại khí thải SO2, NO2, CO, PM10/PM2.5 trong quá trình đốt nhiên liệu Các chất ô nhiễm trong không khí có thể xâm nhập sâu vào phổi, hệ thống tim mạch và gây ra nhiều căn bệnh từ nhẹ như ho, kích ứng hô hấp đến những căn bệnh thậm chí rất nặng như đột quỵ, ung thư phổi

Tại Việt Nam, việc tiếp cận các chỉ số đánh giá chất lượng không khí còn nhiều hạn chế nên việc sử dụng các dữ liệu hiện có để đánh giá tác động đến sức khỏe trong tương lai gần luôn là cần thiết Trong khuôn khổ luận văn này, nhiều phương pháp đánh giá chất lượng môi trường khác nhau được đề cập đến Mặc khác các dữ liệu thực tế cũng được truy vấn, đánh giá và sử dụng để hiện thực một số mô hình đánh giá chất lượng không khí ở mức độ đánh giá ảnh hưởng đến sức khỏe của con người

Các mô hình khác nhau được khảo sát trong luận văn bao gồm: các mô hình dự báo truyền thống (Tự hồi quy, ARIMA, Holt-Winters) và các mô hình mạng nhân tạo (mạng nơ ron ANN, mạng nơ ron RNN, mạng nơ ron LSTM) Kết quả thử nghiệm của luận văn cho thấy các mô hình nơ ron nhân tạo có khả năng dự báo chỉ số chất lượng không khí với sai lệch thấp và tốt hơn nhiều so với các mô hình dự báo truyền thống Ngoài ra, các mô hình mạng nhân tạo trong luận văn cũng có thể được cải tiến để sử dụng nhiều bộ dữ liệu khác nhau cho phù hợp với thực tiễn Kết quả có thể được áp dụng để cải tiến các mô hình dự báo chất lượng không khí

Từ khóa: Dự báo chất lượng không khí, Air Quality Index, Học máy, Mô hình

mạng nơ ron nhân tạo

Trang 8

1.2 Mục tiêu, đối tượng và phạm vi nghiên cứu 11

1.2.1 Mục tiêu nghiên cứu 11

1.2.2 Đối tượng và phạm vi nghiên cứu 11

1.3 Ý nghĩa thực tiễn của đề tài 11

1.4 Cấu trúc luận văn 12

CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT 13

2.1 Các chỉ tiêu chất lượng không khí và phương thức tính 13

2.1.1 Các chỉ tiêu chất lượng không khí 13

2.1.2 Tiêu chí đánh giá chất lượng không khí 15

2.2 Chuỗi thời gian và một số tính chất của chuỗi thời gian 19

2.2.1 Khái niệm 19

2.2.2 Tính chất của chuỗi thời gian 19

2.2.3 Chuỗi dừng 20

2.2.4 Tự tương quan và tự tương quan bán phần 20

2.2.5 Nhiễu trắng và bước ngẫu nhiên 20

2.3 Đánh giá chất lượng không khí bằng phương pháp thống kê 21

2.3.1 Mô hình tự hồi quy 21

2.3.2 Mô hình ARIMA 21

2.3.3 Mô hình làm mượt lũy thừa 22

2.4 Đánh giá chất lượng không khí bằng học máy 24

2.4.1 Mạng nơ ron nhân tạo (Artificial Neural Network - ANN): 24

2.4.2 Mạng nơ ron hồi quy (Recurrent Neural Network - RNN) 26

2.4.3 Mạng nơ ron LSTM (Long Short Term Memory) 26

2.4.4 Một số hàm tối ưu trong học máy 27

Trang 9

2.5 Các công trình liên quan 29

CHƯƠNG 3 – MÔ HÌNH DỰ BÁO CHẤT LƯỢNG KHÔNG KHÍ 34

3.6.4 Mô hình Mạng nhân tạo 41

3.7 Xây dựng thí nghiệm và đánh giá mô hình 42

3.7.1 Xây dựng thí nghiệm 42

3.7.2 Đánh giá mô hình 43

3.8 Tối ưu và mở rộng mô hình 43

3.8.1 Xác định các thông số tối ưu 43

3.8.2 Mở rộng mô hình với tập đầu vào là dữ liệu thô 44

3.8.3 Mở rộng mô hình với tập đầu vào là dữ liệu trạm lân cận 45

CHƯƠNG 4 – KẾT QUẢ VÀ THẢO LUẬN 46

4.3 Xác định các thông số tối ưu 51

4.4 Mở rộng với tập đầu vào là dữ liệu thô 52

4.5 Mở rộng với tập đầu vào là dữ liệu trạm lân cận 54

4.6 Thảo luận chung 55

CHƯƠNG 5 - TỔNG KẾT 57

Trang 10

5.1 Đánh giá kết quả đạt được 57

5.2 Hướng phát triển tương lai 58

TÀI LIỆU THAM KHẢO 59

PHỤ LỤC 61

Trang 11

DANH MỤC CÁC BẢNG

Bảng 2.1 Giá trị giới hạn các thông số cơ bản trong không khí (μg/m3) 13

Bảng 2.2 Khoảng giá trị VN_AQI và đánh giá chất lượng không khí 15

Bảng 2.3 Các mức VN_AQI tương ứng ảnh hưởng đến sức khỏe và khuyến nghị 15Bảng 2.4 Các giá trị BPi và Ii của các chất ô nhiễm không khí 17

Bảng 2.5 Một số hàm kích hoạt phi tuyến thường dùng 24

Bảng 3.1 Các tham số cho mô hình mạng nhân tạo 41

Bảng 3.2 Các tham số mô hình trong thí nghiệm tối ưu 44

Bảng 3.3 Ma trận khoảng cách của các trạm trong đề tài 45

Bảng 4.1 Thống kê các chỉ số tại trạm s1090 46

Bảng 4.2 Sai số dự báo trung bình các mô hình - Thí nghiệm 1 48

Bảng 4.3 Sai số dự báo trung bình các mô hình - Thí nghiệm 2 50

Bảng 4.4 Sai số dự báo trung bình các mô hình - Thí nghiệm 3 51

Bảng 4.5 Sai số dự báo trung bình các mô hình sử dụng đầu vào là dữ liệu thô 52

Bảng 4.6 Sai số dự báo trung bình khi dùng dữ liệu trạm lân cận 54

Trang 12

DANH MỤC CÁC HÌNH ẢNH

Hình 1.1 Phân bố dân cư tiếp xúc với PM2.5 khu vực miền Bắc Việt Nam (2015) 10

Hình 2.1 Mô hình tự hồi quy 21

Hình 2.2 Mô hình ARIMA 22

Hình 2.3 Mạng nơ ron truyền thẳng nhiều lớp 25

Hình 2.4 Mạng RNN và mạng LSTM một lớp 26

Hình 2.5 Các phương pháp đánh giá chất lượng không khí 29

Hình 2.6 Phân bố không gian nồng độ chất ô nhiễmxây dựng từ mô hình WRF 31

Hình 2.7 Tần suất các mạng nơ ron sử dụng trong dự báo chất lượng không khí 33

Hình 3.1 Lược đồ nghiên cứu 34

Hình 3.2 Các trạm quan trắc trong hệ thống AirNet 35

Hình 3.3 Truy vấn thu thập dữ liệu với socket server 36

Hình 3.4 Biểu đồ của nhiễu trắng 37

Hình 3.5 Minh họa quá trình tạo tập huấn luyện cho mạng nhân tạo 38

Hình 3.6 Kỹ thuật tính toán sử dụng cửa sổ trượt 40

Hình 3.7 Quá trình tái sử dụng mô hình ARIMA trong thực nghiệm 41

Hình 4.1 Biểu đồ chỉ số chất lượng không khí tại trạm s1090 47

Hình 4.2 Các biểu đồ kiểm tra nhiễu trắng và bước ngẫu nhiên giá trị main AQI 47Hình 4.3 Biểu đồ phân rã chu kỳ của giá trị main AQI 48

Hình 4.4 Biểu đồ dự báo giá trị main AQI của các mô hình – Thí nghiệm 1 49

Hình 4.5 Biểu đồ so sánh các chỉ số đo sai lệch ở các kiến trúc khác nhau 52

Hình 4.6 Biểu đồ dự báo giá trị main AQI của các mô hình – Thí nghiệm 5 53

Hình 4.7 Biểu đồ giá trị main AQI của 4 trạm quan sát 54

Hình 4.8 Biểu đồ dự báo giá trị main AQI dùng dữ liệu trạm s1046 55

Trang 13

CHƯƠNG 1 - GIỚI THIỆU ĐỀ TÀI

1.1 Đặt vấn đề

Ô nhiễm không khí hiện nay không chỉ là vấn đề của một quốc gia riêng lẻ mà là vấn đề đáng báo động toàn cầu Dữ liệu của Tổ chức Y tế thế giới (WHO – World Health Organization) cho thấy cứ mỗi 10 người thì có 9 người đang hít phải không khí bị ô nhiễm nặng Theo ước tính, mỗi năm ô nhiễm không khí lấy đi tính mạng của gần bảy triệu người Các chất ô nhiễm trong không khí có thể xâm nhập sâu vào phổi, hệ thống tim mạch và gây ra nhiều căn bệnh từ nhẹ như ho, kích ứng hô hấp đến những căn bệnh thậm chí rất nặng như đột quỵ, ung thư phổi [1]

Quá trình phát triển đô thị và công nghiệp hóa ở các quốc gia đều kéo theo các vấn đề về ô nhiễm môi trường, trong đó có ô nhiễm không khí Theo kết quả báo cáo năm 2019 của Cơ quan năng lượng quốc tế (IEA - International Energy Agency), lượng khí CO2 phát thải từ các hoạt động sản xuất công nghiệp và hoạt động giao thông vận tải chiếm lần lượt 39.3% và 27.0% tổng lượng khí CO2 phát thải toàn cầu [2] Các phương tiện giao thông cơ giới sử dụng nhiên liệu hóa thạch như xăng, dầu diesel sản sinh nhiều loại khí thải SO2, NO2, CO, PM10/PM2.5 trong quá trình đốt nhiên liệu, thậm chí rò rỉ nhiên liệu trong khi vận hành gây phát sinh Benzen, Toluen và các hợp chất dễ bay hơi khác như ethylbenzene, xylenes [3]

Tại Việt Nam, ô nhiễm không khí tại các đô thị lớn ngày càng gia tăng do chịu nhiều ảnh hưởng từ các hoạt động giao thông vận tải cũng như các hoạt động phát triển kinh tế xã hội Khí thải từ các phương tiện giao thông đường bộ như xe ô tô và xe gắn máy luôn chiếm tỷ trọng lớn trong tổng lượng khí thải gây ô nhiễm Tính đến đầu năm 2020, toàn quốc có khoảng 45 triệu xe máy và gần 4 triệu xe ô tô đang lưu hành Trong đó, Hà Nội có 6 triệu xe máy, thành phố Hồ Chí Minh có 8 triệu xe máy [4] Trong số các phương tiện giao thông đang lưu hành, nhiều phương tiện đã cũ, quá hạn sử dụng và không được bảo dưỡng định kỳ nên hiệu suất đốt cháy nhiên liệu thấp gây phát thải các chất ô nhiễm không khí ngày càng nhiều Trong khoảng thời gian thực hiện cách ly xã hội để phòng dịch bệnh COVID-19, giá trị các thông số PM2.5 và CO giảm rõ rệt so với khoảng thời gian cùng kỳ các năm trước càng cho thấy sự ảnh hưởng của các nguồn phát thải từ giao thông có ảnh hưởng lớn đến chất lượng chung của khu vực [4]

Theo thống kê của Bộ Tài nguyên và Môi trường Việt Nam, giai đoạn từ năm 2018 đến năm 2019 nhìn chung có nồng độ bụi PM2.5 cao hơn so với giai đoạn từ 2010-2017 Chỉ số chất lượng không khí tại hai thành phố lớn nhất cả nước là Hà Nội và Thành phố Hồ Chí Minh có nhiều địa điểm nằm ở mức xấu, với chỉ số AQI nằm trong khoảng 150-200, thậm chí đôi lúc cao hơn 200 (mức rất xấu) [4] Các hạt bụi mịn kích thước nhỏ như

Trang 14

PM2.5 lơ lửng trong không khí nếu thẩm thấu vào đường hô hấp sẽ gây ảnh hưởng xấu đến sức khỏe con người [5]

Trong một nghiên cứu kết hợp giữa Viện Phân tích Hệ thống Ứng dụng Quốc tế (Cộng hòa Áo) và Viện Hàn lâm Khoa học và Công nghệ (Việt Nam) về quản lý chất lượng không khí tại miền Bắc Việt Nam (năm 2015) cho thấy: giao thông đường bộ là nguồn phát thải PM2.5 lớn tại khu vực Hà Nội khi đóng góp đến gần 25% lượng khí ô nhiễm Nồng độ PM2.5 cao nhất (lên đến 55 μg/m3) tập trung tại khu vực đô thị Hà Nội và giảm dần ở các khu vực lân cận Nghiên cứu trên cũng cho thấy có đến 20 triệu người tiếp xúc với nồng độ PM2.5 cao hơn tiêu chuẩn ban hành, đặc biệt là ở thành phố Hà Nội, tỉnh Bắc Ninh và tỉnh Hưng Yên (Hình 1.1) [6]

Hình 1.1 Phân bố dân cư tiếp xúc với PM2.5 khu vực miền Bắc Việt Nam (2015)

Trước thực trạng chất lượng không khí luôn ở ngưỡng đáng lo ngại, nhu cầu thông tin về chỉ tiêu chất lượng không khí luôn là vấn đề đáng quan tâm với người dân, đặc biệt với những người có thể trạng yếu Nắm bắt được thông tin chất lượng không khí sẽ giúp chủ động hơn cho các hoạt động ngoài trời và các sinh hoạt nói chung khác Các nguồn thông tin chất lượng không khí hiện nay đang ở mức ghi nhận kết quả hiện tại Để giúp chủ động hơn nữa trong việc lên kế hoạch cho các hoạt động và sinh hoạt hằng ngày, thông tin dự báo chất lượng không khí cho tương lai là rất cần thiết

Trước nhu cầu cấp thiết như trên, đề tài “Xây dựng mô hình dự báo chất lượng không khí” được tiến hành, với mục đích bước đầu xây dựng mô hình đánh giá chất

lượng không khí ở mức chấp nhận được, tiến tới xây dựng hệ thống dự báo thông tin chất lượng không khí hoàn chỉnh trong tương lai

Trang 15

1.2 Mục tiêu, đối tượng và phạm vi nghiên cứu 1.2.1 Mục tiêu nghiên cứu

Mục tiêu nghiên cứu của đề tài là tìm hiểu về bài toán dự báo chất lượng không khí, xây dựng và đánh giá khả năng dự báo chất lượng không khí sử dụng các mô hình toán học truyền thống cũng như các mô hình dự báo sử dụng mạng nơ ron nhân tạo Từ đó chọn lựa mô hình phù hợp để dự báo chất lượng không khí trong tương lai gần Ngoài ra, nghiên cứu cũng thực hiện cải tiến mô hình hiện có để có thể sử dụng nhiều loại dữ liệu đầu vào khác nhau phục vụ cho nhu cầu dự báo chất lượng không khí

Để đạt được mục tiêu trên, luận văn thu thập dữ liệu từ nguồn thông tin khách quan, tiến hành các bước làm sạch dữ liệu (loại bỏ dữ liệu dư thừa, xử lý dữ liệu thiếu ) và thực hiện các kiểm định cần thiết Các mô hình dự đoán khác nhau được tìm hiểu và đề xuất bao gồm mô hình tự hồi quy, ARIMA, Holt-Winters cùng nhiều mô hình học máy khác nhau (mạng nhân tạo nhiều lớp ANN, mạng hồi quy RNN và mạng LSTM) Từ đó đề xuất mô hình phù hợp nhất trong dự báo chất lượng không khí

1.2.2 Đối tượng và phạm vi nghiên cứu

Chỉ số AQI chính theo giờ (main AQI) là đối tượng được tập trung khảo sát trong luận văn này Đây là chỉ số cơ bản và chủ yếu của toàn bộ các đánh giá chất lượng không khí tại Việt Nam và tại nhiều quốc gia khác Chỉ số này có cách tính toán khác biệt tùy thuộc vào quy chuẩn của từng quốc gia, nên để phù hợp với thực tiễn đề tài, toàn bộ các chỉ số AQI xem xét trong luận văn đều sử dụng chung theo quy chuẩn của Việt Nam (theo quyết định 1459/QĐ-TCMT)

Nghiên cứu được thực hiện với tập dữ liệu đầu vào thu thập tại các trạm quan trắc có phân bố vị trí địa lý tại khu vực Hà Nội, trong khoảng thời gian khảo sát từ ngày 19/11/2021 đến ngày 19/12/2021 Đây là một trong hai thành phố có mật độ dân số cao nhất cả nước với lưu lượng xe cộ dày đặc, thích hợp cho việc đánh giá các mô hình chất lượng không khí thuộc khu vực đô thị

1.3 Ý nghĩa thực tiễn của đề tài

Trong quá trình thực hiện nghiên cứu, đề tài sẽ thu thập và tổng hợp một bộ dữ liệu về nồng độ chất gây ô nhiễm tại địa phương Đây là nguồn tham khảo hữu ích cho các nghiên cứu sau này trong lĩnh vực môi trường cũng như các đề tài xây dựng mô hình toán học khác

Trang 16

Với nguồn dữ liệu đầu vào thu thập từ thực tiễn và đáng tin cậy, các mô hình có được từ đề tài sẽ cho kết quả khách quan và góp phần hỗ trợ cho các công tác quản lý môi trường tại khu vực nghiên cứu, cung cấp phương pháp tính toán chỉ số chất lượng không khí có độ chính xác tốt, góp phần hỗ trợ việc đánh giá chất lượng không khí cho hiện tại và tương lai gần

Góp phần cung cấp thêm thông tin về hiện trạng chất lượng không khí tại Việt Nam, phục vụ cho các nhà quản lý đưa ra các định hướng hạn chế tác động của ô nhiễm không khí đến sức khỏe con người

1.4 Cấu trúc luận văn

Cấu trúc luận văn được chia thành 5 chương, bao gồm:

1 Giới thiệu tổng quan về đề tài, mục tiêu và phạm vi nghiên cứu 2 Cơ sở lý luận

3 Lược đồ nghiên cứu, phương pháp thực hiện và xây dựng mô hình 4 Kết quả, nhận xét kết quả trên tập huấn luyện – tập kiểm tra và kết luận 5 Đánh giá kết quả đạt được và hướng phát triển tương lai

Trang 17

CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT

2.1 Các chỉ tiêu chất lượng không khí và phương thức tính 2.1.1 Các chỉ tiêu chất lượng không khí

Tại Việt Nam, căn cứ vào quy chuẩn quốc gia hiện đang có hiệu lực (QCVN 05:2013/BTNMT) [7], các thông số được quy định để đánh giá chất lượng không khí xung quanh bao gồm:

 Sulfur dioxide (SO2),

 Carbon monoxide (CO),

 Nitrogen dioxide (NO2),

 Chì (Pb) – Không dùng để tính AQI trong 1459/QĐ-TCMT

Bảng 2.1 Giá trị giới hạn các thông số cơ bản trong không khí (μg/m3) STT Thông số Trung

bình 1 giờ

Trung bình 8 giờ

Trung bình 24 giờ

Trung bình năm

Dấu (-): Không quy định

Trung bình x giờ: giá trị trung bình của các giá trị đo được trong khoảng thời gian x giờ liên tục

2.1.1.1 Sulfur Dioxide (SO2)

Sulfur dioxide là một loại khí độc hại phát sinh chủ yếu do tiêu thụ nhiên liệu hóa thạch hoặc bởi các hoạt động công nghiệp Bệnh nhân với các vấn đề về phổi, người già và trẻ nhỏ có nguy cơ bị tổn thương cao hơn khi tiếp xúc với loại khí này Các tác hại về

Trang 18

sức khỏe khi tiếp xúc có thể kể đến bao gồm viêm phổi , gây kích ứng đường hô hấp, tăng tiết dịch nhầy, co thắt phế quản Ngoài ra các trường hợp bỏng rát da, tổn thương mắt cũng được ghi nhận [8] Các hiện tượng thiên nhiên bất lợi như mưa axit, giảm độ pH của đất cũng có mối liên hệ với loại khí này [9]

2.1.1.2 Carbon Monoxide (CO)

Carbon monoxide là loại khí không màu, không vị phát sinh do sự đốt cháy không hoàn toàn các nhiên liệu hóa thạch Các triệu chứng khi bị nhiễm độc do hít phải carbon monoxide thường gặp là đau đầu, chóng mặt, buồn nôn và nặng hơn là mất ý thức, hôn mê Ái lực của hemoglobin trong máu với carbon monoxide cao hơn so với ái lực với oxygen, dẫn đến việc thiếu oxygen trong máu Tình trạng nhiễm độc có thể diễn tiến nặng khi tiếp xúc với khí này ở nồng độ cao trong thời gian dài [10] Carbon monoxide cũng là loại khí góp phần gây hiệu ứng nhà kính, hiện tượng nóng lên của trái đất và biến đổi khí hậu [9]

2.1.1.3 Nitrogen Oxide (NO2)

Nitrogen oxide là loại khí phát sinh do việc đốt cháy các nhiên liệu hóa thạch và thường có mối liên hệ với các hoạt động giao thông [11] Chúng gây kích ứng đường hô hấp, ho, khó thở và đau rát mắt Nitrogen oxide cũng gây ảnh hưởng đến khứu giác và thậm chí gây các bệnh lý cấp tính ở phổi nếu tiếp xúc ở thời gian dài Năng suất và sản lượng cây trồng cũng được ghi nhận giảm sút khi nitrogen oxide hiện diện ở nồng độ cao trong không khí [8]

2.1.1.4 Ozone (O3)

Khí ozone được tạo thành từ các khí oxygen dưới xúc tác của sự phóng điện trong bầu khí quyển trái đất Nó là một chất oxy hóa cực mạnh và do đó có khả năng kích thích quá trình oxy hóa gây tổn thương tế bào Tiếp xúc với khí ozone có thể gây khó thở, viêm đường hô hấp, làm tình trạng của bệnh nhân hen suyễn thêm trầm trọng Vì ozone ít tan trong nước nên chúng có thể đi sâu vào trong phổi và gây hại cho sức khỏe Khí ozone cũng là một trong những khí gây hiệu ứng nhà kính và góp phần vào sự ấm lên toàn cầu của trái đất [12]

2.1.1.5 Bụi lơ lửng (PM)

Bụi lơ lửng là hỗn hợp các hạt lỏng hoặc rắn có kích thước nhỏ có nguồn phát sinh tự nhiên (cháy rừng, núi lửa, ) hoặc các hoạt động của con người (tiêu thụ nguyên liệu hóa thạch, các hoạt động công nghiệp và nông nghiệp ) Chúng cũng có thể hình thành do các phản ứng hóa học của các chất ô nhiễm dạng khí Một số loại bụi lơ lửng có thể kể đến như: khói nhà máy, khói thuốc, bụi xi măng, bụi đường, vi khuẩn, bào tử nấm mốc, Các hạt có đường kính 10 μm hoặc nhỏ hơn được gọi là PM10, trong khi các hạt có đường kính 5 μm hoặc nhỏ hơn được gọi là PM5 Các hạt bụi lơ lửng có kích thước càng nhỏ

Trang 19

càng dễ đi sâu vào đường hô hấp thậm chí hệ tuần hoàn và gây các ảnh hưởng lâu dài đến sức khỏe [5]

2.1.1.6 Chì (Pb)

Chì là một loại kim loại nặng có sẵn trong tự nhiên Chúng được sử dụng trong pin, xăng động cơ, mỹ phẩm hay trong nhiều vật dụng khác như bột màu, sơn, men gốm Nguồn gây ô nhiễm chì trong không khí chủ yếu đến từ sử dụng các nhiên liệu đốt cháy có pha chì Phơi nhiễm với chì có thể xảy ra do hít, nuốt phải hoặc hấp thu qua da, với trẻ em là đối tượng rất dễ bị tổn thương sức khỏe bởi chất này Ngộ độc chì gây ảnh hưởng đến hệ thần kinh, giảm thông minh, trí nhớ giảm sút, thậm chí gây hôn mê, co giật [13]

2.1.2 Tiêu chí đánh giá chất lượng không khí

Chỉ số chất lượng không khí Việt Nam (VN_AQI – Vietnam Air quality index) là chỉ số được tính toán từ các thông số quan trắc các chất ô nhiễm trong không khí ở Việt Nam Chúng cho biết tình trạng chất lượng không khí, mức độ ảnh hưởng đến sức khỏe con người và được tính theo thang điểm tương ứng dựa theo Quyết định 1459 của Tổng cục môi trường Việt Nam [14] Chỉ số VN_AQI được biểu diễn với các màu sắc để cảnh

báo chất lượng không khí như trình bày ở Bảng 1.2 Mức độ ảnh hưởng tới sức khỏe con người và các khuyến nghị tương ứng được trình bày ở Bảng 1.3

Bảng 2.2 Khoảng giá trị VN_AQI và đánh giá chất lượng không khí

Khoảng giá trị AQI Chất lượng không khí Màu sắc Mã màu RBG

Bảng 2.3 Các mức VN_AQI tương ứng ảnh hưởng đến sức khỏe và khuyến nghị Khoảng

51– 100

- Chất lượng không khí chấp nhận được

- Tự do thực hiện hoạt động ngoài trời

- Chịu tác động nhất định - Có thể hoạt động ngoài trời nhưng nên theo dõi các triệu chứng ho, khó thở

Trang 20

- Bắt đầu có ảnh hưởng đến sức khỏe - Nên giảm các hoạt động mạnh khi ở ngoài trời

- Gặp phải vấn đề về sức khỏe nghiêm trọng hơn

- Nên ở trong nhà và giảm hoạt động mạnh

201 – 300

- Ảnh hưởng đến sức khỏe nghiêm trọng hơn

-Hạn chế tối đa các hoạt động ngoài trời

- Ảnh hưởng đến sức khỏe nghiêm trọng hơn

- Nên ở trong nhà và giảm hoạt động mạnh

301 - 500

- Cảnh báo khẩn cấp, ảnh hưởng sức khỏe nghiêm trọng

- Nên ở trong nhà, đóng cửa ra vào và cửa sổ

- Cảnh báo khẩn cấp, ảnh hưởng sức khỏe nghiêm trọng

- Nên ở trong nhà, đóng cửa ra vào và cửa sổ

2.1.2.1 Giá trị - với thông số PM2,5 và PM10

AQIh là giá trị AQI đại diện cho chất lượng không khí trong 1 giờ Giá trị Nowcast là giá trị trung bình có trọng số được tính toán từ 12 giá trị trung bình 1 giờ gần nhất so với thời điểm tính toán, dùng cho thông số PM2,5 và PM10

Gọi ci là giá trị quan trắc trung bình một giờ tại thời điểm cách i-1 giờ so với hiện tại, và

Ta tính giá trị trọng số:

( ) Với thì

Với thì ∑

Nếu chỉ có một trong ba giá trị (c1, c2, c3) có dữ liệu thì xem như không có dữ liệu

và không tính được giá trị Nowcast Nếu ci không có giá trị thì lấy wi-1 = 0

2.1.2.2 Giá trị – với thông số quan trắc khác

Với các thông số SO2, CO, NO2, O3 thì được tính như sau:

Với các thông số PM2,5, PM10 thì được tính như sau:

Trang 21

: Giá trị AQI đại diện cho chất lượng không khí của thông số x trong 1 giờ

BPi : Nồng độ giới hạn dưới của giá trị thông số quan trắc được quy định tại Bảng 2.4 tương ứng với mức i

BPi+1 : Nồng độ giới hạn trên của giá trị thông số quan trắc được quy định tại Bảng 2.4 tương ứng với mức i+1

Ii : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPiIi+1 : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPi+1Cx : Giá trị quan trắc trung bình 1 giờ của thông số x

Nowcastx : Giá trị Nowcast

Bảng 2.4 Các giá trị BPi và Ii của các chất ô nhiễm không khí i Ii

Giá trị BPi quy định đối với từng thông số (μg/m3) O3(1h) O3(8h) CO SO2NO2PM10PM2,5

2.1.2.3 Giá trị ngày a) Một số khái niệm:

AQId là giá trị AQI đại diện cho chất lượng không khí trong 1 ngày Giá trị AQI lớn nhất của các thông số được sử dụng làm giá trị AQI ngày tổng hợp Giá trị AQI ngày được tính toán dựa trên các giá trị như sau:

 Thông số PM2.5 và PM10: giá trị trung bình 24 giờ

Trang 22

 Thông số SO2, NO2 và CO: giá trị trung bình 1 giờ lớn nhất trong ngày

 Thông số O3: giá trị trung bình 1 giờ lớn nhất trong ngày và giá trị trung bình 8 giờ lớn nhất trong ngày

b) Tính giá trị (giá trị AQI theo ngày cho từng thông số quan trắc):

Với các thông số SO2, CO, NO2, O3, PM10, PM2,5 thì được tính như sau:

: Giá trị AQI đại diện cho chất lượng không khí của thông số x theo ngày BPi : Nồng độ giới hạn dưới của giá trị thông số quan trắc được quy định tại

Bảng 2.4 tương ứng với mức i

BPi+1 : Nồng độ giới hạn trên của giá trị thông số quan trắc được quy định tại

Bảng 2.4 tương ứng với mức i+1

Ii : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPiIi+1 : Giá trị AQI ở mức i đã cho trong bảng tương ứng với giá trị BPi+1Cx : Được quy định theo từng loại thông số quan trắc như sau:

PM2.5, PM10 : Cx là giá trị trung bình 24 giờ,

SO2, NO2, CO : Cx là giá trị trung bình 1 giờ lớn nhất trong ngày

O3 : Cx là giá trị lớn nhất trong giá trị trung bình 1 giờ lớn nhất trong ngày và giá trị trung bình 8 giờ lớn nhất trong ngày

Trang 23

Ghi chú: Không tính toán AQI thông số O3 khi giá trị trung bình 8 giờ lớn nhất trong ngày cao hơn 400 µg/m3 (lúc này chỉ tính toán AQI đối với trung bình 1 giờ lớn nhất trong ngày)

2.2 Chuỗi thời gian và một số tính chất của chuỗi thời gian 2.2.1 Khái niệm

Chuỗi thời gian là chuỗi các điểm dữ liệu được đo theo từng khoảng thời gian liền nhau và có khoảng cách điều nhau giữa những quan sát liên tiếp Nhiều dữ liệu là dạng chuỗi thời gian thường bắt gặp trong cuộc sống như giá chứng khoán hàng ngày, tiền điện phải trả hàng tháng, mực nước thủy triều theo phút, giá trị chỉ số chất lượng không khí theo giờ

Chuỗi thời gian có ưu điểm lớn khi có thể lưu trữ được giá trị của các quan sát theo thời gian Thế giới xung quanh luôn vận động, các sự vật, hiện tượng thường không ở trạng thái tĩnh mà thường xuyên thay đổi theo thời gian, vì vậy dữ liệu chuỗi thời gian có thể được áp dụng trong rất nhiều lĩnh vực Một số lĩnh vực dùng chuỗi thời gian để lưu trữ và xử lý có thể kể đến như: lĩnh vực thống kê, kinh tế lượng, dự báo động đất, dự báo tài chính, kỹ thuật điều khiển, kỹ thuật truyền thông, xử lý tín hiệu Chính vì vậy, phân tích và tìm hiểu được các đặc tính của dữ liệu chuỗi thời gian đóng một vai trò rất quan trọng trong cuộc sống

2.2.2 Tính chất của chuỗi thời gian

Giống như nhiều loại dữ liệu khác, dữ liệu chuỗi thời gian cũng có những tính chất đặc trưng riêng biệt Một số khái niệm liên quan đến chuỗi thời gian có thể kể đến được liệt kê lần lượt bên dưới

- Lag: lag-n của chuỗi thời gian là chuỗi thời gian quá khứ cách thời điểm đang xét

n đơn vị thời gian hay nói cách khác, lag-n thu được bằng cách dịch chuyển n đơn vị thời gian về quá khứ

- Tính xu hướng: là yếu tố thể hiện xu hướng thay đổi của dữ liệu theo thời gian,

đó có thể là xu hướng tăng dần hay giảm dần Xu hướng của chuỗi dữ liệu có thể là tuyến tính hay phi tuyến Đây là đặc điểm thường thấy trong rất nhiều dữ liệu chuỗi thời gian Tính xu hướng ảnh hưởng đáng kể tới việc đưa ra nhận định về mối quan hệ tương quan giữa các chuỗi số Do đó khi xây dựng các mô hình chuỗi thời gian chúng ta cần xem xét yếu tố xu hướng ở các giá trị để có được các dự báo hợp lý

- Tính chu kỳ: là quy luật có tính chất lặp lại của dữ liệu theo thời gian Giá trị chu

kỳ luôn là một giá trị cố định Sự thay đổi của nhiệt độ theo giờ trong ngày, sự thay đổi của mực nước thủy triều theo ngày trong tháng là các ví dụ cho tính chu kỳ của chuỗi dữ liệu Việc tìm ra được tính chu kỳ trong là một công việc quan trọng và cho phép dự báo các giá trị tương lai chính xác hơn

Trang 24

2.2.3 Chuỗi dừng

Một chuỗi thời gian dừng là chuỗi thời gian có trung bình và phương sai của nó không đổi qua thời gian, giá trị hiệp phương sai (covariance) giữa hai giai đoạn chỉ phụ thuộc vào khoảng cách giữa hai giai đoạn ấy chứ không phụ thuộc vào thời gian thực sự tại đó hiệp phương sai được tính

Do vậy, chuỗi thời gian dừng không bao gồm các yếu tố xu thế và có các giá trị xoay quanh giá trị trung bình của chuỗi Có 2 cách để kiểm tra tính dừng của chuỗi là lấy sai phân (bậc 1 hoặc bậc 2) hoặc kiểm định nghiệm đơn vị (unit root test) Việc xác định chuỗi đang xét có là chuỗi dừng hay không khá quan trọng Phân tích với dữ liệu là chuỗi dừng giúp khái quát hóa kết quả phân tích cho các giai đoạn khác

Chuỗi thời gian không dừng là chuỗi dữ liệu thời gian vi phạm một hoặc một số các nguyên tắc trên Trong thực tế, có rất nhiều chuỗi thời gian là chuỗi không dừng Để chuyển đổi chuỗi không dừng thành chuỗi dừng, ta có thể lấy sai phân một hoặc nhiều lần giá trị chuỗi thời gian gốc

2.2.4 Tự tương quan và tự tương quan bán phần

Tự tương quan là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian (trong các số liệu chuỗi thời gian) hoặc không gian (trong số liệu chéo) Hay nói cách khác, sự tự tương quan xảy ra khi giá trị tại thời điểm yt có sự tương quan với giá trị tại các lag trước đó của chính nó

yt ~ ylag

2.2.5 Nhiễu trắng và bước ngẫu nhiên

Một chuỗi thời gian Y được gọi là nhiễu trắng nếu nó thỏa mãn: trung bình bằng 0, các giá trị với các độ trễ khác nhau không có hiện tượng tự tương quan và có sai số phương sai không đổi Do trung bình và phương sai không đổi nên chúng ta gọi phân phối của nhiễu trắng là phân phối xác định và có dạng:

Y ~ N(0, σ2)

Trang 25

Nhiễu trắng là một thành phần ngẫu nhiên thể hiện cho yếu tố không thể dự báo của mô hình do nó không có tính quy luật

Bước ngẫu nhiên là chuỗi thời gian có giá trị phía sau bằng chính giá trị phía trước cộng với nhiễu trắng hay nói cách khác, chuỗi bước ngẫu nhiên là chuỗi thỏa mãn công thức:

Mô hình tự hồi quy AR(p) (autoregressive): là một mô hình dự báo giá trị bằng

cách hồi quy trên chính số liệu ở những chu kỳ trước Mô hình được biểu diễn qua công thức:

Trong đó:

y(t): quan sát dừng hiện tại

y(t-1), y(t-2), , y(t-p): quan sát dừng tại các thời điểm (t-1), (t-2), , (t-p) a0, a1, , ap: các tham số phân tích hồi quy

e(t): sai số dự báo ngẫu nhiên của giai đoạn hiện tại, với giá trị trung bình được mong đợi bằng 0

Hình 2.1 Mô hình tự hồi quy 2.3.2 Mô hình ARIMA

Mô hình ARIMA (Tự hồi quy tích hợp trung bình trượt - Autoregressive Integrated Moving Average) được 2 hai nhà thống kê Box và Jenkins giới thiệu vào năm 1974 Đây là mô hình tích hợp các quá trình: quá trình tự hồi quy bậc p – AR(p) và quá trình trung bình trượt bậc q – MA(q), thể hiện trên chuỗi dữ liệu không dừng, đã được lấy sai phân (với d chỉ mức độ sai phân)

Giá trị thực Giá trị dự đoán

Trang 26

Mô hình trung bình trượt MA(q) (Moving average): là mô hình dự báo giá trị

hiện tại bằng giá trị trung bình có trọng số của những sai số gần nhất Mô hình được biểu diễn qua công thức:

Trong đó:

y(t): quan sát dừng hiện tại

e(t): sai số dự báo ngẫu nhiên, với giá trị trung bình được mong đợi bằng 0

e(t-1), e(t-2), , e(t-q): sai số dự báo quá khứ tại các thời điểm (t-1), (t-2), , (t-q) b0, b1, , bq: giá trị trung bình của y và các hệ số bình quân di động

Sai phân I(d)

Chuỗi dừng: chuỗi thời gian được xem là dừng nếu trung bình và phương sai của nó không đổi theo thời gian Sai phân chỉ sự khác biệt giữa giá trị hiện tại và giá trị trước đó Phân tích sai phân nhằm ổn định giá trị trung bình của chuỗi dữ liệu, giúp chuyển đổi chuỗi thành chuỗi dừng

Ta có: sai phân lần 1: z(t) = y(t) – y(t-1), sai phân lần 2: h(t)=z(t)-z(t-1)

Các bước phát triển mô hình ARIMA gồm các bước chung: xác định mô hình, ước lượng tham số, kiểm tra độ chính xác và dự báo

Hình 2.2 Mô hình ARIMA

ARIMA là một phương pháp mạnh để xây dựng các dự báo chính xác , tuy nhiên mô hình này cần số lượng dữ liệu ban đầu đủ lớn, quá trình tính toán thường mất nhiều thời gian và chi phí

Vì ARIMA là một mô hình dự báo khá phổ biến, việc áp dụng mô hình này trên các tập dữ liệu thời gian khá thường xuyên Trong các nghiên cứu xây dựng mô hình dự báo chất lượng không khí, phương pháp này cũng thường được sử dụng đến [16, 17]

2.3.3 Mô hình làm mượt lũy thừa

Mô hình đơn giản nhất khi dự báo chuỗi thời gian là mô hình sử dụng giá trị phía trước để dự báo các giá trị phía sau:

yt+1 = yt

Trang 27

Vì sử dụng giá trị gần nhất làm giá trị dự báo nên kết quả từ mô hình đơn giản không sử dụng được giá trị tại các lag trước đó Mô hình trung bình cho phép khắc phục vấn đề này khi các giá trị quan sát phía trước lẫn hiện tại đều được sử dụng:

Tuy vậy, trong mô hình trung bình, các giá trị trước đều có cùng trọng số, do vậy không phù hợp với thực tiễn Mô hình làm mượt đơn giản (SES - Simple exponential smoothing) cân bằng vấn đề trên khi đánh trọng số khác nhau cho các giá trị trước đó:

ℓt=αyt+(1−α)(ℓt−1+bt−1) bt=β(ℓt−ℓt−1) + (1−β)bt−1

Hai thành phần cần xác định trong mô hình Holt là chỉ số α và chỉ số β, trong đó chỉ số α thể hiện mức độ ảnh hưởng của các giá trị trước, chỉ số β thể hiện mức độ ảnh hưởng của xu hướng

Để mô hình có thể dự đoán các giá trị có cả tính xu hướng và chu kỳ, nhà khoa học Winters đã cải tiến mô hình Holt bằng cách bổ sung thêm mức độ ảnh hưởng của chu kỳ vào mô hình bằng chỉ số γ Mô hình Holt-Winters theo cấp cộng có dạng:

yt+h = ℓt+hbt+st+h−m(k+1)ℓt = α(yt−st−m)+(1−α)(ℓt−1+bt−1)

st = γyt/(ℓt−1+bt−1)+(1−γ)st−m

Trang 28

2.4 Đánh giá chất lượng không khí bằng học máy

2.4.1 Mạng nơ ron nhân tạo (Artificial Neural Network - ANN):

Mạng nơ ron nhân tạo là một mô hình lấy ý tưởng từ sự hoạt động của mạng nơ ron thần kinh Một mạng nơ ron thường có 3 lớp: Lớp vào, lớp ẩn và lớp ra Mỗi lớp có thể có 1 hoặc nhiều nơ ron đơn lẻ gọi là các perceptron

Mỗi perceptron nhận một hoặc nhiều thông tin đầu vào và cho ra một kết quả duy nhất Các thông tin đầu vào của perceptron phía sau nhận tín hiệu từ perceptron phía trước với các trọng số tương ứng Thông tin đầu ra của perceptron sẽ được tính thông qua một hàm kích hoạt (thường là các hàm phi tuyến)

Bảng 2.5 Một số hàm kích hoạt phi tuyến thường dùng

Trang 29

a) Phân loại: hiện nay có nhiều mô hình mạng nơ ron phục vụ cho nhiều mục tiêu khác

nhau

Dựa theo số lớp trong mạng:

- Mạng một lớp: mạng nơ ron chỉ có một lớp, các perceptron nhận tín hiệu đầu vào và cho ra kết quả cuối mà không thông qua các lớp perceptron nào khác

- Mạng nhiều lớp: có lớp đầu vào và lớp đầu ra riêng biệt Nhiều mô hình còn có các lớp perceptron nằm giữa 2 lớp đầu vào và lớp đầu ra, hay còn gọi là lớp ẩn

Dựa theo đường truyền tín hiệu:

Mạng truyền thẳng: là mạng nơ ron nhiều lớp có đường truyền tín hiệu từ lớp này sang lớp khác diễn ra theo 1 hướng

Hình 2.3 Mạng nơ ron truyền thẳng nhiều lớp

- Mạng có phản hồi: là mạng nơ ron nhiều lớp có đường truyền tín hiệu từ lớp này sang lớp khác diễn ra theo 2 hướng, đầu ra của phần tử lớp sau có thể lan truyền ngược tới đầu vào của phần tử ở lớp trước nó

b) Luật học: hai vấn đề cần học với mỗi mạng nơ ron là học tham số (parameter

learning) và học cấu trúc (structure learning)

- Học tham số: thay đổi hay cập nhật trọng số trong các liên kết giữa các perceptron - Học cấu trúc: thay đổi cấu trúc mạng nơ ron bao gồm số lớp, số phần tử perceptron

trong mỗi lớp, cách liên kết giữa các perceptron

Phương pháp học của mạng nơ ron có thể chia ra làm 3 loại:

- Học có giám sát (supervised learning): Các cặp dữ liệu đầu vào và đầu ra được cho sẵn và cung cấp cho mô hình Kết quả sai khác giữa dữ liệu đầu ra của mô hình và dữ liệu đầu ra cho sẵn được tính toán để thay đổi giá trị của các trong số trong mạng, sao cho sự sai khác này là nhỏ nhất

- Học không giám sát (unsupervised learning): Chỉ có dữ liệu đầu vào nhưng không có dữ liệu đầu ra để so sánh với kết quả sau khi học Mô hình phải tự khám phá, phân tích và thể hiện những cấu trúc có ích ẩn bên trong bộ dữ liệu được nạp vào

Trang 30

- Học củng cố (reinforcement learning): Dữ liệu đầu vào và một số tính chất giới hạn của đầu ra được cung cấp cho mô hình Các tính chất giới hạn này không cho biết cụ thể giá trị đầu ra mà chỉ mang tính đánh giá khi so với kết quả từ mô hình, ví dụ: giá trị cho ra từ mô hình quá cao, giá trị cho ra từ mô hình chỉ chính xác 50%

2.4.2 Mạng nơ ron hồi quy (Recurrent Neural Network - RNN)

Mạng RNN là một lớp của mạng ANN, trong đó các perceptron có khả năng “nhớ” các thông tin đã tính toán trước đó để làm đầu vào cho các lần tính toán sau Việc ghi nhớ các thông tin này giúp mạng RNN có khả năng cho kết quả tốt hơn ANN truyền thống với các tập dữ liệu mà giá trị sau phụ thuộc vào kết quả của giá trị trước, ví dụ như giá cổ phiếu, ngữ cảnh văn bản

2.4.3 Mạng nơ ron LSTM (Long Short Term Memory)

Việc nhớ kết quả trong RNN có đặc điểm: giá trị nhớ bị “pha loãng” qua các lần lặp tiếp theo Để khắc phục việc này, một biến thể của RNN là Mạng nơ ron hồi quy có bộ nhớ dài – ngắn hạn ra đời Trong mạng LSTM , các perceptron có khả năng nhớ thông tin trong suốt thời gian dài, giúp chúng là kỹ thuật hữu ích để áp dụng tính toán cho các tập mẫu mà giá trị của các dữ liệu đầu tiên có ảnh hưởng lớn đến giá trị các dữ liệu sau nó LSTM được áp dụng trên nhiều lĩnh vực, trong đó nhiều nghiên cứu khác nhau đã sử dụng LSTM cho việc đánh giá chất lượng không khí [18, 19]

Trang 31

2.4.4 Một số hàm tối ưu trong học máy

Thuật toán tối ưu là cơ sở để xây dựng mô hình neural network với mục đích học được các đặc tính của dữ liệu đầu vào, từ đó có thể tìm các giá trị trọng số (weight) và sai lệch (bias) phù hợp để tối ưu hóa mô hình Việc tìm các giá trị này cần được thực hiện một cách có hệ thống Do vậy, các thuật toán tối ưu được nghiên cứu để phục vụ mục đích trên Một số thuật toán phổ biến được trình bày như bên dưới:

2.4.4.1 Gradient Descent (GD)

Các bài toán tối ưu thường tìm giá trị nhỏ nhất của một hàm số nào đó, mà hàm số đạt giá trị nhỏ nhất khi đạo hàm bằng 0 Tuy nhiên, không phải lúc nào cũng lấy đạo hàm hàm số được Đối với các hàm số nhiều biến thì đạo hàm rất phức tạp, thậm chí là bất khả thi Nên thay vào đó người ta tìm điểm gần với điểm cực tiểu nhất và xem đó là nghiệm bài toán Thuật toán Gradient Descent (hay giảm dần độ dốc) ra đời, với hướng tiếp cận là chọn một nghiệm ngẫu nhiên và cứ sau mỗi vòng lặp (hay epoch) thì cho nó tiến dần đến điểm cần tìm:

xnew = xold – learningRate * gradient(x) Trong đó:

xnew: tọa độ mới xold: tọa độ cũ

learningRate: tốc độ học gradient: đạo hàm của hàm f

Thuật toán Gradient Descent cơ bản, dễ hiểu Thuật toán đã giải quyết được vấn đề tối ưu mô hình mạng nơ ron bằng cách cập nhật trọng số sau mỗi vòng lặp Tuy nhiên, thuật toán Gradient Descent còn nhiều hạn chế như phụ thuộc vào nghiệm khởi tạo ban đầu và learning rate; tốc độ học quá lớn sẽ khiến cho thuật toán không hội tụ, quanh quẩn bên đích vì bước nhảy quá lớn; hoặc tốc độ học nhỏ ảnh hưởng đến tốc độ training.

2.4.4.2 Stochastic Gradient Descent (SGD)

Stochastic là một biến thể của Gradient Descent Thay vì sau mỗi epoch chúng ta sẽ cập nhật trọng số một lần thì trong mỗi epoch có N điểm dữ liệu chúng ta sẽ cập nhật trọng số N lần Nhìn vào một mặt, SGD sẽ làm giảm đi tốc độ của một epoch Tuy nhiên nhìn theo một hướng khác, SGD sẽ hội tụ rất nhanh chỉ sau vài epoch Công thức SGD cũng tương tự như GD nhưng thực hiện trên từng điểm dữ liệu

Thuật toán giải quyết được đối với cơ sở dữ liệu lớn mà GD không làm được (không phải tính lại đạo hàm trên toàn bộ dữ liệu) Thuật toán tối ưu này hiện nay vẫn hay được sử dụng Tuy nhiên, thuật toán vẫn chưa giải quyết được 2 nhược điểm lớn của gradient descent là learning rate và điểm dữ liệu ban đầu.

Trang 32

2.4.4.3 Momentum

Để khắc phục các hạn chế trên của thuật toán Gradient Descent người ta dùng gradient descent with momentum Khi sử dụng thuật toán này, quá trình học có thể vượt qua các giá trị tối ưu cục bộ vì việc học có đà (momentum), từ đó giúp quá trình học tiến đến giá trị tối ưu toàn cục

Nhìn dưới góc độ toán học, ta có công thức Momentum:

xnew = xold - (gama + learningRate * gradient) Trong đó:

xnew: tọa độ mới xold: tọa độ cũ

gama: parameter, thường = 0.9 learningRate: tốc độ học gradient: đạo hàm của hàm f

Thuật toán tối ưu giải quyết được vấn đề: Gradient Descent không tiến được tới điểm global minimum mà chỉ dừng lại ở local minimum Nhược điểm: mất khá nhiều thời gian dao động qua lại trước khi dừng hẳn, điều này được giải thích vì việc học có đà

n : hằng số

gt : gradient tại thời điểm t

ϵ : hệ số tránh lỗi ( chia cho mẫu bằng 0)

Gt : là ma trận chéo mà mỗi phần tử trên đường chéo (i,i) là bình phương của đạo hàm vectơ tham số tại thời điểm t

gt : gradient tại thời điểm t

ϵ : hệ số tránh lỗi ( chia cho mẫu bằng 0)

Trang 33

RMSprop giải quyết được vấn đề tốc độ học giảm dần của Adagrad (vấn đề tốc độ học giảm dần theo thời gian sẽ khiến việc training chậm dần, có thể dẫn tới bị đóng băng) Tuy nhiên thuật toán RMSprop có thể cho kết quả nghiệm chỉ là local minimum chứ không đạt được global minimum như Momentum

2.4.4.6 Adam

Adam là sự kết hợp của Momentum và RMSprop Nếu giải thích theo hiện tượng vật lí thì Momentum giống như 1 quả cầu lao xuống dốc, còn Adam như 1 quả cầu rất nặng có ma sát, vì vậy nó dễ dàng vượt qua local minimum tới global minimum và khi tới global minimum nó không mất nhiều thời gian dao động qua lại quanh đích vì nó có ma sát nên dễ dừng lại hơn

2.5 Các công trình liên quan

Để đánh giá chất lượng không khí, các trạm quan trắc được xây dựng để thu thập dữ liệu thô và dùng cho các hoạt động nghiên cứu Theo cách quan sát thông thường, dữ liệu của mốc quan sát trước có thể làm tham chiếu để dự báo cho mốc quan sát sau Với các cách tiếp cận toán học, việc này có thể mở rộng ra nhiều mốc dự báo tương lai xa hơn (thay vì chỉ một mốc điểm thời gian) Ngày nay, để dự báo chất lượng không khí thường có 3 nhóm phương pháp chính: Dựa vào mô hình khuếch tán vật chất, dựa vào thống kê và dựa vào học máy

Hình 2.5 Các phương pháp đánh giá chất lượng không khí

Mô hình dự báo

Dựa vào khuếch tán của vật chất

Dựa vào thống kê

Dựa vào học máy

Ngày đăng: 30/07/2024, 17:35

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w