Chương 7 Kết luận và hướng phát triển

Một phần của tài liệu Đồ án tốt nghiệp kĩ sư đại học Bách Khoa Hà Nội (Trang 45 - 47)

• Không dùng Feature Engineering thì kết quả mô hình đề xuất vẫn tốt hơn trong mọi trường hợp khi xét đầu vào là 48 giờ và số giờ dự đoán trong tương lai là từ 1 đến 6 giờ, độ chính xác dựa vào chỉ số MAE cải thiện được từ 17%-41% (Bảng 5).

• Khi áp dụng Feature Engineering, kết quả từ Bảng 4 cho thấy sử dụng mô hình XGBoost cho độ chính xác tốt hơn cho mọi trường hợp kiểm thử xét cho đầu vào là 24 giờ và đầu ra là 1 giờ dự đoán. Xét bộ dữ liệu Hà Nội, cải thiện từ 7% - 10% độ chính xác, và bộ dữ liệu vùng đảo Đài Loan cải thiện khoảng 1% - 1,3%. Tuy nhiên khi xét với đầu vào là 48 giờ và lần lượt thử số giờ dự đoán là từ 1 đến 6 giờ thì kết quả không ổn định và không như mong muốn. Lý do đã được trình bày ở mục 1.22. Như vậy, trong đồ án này, em đã so sánh các mô hình của các mô hình đã được nghiên cứu và đề xuất mô hình khắc phục các vấn đề còn tồn đọng. Kết quả cho thấy mô hình đề xuất đang tiếp cận đúng hướng đi. Tuy còn nhiều vấn đề đối với bài toàn này, như em đã đề cập và nêu những hướng giải quyết ở Error: Reference source not found, nhưng trong khuôn khổ đồ án này và thời gian có hạn nên em xin được đề xuất các hướng phát triển cho bài toán chất lượng không khí này, được trình bày ở mục 1.25 dưới đây.

1.25 Hướng phát triển

Hiện nay, việc nghiên cứu đã hoàn thành mục tiêu là có mô hình dự đoán có độ chính xác cao đối với chỉ số bụi mịn, tuy nhiên vẫn có những vấn đề còn tồn đọng và có thể phát triển tiếp. Em có một số hướng phát triển sau:

• Vì bài toán nhằm giải quyết vấn đề môi trường tại Việt Nam, nhưng vẫn chỉ có dữ liệu của Hà Nội nên chưa khai thác được mối quan hệ về địa lý, không gian. Để tối Để mô hình có thể được ứng dụng thì việc dự đoán cho nhiều khu vực khác nhau là cần thiết, do đó em hướng tới việc tìm kiếm dữ liệu của các thành phố khác, sau đó dựa vào yếu tố địa lý để tăng độ chính xác của mô hình lên.

• Do dữ liệu thường xuyên bị thiếu do các cảm biến không đảm bảo hoàn toàn sẽ lấy được dữ liệu, do đó ảnh hưởng tới quá trình học và dự đoán. Em đề xuất hướng phát triển là tìm một phương pháp đề điền vào dữ liệu trống sao cho khi dự đoán dữ liệu thật thì độ chính xác cao hơn so với một số phương pháp phổ biến như phương pháp lấy trung bình.

• Mô hình hiện tại chỉ so sánh kết quả với mô hình [2], do đó chưa thể hoàn toàn khẳng định mô hình này là vượt trội so với các mô hình khác. Công việc tiếp theo để mô hình đề xuất trở nên hoàn thiện hơn là chạy các bộ dữ liệu mà các mô hình khác sử dụng để so sánh, từ đó có hướng giải quyết và thay đổi làm cho mô hình có độ chính xác cao và ổn định hơn.

• Như đã đề cập ở mục 1.17, Bảng 6 và mục 1.22, XGBoost tồn tại nhược điểm là chỉ xét được một thuộc tính duy nhất. Mà chỉ số bụi PM10 và PM2.5 có thể có tính chất khác nhau nên các thuộc tính khác ảnh hưởng tới PM2.5 chưa chắc ảnh hưởng tới PM10, do đó trong tương lai em sẽ làm quá trình Feature Engineering tổng quát hơn khi muốn dự đoán nhiều chỉ số khác nhau.

[1] C. Arden Pope, III, Richard T. Burnett, Michael J. Thun, Eugenia E. Calle, Daniel Krewski, Kazuhiko Ito, George D. Thurston, “Lung Cancer, Cardiopulmonary Mortality, and Long-term Exposure to Fine Particulate Air Pollution”, JAMA, PMC Publisher, vol. 287, 2002.

[2] Ping-Wei Soh, Jia-Wei Chang, Jen-Wei Huang, “Adaptive Deep Learning-Based Air Quality Prediction Model Using the Most Relevant Spatial-Temporal Relations”, IEEE Access, IEEE Publisher, vol. 6, 2018.

[3] Ibrahim Kok, Mehmet Ulvi Simsek, Suat Ozdemir, “A deep learning model for air quality prediction in smart cities”, 2017 IEEE International Conference on Big Data, Boston USA.

[4] Zhongang Qi, Tianchun Wang, Guojie Song, Weisong Hu, Xi Li, Zhongfei Zhang, “Deep Air Learning: Interpolation, Prediction, and Feature Analysis of Fine-Grained Air Quality”, IEEE Transactions on Knowledge and Data Engineering, IEEE

Publisher, vol. 30, December 2018.

[5] Yijun Lin , Nikhit Mago, Yu Gao, Yaguang Li, Yao-Yi Chiang, Cyrus Shahabi, José Luis Ambite, “Exploiting Spatiotemporal Patterns for Accurate Air Quality

Forecasting using Deep Learning”, the 26th ACM SIGSPATIAL International Conference, Washington USA, November 2018.

[6] Ilya Sutskever, Oriol Vinyals, Quoc V. Le, “Sequence to Sequence Learning with Neural Networks”, arXiv:1409.3215v3 [cs.CL], December 2014.

[7] PM Index, Taiwan Environmental Protection Administration,

https://taqm.epa.gov.tw/taqm/en/YearlyDataDownload.aspx, last accessed: December 19, 2019.

Một phần của tài liệu Đồ án tốt nghiệp kĩ sư đại học Bách Khoa Hà Nội (Trang 45 - 47)

Tải bản đầy đủ (DOCX)

(55 trang)
w