Bù dữ liệu nồng độ chất ô nhiễm khuyết thiếu

Một phần của tài liệu Nghiên cứu ứng dụng thuật toán di truyền (genetic algorithm) trong dự (Trang 52 - 69)

Từ kết quả nghiên cứu mô hình FFNN đã tiến hành bù số liệu đối với SO2 và PM10.

Để đánh giá độ tin cậy của các kết quả bù dữ liệu từ mô hình FFNN đƣợc kiểm tra thông qua phân bố dữ liệu. Kết quả cho thấy, bộ dữ liệu sau khi đã đƣợc bù hoàn chỉnh bởi FFNN hoàn toàn phù hợp với phân bố Weibull (tính toán sử dụng công cụ thống kê SPSS) và phù hợp với bộ dữ liệu nguồn, điều này là hoàn toàn phù hợp với kết quả đã đƣợc công bố của Chử Thị Hồng Nhung (2012) [36].

48

Bảng 3.11. Tham số phân bố Weibull của dữ liệu nồng độ SO2

Năm Tham số Weibull Tham số hình dạng (α) Tham số tỷ lệ (β) 2003 Dữ liệu nguồn 2,173 17,242 Dữ liệu đã đƣợc bù 2,235 17,324 2004 Dữ liệu nguồn 2,646 16,726 Dữ liệu đã đƣợc bù 2,704 16,706 2005 Dữ liệu nguồn 3,017 18,049 Dữ liệu đã đƣợc bù 3,134 17,742 2006 Dữ liệu nguồn 3,424 21,101 Dữ liệu đã đƣợc bù 3,426 21,09 2007 Dữ liệu nguồn 2,619 17,268 Dữ liệu đã đƣợc bù 2,643 17,266 2003-2007 Dữ liệu nguồn 2,569 18,427 Dữ liệu đã đƣợc bù 2,728 18,363 2002-2010 [36] 2,097 14,644

Bảng 3.12. Tham số Weibull của dữ liệu nồng độ PM10 từ 2003 đến 2007 Tham số hình dạng (α) Tham số tỷ lệ (β)

Dữ liệu nguồn 1,884 89,915

Dữ liệu đã bù 1,882 89,968

49

Qua những kết quả thử nghiệm sơ bộ trên hai thông số chất lƣợng không khí là SO2 và PM10 ta thấy kết quả số liệu sau khi bù tƣơng đồng với dữ liệu nguồn theo phân bố Weibull. Nó cho thấy FFNN nói riêng và ANN nói chung là một phƣơng pháp tiếp cận mới và khả thi để giải quyết bài toán khuyết thiếu dữ liệu quan trắc chất lƣợng không khí tại Việt Nam.

Đánh giá kết quả của công cụ dự báo FFNN và GA

Từ kết quả dự báo của mô hình FFNN nói chung và kết hợp GA nói riêng, những nhƣợc điểm chính của mô hình và đề xuất để đạt đƣợc hiệu suất mô hình tốt nhất là:

- Độ chính xác của mô hình FFNN phụ thuộc vào số lƣợng và chất lƣợng của bộ dữ liệu đào tạo hay nói cách khác cần có bộ dữ liệu đủ lớn và đầy đủ. Mô hình FFNN là loại mô hình đơn giản nhất trong các loại mô hình mạng thần kinh nhân tạo. Do đó để có đƣợc kết quả dự báo tốt nhất, cần có phƣơng tiện thu thập dữ liệu chính xác, hiện tại là các trạm quan trắc tự động cần đƣợc bảo trì và nâng cấp để nâng cao chất lƣợng dữ liệu.

- Mô hình chƣa xem xét thấu đáo các mối quan hệ của các yếu tố lan truyền từ các nguồn xa. Đồng thời mô hình chƣa xem xét đến ảnh hƣởng của các yếu tố ngoại vi (khí tƣợng thủy văn, các chất ô nhiễm khác) đến kết quả dự báo, điều này khiến kết quả còn hạn chế. Để khắc phục trong các hƣớng nghiên cứu tiếp theo cần triển khai nghiên cứu mô hình với nhiều biến đầu vào và nâng cấp kiến trúc mạng để có thể tính đến mối tƣơng quan của các yếu tố khác đến yếu tố dự báo.

- Kết quả tối ƣu của thuật toán di truyền phụ thuộc vào tham số di truyền, việc lựa chọn cần xác định dựa trên đặc điểm của mỗi đối tƣợng dự báo. Nhƣng việc sử dụng GA để tối ƣu cấu trúc mạng ANN là một công cụ tiềm năng cần đƣợc nghiên cứu chuyên sâu hơn để nâng cao chất lƣợng dự báo.

50

KẾT LUẬN

1. Nồng độ của chất ô nhiễm SO2 và PM10 đã đƣợc dự báo bằng mô hình FFNN và cho kết quả khả quan. Đối với SO2 độ chính xác của mô hình (MAPA) là 64,1% và sai số (nRMSE) là 43% với số nơ ron lớp ẩn là 10. Đối với PM10 độ chính xác (MAPA) là 83,3% và sai số (nRMSE) 23% với số nơ-ron lớp ẩn là 05.

2. Nồng độ của chất ô nhiễm SO2 và PM10 đã đƣợc dự báo bằng mô hình FFNN kết hợp GA tìm số nơ-ron lớp ẩn cho kết quả tốt, đạt độ chính xác tƣơng đƣơng và sai số nhỏ hơn so với mô hình FFNN không kết hợp GA. Cụ thể là đối với SO2: độ chính xác (MAPA) của mô hình là 64,1% và sai số (nRMSE) là 42,7% với số nơ- ron lớp ẩn là 68 cùng các tham số GA là: kích thƣớc quần thể là 30, tỷ lệ chọn lọc là 0,75, tỷ lệ đột biến là 0,2. Còn đối với PM10 độ chính xác (MAPA) của mô hình là 84% và sai số (nRMSE) là 21,7% với số nơ-ron lớp ẩn là 254 cùng các tham số GA là: kích thƣớc quần thể là 30, tỷ lệ chọn lọc là 0,5, tỷ lệ đột biến là 0,15. Kết quả này tƣơng đồng với các nghiên cứu đã công bố trên thế giới đối với PM10. Bên cạnh đó FFNN-GA thể hiện một số lợi thế hơn cụ thể là: số nơ-ron trong lớp ẩn tìm đƣợc nhờ GA là dựa trên việc tối ƣu hóa các nghiệm (lời giải) theo cơ chế di truyền học, nhƣ vậy kết quả có cơ sở khoa học hơn việc chọn mặc định số nơ-ron trong lớp ẩn dựa trên kinh nghiệm. Đồng thời, việc ứng dụng GA để tối ƣu hóa cấu trúc FFNN giúp giảm đáng kể công sức của ngƣời thiết kế mạng, có thể xác định đƣợc các tham số tối ƣu cho mạng một cách nhanh chóng, độ tin cậy của mô hình vì thế đƣợc tăng lên đáng kể. Thêm nữa, việc sử dụng GA tƣơng đối đơn giản, không đòi hỏi quá cao về mặt chuyên môn cũng nhƣ phải dựa vào kinh nghiệm của ngƣời xây dựng mạng.

3. Số liệu khuyết thiếu của chất ô nhiễm SO2 và PM10 đã đƣợc bù bằng mô hình FFNN với kết quả khả quan và đƣợc kiểm chứng thông qua đánh giá phân bố xác suất. Bộ dữ liệu sau khi bù có phân bố Weibull phù hợp với bộ dữ liệu nguồn.

51

TÀI LIỆU THAM KHẢO

1. Nguyễn Đình Thúc (2000), “Trí tuệ nhân tạo-Mạng nơ ron-Phương pháp

và ứng dụng”, Nhà xuất bản Giáo Dục, Hà Nội.

2. Nguyễn Đình Thúc (2000), “Trí tuệ nhân tạo-Lập trình tiến hóa”, Nhà xuất bản Giáo dục, Hà Nội.

3. Phạm Thị Hoàng Nhung (2007), “Ứng dụng mạng thần kinh nhân tạo và

thuật toán di truyền để dự báo thủy văn”, Luận văn thạc sỹ khoa học, Trƣờng Đại

học Công nghệ, Đại học Quốc gia Hà Nội.

4. J.C.M. Pires, B. Goncalves, F.G.Azevedo, A.P.Carneiro, N.Rego, A.J.B. Assembleia, J.F.B. Lima, P.A.Silva, C.Alves, F.G.Martins (2012), “Optimization of artificial neural network models through genetic algorithms for surface ozone concentration forecasting”, Environ Sel Pollut Res-Springer-Verlag (19), 3228- 3234.

5. Hu Li, Raudel Sanchez, S.Joe Qin, Halil I.Kavak, Ian A.Webster, Theodore T.Tsotsis, Muhammad Sahimi (2011), “Computer simulation of gas generation and transport in landfills. V: Use of artificial neural network and the genetic algorithm for short-and long-term forecasting and planning”, Chemical

Engineering Scienc (66), 2646-2659. (adsbygoogle = window.adsbygoogle || []).push({});

6. Harri Niska, Teri hiltunen, Ari Karppinen, Juhani Ruuskanen, Mikko kolehmainen (2004), “Evolving the neural network model for forecasting air pollution time series”, Engineering Applications of Artificial Intelligence (17), 159-167.

7. Y.J.Cao, Q.H.Wu (1999), “Teaching Genetic Algorithm using Matlab”

Int.J.Elect.Enging.Educ (36), 139-153.

8. Siva Venkadesh, Gerret Hoogenboom, Walter Potter, Ronald McClendon (2013), “A genetic algorithm to refine input data selection for air temperature prediction using artificial neural networks”, Applied Soft Computing (13), 2253- 2260.

52

9. Hu Li, Raudel Sanchez, S.Joe Qin, Halil I.Kavak, Ian A.Webster, Theodore T.Tsotsis, Muhammad Sahimi (2011), “Computer simulation of gas generation and transport in landfills. V: Use of artificial neural network and the genetic algorithm for short- and long-term forecasting and planning”, Chemical

Engineering Science (66), 2646-2659.

10. Minglei Duan (April 5, 2002), “Time Series Predictability”, Luận văn thạc sỹ tại Faculty of the Graduate School, Marquette University.

11. Nina R.Dhamge, S.L.Atmapoojya, Mahendra S.Kadu (2012), “Genetic Algorithm driven ANN model for runoff estimation”, Procedia Technology (6), 501-508

12. Hong Zhao, Jie Zhang, Kai Wang, Zhi peng Bai, Aixie Liu (2010), “A GA-ANN model for air quality Predicting”, Computer Symposim (ÍCS), 693-699.

13. Paulo Cortez, Miguel Rocha, Josse neves (2001), “A Meta-Genetic

Algorithm for Time Series Forecasting”, Proceeding of Workshop on Artificial

Intelligence Techniques for Financial Time Series Analysis, Porto, Portugal, 21- 31.

14. Yang Zhangang, Che Yanbo, K.Ƣ.Eric Cheng (2007), “Genetic Algorithm-Based RBF Neural Network Load Forecasting Model”, Power

Engineering Society General Meeting, IEEE, 1-6.

15. Colin R.Reeves (2010), “Genetic Algorithms”, International Series in

Operations Research & Management Science (146), 109-139.

16. Jaime Reyes, Abraham Sanchez (2013), “Analysis of air quality data in Mexico city with clustering techniques based on genetic algorithms”,

Electronics, Communications and Computing 2013 International Conference, 27- 31.

17. Pires JCM, Martins FG, Alvim-Ferraz MCM, Pereira MC (2008), “Genetic Algorithm Based Technique for Defining Threshold Regression Models”, International Congress on Environmental Modelling and Software

53

18. C.L.Wu, K.W.Chau (2006), “A flood forecasting neural network model with genetic algorithm”, Int.J. Environment and Pollution (28), 1-13.

19. Ahmad Zia Ul-Saufie, Ahmad Shukri Yahaya, Nor Azam Ramli, Norrimi Rosaida, Hazrul Abdul Hamid (2013), “Future daily PM10 concentrations prediction by combining regression models and feedforward backpropagation models with principle component analysis (PCA)”, Atmospheric

Environment (77), 621-630.

20. S.I.V.Sousa, F.G.Martins, M.C.M. Alvim-Ferraz, M.C.Pereira (2007), “Multiple linear regression and artificial neural networks based on principal components to predict ozone concentrations”, Envrionment Modelling &

Software (22), 97-103.

21. Adriana Coman, Anda Ionescu, Yves Candau (2008), “Hourly ozone prediction for a 24-h horizon using neural networks”, Environmental Modelling

& Software (23), 1407-1421.

22. S.A.Abdul-Wahab, S.M.Al-Alawi (2002), “Assessment and prediction of tropospheric ozone concentration levels using artificial neural networks”,

Environmental modeling and Software (17), 219-228. (adsbygoogle = window.adsbygoogle || []).push({});

23. A.S.Luna, M.L.L.Paredes, G.C.G de Oliveira, S.M. Correa (2014), “Prediction of ozone concentration in tropospheric levels using artificial neural networks and support vector machine at Rio de Janeiro, Brazil”, Atmospheric

Environment (98), 98-104.

24. Lovro Hrust, Zvjezdana Bencetic klaic, Josip Krizan, Oleg Antonic, Predrag Hercog (2009), “Neural network forecasting of air pollutants hourly concentrations using optimized temporal averages of meteorological variables and pollutant concentrations”, Atmospheric Environment (43), 5588-5596.

25. Sang Hyun Sohn, Sea Cheon Oh, Yeong-Koo Yeo (1999), “Prediction of Air Pollutants by Using an Artificial Neural Network”, Korean J.Chem.Eng (16), 382-387.

26. Shuiyuan Cheng, Li Li, Dongsheng Chen, Jianbing Li (2012), “A neural network based ensemble approach for improving the accuracy of meteorological

54

fields used for regional air quality modeling”, Jounal of Environmental

Management (112), 404-414.

27. Ugur Kesgin (2004), “Genetic algorithm and artificial neural network for engine optimization of effiency and NOx emission”, Fuel (83), 885-895.

28. Giuseppe Nunnari, Stephen Dorling, Uwe Schkink, Gavin Cawley, Rob Foxall, Tim Chatterton (2004), “Modelling SO2 concentration at a point with statistical approaches”, Environmental Modelling and Software (19), 887-905.

29. Ulku Alver Sahin, Cuma Bayat, Osman N. Ucan (2011), “Application of cellular neural (CNN) to the prediction of missing air pollutant data”,

Atmospheric Research (101), 314-326.

30. Nguyễn Kỳ Phùng, Nguyễn Khoa Việt Trƣờng (2007), “Mô hình hóa các quá trình xử lý nƣớc thải bằng mạng nơ-ron nhân tạo”, Tạp chí phát triển KH&CN (10), số 01, 87-95.

31. Goldberg, David E. Korb, Bradley, Deb Kalyanmoy (1989), “Messy genetic algorithms: motivation, analysis, and first results”, Complex Systems, 3(5), 493-530. ISSN 0891-2513.

32. Mahfoud, S. and G. Mani (1996), “Finalcial forecasting using genetic algorithms”, Applied Artificial Intelligence (10), 543-565.

33. Daniel Svozil, Vladimir Kvasniska, and Jiri Pospichal (1997), “Introduction to multi-layer feed-forward neural networks’’, Chemometrics and

Intelligent Laboratory Systems 39(1), 43-62.

34. QCVN 05:2013/BTNMT Quy chuẩn kỹ thuật quốc gia về chất lƣợng không khí xung quanh.

35. De Nevers, Noel (2000), “Air Pollution Control Engineering”, William C Brown Pub.

36. Chử Thị Hồng Nhung và Nghiêm Trung Dũng (2012), “Xác định định luật phân bố xác suất của dữ liệu chất lƣợng không khí đƣợc quan trắc tại Hà

55

PHỤ LỤC

A. Minh họa quá trình chạy mô hình trên chƣơng trình matlab cho FFNN

56

57

58

B. Minh họa quá trình chạy mô hình trên chƣơng trình matlab cho GA+FFNN

59

60

61 (adsbygoogle = window.adsbygoogle || []).push({});

Hình B.4: Code chạy chƣơng trình FFNN sử dụng GA tối ƣu cấu trúc mạng

62

Hình B.5: Code chạy chƣơng trình tìm số nơ ron lớp ẩn cho PM10 với các tham số xác định

63

64

Một phần của tài liệu Nghiên cứu ứng dụng thuật toán di truyền (genetic algorithm) trong dự (Trang 52 - 69)