Chương 5 Thí nghiệm và đánh giá
1.16 Kịch bản thí nghiệm
Em sử dụng chỉ số PM2.5 và PM10 làm thuộc tính để đánh giá vì chúng được sử dụng làm chỉ số đánh giá rộng rãi trong các bài báo, và cũng là chỉ số môi trường khó dự đoán. Dữ liệu sử dụng bao gồm hai bộ: Hà Nội và vùng đảo Đài Loan do cơ quan TWEPA (Taiwan Environmental Protection Administration) công bố [7]. Cả hai bộ dữ liệu đều sử dụng 60% để huấn luyện model, 20% để xác thực (validate) và 20% để thử nghiệm kết quả xem mô hình học có tốt ko. Dữ liệu quan sát được chia theo từng giờ.
Dữ liệu được thu thập tại Hà Nội từ ngày 1/1/2016 đến 1/1/2018 bao gồm các chỉ số: thời gian, tốc độ gió, hướng gió, nhiệt độ, độ ẩm, phong vũ biểu, phóng xạ, nhiệt độ trong, nhiệt độ trong, và các loại khí NO, NO2, NOx, SO2, CO, O3, ba chỉ số bụi PM-10, PM-2.5, PM- 1. Ngoài ra còn có CH4, NMHC, THC, BENZEN, TOLUEN, ETHYL BENZEN, MP- XYLEN, O-XYLEN, nhưng do thiếu dữ liệu nhiều nên lược bỏ các thuộc tính này đi. Dữ liệu sử dụng do rời rạc, không có tính xuyên suốt do thiếu dữ liệu nên em sử dụng phương pháp lấy trung bình để điền dữ liệu bị thiếu.
Dữ liệu vùng đảo Đài Loan là dữ liệu dùng để so sánh với kết quả của bài báo, từ ngày 1/1/2014 đến 30/09/2017, bao gồm các chỉ số: nhiệt độ không khí xung quanh, CO, NO, NO2, NOx, O3, RH, SO2, hướng gió, tốc độ gió, và hai chỉ số bụi mịn PM10, PM2.5. Dữ liệu của tập này cũng không đủ nên em dùng phương pháp lấy giá trị trung bình để điền dữ liệu bị thiếu.
Chỉ số MAE (mean absolute error) và RMSE (root mean squared error) thường được sử dụng để đánh giá độ chính xác của kết quả dự đoán do các chỉ số này được sử dụng làm thước đo trong nhiều bài báo khác [2], [19], [20], [21].
Công thức 4 Sai số toàn phương trung bình (RMSE). Trong đó:
• là giá trị thực.
• là giá trị dự đoán có được từ mô hình. • n là số lượng phần tử đang xét.
MAE và RMSE càng thấp thì kết quả dự đoán càng chính xác. Tuy nhiên trong kết quả được trình bày dưới đây, em chỉ so sánh chỉ số MAE.
Em kí hiệu độ dài chuỗi dữ liệu đầu vào là l, độ dài chuỗi đầu ra là h (xem Error: Reference source not found). Hiện tại, em mới thử nghiệm với h = 24 giờ, l = 1 giờ, tức là cho dữ liệu thời gian là 1 ngày, đoán chỉ số bụi cho 1 giờ tiếp theo và h = 48 giờ, l = 1-6 giờ. Dưới đây là bảng thông số các tham số được sử dụng cho các thí nghiệm. Độ dài chuỗi thời gian đầu vào và đầu ra sẽ được trình bày chi tiết trong các bảng kết quả ở mục 1.17.
Bảng 3 Thông số thí nghiệm Batch Size 200 Test Size 0.2 Sequence Length of Input (l) 24
Neuron Units 100
Epochs 300
Optimizer Adam
Number of Epochs for Early Stopping
20