2.3. Dữ liệu nghiên cứu
2.3.2. Xây dựng cơ sở dữ liệu chạy mơ hình
Từ 15 dữ liệu đầu vào đƣợc lựa chọn, xử lý và xét tính tƣơng quan của mỗi cặp dữ liệu để từ đó lọc bỏ các yếu tố có tính tƣơng quan cao:
Bảng 2.2 Dữ liệu và xử lý dữ liệu
Dữ liệu Xử lý dữ liệu
Nhóm dữ liệu về khí hậu (Nhiệt độ, lƣợng mƣa, độ ẩm, gió) có nguồn gốc dữ liệu từ các điểm trạm quan trắc khí tƣợng quốc gia
- Sau khi thu thập, sử dụng thuật toán Kriging để nội suy cho toàn bộ khu vực nghiên cứu thu đƣợc kết quả là raster nội suy với độ phân giản 30m. - Kiểm tra mức độ tƣơng quan giữa các yếu tố, kết quả giá trị tƣơng quan của lƣợng mƣa và độ ẩm là > 0,9 do đó loại trừ yếu tố độ ẩm khỏi cơ sở dữ liệu đầu vào của mơ hình.
Nhóm dữ liệu về chỉ số từ ảnh Landsat
- NDVI đƣợc sử dụng để trích xuất chỉ số thực vật nằm trong khoảng từ -1 đến 1. Giá trị NDVI nhỏ hơn 0 mô tả vùng không thực vật. Mặt khác, giá trị NDVI cao hơn 0 cho thấy chất lƣợng thực vật khác nhau và tăng dần lên khi giá trị gần 1.
- NDVI sau đó đƣợc tính tốn bằng cách sử dụng các dải hồng ngoại gần và đỏ.
- Kếm tra mức độ tƣơng quan giữa 2 yếu tố NDVI và NDMI cao đáng kể khi vƣợt quá 0,9. Do đó loại trừ chỉ số NDMI khỏi các yếu tố đầu vào của mơ hình.
Nhóm dữ liệu về kinh tế - xã hội
- Bản đồ raster nhóm đất đƣợc chiết xuất từ bản đồ hiện trạng sử dụng đất năm 2010 (gồm các khoanh vi với mục đích sử dụng đất khác nhau). Xử lý bằng
phần mềm ArcGIS.
- Từ dữ liệu này chiết xuất ra các yếu tố (khoảng cách đến đƣờng, khoảng cách đến khu dân cƣ, khoảng cách đến sông, khoảng cách đến rừng, khoảng cách vùng đất ngập nƣớc)
- Kiểm tra mức độ tƣơng quan của các yếu tố đều đạt và chấp nhận đƣa vào mơ hình.
Ngồi dữ liệu các yếu tố ảnh hƣởng làm đầu vào của mơ hình thì cịn cần có các mẫu về vị trí các điểm xuất hiện bệnh sốt rét và các điểm không xuất hiện bệnh sốt rét để làm cơ sở cho mơ hình mạng học (đào tạo) tƣơng ứng 70% khối lƣợng mẫu và để kiểm tra sự đúng đắn của mơ hình (training data - test data) tƣơng ứng với 30% khối lƣợng mẫu.
Dữ liệu thu thập đƣợc tham chiếu lại vào các yếu tố ảnh hƣởng để đƣa vào thành thuộc tính của các điểm đào tạo mạng (Bảng 4).
Bảng 2.3 Dữ liệu thu thập để đào tạo và kiểm thử mạng
Hình 2.26 Bản đồ vị trí các điểm mẫu để huấn luyện mạng (số liệu từ Trung tâm y tế dự phịng tỉnh Đắk Nơng đƣợc thu thập trong năm 2017)
Chƣơng 3 - KẾT QUẢ MƠ HÌNH, ĐÁNH GIÁ VÀ KẾT LUẬN LUẬN
Xây dựng mơ hình mạng thần kinh nhân tạo để dự đốn điểm dịch bệnh sốt rét với phƣơng pháp và dữ liệu đầu vào đã đƣợc xác định ở Chƣơng 2. Nội dung Chƣơng 3 trình bày kết quả thu đƣợc để từ đó làm cơ sở đánh giá.