2.1. Phƣơng pháp nghiên cứu
2.1.1. Các phƣơng pháp nghiên cứu
Hình 2.1 Mơ hình dữ liệu và quy trình xử lý mạng huấn luyện
Thu thập, phân tích lựa chọn và xử lý dữ liệu đầu vào là các yếu tố cho mơ hình, sau đó thực hiện phân chia dữ liệu này thành 2 phần: phần để huấn luyện trong mạng (70% dữ liệu đầu vào) và phần dữ liệu để xác định (30% dữ liệu đầu vào). Dữ liệu đƣa vào huấn luyện mạng đƣợc tối ƣu hóa qua định nghĩa địa lý sinh học (BBO) rồi đƣa vào mơ hình mạng để huấn luyện (Multiple layer perceptron). Đầu ra và các tham số về sai số sẽ đƣợc xác định qua hàm điều kiện nếu không “Đạt” quá trình trên
sẽ lặp lại cho tới khi hồn thiện mơ hình với các trọng số cụ thể. Mơ hình sau khi đƣợc huấn luyện sẽ đƣợc sử dụng để xác định các dữ liệu đầu vào còn lại (30%).
Thu thập, phân tích và xử lý số liệu
Đây là phƣơng pháp cơ bản và quan trọng trong nghiên cứu khoa học, phân tích từ số liệu đặc điểm tự nhiên - kinh tế - xã hội với vị trí điểm bệnh sốt rét trong khu vực: dữ liệu ảnh từ vệ tinh viễn thám, số liệu quan trắc về môi trƣờng, hiện trạng sử dụng đất, đặc điểm địa hình và số liệu về sốt rét tại địa phƣơng v.v. Việc tiếp cận nguồn số liệu này cho phép lựa chọn các biến số, thực hiện phân tích, so sánh, kiểm chứng vấn đề nghiên cứu.
Cụ thể, trong đề tài nghiên cứu sử dụng các nguồn dữ liệu chiết xuất ra các thông tin cần thiết, nhƣ từ dữ liệu ảnh Landsat chiết xuất ra thông tin chỉ số thực vật NDVI hay từ dữ liệu hiện trạng sử dụng đất chiết xuất ra thông tin khoảng cách tới đƣờng giao thông v.v.
Phƣơng pháp Viễn thám
Do đặc điểm của thông tin viễn thám là sự phản ánh một cách trung thực các đối tƣợng của bề mặt, đặc biệt là thực vật, thuỷ văn và đất, nên ta có thể sử dụng chúng để nghiên cứu thông qua đặc điểm phản xạ phổ của từng đối tƣợng đó. Việc giải đốn các đối tƣợng đƣợc thực hiện theo quan niệm của các cách tiếp cận khác nhau trong viễn thám là đa phổ, đa nguồn, đa thời gian, đa độ phân giải, đa phƣơng pháp [15].
Kết hợp với số liệu đo đạc, định vị GPS toạ độ của các điểm thu thập số liệu (mật độ muỗi, độ cao địa hình...), ta có thể phân tích tƣ liệu viễn thám đa thời gian, cùng với các dữ liệu về bệnh dịch nhằm tìm ra những quy luật về mối liên hệ và từ đó đƣa ra những nhận định về nguyên nhân, sự phân bố và diễn biến của dịch bệnh trong tƣơng lai.
Sử dụng chỉ số thực vật (Normalized Difference Vegetation Index - NDVI) phản ảnh rất rõ trạng thái của lớp phủ thực vật, chỉ số này giúp xác định sự xuất
hiện thảm thực vật màu xanh lá cây và còn đánh giá đƣợc cả chất lƣợng của chúng: Độ phủ là một chỉ tiêu liên quan, trực tiếp cũng nhƣ gián tiếp ảnh hƣởng đến sự sinh sống và sinh sản của muỗi. Nguyên tắc tính NDVI là lá “xanh” hấp thụ bức xạ ở các bƣớc sóng màu đỏ - RED (640-670mm) do có sự hiện diện của các sắc tố diệp lục và bị tán xạ ở bƣớc sóng rất gần với cận hồng ngoại - NIR (700-1100mm) do cấu trúc bên trong của lá. Ngƣợc lại bề mặt đất trống có phản xạ cao hơn ở các bƣớc sóng màu đỏ và hệ số phản sạ thấp hơn ở các bƣớc sóng cận hồng ngoại, NDVI=Band4 (NIR) - Band2 (RED)/Band4 (NIR) + Band2 (RED). NDVI có giá trị dao động từ -1 đến +1 [12].
Ngoài ra, chỉ số thực vật cũng đƣợc để đánh giá các yếu tố tự nhiên khác nhƣ độ ẩm đất, loại đất, sự có mặt của nƣớc và tình trạng ngập úng...
Phƣơng pháp Bản đồ và GIS
Đây là phƣơng pháp quan trọng trong suốt quá trình thực hiện đề tài, bởi GIS là hệ thống cho phép thu thập, chuẩn hóa, tích hợp dữ liệu, phân tích, chiết xuất thông tin, đồng thời GIS cũng cho phép mơ hình hố và trình bày bản đồ, lập báo cáo, là cơ sở để thể hiện vị trí các điểm sốt rét trên địa bàn tỉnh.
Có nhiều cách tiếp cận khác nhau, tuy nhiên, tựu chung có thể khái niệm Hệ thống thông tin địa lý (theo ESRI, 1997) GIS là một tập hợp có tổ chức bao gồm phần cứng, phần mềm máy tính, dữ liệu địa lý và con ngƣời đƣợc thiết kế nhằm mục đích nắm bắt, lƣu trữ, cập nhật, điều khiển, phân tích và hiển thị tất cả các dạng thơng tin liên quan đến vị trí địa lý.
Ngày nay, hệ thống thông tin địa lý đƣợc ứng dụng trong nhiều ngành khoa học khác nhau và đạt đƣợc nhiều thành công, đáp ứng việc nghiên cứu cả về khơng gian và thời gian. GIS có thể coi là một cầu nối giữa những nhà y tế cộng đồng, nhà khoa học địa lý học và toán học trong nghiên cứu về sự phát sinh và phát triển của bệnh sốt rét.
Ngày nay, phƣơng pháp này đang ngày càng đƣợc ứng dụng nhiều, gần gũi hơn với đời sống của con ngƣời và ngày càng nhận đƣợc sự quan tâm vì thế mạnh của phƣơng pháp đem lại, khắc phục đƣợc nhiều hạn chế so với các phƣơng pháp truyền thống định tính hay định lƣợng nhƣng nặng tính chủ quan của con ngƣời.
Mơ hình huấn luyện mạng thần kinh nhân tạo gồm có đầu vào là các biến số - yếu tố, sự đa dạng trong cấu trúc mạng huấn luyện thì tùy vào mỗi bài tốn. Tối ƣu hóa mạng huấn luyện bằng thuật toán địa lý sinh học, thực thi nhờ quá trình lặp và điều chỉnh, kiểm tra mơ hình bằng các mẫu thử. Sau khi thu đƣợc kết quả mơ hình mạng huấn luyện, thực hiện triển khai trên tồn địa bàn tỉnh Đắk Nơng để dự đốn nguy cơ sốt rét.