DỰ BÁO NGUY CƠ DỊCH BỆNH

Một phần của tài liệu Ứng dụng hệ thống thông tin địa lý trong quản lý dịch bệnh sốt xuất huyết theo không gian và thời gian (Trang 48 - 52)

Ở phần tổng quan, chúng ta tìm hiểu 4 mô hình dự báo dịch bệnh, trong đó mô hình thứ 4 dự báo nguy cơ xảy ra dịch bệnh dựa vào những yếu tố trực tiếp và gián tiếp ảnh hưởng đến nguy cơ của sự lan tràn, xảy ra dịch bệnh. Tuy nhiên số lƣợng biến đƣa vào nhiều, quy trình nghiên cứu và thời gian để xây dựng các biến dài nhƣng thời gian để thực hiện luận văn thì hạn chế. Trong khi đó các mô hình nghiên cứu của tác giả Nguyễn Thị Nhƣ Mai tuy chỉ đánh giá dựa vào 2 hoặc 3 biến số, nhưng là các biến số này lại ảnh hưởng rất lớn đến nguy cơ xảy ra dịch bệnh.

Các yếu tố này đƣợc xây dựng dựa vào đặc thù riêng của Việt Nam, với đặc điểm số lƣợng biến ít, đơn giản, chỉ cần thu thập ở các đơn vị chức năng trên địa bàn tỉnh, nên đƣợc học viên đánh giá cao hơn.

Xem xét cụ thể các mô hình của tác giả Nguyễn Thị Nhƣ Mai cho thấy mô hình thứ 3 có độ chính xác 83,01%, là chính xác nhất để tiên đoán dịch bệnh, nhƣng lại căn cứ vào 2 biến số của thời điểm hiện tại (số mắc trong tháng và nhiệt độ trong tháng), trong trường hợp này muốn dự báo phải thu thập số mắc trong cùng tháng muốn dự báo, do đó khả năng dự báo trở nên kém ý nghĩa. Trong khi mô hình thứ nhất và thứ 2 có độ chính xác thấp hơn, nhƣng lại căn cứ hoàn toàn vào các giá trị biến số của tháng trước so với thời điểm cần dự báo, điều này làm cho việc dự báo

37 có ý nghĩa hơn. Đồng thời, ta thấy mô hình thứ nhất và thứ hai có độ chính xác tương đương nhau nhưng mô hình thứ nhất lại chỉ dựa vào 2 yếu tố nên có ưu thế hơn.

Xem xét sự phù hợp và tính hợp lý, độ chính xác của tất cả các mô hình, học viên chọn mô hình dự báo thứ nhất của tác giả Nguyễn Thị Nhƣ Mai để tiên đoán dịch bệnh vì:

- Đơn giản, chỉ dựa vào 2 biến là số ca mắc của tháng trước SM1 và ẩm độ trung bình của 2 tháng trước thời điểm dự báo AĐ2.

- Độ chính xác gần bằng độ chính xác của của mô hình có độ đơn giản tiếp theo trong các mô hình đã nghiên cứu, nhƣng lại không cần thu thập dữ liệu về mật độ muỗi cái của tháng trước như mô hình sau yêu cầu.

Trong mô hình thứ nhất Y là giá trị quan sát, tiên đoán số lƣợng ca bệnh có dạng:

Y = Hằng số + Hệ số 1 x SM1 + Hằng số 2 x AĐ2

Mặt khác, mô hình của tác giả Nguyễn Thị Nhƣ Mai là mô hình thực nghiệm, áp dụng riêng cho địa bàn tỉnh Tiền Giang, nên khi sử dụng ở Bình Dương cần tính toán lại các chỉ số cho phù hợp. Với dữ liệu bệnh nhân sốt xuất huyết thu thập của năm 2009, số liệu thống kê về độ ẩm ở Niên giám thống kê tỉnh Bình Dương năm 2010:

STT SỐ CA BỆNH SỐ CA BỆNH

THÁNG TRƯỚC ĐÓ ẨM ĐỘ

1 129 274 0.85

2 50 129 0.81

3 41 50 0.76

4 49 41 0.79

5 40 49 0.79

6 116 40 0.83

7 182 116 0.87

8 123 182 0.87

9 119 123 0.9

10 88 119 0.89

11 90 88 0.9

12 86 90 0.88

Bảng 4 - Dữ liệu số mắc và độ ẩm

38 Sử dụng modul tính toán trong phần mềm excel để tính toán các hệ số của phương trình hồi quy, ta có kết quả tính toán như sau:

Hình 17 - Kết quả tính toán hồi quy

Hình 18- Đồ thị biểu diễn sự phân bố của các điểm

Quan sát kết quả tính toán này nhận thấy tại thời điểm tháng 7 và tháng 8, số lượng ca bệnh quan sát thấy bất thường, giá trị này loại bỏ trong lần tính tiếp theo:

Kết quả của tính toán của lần hồi quy tiếp theo nhƣ sau:

Hình 19- Kết quả tính toán hồi quy

39 Hình 20- Đồ thị biểu diễn sự phân bố của các điểm

So sánh với kết quả tính toán ở các lần tiếp theo, nhận thấy giá trị tính toán của mô hình ở lần tính toán thứ 2 là phù hợp nhất, do đó chọn các giá trị ở lần tính toán thứ 2 để xây dựng mô hình hồi quy.

Ta được phương trình như sau:

Y = – 265,6591 + 0,2777 SM1+373,6508 AĐ2 Trong đó:

+ Multiple R: là hệ số tương quan bội, giải thích mối quan hệ giữa biến Y với biến SM1 và AĐ2.

+ R Square: Hệ số xác định, trong 100% sự biến động của biến Y thì bị chịu ảnh hưởng của 2 biến SM1 và AĐ2 ở mức độ nào.

+ Adjusted R square: Hệ số xác định mẫu điều chỉnh.

+ Standard Error: sai số chuẩn của Y do hồi quy.

+ Observations: số quan sát hay dung lƣợng mẫu.

Ở bảng phân tích phương sai thì:

+ Regression: do hồi quy.

+ Residual: do ngẫu nhiên.

+ df: số bậc tự do.

+ SS: tổng bình phương của mức độ (sai lệch) giữa các giá trị quan sát của y với giá trị bình quân của chúng.

+ MS: phương sai hay số bình quân của tổng bình quân độ lệch nói trên.

+ TSS Tổng bình phương của tất cả các mức sai lệch giữa giá trị quan sát với giá trị bình quân của chúng.

Ở bảng phân tích hồi quy:

+ Intercept: hằng số chặn, chỉ giá trị xuất phát của mô hình hồi quy.

+ X Variable 1, 2: lần lƣợt là hệ số, độ lệch chuẩn, tiêu chuẩn để kiểm định độ tin cậy, xác suất để kiểm định độ tin cậy .v.v.

40

CHƯƠNG V

Một phần của tài liệu Ứng dụng hệ thống thông tin địa lý trong quản lý dịch bệnh sốt xuất huyết theo không gian và thời gian (Trang 48 - 52)

Tải bản đầy đủ (PDF)

(97 trang)