1. Trang chủ
  2. » Thể loại khác

NGHIÊN CỨU MỘT SỐ MÔ HÌNH DỰ BÁO DỊCH TẢ DỰA TRÊN KHAI PHÁ DỮ LIỆU VÀ PHÂN TÍCH KHÔNG GIAN ỨNG DỤNG CÔNG NGHỆ GIS

137 25 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 137
Dung lượng 16,01 MB

Nội dung

i HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - LÊ THỊ NGỌC ANH NGHIÊN CỨU MỘT SỐ MƠ HÌNH DỰ BÁO DỊCH TẢ DỰA TRÊN KHAI PHÁ DỮ LIỆU VÀ PHÂN TÍCH KHƠNG GIAN ỨNG DỤNG CƠNG NGHỆ GIS LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI – 2018 ii HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - LÊ THỊ NGỌC ANH NGHIÊN CỨU MỘT SỐ MƠ HÌNH DỰ BÁO DỊCH TẢ DỰA TRÊN KHAI PHÁ DỮ LIỆU VÀ PHÂN TÍCH KHƠNG GIAN ỨNG DỤNG CƠNG NGHỆ GIS CHUN NGÀNH : HỆ THỐNG THÔNG TIN MÃ SỐ : 9.48.01.04 LUẬN ÁN TIẾN SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Hoàng Phương TS Hoàng Xuân Dậu HÀ NỘI – 2018 iii LỜI CAM ĐOAN Tôi cam đoan nội dung luận án kết nghiên cứu thân Tất tham khảo từ nghiên cứu liên quan nêu rõ nguồn gốc cách rõ ràng danh mục tài liệu tham khảo đề cập phần sau luận án Những đóng góp luận án kết nghiên cứu tác giả công bố báo tác giả phần sau luận án chưa công bố cơng trình khoa học khác Tác giả luận án Lê Thị Ngọc Anh iv LỜI CẢM ƠN Trong suốt q trình học tập hồn thành luận án, nhận hướng dẫn, giúp đỡ quý báu thày, anh, chị, em bạn bè đồng nghiệp Với lòng kính trọng biết ơn sâu sắc xin bày tỏ lời cảm ơn chân thành tới: - Tập thể thày hướng dẫn PGS.TS Nguyễn Hoàng Phương Tiến sĩ Hoàng Xuân Dậu, hai người thày kính mến hết lòng giúp đỡ, dạy bảo, động viên tạo điều kiện thuận lợi cho tơi suốt q trình học tập hoàn thành luận án - PGS.TS Hà Quang Thụy, PGS.TS Nguyễn Hải Châu- Trường Đại Học Công nghệ - Đại học Quốc Gia Hà Nội đóng góp ý kiến vơ q báu q trình nghiên cứu hoàn thiện luận án - Tập cán Trung tâm nghiên cứu đào tạo nguồn nhân lực y tế, tập thể cán Trung tâm y tế dự phòng Hà nội, tập thể cán Trung tâm Nghiên cứu khí tượng thủy văn Trung ương, Sở khoa học công nghệ thành phố Hà nội tạo điều kiện cho tơi q trình thu thập số liệu tiến hành nghiên cứu - Xin gửi lời cảm ơn sâu sắc tới Ban giám đốc, Khoa quốc tế đào tạo Sau đại học Học viên Cơng nghệ Bưu Viễn thơng giúp đỡ tạo điều kiện thuận lợi trình học tập nghiên cứu - Xin gửi lời cảm ơn tới Ban Giám Hiệu, Ban quản lý dự án Việt Nam – Hà Lan, Phòng Cơng nghệ thơng tin Trường Đại học Y Hà Nội, bạn bè, đồng nghiệp giúp đỡ, động viên lúc gặp khó khăn tạo điều kiện thuận lợi cho tơi thực nghiên cứu hồn thành luận án - Xin dành tất yêu thương lời cảm ơn tới gia đình, bố mẹ, anh chị em người thân bên cạnh động viên giúp đỡ học tập, làm việc hoàn thành luận án Xin chân thành cảm ơn v MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN iv DANH MỤC CÁC TỪ VIẾT TẮT viii DANH MỤC CÁC KÝ HIỆU ix DANH MỤC HÌNH VẼ x DANH MỤC BẢNG xii DANH MỤC BIỂU ĐỒ xiii MỞ ĐẦU Tính cấp thiết Tình hình nghiên cứu Lý chọn đề tài Mục tiêu tổng quát Mục tiêu cụ thể Đối tượng phạm vi nghiên cứu Những đóng góp luận án Cấu trúc luận án CHƯƠNG 1: TỔNG QUAN VỀ CÁC MƠ HÌNH DỰ BÁO DỊCH BỆNH 1.1 Khái niệm thuật ngữ 1.1.1 Khái niệm 1.1.2 Một số thuật ngữ liên quan 1.2 Tổng quan dự báo dịch bệnh mơ hình dự báo có 1.2.1 Một số mơ hình dự báo dịch bệnh 1.2.2 Một số kỹ thuật xây dựng mơ hình dự báo phổ biến 18 1.2.3 Nhận xét mơ hình dự báo dịch bệnh có 30 1.3 Dịch tả nhu cầu dự báo dịch tả 33 1.4 Định hướng nghiên cứu luận án 36 vi 1.5 Dữ liệu sử dụng nghiên cứu tiền xử lý liệu 36 1.5.1 Dữ liệu sử dụng nghiên cứu 37 1.5.2 Tiền xử lý liệu 38 1.6 Kết luận 41 CHƯƠNG 2: DỰ BÁO DỊCH TẢ DỰA TRÊN KHAI PHÁ LUẬT KẾT HỢP VÀ HỒI QUI, PHÂN LỚP 42 2.1.Dự báo dịch tả dựa khai phá luật kết hợp 42 2.1.1 Khai phá luật kết hợp sử dụng thuật toán Apriori 42 2.1.2 Kết thử nghiệm 44 2.1.3 Nhận xét 46 2.2 Dự báo dịch tả dựa học máy hồi qui, phân lớp 47 2.2.1 Bài toán dự báo với kỹ thuật hồi qui 47 2.2.2 Dự báo với kỹ thuật phân lớp 49 2.2.3 Dự báo bệnh tả dựa học máy hồi qui phân lớp 51 2.2.4.Kết thử nghiệm 56 2.2.5 Hiệu chỉnh mô hình dự báo với liệu khơng cân 63 2.3 Kết luận 65 CHƯƠNG 3: ẢNH HƯỚNG CỦA YẾU TỐ KHÍ HẬU VÀ ĐỊA LÝ TRONG DỰ BÁO DỊCH TẢ NGẮN HẠN 67 3.1 Xây dựng mơ hình dự báo dịch tả ngắn hạn 67 3.2 Thực nghiệm đánh giá mơ hình 70 3.3 Mối quan hệ độ xác khoảng thời gian dự báo 73 3.4 Mức độ quan trọng biến khí hậu 74 3.5 Nhận xét 75 3.6 Kết luận 76 vii CHƯƠNG 4: DỰ BÁO DỊCH TẢ DỰA TRÊN PHÂN TÍCH KHƠNG GIAN VỚI CÔNG NGHỆ GIS 77 4.1 Mơ hình dự báo đề xuất dựa phân tích khơng gian 77 4.2 Kết thực nghiệm 80 4.2.1 Phân tích điểm nóng dịch tả 80 4.2.2.Xây dựng mơ hình hồi qui đa biến dự báo dịch tả địa bàn Tp Hà Nội 84 4.3 Nhận xét 92 4.4 Kết luận 93 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 94 Kết luận 94 Những hạn chế luận án 97 Hướng nghiên cứu 97 DANH MỤC CÁC BÀI BÁO CÔNG BỐ 99 TÀI LIỆU THAM KHẢO 100 PHỤ LỤC 110 Phụ lục1 Kết tập luật thu nhận có độ thống kê lớn 110 Phụ lục Kết thực nghiệm mô hình dự báo cục với hai thuật tốn hồi quy ba phân lớp cho 29 quận/huyện Hà Nội 112 Phụ lục 3: Kết hồi qui độ quan trọng biến khí hậu 117 Phụ lục Kết thực nghiệm mơ hình GWR cho năm từ 2007-2010 122 viii DANH MỤC CÁC TỪ VIẾT TẮT DIỄN GIẢI TỪ VIẾT TẮT TIẾNG ANH TIẾNG VIỆT AIC Akaite's Information Criterion Chuẩn số thông tin CC Correlation coefficient Hệ số tương quan DT Decission Trees Cây định GIS Geographic Information System Hệ thống thông tin đại lý Geographically Weighted Hồi qui trọng số không gian GWR Regression IDW Inverse Distance Weight Nội suy số không gian kNN K Nearest Neighbors Thuật toán K láng giềng LM Linear Regression Hồi qui tuyến tính MAE Mean Absolute error Sai số tuyệt đối MSE Mean square error Sai số qn phương Multi Dimensional Mơ hình Makov đa chiều không đồng Inhomogeneous Makov Chain MDIMC Hồi qui ước lượng bình phương nhỏ OLS Ordinary Least square RF Random Forest Rừng ngẫu nhiên RMSE Root mean square error Sai số quân phương SOI Southern Oscillation Index SIR Susceptible – Infectious- Recoved Mơ hình lan truyền dịch bệnh SVM Support Vector Machine Máy vector hỗ trợ V.vibrios Vibrio Cholera Vi khuẩn tả Chỉ số dao động phía nam đo thay đổi cường độ ElNino Lania ix DANH MỤC CÁC KÝ HIỆU KÝ HIỆU DIỄN GIẢI KPDL Khai phá liệu CSDL Cơ sở liệu β Tốc độ truyền nhiễm γ Tỷ lệ hồi phục R0 Lượng tái nhiễm β Tốc độ truyền nhiễm Dexample Tập liệu tài nguyên cư cho xây dựng mơ hình Dtest Tập liệu để kiểm thử đánh giá mơ hình DL1 Tập liệu theo ngày DL2 Tập liệu theo tháng KHi Giá trị khí hậu thời điểm i QHi Quận/ huyện thứ i LCQHi Quận/huyện lân cận QHi DTi,t Giá trị dịch tả QHi thời điểm t Giá trị dịch tả quận/huyện lân cận với quận/huyện xem DTLCi,t DTt-2 xét thời điểm t Giá trị dịch tả thời thời điểm khứ tháng trước x DANH MỤC HÌNH VẼ Hình 1.2 Q trình chuyển đổi tỷ lệ dương tính 14 Hình 1.3: Giải thuật rừng ngẫu nhiên 25 Hình 2.1 50 luật thu với độ đo thống kê lớn 45 Hình 2.2 Quá trình học sử dụng hàm hồi quy 48 Hình 2.3 Quá trình học sử dụng mơ hình (bộ) phân lớp 50 Hình 2.4 Lưu đồ xây dựng mơ hình dự báo dịch tả dựa hồi qui, phân lớp 54 Hình 3.1 Minh họa việc huấn luyện mơ hình hồi qui RF theo phương pháp cửa sổ trượt có độ trễ thời gian 70 Hình 3.2 Minh họa so sánh độ xác dự báo ba mơ hình với khoảng dự báo ngày quận Đống Đa,Bai Đình, Ứng Hòa, Sóc Sơn 71 Hình 3.3 So sánh ảnh hưởng nhóm biến khí hậu nhóm biến lân cận đến độ xác mơ hình với độ đo R2: (a),(b),(c),(d) ứng với khoảng dự báo trước 3,7,14 30 ngày 72 Hình 3.4 So sánh tính xác mơ hình Đầy đủ với độ dài dự đốn khác 74 Hình 3.5 Mức độ quan trọng biến khí hậu mơ hình hồi qui RF 75 Hình 4.1 Mơ hình dự báo đề xuất dựa phân tích khơng gian 79 Hình 4.2 Phân tích điểm nóng số ca bệnh tả tháng 2, 80 Hình 4.3 Phân tích điểm nóng số ca bệnh tả tháng 4, 81 Hình 4.4 Phân tích điểm nóng số ca bệnh tả tháng 6, 81 Hình 4.5 Phân tích điểm nóng số ca bệnh tả tháng 8, 82 Hình 4.6 Phân tích điểm nóng số ca bệnh tả tháng 10, 11 82 Hình 4.7 Phân tích điểm nóng số ca bệnh tả năm 2004, 2007 83 Hình 4.8 Phân tích điểm nóng số ca bệnh tả năm 2008, 2009 84 Hình 4.9 Phân tích điểm nóng số ca bệnh tả năm 2010 84

Ngày đăng: 29/04/2020, 13:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Lê Thị Ngọc Anh, Nguyễn Thị Lan Hương, Nguyễn Hoàng Long và cộng sự (2012). Thiết lập mô hình cảnh báo với độ chễ thời gian cho dịch sốt xuất huyết Dengue tại Hà Nội. Tạp chí nghiên cứu y học, 83 (3), 186-192 Sách, tạp chí
Tiêu đề: Tạp chí nghiên cứu y học
Tác giả: Lê Thị Ngọc Anh, Nguyễn Thị Lan Hương, Nguyễn Hoàng Long và cộng sự
Năm: 2012
2. Lê Thị Ngọc Anh và Nguyễn Minh Sơn (2009). Ứng dụng hệ thống thông tin địa lý (GIS) để xây dung hệ thống bản đồ dịch tễ học về tình trạng lây nhiễm HIV và sử dụng ma túy trong các quận huyện của thành phố Hà Nội. Tạp chí nghiên cứu y học, 4 (3), 134-141 Sách, tạp chí
Tiêu đề: Tạp chí nghiên cứu y học
Tác giả: Lê Thị Ngọc Anh và Nguyễn Minh Sơn
Năm: 2009
5. Nguyễn Văn Hiếu (1984). Đặc điểm dịch tễ học về các vụ dịch tả ở Hải Phòng năm 1976-1981 tại Hải Phòng, Đại học Y Hà Nội Sách, tạp chí
Tiêu đề: Đặc điểm dịch tễ học về các vụ dịch tả ở Hải Phòng năm 1976-1981 tại Hải Phòng
Tác giả: Nguyễn Văn Hiếu
Năm: 1984
6. Công ty IBM (2011). Báo cáo phân tích dự báo trong chăm sóc y tế. Tạp chí Công nghệ thông tin - Truyền thông, 4 (17), 23-26 Sách, tạp chí
Tiêu đề: Tạp chí Công nghệ thông tin - Truyền thông
Tác giả: Công ty IBM
Năm: 2011
7. Nguyễn Kim Lợi, Lê Cảnh Định và Trần Thống Nhất (2009). Hệ thống thông tin địa lý nâng cao, NXB Nông nghiệp Sách, tạp chí
Tiêu đề: Hệ thống thông tin địa lý nâng cao
Tác giả: Nguyễn Kim Lợi, Lê Cảnh Định và Trần Thống Nhất
Nhà XB: NXB Nông nghiệp
Năm: 2009
8. Thành phố Hà nội (2011). Báo cáo tổng thể hiện trạng môi trường thành phố Hà Nội giai đoạn 5 năm 2006-2010, Ủy ban nhân dân thành phố Hà Nội, 9. Nguyễn Đình Sơn, Nguyễn Thái Hòa và Dương Quang Minh (2005). Một sốđặc điểm dịch tế học bệnh tả tại tỉnh Thừa Thiên Huế,. Tạp chí y học dự phòng,, 29740, 194-197 Sách, tạp chí
Tiêu đề: Báo cáo tổng thể hiện trạng môi trường thành phố Hà Nội giai đoạn 5 năm 2006-2010", Ủy ban nhân dân thành phố Hà Nội, 9. Nguyễn Đình Sơn, Nguyễn Thái Hòa và Dương Quang Minh (2005). Một số đặc điểm dịch tế học bệnh tả tại tỉnh Thừa Thiên Huế,. "Tạp chí y học dự phòng
Tác giả: Thành phố Hà nội (2011). Báo cáo tổng thể hiện trạng môi trường thành phố Hà Nội giai đoạn 5 năm 2006-2010, Ủy ban nhân dân thành phố Hà Nội, 9. Nguyễn Đình Sơn, Nguyễn Thái Hòa và Dương Quang Minh
Năm: 2005
13. Gray A, Greenhalgh D, Hu L et al (2011). A Stochastic Differential Equation SIS Epidemic Model. SIAM Journal of Applied Mathematics 71 (3), 876-902 Sách, tạp chí
Tiêu đề: SIAM Journal of Applied Mathematics
Tác giả: Gray A, Greenhalgh D, Hu L et al
Năm: 2011
14. Huq A, Sack RB (2005). Critical factors in uencing the occurrence of Vibrio cholerae in the environment of Bangladesh. Applied and Environmental Microbiology, 71 (8), 4645-4654 Sách, tạp chí
Tiêu đề: Applied and Environmental Microbiology
Tác giả: Huq A, Sack RB
Năm: 2005
15. Rakesh Agrawal, Tomasz Imielinski, Arun Swami (1993). Mining association rules between sets of items in large databases. In Proc. of theACM SIGMOD Conference on Management of Data,, 207-216 Sách, tạp chí
Tiêu đề: In Proc. of theACM SIGMOD Conference on Management of Data
Tác giả: Rakesh Agrawal, Tomasz Imielinski, Arun Swami
Năm: 1993
17. Agrawal.R, Mannila.H, Srikant.R et al (1996). Fast discovery of association rules. Advances in knowledge discovery and data mining, American Association for Artificial Intelligence, Menlo Park, CA, USA, 307-328 Sách, tạp chí
Tiêu đề: Advances in knowledge discovery and data mining
Tác giả: Agrawal.R, Mannila.H, Srikant.R et al
Năm: 1996
18. Gil AI, Louis VR, Rivera ING (2004). Occurrence and distribution of Vibrio cholerae in the coastal environment of Peru. Environmental Microbiology., 6 (7), 699-706 Sách, tạp chí
Tiêu đề: Environmental Microbiology
Tác giả: Gil AI, Louis VR, Rivera ING
Năm: 2004
19. Dang Duc Anh, Anna Lena Lopez, Vu Dinh Thiem et al (2011). Use of oral cholera vaccines in an outbreak in Vietnam: a case control study. PLoS Neglected Tropical Diseases, 5 (1) Sách, tạp chí
Tiêu đề: PLoS Neglected Tropical Diseases
Tác giả: Dang Duc Anh, Anna Lena Lopez, Vu Dinh Thiem et al
Năm: 2011
20. Rasam ARA, Ghazali R, Noor AMM et al (2014). Spatial epidemiological techniques in cholera mapping and analysis towards a local scale predictive modelling. IOP Conference Series: Earth and Environmental Science., IOP Publishing Sách, tạp chí
Tiêu đề: IOP Conference Series: Earth and Environmental Science
Tác giả: Rasam ARA, Ghazali R, Noor AMM et al
Năm: 2014
21. Lobitz B, Beck L, Huq A et al (2000). Climate and infectious disease: use of remote sensing for detection of Vibrio cholerae by indirect measurement.Proceedings of the National Academy of Sciences, 97 1438–1443 Sách, tạp chí
Tiêu đề: Proceedings of the National Academy of Sciences
Tác giả: Lobitz B, Beck L, Huq A et al
Năm: 2000
22. Osei Frank B, Alfred A Duker, Alfred Stein (2012). Cholera and Spatial Epidemiology, INTECH Open Access Publisher Sách, tạp chí
Tiêu đề: Cholera and Spatial Epidemiology
Tác giả: Osei Frank B, Alfred A Duker, Alfred Stein
Năm: 2012
23. Osei Frank B, Alfred A. Duker. (2008). Spatial dependency of V. cholera prevalence on open space refuse dumps in Kumasi, Ghana: a spatial statistical modelling. International Journal of Health Geographics 7(1) Sách, tạp chí
Tiêu đề: International Journal of Health Geographics
Tác giả: Osei Frank B, Alfred A. Duker
Năm: 2008
27. Martin Charlton, Stewart Fotheringham, Chris Brunadon (2005). Geographically Weighted Regression, ESRC National Centre for Research Methods Sách, tạp chí
Tiêu đề: Geographically Weighted Regression
Tác giả: Martin Charlton, Stewart Fotheringham, Chris Brunadon
Năm: 2005
29. Colin Childs (2004). Interpolating Surfaces in ArcGIS: spatial analyst, ESRI Education Sách, tạp chí
Tiêu đề: Interpolating Surfaces in ArcGIS: spatial analyst
Tác giả: Colin Childs
Năm: 2004
31. Rita R Colwell (1996). Global climate and infectious disease: the cholera paradigm. Science, 274 (5295), 2025–2031 Sách, tạp chí
Tiêu đề: Science
Tác giả: Rita R Colwell
Năm: 1996
32. Adele Cutler. (2015). Random Forests: Statistical Methods for Prediction and Understanding., < http://www.math.usu.edu/~adele/RandomForests/index.htm.http://www.math.usu.edu/~adele/RandomForests/Ovronnaz.pdf&gt Link

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w