50 luật thu được với độ đo thống kê lớn hơ n1

Một phần của tài liệu 1-Luanan-NCS-LeThiNgocAnh (Trang 58 - 61)

Bảng 2.1.Trích một số luật trong số 50 luật kết hợp sinh từ bộ dữ liệu

Rule LHS RHS Support Confidence Lift

#

R1 {Đống Đa, Hai Bà Trưng, Hồng Mai} {ThanhXuan} 0.3027027 0.8615385 2.097166

R2 {Đống Đa, Hồng Mai} {Cầu Giấy} 0.3081081 0.7307692 2.048368

R3 {Hai Bà Trưng, Hồng Mai} {ThanhXuan} 0.3081081 0.8260870 2.010870

………

R9 {Từ Liêm} {ThanhXuan} 0.3027027 0.7272727 1.770335

R10 {Thanh Xuân} {Từ Liêm} 0.3027027 0.7368421 1.770335

………

R49 {Hà Đơng} {Hồng Mai} 0.3027027 0.7466667 1.354248

R50 {Hai Bà Trưng} {Hồng Mai} 0.3729730 0.7113402 1.290176

Các quận xuất hiện trong cả vế trái và vế phải của 50 luật kết hợp bao gồm 9 quận/huyện: Đống Đa, Hai Bà Trưng, Hồng Mai, Thanh Xuân, Từ Liêm, Hà Đơng, Ba Đình, Cầu Giấy và Hồn Kiếm, trong đĩ chỉ cĩ quận Hồn Kiếm khơng cĩ con

sơng nào chảy qua địa bàn. Xem xét các yếu tố thủy văn Hà Nội cĩ ảnh hưởng đến sự lây lan của dịch tả , cĩ 3 con sơng bị ơ nhiễm nặng chảy qua thành phố Hà Nội, bao gồm sơng Tơ Lịch, sơng Kim Ngưu và sơng Nhuệ [8]. Các con sơng này chảy qua một số quận/huyện như thể hiện trong Bảng 2.2. Bảng 2.2 cũng cho biết danh sách các quận/huyện tiếp giáp với quận/huyện bị ơ nhiễm bởi các con sơng chảy qua.

Bảng 2.2. Các quận/huyện cĩ sơng ơ nhiễm chảy qua và các quận/huyện tiếp giáp

Quận/Huyện Các sơng chảy qua Quận/huyện tiếp giáp

Ba Đình Tơ Lịch Hồn Kiếm, Cầu Giấy, Đống Đa

Cầu Giấy Tơ Lịch Từ Liêm, Ba Đình, Cầu Giấy, Đống Đa

Đống Đa Tơ Lịch Hồn Kiếm, Cầu Giấy, Ba Đình, Hai Bà Trưng, Thanh Xuân

Hà Đơng Nhuệ Từ Liêm, Thanh Xuân

Hai Bà Trưng Kim Ngưu Hồn Kiếm, Hồng Mai, Thanh Xuân, Đống Đa

Hồng Mai Kim Ngưu, Tơ Lịch Hai Bà Trưng, Thanh Xuân

Hồn Kiếm Ba Đình, Hai Bà Trưng, Đống Đa

Thanh Xuân Tơ Lịch, Kim Ngưu Cầu Giấy, Hà Đơng, Hồng Mai, Đống Đa

Từ Liêm Nhuệ Cầu Giấy, Hà Đơng, Thanh Xuân

2.1.3. Nhận xét

Nghiên cứu này khai phá các luật kết hợp số ca bệnh tả với dữ liệu thủy hệ của Hà Nội và từ kết quả nghiên cứu cĩ thể rút ra một số nhận định:

• Các ca mắc tả cĩ xu hướng cùng xuất hiện tại các quận/huyện cĩ các con sơng ơ nhiễm của thành phố Hà Nội là Tơ Lịch, Kim Ngưu, Nhuệ chảy qua địa bàn với độ chắc chắn cao (trên 70%);

• Các ca mắc tả tại các quận cĩ các sơng ơ nhiễm chảy qua địa bàn và các ca mắc tả tại các quận tiếp giáp, như Hồn Kiếm cĩ xu hướng cùng xảy ra với độ chắc chắn cao (trên 70%).

Kết quả nghiên cứu cho thấy xu hướng cùng xuất hiện ca bệnh tả tại các

quận/huyện cĩ sơng ơ nhiễm chảy qua tại Hà Nội dựa trên khai phá luật kết hợp tương đồng với kết quả các nghiên cứu về bệnh tả trên thế giới và Việt Nam trước đây [54], [88] [85], [80], [5], [9]. Điều này khẳng định khai phá luật kết hợp phù hợp với mơ hình dự báo dịch tả trong điều kiện dữ liệu phân bố khơng chuẩn và khơng cĩ sự

nghiên cứu mới là bước đầu, nhưng với kết quả là tập các luật kết hợp với độ tin cậy và độ chắc chắn khá cao cĩ thể sử dụng như là một trong các yếu tố hỗ trợ ra quyết định trong cơng tác phịng chống dịch tại thành phố Hà Nội. Đây là một bằng chứng khoa học cĩ giá trị thể hiện tính lân cận khơng gian giữa các quận huyện cĩ ảnh hưởng đến mơ hình dự báo. Nghiên cứu này đã đăng trong kỷ yếu hội nghị quốc tế về Truyền thơng quản lý và viễn thơng 2015 (ComManTel2015) tại Đà Nẵng - Việt Nam.

2.2 Dự báo dịch tả dựa trên học máy hồi qui, phân lớp2.2.1 Bài tốn dự báo với kỹ thuật hồi qui 2.2.1 Bài tốn dự báo với kỹ thuật hồi qui

Kỹ thuật hồi qui được chia thành hai lớp chính là hồi qui tuyến tính và hồi qui phi tuyến theo dạng của hàm dự báo f trong mơ hình dự báo. Kỹ thuật hồi qui (tuyến tính hay phi tuyến) đều hướng tới mơ hình hồi qui khớp nhất với tập dữ liệu Dlearn cĩ nghĩa là quá trình xây dựng hàm hồi qui được quy về một bài tốn xác định tham số với ràng buộc sai số giá trị biến đầu ra thực tế với giá trị biến đầu ra theo mơ hình là cực tiểu. Hình 2.2 mơ tả minh họa một ví dụ sử dụng kỹ thuật hồi qui xây dựng mơ hình dự báo dịch tả. Giả sử, với đơn vị thời gian là một tháng, sau bước khảo sát dữ liệu dịch tả và khí hậu, chúng ta lựa chọn các biến sau đây (KHi, DTi) là giá trị khí hậu (KHi) và giá trị dịch tả (DTi) vào thời điểm thứ i tại quận/huyện đang được xem xét. Giá trị dịch tả của các quận/huyện lân cận với quận/huyện đang xét tại thời điểm

i được ký hiệu là DTLCi. Giả sử cần dự báo cho một tháng tiếp theo đối với quận huyện đang xem xét. Phân tích bài tốn cho thấy giá trị biến dịch tả vào thời điểm thứ t là DTt phụ thuộc vào các giá trị: (i) giá trị dịch tả của quận/huyện đang xem xét ở thời điểm trước đĩ DTt-2, giá trị biến dịch tả ở vùng phụ cận ở thời điểm trước đĩ DTLCt-2, giá trị biến khí hậu của quận/huyện đang xem xét thời điểm trước đĩ KHt-2.

Một phần của tài liệu 1-Luanan-NCS-LeThiNgocAnh (Trang 58 - 61)

Tải bản đầy đủ (DOC)

(137 trang)
w