Trường Đại học Kiến Trúc Hà Nội Khoa Công Nghệ Thông Tin Đề tài KHAI PHÁ DỮ LIỆU TỈ LỆ MẮC VÀ TỬ VONG DO VIRUS COVID 19 BẰNG THUẬT TOÁN PHÂN CỤM K MEANS Giảng viên hướng dẫn Đoàn Trung Sơn Nguyễn Thị[.]
Trường Đại học Kiến Trúc Hà Nội Khoa Công Nghệ Thông Tin Đề tài: KHAI PHÁ DỮ LIỆU TỈ LỆ MẮC VÀ TỬ VONG DO VIRUS COVID-19 BẰNG THUẬT TOÁN PHÂN CỤM K-MEANS Giảng viên hướng dẫn: Đoàn Trung Sơn Nguyễn Thị Khánh Trâm Sinh viên thực hiện: download by : skknchat@gmail.com Nguyễn Văn Thản Nội dung download by : skknchat@gmail.com I TỔNG QUAN ĐỀ TÀI Mục tiêu đề tài Đối tượng phương pháp nghiên cứu download by : skknchat@gmail.com Mục Tiêu Đề Tài: Sử dụng phương pháp nghiên cứu hồi cứu với hỗ trợ chuyên môn bác sĩ chuyên khoa, đề tài tiến hành nghiên cứu sở thuật toán phân cụm khai phá liệu download by : skknchat@gmail.com Đối tượng phương pháp nghiên cứu Đối tượng nghiên cứu: - Nghiên cứu thuật tốn k-means - Tình hình dịch covid-19 63 tỉnh thành Việt Nam Phương pháp nghiên cứu: Sử dụng phương pháp nghiên cứu hồi cứu với hỗ trợ chuyên môn bác sĩ chuyên khoa, đề tài tiến hành nghiên cứu sở thuật toán phân cụm khai phá liệu download by : skknchat@gmail.com Ý Nghĩa Đề Tài Ý nghĩa thực tiễn Ý nghĩa khoa học - Đánh giá tỷ lệ nhiễm , chết virus phát bệnh - Với trợ giúp máy tính, đề tài đóng góp biện pháp thực hỗ trợ cán - Góp phần chuẩn đốn sớm, điều trị y tế đánh giá bệnh cho bệnh nhân cho bệnh nhân download by : skknchat@gmail.com Cơ sở liệu Y khoa II.CƠ SỞ LÝ THUYẾT Kỹ thuật phân cụm Khai phá liệu download by : skknchat@gmail.com Thuật Toán KMeans Cơ sở liệu Y khoa Đại dịch COVID-19 đại dịch bệnh truyền nhiễm với tác nhân virus SARSCoV-2, diễn phạm vi toàn cầu.Khởi nguồn vào tháng 12 năm 2019 với tâm dịch ghi nhận thành phố Vũ Hán thuộc miền Trung Trung Quốc, bắt nguồn từ nhóm người mắc viêm phổi khơng rõ ngun nhân Các nhà khoa học Trung Quốc tiến hành nghiên cứu phân lập chủng loại corona virus mới, Tổ chức Y tế Thế giới lúc tạm thời gọi 2019-nCoV, có trình tự gen giống với SARS-CoV trước với mức tương đồng lên tới 79,5% download by : skknchat@gmail.com Khái niệm khai phá liệu Data mining – khai phá liệu trình phân loại, xếp tập hợp liệu lớn để xác định mẫu thiết lập mối liên hệ nhằm giải vấn đề nhờ phân tích liệu Các MCU khai phá liệu cho phép doanh nghiệp dự đốn xu hướng tương lai Quá trình khai phá liệu trình phức tạp bao gồm kho liệu chun sâu cơng nghệ tính tốn Hơn nữa, Data Mining khơng giới hạn việc trích xuất liệu mà cịn sử dụng để chuyển đổi, làm sạch, tích hợp liệu phân tích mẫu download by : skknchat@gmail.com Kỹ thuật phân cụm Khai phá liệu Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning Machine Learning Có nhiều định nghĩa khác kỹ thuật này, chất ta hiểu phân cụm qui trình tìm cách nhóm đối tượng cho vào cụm (clusters), cho đối tượng cụm tương tự (similar) đối tượng khác cụm khơng tương tự (Dissimilar) download by : skknchat@gmail.com Thuật Toán K-Means K-Means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm Tư tưởng thuật tốn K-Means tìm cách phân nhóm đối tượng (objects) cho vào K cụm (K số cụm xác đinh trước, K nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid ) nhỏ download by : skknchat@gmail.com Thuật toán K-Means thực qua bước sau: Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụm đại diện tâm cụm Tính khoảng cách đối tượng (objects) đến K tâm (thường dùng khoảng cách Euclidean) Nhóm đối tượng vào nhóm gần Xác định lại tâm cho nhóm Thực lại bước khơng có thay đổi nhóm đối tượng download by : skknchat@gmail.com III CHƯƠNG TRÌNH WEKA phần mềm khai tháᴄ liệu mã nguồn mở đượᴄ phát triển Đại họᴄ Wiᴄhita Giống RapidMiner, Weka không ᴄó mã hóa ᴠà ѕử dụng GUI đơn giản Sử dụng Weka, bạn ᴄó thể gọi trựᴄ tiếp ᴄáᴄ thuật tốn họᴄ máу hoặᴄ nhập ᴄhúng mã Jaᴠa Nó ᴄung ᴄấp loạt ᴄáᴄ ᴄông ᴄụ trựᴄ quan hóa, tiền хử lý, phân loại, phân ᴄụm, ᴠ.ᴠ download by : skknchat@gmail.com IV Kết Luận Sau thời gian thực hiện, em thực số kết sau: • Tìm hiểu khai phá liệu • Vai trị khai phá liệu • Tìm hiểu thuật tốn K-Means • Tìm hiểu K-means giải toán phân cụm người mắc bệnh chết tỉnh thành Em tìm hiểu lý thuyết xác suất đến thuật toán K-means Tuy độ xác cịn chưa cao chất phương pháp tập liệu chưa đủ lớn mong thầy giúp đỡ để tốn chúng em hoàn thiện download by : skknchat@gmail.com Thank For Watching download by : skknchat@gmail.com ... niệm khai phá liệu Data mining – khai phá liệu trình phân loại, xếp tập hợp liệu lớn để xác định mẫu thiết lập mối liên hệ nhằm giải vấn đề nhờ phân tích liệu Các MCU khai phá liệu cho phép doanh... skknchat@gmail.com Thuật Toán K-Means K-Means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm Tư tưởng thuật tốn K-Means tìm cách phân nhóm đối tượng (objects) cho vào K cụm (K số cụm xác đinh... hiểu khai phá liệu • Vai trị khai phá liệu • Tìm hiểu thuật tốn K-Means • Tìm hiểu K-means giải tốn phân cụm người mắc bệnh chết tỉnh thành Em tìm hiểu lý thuyết xác suất đến thuật tốn K-means