(TIỂU LUẬN) đề tài khai phá dữ liệu tỉ lệ mắc và tử vong do virus covid 19 bằng thuật toán phân cụm k means

15 3 0
(TIỂU LUẬN) đề tài khai phá dữ liệu tỉ lệ mắc và tử vong do virus covid 19 bằng thuật toán phân cụm k means

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trường Đại học Kiến Trúc Hà Nội Khoa Công Nghệ Thông Tin Đề tài: KHAI PHÁ DỮ LIỆU TỈ LỆ MẮC VÀ TỬ VONG DO VIRUS COVID-19 BẰNG THUẬT TOÁN PHÂN CỤM K-MEANS Giảng viên hướng dẫn: Đoàn Trung Sơn Nguyễn Thị Khánh Trâm Sinh viên thực hiện: Nguyễn Văn Thản Nội dung KẾT LUẬN I TỔNG QUAN ĐỀ TÀI Mục tiêu đề tài Đối tượng phương pháp nghiên cứu Mục Tiêu Đề Tài: Sử dụng phương pháp nghiên cứu hồi cứu với hỗ trợ chuyên môn bác sĩ chuyên khoa, đề tài tiến hành nghiên cứu sở thuật toán phân cụm khai phá liệu Đối tượng phương pháp nghiên cứu Đối tượng nghiên cứu: - Nghiên cứu thuật tốn k-means - Tình hình dịch covid-19 63 tỉnh thành Việt Nam Phương pháp nghiên cứu: Sử dụng phương pháp nghiên cứu hồi cứu với hỗ trợ chuyên môn bác sĩ chuyên khoa, đề tài tiến hành nghiên cứu sở thuật toán phân cụm khai phá liệu Ý Nghĩa Đề Tài Ý nghĩa thực tiễn - - Đánh giá tỷ lệ nhiễm , chết virus Ý nghĩa khoa học - Với trợ giúp máy tính, đề tài đóng phát bệnh góp biện pháp thực hỗ trợ cán Góp phần chuẩn đốn sớm, điều trị y tế đánh giá bệnh cho bệnh nhân cho bệnh nhân Cơ sở liệu Y khoa II.CƠ SỞ LÝ THUYẾT Kỹ thuật phân cụm Khai phá liệu Thuật Toán KMeans Cơ sở liệu Y khoa Đại dịch COVID-19 đại dịch bệnh truyền nhiễm với tác nhân virus SARSCoV-2, diễn phạm vi toàn cầu.Khởi nguồn vào tháng 12 năm 2019 với tâm dịch ghi nhận thành phố Vũ Hán thuộc miền Trung Trung Quốc, bắt nguồn từ nhóm người mắc viêm phổi không rõ nguyên nhân Các nhà khoa học Trung Quốc tiến hành nghiên cứu phân lập chủng loại corona virus mới, Tổ chức Y tế Thế giới lúc tạm thời gọi 2019-nCoV, có trình tự gen giống với SARS-CoV trước với mức tương đồng lên tới 79,5% Khái niệm khai phá liệu Data mining – khai phá liệu trình phân loại, xếp tập hợp liệu lớn để xác định mẫu thiết lập mối liên hệ nhằm giải vấn đề nhờ phân tích liệu Các MCU khai phá liệu cho phép doanh nghiệp dự đốn xu hướng tương lai Quá trình khai phá liệu trình phức tạp bao gồm kho liệu chun sâu cơng nghệ tính tốn Hơn nữa, Data Mining khơng giới hạn việc trích xuất liệu mà cịn sử dụng để chuyển đổi, làm sạch, tích hợp liệu phân tích mẫu Kỹ thuật phân cụm Khai phá liệu Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning Machine Learning Có nhiều định nghĩa khác kỹ thuật này, chất ta hiểu phân cụm qui trình tìm cách nhóm đối tượng cho vào cụm (clusters), cho đối tượng cụm tương tự (similar) đối tượng khác cụm khơng tương tự (Dissimilar) Thuật Tốn K-Means K-Means thuật toán quan trọng sử dụng phổ biến kỹ thuật phân cụm Tư tưởng thuật tốn K-Means tìm cách phân nhóm đối tượng (objects) cho vào K cụm (K số cụm xác đinh trước, K nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid ) nhỏ Thuật tốn K-Means thực qua bước sau: Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụm đại diện tâm cụm Tính khoảng cách đối tượng (objects) đến K tâm (thường dùng khoảng cách Euclidean) Nhóm đối tượng vào nhóm gần Xác định lại tâm cho nhóm Thực lại bước khơng có thay đổi nhóm đối tượng III CHƯƠNG TRÌNH WEKA phần mềm khai tháᴄ liệu mã nguồn mở đượᴄ phát triển Đại họᴄ Wiᴄhita Giống RapidMiner, Weka khơng ᴄó mã hóa ᴠà ѕử dụng GUI đơn giản Sử dụng Weka, bạn ᴄó thể gọi trựᴄ tiếp ᴄáᴄ thuật toán họᴄ máу hoặᴄ nhập ᴄhúng mã Jaᴠa Nó ᴄung ᴄấp loạt ᴄáᴄ ᴄơng ᴄụ trựᴄ quan hóa, tiền хử lý, phân loại, phân ᴄụm, ᴠ.ᴠ IV Kết Luận Sau thời gian thực hiện, em thực số kết sau: • Tìm hiểu khai phá liệu • Vai trị khai phá liệu • Tìm hiểu thuật tốn K-Means • Tìm hiểu K-means giải toán phân cụm người mắc bệnh chết tỉnh thành Em tìm hiểu lý thuyết xác suất đến thuật toán K-means Tuy độ xác cịn chưa cao chất phương pháp tập liệu chưa đủ lớn mong thầy giúp đỡ để tốn chúng em hoàn thiện Thank For Watching ... K? ?? thuật phân cụm Khai phá liệu Phân cụm k? ?? thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning Machine Learning Có nhiều định nghĩa khác k? ?? thuật này, chất ta hiểu phân. .. Y khoa II.CƠ SỞ LÝ THUYẾT K? ?? thuật phân cụm Khai phá liệu Thuật Toán KMeans Cơ sở liệu Y khoa Đại dịch COVID- 19 đại dịch bệnh truyền nhiễm với tác nhân virus SARSCoV-2, diễn phạm vi toàn cầu.Khởi... loại, phân ᴄụm, ᴠ.ᴠ IV K? ??t Luận Sau thời gian thực hiện, em thực số k? ??t sau: • Tìm hiểu khai phá liệu • Vai trị khai phá liệu • Tìm hiểu thuật tốn K- Means • Tìm hiểu K- means giải toán phân cụm

Ngày đăng: 08/12/2022, 03:38

Tài liệu cùng người dùng

Tài liệu liên quan