1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

72 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 72
Dung lượng 3,35 MB

Nội dung

i∣ — HỌC VIỆN NGÂN HÀNG HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ ^r⅛6 AC KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID-19 BÙI PHƯƠNG ANH HÀ NỘI - 2020 KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC •••• ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HƠ HẤP CẤP COVID-19 Giáo viên hướng dẫn : TS Chu Thị Hồng Hải Sinh viên thực : Bùi Phương Anh Mã sinh viên : 19A4040001 Lớp : HTTTA Khóa : 19 Hệ : Đại học quy HÀ NỘI - 2020 Khóa luận tốt nghiệp LỜI CẢM ƠN Kính thưa Quý Thầy Cô! Sau thời gian nghiên cứu, gắn bó học tập trường Học viện Ngân hàng dẫn dắt giảng viên trường, em nhận nhiều kiến thức quý báu chuyên ngành ngồi sống, hành trang em trường bước vào đời Và này, em xin gửi lời cám ơn chân thành tới Thầy, Cô Học viện Ngân hàng, đặc biệt GVHD TS Chu Thị Hồng Hải, người trực tiếp hướng dẫn, thầy ln tận tình giúp đỡ, sữa chữa lỗi để em hồn thành đề tài khóa luận tốt nghiệp Do hạn chế kiến thức thời gian, nên nội dung khóa luận khơng tránh khỏi sai sót, hạn chế Vì vậy, em mong góp ý q báu từ Thầy Cơ để khóa luận em hoàn thiện Cuối lời, em xin trân trọng cảm ơn thầy cô giáo giảng dạy Khoa Hệ thống thông tin quản lý - Học viện Ngân hàng đặc biệt giáo viên hướng dẫn, Tiến sỹ Chu Thị Hồng Hải tận tình giúp đỡ, tạo điều kiện cho em suốt trình thực hồn thành khóa luận tốt nghiệp Em xin chân thành cám ơn! Hà Nội, ngày 14 tháng 06 năm 2020 Sinh viên thực Bùi Phương Anh - 19A4040001 Page | i Khóa luận tốt nghiệp LỜI CAM ĐOAN Em xin cam đoan cơng trình nghiên cứu riêng em, hồn thiện hướng dẫn TS.Chu Thị Hồng Hải - Giảng viên Khoa Hệ thống thông tin quản lý - Học viện Ngân hàng Các nội dung nghiên cứu, kết nêu khóa luận hồn tồn trung thực Những số liệu thông tin phục vụ cho việc phân tích đánh giá thu thập từ nguồn trích rõ Danh mục tài liệu Ngồi ra, khóa luận có sử dụng số nhận xét, đánh giá, thông tin từ số tài liệu có trích dẫn thích nguồn gốc Nếu phát có gian lận nào, em xin hồn tồn chịu trách nhiệm nội dung khóa luận Bùi Phương Anh Bùi Phương Anh - 19A4040001 Page | ii Khóa luận tốt nghiệp NHẬN XÉT (Của giáo viên hướng dẫn) mặt: Mục đích đề tài; Tính thời ứng dụng đề tài; Bố cục hình thức trình bầy đề tài; Ket thực đề tài; Ý thức, thái độ sinh viên trình thực đề tài Kết luận Hà Nội, ngày tháng năm 2020 Giáo viên hướng dẫn (Ký tên) Bùi Phương Anh - 19A4040001 Page | iii Khóa luận tốt nghiệp MỤC LỤC LỜI CẢM ƠN I LỜI CAM ĐOAN II DANH MỤC CÁC CHỮ VIẾTTẮT VI DANH MỤC BẢNG BIỂU VII DANH MỤC HÌNH VẼ VIII LỜI MỞ ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU 1.1 Tổng quan khai phá liệu 1.1.1 Khái niệm khai phá liệu 1.1.2 Các kỹ thuật áp dụng khai phá liệu 1.1.3 Kiến trúc hệ thống khai phá liệu 1.1.4 Lợi ích khai phá liệu 1.1.5 Ứng dụng khai phá liệu 1.2 Khai phá liệu web 1.2.1 Khái niệm khai phá liệu web .9 1.2.2 Lợi ích khai phá liệu web 10 1.2.3 Các kiểu liệu web 11 1.3 Một số phương pháp tiếp cận khai phá liệu Web .12 1.3.1 Phương pháp khai phá nội dung Web 12 1.3.2 Khai phá cấu trúc web 16 1.3.3 Khai phá sử dụng web 17 1.4 Tổng quan trích chọn thơng tin Xử lý ngơn ngữ tự nhiên .17 1.4.1 Trích chọn thông tin 17 1.4.2 Xử lý ngôn ngữ tự nhiên 19 1.5 Kết luận chương .20 CHƯƠNG 2: THỰC TRẠNG CUNG CẤP THÔNG TIN VỀ DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID-19 TRÊN WEB 21 2.1 Thực trạng Việt Nam .21 2.1.1 Bối cảnh dịch bệnh Việt Nam 22 2.1.2 Thực trạng cung cấp thông tin Việt Nam 23 2.1.3 Một số website thống cung cấp thơng tin Việt Nam 25 2.2 Thực trạng giới 29 2.2.1 Bối cảnh giới 30 2.2.2 Thực trạng cung cấp thông tin giới 31 2.2.3 Một số website ứng dụng cung cấp thông tin tiêu biểu giới 32 2.3 Kết luận chương .35 Bùi Phương Anh - 19A4040001 Page | iv Khóa luận tốt nghiệp CHƯƠNG 3: ỨNG DỤNG KHAI PHÁ DỮCHỮ LIỆUVIẾT XÂY DỰNG DANH MỤC CÁC TẮT WEBSITE TRANG TIN VỀ DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID-19 36 3.1 Phát biểu toán 36 3.2 Bài tốn - Trích chọn thơng tin từ web 36 3.2.1 Pha 38 3.2.2 Pha 42 3.3 Bài toán - Xây dựng website 44 3.3.1 Mơ hình hệ thống 44 3.3.2 Thiết kế sở liệu .45 3.3.3 Triển khai 48 CHƯƠNG 4: THỰC NGHIỆM 51 4.1 Môi trường công cụ tiến hành thực nghiệm 51 4.2 Thu thập thông tin cho sở liệu 52 4.3 Xây dựng trang tin 54 4.4 Kết luận chương 58 KẾT LUẬN 59 DANH MỤC TÀI LIỆU THAM KHẢO 60 STT Viết tắt Cụm từ tiếng Anh Cụm từ tiếng Việt CNTT Information Technology Công nghệ thông tin CSDL Database Cơ sở liệu KDD Knowledge Discovery in Database KPDL Data mining Khám phá tri thức sở liệu Khai phá liệu KPVB Text Mining Khai phá văn URL Uniform Resource Locator Định vị tài nguyên IE Information Extraction Trích xuấ thơng tin NPL Natural Process Language Quy trình xử lý ngơn ngữ tự nhiên Bùi Phương Anh - 19A4040001 Page | v Bùi Phương Anh - 19A4040001 Page | vi Khóa luận tốt nghiệp DANH MỤC BẢNG BIỂU Bảng 1: Tập từ khóa liên quan đến bệnh COVID-19 39 Bảng 2: Tập từ đồng nghĩa gặp q trình trích chọn 40 Bảng 3: Bảng dim_vietnam_province 46 Bảng 4: Bảng nowdata_total 47 Bảng 5: Bảng nowdata_detail 47 Bảng 6: Bảng history_data .47 Bảng 7: Bảng dim_country 47 Bảng 8: Bảng world_now 48 Bùi Phương Anh - 19A4040001 Page | vii ... Thực trạng cung cấp thơng tin tình hình dịch bệnh viêm đường hơ hấp cấp COVID- 19 Chương 3: Ứng dụng khai phá liệu xây dựng website trang tin tình hình dịch bệnh viêm đường hô hấp cấp COVID- 19 Chương... THÔNG TIN QUẢN LÝ KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ ^r⅛6 AC KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID- 19... PHƯƠNG ANH HÀ NỘI - 2020 KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC •••• ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HƠ HẤP CẤP COVID- 19 Giáo viên hướng dẫn :

Ngày đăng: 07/04/2022, 11:20

HÌNH ẢNH LIÊN QUAN

WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH (Trang 3)
Quy trình khám phá tri thức được biểu diễn qua hình vẽ dưới đây: - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
uy trình khám phá tri thức được biểu diễn qua hình vẽ dưới đây: (Trang 14)
ứng. Mục tiêu cho việc học tập không giám sát làmô hình hóa cấu trúc cơ bản hoặc phân phối trong dữ liệu để tìm hiểu thêm về dữ liệu - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
ng. Mục tiêu cho việc học tập không giám sát làmô hình hóa cấu trúc cơ bản hoặc phân phối trong dữ liệu để tìm hiểu thêm về dữ liệu (Trang 15)
Hình 1.3: Cấu trúc của web mining - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 1.3 Cấu trúc của web mining (Trang 21)
Có thể khái quát các kiểu dữ liệu web qua hình dưới đây. - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
th ể khái quát các kiểu dữ liệu web qua hình dưới đây (Trang 23)
Hình 1.5: Quy trình khai phá văn bản - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 1.5 Quy trình khai phá văn bản (Trang 25)
Hình 2.1: Thống kê về sự tin tưởng vào thông tintrong nước vềCOVID-19 - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 2.1 Thống kê về sự tin tưởng vào thông tintrong nước vềCOVID-19 (Trang 37)
Hình 2.3: Tờ khaiy tế Online - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 2.3 Tờ khaiy tế Online (Trang 39)
Hình 2.2: Trang tin về tình hình dịch bệnh viêmđường hô hấpCOVID-19của bộ y tế - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 2.2 Trang tin về tình hình dịch bệnh viêmđường hô hấpCOVID-19của bộ y tế (Trang 39)
Hình 2.6: Fanpage Thông tin Chính phủ - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 2.6 Fanpage Thông tin Chính phủ (Trang 40)
điện thoại theo dõi tình hình, khai báo thông tin hay tìm kiếm nguồn gốc lây lan một cách - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
i ện thoại theo dõi tình hình, khai báo thông tin hay tìm kiếm nguồn gốc lây lan một cách (Trang 44)
Hình 2.8: Trang tin của WHO - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 2.8 Trang tin của WHO (Trang 45)
sắc nhẹ nhàng, hơi rối mắt vì nhiều bảng biểu. - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
s ắc nhẹ nhàng, hơi rối mắt vì nhiều bảng biểu (Trang 46)
Hình 2.9: Trang tin Thông tin chiếndịch chống COVID của Tokyo Nhật Bản - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 2.9 Trang tin Thông tin chiếndịch chống COVID của Tokyo Nhật Bản (Trang 46)
Hình 3.1: Quá trình phát hiện và trích chọn thông tin về tình hình dịch bệnh COVID19 - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 3.1 Quá trình phát hiện và trích chọn thông tin về tình hình dịch bệnh COVID19 (Trang 49)
Hình 3.2: Thành phần phát hiện thông tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 3.2 Thành phần phát hiện thông tin (Trang 50)
Hình 3.4: Mô hình tổng quát khi xây dựng trang tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 3.4 Mô hình tổng quát khi xây dựng trang tin (Trang 56)
Bảng 4: Bảng nowdatatotal >  Bảng NOWDATA_DETAIL - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Bảng 4 Bảng nowdatatotal > Bảng NOWDATA_DETAIL (Trang 58)
Bảng 7: Bảng dimcountry - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Bảng 7 Bảng dimcountry (Trang 59)
Bảng 8: Bảng world now - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Bảng 8 Bảng world now (Trang 60)
Hình 3.8: Phác thảo thiết kếhệ trang tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 3.8 Phác thảo thiết kếhệ trang tin (Trang 61)
Hình 4.1: Kết quả của thu thập dữ liệuvà tiền xử lý dữ liệu - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.1 Kết quả của thu thập dữ liệuvà tiền xử lý dữ liệu (Trang 65)
Hình 4.2:Sử dụng trigger để lọc dữ liệu - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.2 Sử dụng trigger để lọc dữ liệu (Trang 66)
Hình 4.3: Trích thông tin và kết nối tới database - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.3 Trích thông tin và kết nối tới database (Trang 66)
Hình 4.4: Kết quả của quá trình thu thập thông tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.4 Kết quả của quá trình thu thập thông tin (Trang 67)
Hình 4.8: Khối 4- Top 5 Tỉnh/ TP cósốca nhiễm cao nhất - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.8 Khối 4- Top 5 Tỉnh/ TP cósốca nhiễm cao nhất (Trang 69)
Hình 4.9: Khối 5- Bản đồ Việt Nam - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.9 Khối 5- Bản đồ Việt Nam (Trang 69)
Hình 4.11: Sốca nhiễm cụ thể - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
Hình 4.11 Sốca nhiễm cụ thể (Trang 70)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w