Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

72 4 0
Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i∣ — HỌC VIỆN NGÂN HÀNG HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ ^r⅛6 AC KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID-19 BÙI PHƯƠNG ANH HÀ NỘI - 2020 KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC •••• ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HƠ HẤP CẤP COVID-19 Giáo viên hướng dẫn : TS Chu Thị Hồng Hải Sinh viên thực : Bùi Phương Anh Mã sinh viên : 19A4040001 Lớp : HTTTA Khóa : 19 Hệ : Đại học quy HÀ NỘI - 2020 Khóa luận tốt nghiệp LỜI CẢM ƠN Kính thưa Quý Thầy Cô! Sau thời gian nghiên cứu, gắn bó học tập trường Học viện Ngân hàng dẫn dắt giảng viên trường, em nhận nhiều kiến thức quý báu chuyên ngành ngồi sống, hành trang em trường bước vào đời Và này, em xin gửi lời cám ơn chân thành tới Thầy, Cô Học viện Ngân hàng, đặc biệt GVHD TS Chu Thị Hồng Hải, người trực tiếp hướng dẫn, thầy ln tận tình giúp đỡ, sữa chữa lỗi để em hồn thành đề tài khóa luận tốt nghiệp Do hạn chế kiến thức thời gian, nên nội dung khóa luận khơng tránh khỏi sai sót, hạn chế Vì vậy, em mong góp ý q báu từ Thầy Cơ để khóa luận em hoàn thiện Cuối lời, em xin trân trọng cảm ơn thầy cô giáo giảng dạy Khoa Hệ thống thông tin quản lý - Học viện Ngân hàng đặc biệt giáo viên hướng dẫn, Tiến sỹ Chu Thị Hồng Hải tận tình giúp đỡ, tạo điều kiện cho em suốt trình thực hồn thành khóa luận tốt nghiệp Em xin chân thành cám ơn! Hà Nội, ngày 14 tháng 06 năm 2020 Sinh viên thực Bùi Phương Anh - 19A4040001 Page | i Khóa luận tốt nghiệp LỜI CAM ĐOAN Em xin cam đoan cơng trình nghiên cứu riêng em, hồn thiện hướng dẫn TS.Chu Thị Hồng Hải - Giảng viên Khoa Hệ thống thông tin quản lý - Học viện Ngân hàng Các nội dung nghiên cứu, kết nêu khóa luận hồn tồn trung thực Những số liệu thông tin phục vụ cho việc phân tích đánh giá thu thập từ nguồn trích rõ Danh mục tài liệu Ngồi ra, khóa luận có sử dụng số nhận xét, đánh giá, thông tin từ số tài liệu có trích dẫn thích nguồn gốc Nếu phát có gian lận nào, em xin hồn tồn chịu trách nhiệm nội dung khóa luận Bùi Phương Anh Bùi Phương Anh - 19A4040001 Page | ii Khóa luận tốt nghiệp NHẬN XÉT (Của giáo viên hướng dẫn) mặt: Mục đích đề tài; Tính thời ứng dụng đề tài; Bố cục hình thức trình bầy đề tài; Ket thực đề tài; Ý thức, thái độ sinh viên trình thực đề tài Kết luận Hà Nội, ngày tháng năm 2020 Giáo viên hướng dẫn (Ký tên) Bùi Phương Anh - 19A4040001 Page | iii Khóa luận tốt nghiệp MỤC LỤC LỜI CẢM ƠN I LỜI CAM ĐOAN II DANH MỤC CÁC CHỮ VIẾTTẮT VI DANH MỤC BẢNG BIỂU VII DANH MỤC HÌNH VẼ VIII LỜI MỞ ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU 1.1 Tổng quan khai phá liệu 1.1.1 Khái niệm khai phá liệu 1.1.2 Các kỹ thuật áp dụng khai phá liệu 1.1.3 Kiến trúc hệ thống khai phá liệu 1.1.4 Lợi ích khai phá liệu 1.1.5 Ứng dụng khai phá liệu 1.2 Khai phá liệu web 1.2.1 Khái niệm khai phá liệu web .9 1.2.2 Lợi ích khai phá liệu web 10 1.2.3 Các kiểu liệu web 11 1.3 Một số phương pháp tiếp cận khai phá liệu Web .12 1.3.1 Phương pháp khai phá nội dung Web 12 1.3.2 Khai phá cấu trúc web 16 1.3.3 Khai phá sử dụng web 17 1.4 Tổng quan trích chọn thơng tin Xử lý ngơn ngữ tự nhiên .17 1.4.1 Trích chọn thông tin 17 1.4.2 Xử lý ngôn ngữ tự nhiên 19 1.5 Kết luận chương .20 CHƯƠNG 2: THỰC TRẠNG CUNG CẤP THÔNG TIN VỀ DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID-19 TRÊN WEB 21 2.1 Thực trạng Việt Nam .21 2.1.1 Bối cảnh dịch bệnh Việt Nam 22 2.1.2 Thực trạng cung cấp thông tin Việt Nam 23 2.1.3 Một số website thống cung cấp thơng tin Việt Nam 25 2.2 Thực trạng giới 29 2.2.1 Bối cảnh giới 30 2.2.2 Thực trạng cung cấp thông tin giới 31 2.2.3 Một số website ứng dụng cung cấp thông tin tiêu biểu giới 32 2.3 Kết luận chương .35 Bùi Phương Anh - 19A4040001 Page | iv Khóa luận tốt nghiệp CHƯƠNG 3: ỨNG DỤNG KHAI PHÁ DỮCHỮ LIỆUVIẾT XÂY DỰNG DANH MỤC CÁC TẮT WEBSITE TRANG TIN VỀ DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID-19 36 3.1 Phát biểu toán 36 3.2 Bài tốn - Trích chọn thơng tin từ web 36 3.2.1 Pha 38 3.2.2 Pha 42 3.3 Bài toán - Xây dựng website 44 3.3.1 Mơ hình hệ thống 44 3.3.2 Thiết kế sở liệu .45 3.3.3 Triển khai 48 CHƯƠNG 4: THỰC NGHIỆM 51 4.1 Môi trường công cụ tiến hành thực nghiệm 51 4.2 Thu thập thông tin cho sở liệu 52 4.3 Xây dựng trang tin 54 4.4 Kết luận chương 58 KẾT LUẬN 59 DANH MỤC TÀI LIỆU THAM KHẢO 60 STT Viết tắt Cụm từ tiếng Anh Cụm từ tiếng Việt CNTT Information Technology Công nghệ thông tin CSDL Database Cơ sở liệu KDD Knowledge Discovery in Database KPDL Data mining Khám phá tri thức sở liệu Khai phá liệu KPVB Text Mining Khai phá văn URL Uniform Resource Locator Định vị tài nguyên IE Information Extraction Trích xuấ thơng tin NPL Natural Process Language Quy trình xử lý ngơn ngữ tự nhiên Bùi Phương Anh - 19A4040001 Page | v Bùi Phương Anh - 19A4040001 Page | vi Khóa luận tốt nghiệp DANH MỤC BẢNG BIỂU Bảng 1: Tập từ khóa liên quan đến bệnh COVID-19 39 Bảng 2: Tập từ đồng nghĩa gặp q trình trích chọn 40 Bảng 3: Bảng dim_vietnam_province 46 Bảng 4: Bảng nowdata_total 47 Bảng 5: Bảng nowdata_detail 47 Bảng 6: Bảng history_data .47 Bảng 7: Bảng dim_country 47 Bảng 8: Bảng world_now 48 Bùi Phương Anh - 19A4040001 Page | vii ... Thực trạng cung cấp thơng tin tình hình dịch bệnh viêm đường hơ hấp cấp COVID- 19 Chương 3: Ứng dụng khai phá liệu xây dựng website trang tin tình hình dịch bệnh viêm đường hô hấp cấp COVID- 19 Chương... THÔNG TIN QUẢN LÝ KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ ^r⅛6 AC KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HÔ HẤP CẤP COVID- 19... PHƯƠNG ANH HÀ NỘI - 2020 KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC •••• ỨNG DỤNG KHAI PHÁ DỮ LIỆU WEB XÂY DỰNG WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH VIÊM ĐƯỜNG HƠ HẤP CẤP COVID- 19 Giáo viên hướng dẫn :

Ngày đăng: 07/04/2022, 11:20

Hình ảnh liên quan

WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp
WEBSITE TRANG TIN VỀ TÌNH HÌNH DỊCH BỆNH Xem tại trang 3 của tài liệu.
Quy trình khám phá tri thức được biểu diễn qua hình vẽ dưới đây: - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

uy.

trình khám phá tri thức được biểu diễn qua hình vẽ dưới đây: Xem tại trang 14 của tài liệu.
ứng. Mục tiêu cho việc học tập không giám sát làmô hình hóa cấu trúc cơ bản hoặc phân phối trong dữ liệu để tìm hiểu thêm về dữ liệu - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

ng..

Mục tiêu cho việc học tập không giám sát làmô hình hóa cấu trúc cơ bản hoặc phân phối trong dữ liệu để tìm hiểu thêm về dữ liệu Xem tại trang 15 của tài liệu.
Hình 1.3: Cấu trúc của web mining - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 1.3.

Cấu trúc của web mining Xem tại trang 21 của tài liệu.
Có thể khái quát các kiểu dữ liệu web qua hình dưới đây. - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

th.

ể khái quát các kiểu dữ liệu web qua hình dưới đây Xem tại trang 23 của tài liệu.
Hình 1.5: Quy trình khai phá văn bản - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 1.5.

Quy trình khai phá văn bản Xem tại trang 25 của tài liệu.
Hình 2.1: Thống kê về sự tin tưởng vào thông tintrong nước vềCOVID-19 - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 2.1.

Thống kê về sự tin tưởng vào thông tintrong nước vềCOVID-19 Xem tại trang 37 của tài liệu.
Hình 2.3: Tờ khaiy tế Online - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 2.3.

Tờ khaiy tế Online Xem tại trang 39 của tài liệu.
Hình 2.2: Trang tin về tình hình dịch bệnh viêmđường hô hấpCOVID-19của bộ y tế - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 2.2.

Trang tin về tình hình dịch bệnh viêmđường hô hấpCOVID-19của bộ y tế Xem tại trang 39 của tài liệu.
Hình 2.6: Fanpage Thông tin Chính phủ - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 2.6.

Fanpage Thông tin Chính phủ Xem tại trang 40 của tài liệu.
điện thoại theo dõi tình hình, khai báo thông tin hay tìm kiếm nguồn gốc lây lan một cách - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

i.

ện thoại theo dõi tình hình, khai báo thông tin hay tìm kiếm nguồn gốc lây lan một cách Xem tại trang 44 của tài liệu.
Hình 2.8: Trang tin của WHO - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 2.8.

Trang tin của WHO Xem tại trang 45 của tài liệu.
sắc nhẹ nhàng, hơi rối mắt vì nhiều bảng biểu. - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

s.

ắc nhẹ nhàng, hơi rối mắt vì nhiều bảng biểu Xem tại trang 46 của tài liệu.
Hình 2.9: Trang tin Thông tin chiếndịch chống COVID của Tokyo Nhật Bản - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 2.9.

Trang tin Thông tin chiếndịch chống COVID của Tokyo Nhật Bản Xem tại trang 46 của tài liệu.
Hình 3.1: Quá trình phát hiện và trích chọn thông tin về tình hình dịch bệnh COVID19 - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 3.1.

Quá trình phát hiện và trích chọn thông tin về tình hình dịch bệnh COVID19 Xem tại trang 49 của tài liệu.
Hình 3.2: Thành phần phát hiện thông tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 3.2.

Thành phần phát hiện thông tin Xem tại trang 50 của tài liệu.
Hình 3.4: Mô hình tổng quát khi xây dựng trang tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 3.4.

Mô hình tổng quát khi xây dựng trang tin Xem tại trang 56 của tài liệu.
Bảng 4: Bảng nowdatatotal >  Bảng NOWDATA_DETAIL - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Bảng 4.

Bảng nowdatatotal > Bảng NOWDATA_DETAIL Xem tại trang 58 của tài liệu.
Bảng 7: Bảng dimcountry - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Bảng 7.

Bảng dimcountry Xem tại trang 59 của tài liệu.
Bảng 8: Bảng world now - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Bảng 8.

Bảng world now Xem tại trang 60 của tài liệu.
Hình 3.8: Phác thảo thiết kếhệ trang tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 3.8.

Phác thảo thiết kếhệ trang tin Xem tại trang 61 của tài liệu.
Hình 4.1: Kết quả của thu thập dữ liệuvà tiền xử lý dữ liệu - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.1.

Kết quả của thu thập dữ liệuvà tiền xử lý dữ liệu Xem tại trang 65 của tài liệu.
Hình 4.2:Sử dụng trigger để lọc dữ liệu - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.2.

Sử dụng trigger để lọc dữ liệu Xem tại trang 66 của tài liệu.
Hình 4.3: Trích thông tin và kết nối tới database - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.3.

Trích thông tin và kết nối tới database Xem tại trang 66 của tài liệu.
Hình 4.4: Kết quả của quá trình thu thập thông tin - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.4.

Kết quả của quá trình thu thập thông tin Xem tại trang 67 của tài liệu.
Hình 4.8: Khối 4- Top 5 Tỉnh/ TP cósốca nhiễm cao nhất - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.8.

Khối 4- Top 5 Tỉnh/ TP cósốca nhiễm cao nhất Xem tại trang 69 của tài liệu.
Hình 4.9: Khối 5- Bản đồ Việt Nam - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.9.

Khối 5- Bản đồ Việt Nam Xem tại trang 69 của tài liệu.
Hình 4.11: Sốca nhiễm cụ thể - Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp

Hình 4.11.

Sốca nhiễm cụ thể Xem tại trang 70 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan