Mô tả thực nghiệm: Trong phần này khóa luận sẽ sử dụng công cụ FineReport để
dựng trang tin. Công cụ xây dựng dựa trên mô hình 3 lớp nên khi thay đổi bố cục, vị trí cơ sở dữ liệu sẽ không bị ảnh hưởng. Công cụ có rất nhiều phần hỗ trợ thiết kế như các dạng biểu đồ, loại bản đồ khác nhau và cung cấp thêm bảng điều khiển nên dựng trang tin đơn giản hơn phần nào. Sau khi cài đặt công cụ/ mở dashboard mới bắt đầu tiến hành
thiết kế trang theo khung đã phác thảo sẵn. Để trang tin được sinh động bắt mắt hơn, viết thêm một số function hay Scipt và tùy chỉnh cho hợp lý. Tiếp đến kết nối tới SQL Server có chứa thông tin đã được thu thập. Tạo từng dataset mới ứng với mỗi vùng thông
tin cần hiển thị. Gán dataset cho vùng thông tin và view trên localhost.
Khóa luận tốt nghiệp
Hình 4.5: Thiết kế trang tin thông qua FineReport
Hình 4.6: Khối 2 - Số liệu tổng thể
Bệnh nhân Tu oi Giới tính Địa đi êm Tĩnh trạng Quốc t ɪ BNl 6 Ể Nam H⅛ CliL Mmh Khỏi Tnmg Qi
BN2 S2 Nam H⅛ MmhChi Khỏi Tnmg Qi
BNJ 2 5 Nữ Thanh Hca Khôi Việt Na BN4 2 9
Nam Vinh Phúc Khỏi Việt Na
BN5 2
3
Nữ Vnih Phúc Khỏi Việt Na
BNỂ 2
5 Nữ KhinhHóa Khỏi Việt Na
BN? 73 Nam HoChiMinh Khỏi HoaK
BNS 2
9 Nữ '.’ình Phúc Khỏi Việt Na
BN9 3
0 Nam Vinh Phúc Khôi Việt Na
ENlO 4
2 Nữ Vinh Phúc Khỏi Việt Na
BNll 4
9 Nữ Vnih Phúc Khỏi Việt Na
ENl 2 ló Nữ Vinh Phiic Khỏi Việt Na
ENlJ 2 9
Nữ Vnih Phiic Khỏi Việt Na τ
t ■ ►
Hình 4.8: Khối 4 - Top 5 Tỉnh/ TP có số ca nhiễm cao nhất
Hình 4.9: Khối 5 - Bản đồ Việt Nam
Hình 4.11: Số ca nhiễm cụ thể
Thống kẽ tình hình dịch bệnh COVID-19 Việt Nam năm 2020
50_________________________________:
10 A . ... \ -A.,.--., /ʌʌ A.Λ.A,. ... .ΛΛ∙. .-...À. .... A -O-sổ ca nhiễm mới 10... ******---*•---•—..."*...* . ...*—...*...****...ζ -O- SỔ ca khôi 03/0503/11 03/17 03/23 03/29 04/04 04/10 04/16 04/22 04/28 05/04 05/10 05/16 05/22 05/28 06/0306/09
4.4. Ket luận chương
Trong phần này, khóa luận đã trình bày quá trình tiến hành thực hiện thực nghiệm bao gồm thu thập thông tin cho cơ sở dữ liệu và xây dựng trang tin về tình hình dịch bệnh COVID-19. Thông qua kết qua thu được, ta thấy tính khả thi của trang tin và có cơ hội định hướng để phát triển thêm.
Khóa luận tốt nghiệp
KẾT LUẬN
Ket quả đạt được của khóa luận
Trong quá trình làm bài em đã nhớ lại kiến thức về khai phá dữ liệu, hiểu thêm về cách thức hoạt động của khai phá dữ liệu web. Những kỹ thuật áp dụng trong khai phá web là gì, hiểu về crawl dữ liệu, biết thêm về một số công cụ trích xuất thông tin. Bài toán đặt ra đã được giải quyết hầu hết đối với từng bài toán con. Bài toán 1 đã áp dụng được khai phá dữ liệu để lấy được thông tin liên quan đến tình hình dịch bênh COVID-19 tại các website thông tin chính thống. Bài toán 2 đã xây dựng được trang tin,
trang tin cũng cấp đủ những thông tin cần có của một trang tin về bệnh dịch. Tuy nhiên trong quá trình thực nghiệm thực tế nhận thấy vẫn còn một số khó khăn nhất định, hạn chế việc giải bài toán triệt để và bên cạnh đó sẽ đưa ra một số định hướng tương lai.
Khó khăn và hạn chế.
- Trong khi thực nghiệm sử dụng công cụ Octoparse để trích chọn thông tin từ website, tuy nhiên do đây chỉ đang là bản dùng thử nên khi xuất dữ liệu vào database SQL Server sẽ không được đặt thời gian tự động cập nhật thông tin hàng ngày. Phải tự update cơ sở dữ liệu thủ công.
- Sử dụng công cụ FineReport chưa đẩy lên host, vẫn đang dưới localhost và vì đây chủ yếu là công cụ làm báo cáo nên các thành phần đều phải xây dựng và tùy chỉnh nhiều.
- Các tập luật vẫn còn được xây dựng thủ công nên tập luật không bao phủ được hết các miền dữ liệu nên có thể bỏ xót thông tin liên quan cần thiết.
- Tại pha 2 khi trích chọn thông tin, xử lý ngôn ngữ tự nhiên vẫn còn hạn chế, chưa
thực sự chuẩn, vẫn phải xử lý thủ công.
Định hướng tương lai
- Tiếp tục phát triển và hoàn thiện trang tin. Tìm hiểu sử dụng thành thạo các công
cụ đặc biệt trong phần trích chọn thông tin đưa vào cơ sở dữ liệu. Cần đảm bảo độ chính
xác của thông tin cao hơn, thông tin được trích tự động.
- Trang tin hoàn thiện dần có thể sử dụng thay đổi trong tình hình nếu có bệnh dịch
mới. Cung cấp thông tin đến người dân nhanh nhất, cảnh báo mức độ nguy hiểm hạn chế sự lây lan.
Khóa luận tốt nghiệp
DANH MỤC TÀI LIỆU THAM KHẢO
[1] Submitted to Banking Academy, Khóa luận 2019 - Ứng dụng khai phá dữ liệu
trích chọn thông tin sự kiện y tế trên các trang web tiếng việt, Tạ Quốc Anh [2] Giáo trình tại FPT University, FPT Polytechnic
[3] Research Scholar, Manonmaniam Sundaranar University, Tirunelveli 2Assistant Professor, Sarah Tucker College, Manonmaniam Sundaranar University, Tirunelveli, Jan 2019
[4] The Annals of the University of Petrosani, Economics
[5] Department of Computer and information Science Faculty of Science and Technology University of Macau Av. Padre Tomás, S.J., Taipa, Macao S.A.R., China
[6] The Role of Web Content Mining and Web Usage Mining in Improving Search
Result Delivery, Department of Computer Science and Engineering, H.V.P.M’s College of Engg. & Tech, Amravati University, India
[7] https://www.fìnereport.com/
[8] https://www.octoparse.com/
[9] https://ncov.moh.gov.vn/