Xây dựng trang tin

Một phần của tài liệu Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp (Trang 67 - 72)

Mô tả thực nghiệm: Trong phần này khóa luận sẽ sử dụng công cụ FineReport để

dựng trang tin. Công cụ xây dựng dựa trên mô hình 3 lớp nên khi thay đổi bố cục, vị trí cơ sở dữ liệu sẽ không bị ảnh hưởng. Công cụ có rất nhiều phần hỗ trợ thiết kế như các dạng biểu đồ, loại bản đồ khác nhau và cung cấp thêm bảng điều khiển nên dựng trang tin đơn giản hơn phần nào. Sau khi cài đặt công cụ/ mở dashboard mới bắt đầu tiến hành

thiết kế trang theo khung đã phác thảo sẵn. Để trang tin được sinh động bắt mắt hơn, viết thêm một số function hay Scipt và tùy chỉnh cho hợp lý. Tiếp đến kết nối tới SQL Server có chứa thông tin đã được thu thập. Tạo từng dataset mới ứng với mỗi vùng thông

tin cần hiển thị. Gán dataset cho vùng thông tin và view trên localhost.

Khóa luận tốt nghiệp

Hình 4.5: Thiết kế trang tin thông qua FineReport

Hình 4.6: Khối 2 - Số liệu tổng thể

Bệnh nhân Tu oi Giới tính Địa đi êm Tĩnh trạng Quốc t ɪ BNl 6 Ể Nam H⅛ CliL Mmh Khỏi Tnmg Qi

BN2 S2 Nam H⅛ MmhChi Khỏi Tnmg Qi

BNJ 2 5 Nữ Thanh Hca Khôi Việt Na BN4 2 9

Nam Vinh Phúc Khỏi Việt Na

BN5 2

3

Nữ Vnih Phúc Khỏi Việt Na

BNỂ 2

5 Nữ KhinhHóa Khỏi Việt Na

BN? 73 Nam HoChiMinh Khỏi HoaK

BNS 2

9 Nữ '.’ình Phúc Khỏi Việt Na

BN9 3

0 Nam Vinh Phúc Khôi Việt Na

ENlO 4

2 Nữ Vinh Phúc Khỏi Việt Na

BNll 4

9 Nữ Vnih Phúc Khỏi Việt Na

ENl 2 ló Nữ Vinh Phiic Khỏi Việt Na

ENlJ 2 9

Nữ Vnih Phiic Khỏi Việt Na τ

t ■ ►

Hình 4.8: Khối 4 - Top 5 Tỉnh/ TP có số ca nhiễm cao nhất

Hình 4.9: Khối 5 - Bản đồ Việt Nam

Hình 4.11: Số ca nhiễm cụ thể

Thống kẽ tình hình dịch bệnh COVID-19 Việt Nam năm 2020

50_________________________________:

10 A . ... \ -A.,.--., /ʌʌ A.Λ.A,. ... .ΛΛ∙. .-...À. .... A -O-sổ ca nhiễm mới 10... ******---*•---•—..."*...* . ...*—...*...****...ζ -O- SỔ ca khôi 03/0503/11 03/17 03/23 03/29 04/04 04/10 04/16 04/22 04/28 05/04 05/10 05/16 05/22 05/28 06/0306/09

4.4. Ket luận chương

Trong phần này, khóa luận đã trình bày quá trình tiến hành thực hiện thực nghiệm bao gồm thu thập thông tin cho cơ sở dữ liệu và xây dựng trang tin về tình hình dịch bệnh COVID-19. Thông qua kết qua thu được, ta thấy tính khả thi của trang tin và có cơ hội định hướng để phát triển thêm.

Khóa luận tốt nghiệp

KẾT LUẬN

Ket quả đạt được của khóa luận

Trong quá trình làm bài em đã nhớ lại kiến thức về khai phá dữ liệu, hiểu thêm về cách thức hoạt động của khai phá dữ liệu web. Những kỹ thuật áp dụng trong khai phá web là gì, hiểu về crawl dữ liệu, biết thêm về một số công cụ trích xuất thông tin. Bài toán đặt ra đã được giải quyết hầu hết đối với từng bài toán con. Bài toán 1 đã áp dụng được khai phá dữ liệu để lấy được thông tin liên quan đến tình hình dịch bênh COVID-19 tại các website thông tin chính thống. Bài toán 2 đã xây dựng được trang tin,

trang tin cũng cấp đủ những thông tin cần có của một trang tin về bệnh dịch. Tuy nhiên trong quá trình thực nghiệm thực tế nhận thấy vẫn còn một số khó khăn nhất định, hạn chế việc giải bài toán triệt để và bên cạnh đó sẽ đưa ra một số định hướng tương lai.

Khó khăn và hạn chế.

- Trong khi thực nghiệm sử dụng công cụ Octoparse để trích chọn thông tin từ website, tuy nhiên do đây chỉ đang là bản dùng thử nên khi xuất dữ liệu vào database SQL Server sẽ không được đặt thời gian tự động cập nhật thông tin hàng ngày. Phải tự update cơ sở dữ liệu thủ công.

- Sử dụng công cụ FineReport chưa đẩy lên host, vẫn đang dưới localhost và vì đây chủ yếu là công cụ làm báo cáo nên các thành phần đều phải xây dựng và tùy chỉnh nhiều.

- Các tập luật vẫn còn được xây dựng thủ công nên tập luật không bao phủ được hết các miền dữ liệu nên có thể bỏ xót thông tin liên quan cần thiết.

- Tại pha 2 khi trích chọn thông tin, xử lý ngôn ngữ tự nhiên vẫn còn hạn chế, chưa

thực sự chuẩn, vẫn phải xử lý thủ công.

Định hướng tương lai

- Tiếp tục phát triển và hoàn thiện trang tin. Tìm hiểu sử dụng thành thạo các công

cụ đặc biệt trong phần trích chọn thông tin đưa vào cơ sở dữ liệu. Cần đảm bảo độ chính

xác của thông tin cao hơn, thông tin được trích tự động.

- Trang tin hoàn thiện dần có thể sử dụng thay đổi trong tình hình nếu có bệnh dịch

mới. Cung cấp thông tin đến người dân nhanh nhất, cảnh báo mức độ nguy hiểm hạn chế sự lây lan.

Khóa luận tốt nghiệp

DANH MỤC TÀI LIỆU THAM KHẢO

[1] Submitted to Banking Academy, Khóa luận 2019 - Ứng dụng khai phá dữ liệu

trích chọn thông tin sự kiện y tế trên các trang web tiếng việt, Tạ Quốc Anh [2] Giáo trình tại FPT University, FPT Polytechnic

[3] Research Scholar, Manonmaniam Sundaranar University, Tirunelveli 2Assistant Professor, Sarah Tucker College, Manonmaniam Sundaranar University, Tirunelveli, Jan 2019

[4] The Annals of the University of Petrosani, Economics

[5] Department of Computer and information Science Faculty of Science and Technology University of Macau Av. Padre Tomás, S.J., Taipa, Macao S.A.R., China

[6] The Role of Web Content Mining and Web Usage Mining in Improving Search

Result Delivery, Department of Computer Science and Engineering, H.V.P.M’s College of Engg. & Tech, Amravati University, India

[7] https://www.fìnereport.com/

[8] https://www.octoparse.com/

[9] https://ncov.moh.gov.vn/

Một phần của tài liệu Ứng dụng khai phá dữ liệu web xây dựng website trang tin về tình hình dịch bệnh viêm đường hô hấp cấp covid 19,khóa luận tốt nghiệp (Trang 67 - 72)

Tải bản đầy đủ (DOCX)

(72 trang)
w