Các thành ph¶n cıa mÎt bài báo

Một phần của tài liệu Trích chọn sự kiện dịch bệnh cho hệ thống giám sát trực tuyến (Trang 44)

STT Tên thành ph¶n Mô t£

1 Tiêu ∑ Tiêu ∑cıa bài báo

2 Tóm t≠t Ph¶n tóm t≠t cıa bài báo

3 Ngày xußt b£n Ngày mà bài báo ó ˜Òc xußt b£n

4 Liên k∏t ‡a chøliên k∏t cıa bài báo

5 NÎi dung NÎi dung cıa bài báo

4.3 ánh gía quá trình phát hiªn s¸ kiªn

Nh˜tác gi£ ã ∑ c™p, thành ph¶n phát hiªn s¸kiªn có hai ch˘c n´ng, ó là:bÎ

lÂc d˙ liªu và bÎ phân lÓp. Nh˜ v™y, ∫ ánh giá tính hiªu qu£cıa quá trình phát hiªn s¸ kiªn, tác gi£s≥ ánh giá trên hai ch˘c n´ng chính cıa thành ph¶n này.

4.3.1 ánh giá bÎ lÂc d˙ liªu

Mô t£ th¸c nghiªm: mˆc ích cıa th¸c nghiªm này ánh giá kh£ n´ng cıa bÎ lÂc d˙ liªu ˜Òc nêu trong mˆc 3.5.

Phát bi∫u th¸c nghiªm

• ¶u vào: mÎt t™p các bài báo ˜Òc thu th™p t¯ trang Báo MÓi. • ¶u ra: các bài báo liên quan tÓi mi∑n d˙ liªu d‡ch bªnh.

D˙ liªu th¸c nghiªm: d˙ liªu là 3.842.137 bài báo.

BÎ lÂc d˙liªu là ch˘c n´ng ¶u tiên trong pha phát hiªn s¸ kiªn, nó lÂc các bài báo ˜Òc g˚i tÓi t¯ thành ph¶n thu th™p d˙ liªu. Nh˜ ã ∑ c™p trong ch˜Ïng 3, ch˘c n´ng này s˚ dˆng M®u 1 (3.2) và M®u 2 (3.3) ∫ lÂc các bài báo. Nh˜ v™y, hiªu n´ng cıa ch˘c n´ng này phˆ thuÎc vào Î bao phıcıa t™p lu™t trong M®u 1

và M®u 2. Thông th˜Ìng, chúng ta ph£i ánh giá Î chính xác cıa hai m®u trên toàn bÎt™p d˙liªu (3.842.137 bài báo); tuy nhiên, ph˜Ïng pháp này tËn nhi∑u chi phí vì tác gi£ s˚ dˆng ph˜Ïng pháp ánh gi£ thı công.

CH◊ÃNG 4. TH‹C NGHIõM VÀ ÁNH GIÁ KòT QUÉ 34

Một phần của tài liệu Trích chọn sự kiện dịch bệnh cho hệ thống giám sát trực tuyến (Trang 44)