Xây dựng kịch bản kiểm thử

Một phần của tài liệu (LUẬN văn THẠC sĩ) tổng hợp ý kiến phản hồi của độc giả theo sự kiện phản ánh bởi báo chí (Trang 47 - 49)

Kiểm thử là một quá trình đánh giá một hệ thống hay là các thành phần của nĩ với mục đích là xác định xem nĩ cĩ thỏa mãn những yêu cầu được đưa ra hay

khơng. Hiểu một cách đơn giản, kiểm thử là chạy một chương trình để xác nhận bất kì lỗ hổng, lỗi sai hay những yêu cầu bị bỏ quên, những yêu cầu khơng đúng so với yêu cầu thực tế đề ra.

Để thực hiện kiểm thử được thuật tốn, luận văn sẽ xây dựng kịch bản kiểm thử thuật tốn đã cài đặt. Mục đích là để xác định mức độ chính xác của thuật tốn.

Thuật tốn Naive Bayes và thuật tốn LSTM

Đầu vào của 2 thuật tốn này đơn giản là nội dung các bài báo mạng. Bước 1: Chọn ngẫu nhiên 500 bài báo theo 10 chủ đề và đã được gán nhãn trên trang báo điện tử https://vnexpress.net/, https://thanhnien.vn/,

https://nld.com.vn/

Bước 2: Lấy nội dung của các bài báo mạng làm đầu vào của thuật tốn, chạy thuật tốn và xác định chủ đề của thuật tốn.

Bước 3: Tính độ chính xác của thuật tốn dựa theo các thơng số Accuracy, Recall, Precision, F1-score.

Thuật tốn phân loại dựa trên từ đại diện

Đầu vào của thuật tốn yêu cầu phải đưa ra một danh sách N từ khĩa, trong N từ khĩa (N = 10) này cĩ thể chọn ra được một từ đại diện nội dung cho bài báo, do vậy kịch bản kiểm thử sẽ được xây dựng để thực hiện bằng phương pháp thủ cơng.

Các bước thực hiện kiểm thử thuật tốn bao gồm:

Bước 1: Chọn ngẫu nhiên 500 bài báo theo 10 chủ đề và đã được gán nhãn trên trang báo điện tử https://vnexpress.net/, https://thanhnien.vn/,

https://nld.com.vn/

Bước 2: Các từ khĩa được gán nhãn tag sau mỗi bài báo sẽ được chọn để làm dữ liệu đầu vào (N từ khĩa) của thuật tốn.

Bước 3: Nhập 10 từ khĩa đã nhận được từ bước 2, chạy thuật tốn và xác định chủ đề của thuật tốn.

Bước 4: Tính độ chính xác của thuật tốn dựa theo các thơng số Accuracy, Recall, Precision, F1-score.

Dựa vào kết quả thu được sau khi kiểm thử, luận văn sẽ đánh giá thuật tốn phân loại văn bản, cụ thể là các bài báo tiếng Việt được mơ tả trong luận văn.

Một phần của tài liệu (LUẬN văn THẠC sĩ) tổng hợp ý kiến phản hồi của độc giả theo sự kiện phản ánh bởi báo chí (Trang 47 - 49)

Tải bản đầy đủ (PDF)

(57 trang)