II. Chương trình và kết quả thực nghiệm
2.2. Kết quả thực nghiệm
Sau khi cài đặt và chạy thành công các mô hình, dựa trên dữ liệu(output) thu được chúng ta sẽ tiến hành đánh giá độ chính xác và so sánh các mô hình.
Chúng ta so sánh kết quả Output dựa trên biểu đồ, ta thấy được độ chính xác của từng mô hình thể hiện trên biểu đồ. Với bài toán được đặt ra ban đầu thì mô hình SVM đạt được hiệu quả phân loại chính xác cao nhất ~93% so với các mô hình Machine Learning cơ bản.
Trong tương lai với nhiều bài toán khác nhau về phân loại dữ liệu… chúng ta có thể cân nhắc sử dụng mô hình Machine Learning phù hợp giúp giải quyết vấn đề một cách hiệu quả nhất, vừa rút ngắn được thời gian, giảm bộ nhớ dữ liệu… tối ưu nhất để đạt được kết quả như mong đợi.
Trong quá trình thực hiện đề tài, chúng em đã cố gắng hết sức để tìm hiểu và học hỏi nhưng vì khả năng còn giới hạn không tránh khỏi những sai sót, có thể chưa giải quyết được hết tất cả những vấn đề đặt ra. Chúng em rất mong nhận được sự thông cảm của thầy cô và các bạn.
KẾT LUẬN
Trong thời đại bùng nổ thông tin, đặc biệt là thời đại công nghệ 4.0 cũng như sự phát triển của mạng xã hội như hiện nay thì việc gặp phải các "Fake News" là điều không thể tránh khỏi. Thậm chí tin giả tin tặc đang được nhìn nhận như một trong những mối đe dọa lớn nhất đến sự tiếp cận tri thức, văn hóa và tranh luận tự do. Vì vậy mỗi chúng ta cần phải biết chắc lọc phát hiện tin tức fake news hay không để theo dõi và tránh bị các nguồn tin sai lệch, tin giả tin tặc làm ảnh hưởng đến cuộc sống của chính mình.
Qua đề tài này chúng ta đã học được cách xây dựng một mô hình phát hiện fake news, triển khai được TfidfVectorizer, khởi chạy được các mô hình Mechine Learning cơ bản để có thể làm tiền đề xây dựng thành công một ứng dụng phát hiện tin đồn như mong muốn đặt ra và có hiệu quả cao nhất phù hợp với hiện trạng cuộc sống. Hi vọng trong thời gian tới chúng ta sẽ thành công xây dựng được phần mềm phát hiện tin đồn trong xã hội.
TÀI LIỆU THAM KHẢO
* Link tham khảo các mẫu dữ liệu và tài liệu liên quan:
- Data Fake news :
[https://raw.githubusercontent.com/laxmimerit/fake-real-news-dataset/ main/data/Fake.csv]
[https://raw.githubusercontent.com/laxmimerit/fake-real-news-dataset/ main/data/True.csv]
- Tìm hiểu về ngôn ngữ lập trình Python: [ https://www.w3schools.com/python/ ]
- Tìm hiểu về các mô hình của Mechine Learning [ https://machinelearningcoban.com]
- Sách tham khảo:
>> Ebook Python cơ bản
- Python tiếng Việt siêu cơ bản của Võ Tuấn Duy xuất bản 30-08-
2018. Với 15 chương, mỗi chương trình bày một khía cạnh của Python thông qua những trải nghiệm thực tế của tác giả. Tài liệu miễn phí này sẽ giúp chúng ta tiếp cận và tự học được ngôn ngữ lập trình Python.