6.1 Kết luận chung
Trong quá trình thực hiện luận văn, nhóm đã tiếp cận được rất nhiều kiến thức,
phương pháp, cũng như làm việc với các công nghệ mới hiện nay. Qua đó giúp nhóm nâng cao kỹ năng lập trình và cập nhật xu hướng. Bài toán phân loại văn bản có ứng
dụng rộng rãi và có ý nghĩa to lớn đối với thời đại hiện nay. Sự phát triển của mạng xã hội cũng kéo theo lượng người dùng ngày càng lớn dẫn đến các vấn đề khác nhau mà trẻ em không nên tiếp xúc đặc biệt là bình luận của người khác để lại. Điều này, tôi đã áp dụng vào luận văn bằng việc tìm hiểu về mô hình vector hóa văn bản thuộc
thư viện FastText, cũng như mô hình máy học LSTM trong thư viện Keras. Nhóm đã
xây dựng thành công mô hình FastText đồng thời so sánh với mô hình Glove. Thông qua đề tài này, nhóm đã hiểu sâu hơn về NLP, cũng như biết được cách hoạt động và xây dựng mô hình FastText và LSTM dé phuc vu bai toan. Nho vao viéc thuc hién luận văn này mà nhóm đã biết cách xây dựng API bang Django REST framework và áp dụng mô hình máy học vào API. Đồng thời, nhóm hiểu rõ về cách hoạt động và cách xây dựng Chrome extension bằng công nghệ của web như: HTML, CSS và JavaScript kết hợp với API của Chrome Developers. Nâng cao kỹ năng sử dụng Github dé deploy code.
Ngoài ra, nhóm còn trau dồi thêm kỹ năng giải quyết van đề khi gặp khó khăn trong lúc tìm hiểu cũng như hoàn thiện bài toán và kỹ năng làm việc nhóm bằng việc lắng nghe ý kiến đồng đội, chia sẻ kiến thức và giúp đỡ lẫn nhau. Với sự hướng dẫn và hỗ trợ của giảng viên đã giúp nhóm định hình được vấn đề và thúc tiến quá trình thực hiện luận văn một cách tốt nhất. Việc thực hiện đề tại này đã giúp nhóm tiễn bộ các kỹ năng hữu ích cần có cho việc phát triển các công việc trong tương lai.
6.2 Thuận lợi, khó khăn
> Thuận lợi
Nguồn tài liệu mà nhóm tham khảo được cung cấp đa dạng bởi Internet và các diễn đàn tin tức về công nghệ tạo nên nguồn cảm hứng phát triển đề tài luận văn.
Giảng viên hướng dẫn luôn theo sát, tận tình, sẵn sảng trao đôi, hướng dẫn. Tận tình trong việc hỗ trợ và nhiệt huyết trong giảng dạy từ giảng viên giúp nhóm trau dồi kinh
nghiệm, kiến thức giải quyết van đề mà nhóm gặp khó khăn dé hoan thành báo cáo.
Sự giúp đỡ đến từ gia đình, thầy cô và bạn bè góp phần tạo nên động lực vững chắc cho nhóm dé hoàn thiện đề tài luận văn một cách tốt nhất. Công nghệ ngày nay cung cấp nhiều công cụ hỗ trợ nhóm đạt được những gì đã đề ra và nâng cao kỹ năng, kiến
thức của nhóm.
> Khó khăn
Bên cạnh những thuận lợi nêu trên, nhóm không thé không gặp phải những khó khăn nhất định. Trong khoảng thời gian tìm hiểu và phát triển đề tài luận văn, một số công nghệ còn khá mới nên nhóm gặp khó khăn trong tìm kiếm tài liệu phù hợp. Phần mềm và thiết bị đòi hỏi chỉ phí nâng cấp lớn nên nhóm chưa thê đáp ứng. Kinh nghiệm phát triển và quản lý ứng dụng của nhóm còn hạn chế dé phát triển mô hình có thể tối ưu nhất.
6.3 Thiếu sót trong luận văn
Chua áp dung được ReactJS vào xây dựng Chrome extension. Vì nhóm nhận
thay rằng ReactJS không giải quyết được van đề xây dựng giao diện cho người ding thay vào đó nhóm sử dụng HTML, CSS và JavaScript dé giảm bớt dung lượng khi
xây dựng.
Chưa so sánh được hai mô hình vector hóa văn bản FastText va Glove khi sử
dụng với LSTM. Vì nền tảng Google Colab sử dụng Python phiên bản 3.10 và package glove_python, glove-python-binary dé huấn luyện mô hình không gian
vector là những package cũ, chúng chỉ hoạt động trên Python phiên bản 3.6, 3.7, 3.8.
Nên không thê cài đặt các package đó trên Google Colab, dẫn đến không thể huấn luyện mô hình Glove bằng tập corpus giống với FastText.
6.4 Hướng phát triển
Trong tương lại, nhóm sẽ thu thập thêm nhiều đữ liệu bình luận và gắn nhãn, và tiền hành huấn luyện cho mô hình dé tăng độ chính xác, đặc biệt là hai nhãn đã được kế trên.
Nhóm cải thiện API dé có thé tích hợp vào nhiều nền tảng không chi dừng lại ở extension. Đặc biệt, hỗ trợ cho các người dùng khác sử dung API này dé làm về các
chủ đê như mạng xã hội.
Phạm vi về đối tượng không chỉ dừng lại ở trẻ em và người nhạy cảm về sức khỏe tinh thần mà nhóm có thé trích suất đặc trưng của từng người dùng để tối ưu hóa
trải nghiệm của từng người dùng.
Đặc biệt, nhóm muốn phát triển mô hình có thé thực hiện trên ngôn ngữ tiếng Việt. Điều này sẽ giúp ích rất nhiều đến người dùng tại đất nước chúng ta để tạo ra một cộng đồng mạng lành mạnh nói chung, cũng như giải quyết bài toán trên một ngôn ngữ khó như tiếng Việt nói riêng.