1. Trang chủ
  2. » Mẫu Slide

XÂY DỰNG HỆ THỐNG PHÂN LOẠI VĂN BẢN DỰA TRÊN THUẬT TOÁN SUPPORT VECTOR MACHINE

16 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trong thời đại số hóa hiện nay, với sự phát triển mạnh mẽ của công nghệ thông tin, lượng thông tin và dữ liệu được tạo ra trên các nền tảng số tăng đáng kể. Tuy nhiên, đồng với sự tăng trưởng này, cũng xuất hiện nhiều thông tin không đáng tin cậy hoặc có nội dung xấu được lan truyền và trộn lẫn với các thông tin chính thống. Điều này tạo ra một thách thức lớn cho người dùng trong việc sử dụng thông tin và đặt ra yêu cầu cấp thiết về việc phân loại thông tin một cách tự động. Việc tự động hóa việc phân loại thông tin giúp giải quyết vấn đề trên bằng cách áp dụng các kỹ thuật và công nghệ để tự động nhận diện, phân loại và xử lý thông tin. Thay vì phải dành nhiều thời gian và công sức để kiểm tra và xác định tính chính xác của từng thông tin, hệ thống phân loại tự động có thể tự động phân loại các thông tin vào các nhóm, chủ đề hoặc mức độ tin cậy khác nhau.

XÂY DỰNG HỆ THỐNG PHÂN LOẠI VĂN BẢN DỰA TRÊN THUẬT TỐN SUPPORT VECTOR MACHINE NHĨM I Lý chọn đề tài II Khảo sát hệ thống NỘI DUNG III Phân tích hệ thống IV Tổng kết đề tài I Lý chọn đề tài - Trong thời đại số hóa nay, lượng thơng tin liệu tạo tảng số tăng đáng kể Thơng tin khơng đáng tin cậy có nội dung xấu Phân loại thông tin cách tự động II Khảo sát hệ thống Địa điểm khảo sát: Thư viện số đại học Công nghiệp Hà Nội Ban quản lý Bộ phận quản lý tài liệu Bộ phận quản trị (CNTT) Cơ cấu tổ chức thư viện trực tuyến II Khảo sát hệ thống HOẠT ĐỘNG HỆ THỐNG Quản lý, cung cấp tài liệu trực tuyến Cập nhật tài liệu trực tuyến Tìm kiếm, tra cứu thơng tin Quản lý, tài khoản người dùng Mượn trả sách trực tuyến Hỗ trợ người dùng Bảo mật quản lý liệu Hạn chế Hoạt động cập tài liệu cịn thực thủ cơng Hiệu phân loại tài liệu chưa cao, tiềm ẩn sai sót Tốn cơng sức, nhân lực ĐỀ XUẤT GIẢI PHÁP XÂY DỰNG HỆ THỐNG PHÂN LOẠI VĂN BẢN DỰA TRÊN THUẬT TOÁN SUPPORT VECTOR MACHINE III Phân tích hệ thống Tham khảo sơ số hệ thống bật: Phân loại tin nhắn rác IOS Phân loại email spam Google Mail III Phân tích hệ thống Mơ hình dự định hệ thống: Hệ thống phân loại Thu thập liệu Xử lý liệu Tạo từ điển Áp dụng phân loại III Phân tích hệ thống Thu thập liệu • Xác định nguồn liệu: Trang web, sách, báo chí … • Thiết kế quy trình thu thập liệu: Web scraping, API III Phân tích hệ thống Xử lý liệu Loại bỏ thông tin không cần thiết Xử lý sơ văn 11 III Phân tích hệ thống Xác định từ khóa Tạo từ điển Lưu trữ thông tin 12 III Phân tích hệ thống Áp dụng phân loại Chọn đặc trưng Phân loại nội dung văn Đánh giá độ xác Đưa kết phân loại IV Tổng kết đề tài Kết đạt Đưa giải pháp phần mềm cho việc phân loại văn quy trình cập nhật tài liệu cho thư viện trực tuyến Kiến thức chun mơn cịn hạn chế để hồn thiện đề tài Cịn gặp nhiều bất cập cơng việc hoạt động nhóm, hoạt động nhóm chưa hiệu Hạn chế IV Tổng kết đề tài Hướng phát triển Mở rộng quy mô Nâng cao hiệu phân loại Tích hợp thêm nhiều nghiệp vụ Thank you

Ngày đăng: 07/08/2023, 01:37

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w