Phương pháp phân loại theo từ khĩa

Một phần của tài liệu Ứng dụng mạng Neural trong phân loại thư rác (Trang 47 - 48)

Phương pháp lọc thư rác theo từ khĩa là phương pháp truyền thống trong việc lọc thư rác. Người ta dựa vào những từ hay cụm từ cĩ trong đầu đề thư hoặc nội dung thư để lọc

Số hĩa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

48 Khi một thư mới được gửi tới hịm thư của bạn, bạn phải sử dụng một bộ lọc thư mới đơn giản bằng cách chọn một số từ hoặc cụm từ trong nội dung thư. Các từ hay cụm từ này sẽ xác định đĩ là thư rác hay khơng. Vì mục đích của tất cả spam cơ bản là giống nhau (bán hay quảng cáo một sản phẩm hay dịch vụ) và nội dung của hầu hết spam đều mang đặc điểm chung. Một số cụm từ xuất hiện thường xuyên trên spam.

Một vài năm gần đây những kẻ gửi thư rác đã bắt đầu nhận ra rằng thư rác của chúng đã bị chặn bởi bộ lọc theo từ khĩa này. Do vậy những kẻ gửi thư rác đã thay đổi cách viết nội dung của thư rác nhằm làm cho thư rác của chúng cĩ thể xuyên qua các bộ lọc.

Phương pháp này cĩ một số ưu điểm và nhược điểm sau:

Ưu điểm:

Tính thích nghi: Người dùng cĩ thể dễ dàng biến đổi bộ lọc của mình để nĩ cĩ thể lọc các kiểu thư rác mà người đĩ đang phải nhận và điều quan trọng là nĩ khơng cản trở các từ hoặc các cụm từ được sử dụng hằng ngày trong kinh doanh thương mại với bạn bè hay những người thân quen.

Nhược điểm:

Yêu cầu nhiều tiến trình xử lý bằng tay để điều chỉnh và duy trì bộ lọc được hiệu quả. Để cĩ thể đánh lừa các bộ lọc, những kẻ gửi thư rác luơn luơn thay đổi hình thức nội dung thư rác, do đĩ những bộ lọc mở rộng phải được tạo ra để chống lại điều đĩ.

Một phần của tài liệu Ứng dụng mạng Neural trong phân loại thư rác (Trang 47 - 48)

Tải bản đầy đủ (PDF)

(79 trang)