2. Các thành phần cơ bản của một bức thư
1.2. Các nguyên lý hoạt động của hệ thống chống thư rác
Việc định nghĩa chính xác một thư là thư rác hay khơng là khơng thể, vì vậy việc xác định các cơ sở, các đặc điểm của một bức thư là thư rác là điểm quyết đ ịnh thành cơng của một hệ thống lọc thư rác
• Các thơng tin của header cĩ thể kiểm tra theo các chuẩn của Internet.
• Cĩ thể kiểm tra sự xuất hiện trong header và body của các cụm từ hoặc các thành phần nào đĩ thơng thường xuất hiện trong các thư rác. Ví dụ như cụm từ: “Khuyến mãi lớn”, “Nhanh chân trúng thưởng”
• Header và Body bức thư cĩ thể được kiểm tra qua một số CSDL trên mạng lưu trữ các tổng kiểm tra của các thơng điệp được xác nhận là thư rác.
• Địa chỉ IP của người gửi cĩ thể được kiểm tra thơng qua CSDL về các địa chỉ IP đã được sử dụng cho việc gửi thư rác.
• Một số các địa chỉ, host, domain được liệt kê như là các Blacklist hay Whitelist. Các danh sách này cĩ thể được tạo ra một cách tự động dựa trên các thư đã được xác nhận trước đĩ.
• SpamAssassin cĩ thể được huấn luyện để nhận ra một số dạng của các thư rác từ một số các thư mà bạn xem là thư rác hoặc thư sạch.
• Địa chỉ IP của hệ thống tạo ra thư cĩ thể được so sánh với tên miền sử dụng giao thức Sender Policy Framework (SPF) (http://spf.pobox.com) để xác định rằng hệ thống được cho phép gửi thư từ các người dùng của hệ thống đĩ. Cĩ từ SpamAssassin 3.0.
• SpamAssassin cĩ thể phân quyền cho các người gửi định mở rộng một số sức mạnh tính tốn dưới dạng Hashcash (http://www.hashcash.org).Các Spammers khơng thể thự hiện các tính tốn cần thiết và gửi một số lượng các thư lớn một cách nhanh chĩng qua hệ thống. Cĩ từ SpamAssassin 3.0.
Ngồi ra chúng ta cịn cĩ một số hướng tiếp cận sau:
Thứ nhất, chúng ta cĩ thể kết hợp các kỹ thuật như kiểm tra định dạng thư, lọc nội dung, sử dụng các Blacklist trên mạng thành một giải pháp hồn thiện.
Mặt khác, trong hệ thống chặt chẽ, nĩ giữ tất cả các thư của tất cả các người gửi chưa xác định và gửi lại một bức thư với một mã đặc biệt hoặc tập một số hướng dẫn để người gửi phải gửi lại thư xác nhận rằng địa chỉ thư là của mình và thư của mình khơng phải do các cơng cụ sinh thư rác tự động tạo ra. Sau đĩ các lá thư của người gửi cĩ thể được lưu hành bình thường.
Trong một số hệ thống khác, các máy chủ thư điện tử ban đầu trả về các gĩi SMTP lỗi cho các người gửi mới hay các hệ thống gửi thư mới. Nếu hệ thống gửi lại bức thư trong một khoảng thời gian hợp lý thì mail server chấp nhận bức thư đĩ và cả các bức thư sau đĩ từ host gửi thư trên. Phương pháp này cũng hiệu quả bởi vì các Spammer xử lý các lỗi tạm thời này như là một lỗi cố định và cố gắng gửi liên tục các thư theo khoảng thời gian đều đặn đến đáng nghi. Các thư này sẽ khơng được chấp nhận.
Trong hệ thống giới hạn về thời gian, các người dùng tạo ra các biến thể duy nhất của địa chỉ email của họ để cĩ thể đưa lên các trang web, các thư, các newsgroup,… Các địa chỉ này chỉ tồn tại trong một khoảng thời gian xác định theo yêu cầu của người đĩ. Khi đĩ,chúng ta sẽ tránh được các thư rác trong khoảng thời gian sau khi hết hạn trên, tránh được các cơng cụ tìm địa chỉ thư tự động trên mạng mà các Spammer hay dùng.
Trong hệ thống cĩ tính cước, người gửi phải trả một chi phí nhỏ cho mỗi thơng điệp họ gửi đi, như thế sẽ ngăn chặn được các Spammer gửi thư hàng loạt và cĩ thể chi phí đĩ được trả lại nếu người nhận xác định thư đĩ khơng phải là thư rác.