Tách ại của thư rác

Một phần của tài liệu Nghiên cứu phân loại thư rác dựa trên kỹ thuật học máy naive bayes (Trang 30 - 32)

Theo thống kê thƣ rác hiện chiếm hơn một nửa số email truyền trên Internet

và chính thƣ rác là nguồn lây lan virus nhanh nhất. Thiệt hại do chúng gây ra rất lớn

đối với sự phát triển internet nĩi chung và ngƣời sử dụng thƣ điện tử nĩi riêng. Theo thống kê tồn cầu của hãng nghiên cứu Ferris Research ở San

thiệt hại do thƣ rác gây ra đối với các doanh nghiệp ƣớc tính khoảng 17 tỷ USD/năm.

Thƣ rác chiếm khoảng 80% lƣu lƣợng thƣ điện tử thế giới trong quý 1/2006,

đĩ là kết luận của nhĩm hợp tác chống thƣ rác gồm các cơng ty AOL, Bell Canada, Cigular Wireless, EarthLink, France Telecom, Microsoft, Verizon, và Yahoo. Microsoft và AOL cho biết hai hãng này trung bình mỗi ngày chặn gần 5 tỷthƣ rác. Ƣớc tính, cứ 9 trong 10 email sử dụng dịch vụ MSN Hotmail của Microsoft là thƣ

rác.

Tại Việt Nam, tình hình thƣ rác cũng đang rất phức tạp. Cơng ty Điện tốn và Truyền số liệu (VDC) – một trong các ISP lớn nhất Việt Nam - cho biết, thƣ rác

hiện nay chiếm phần lớn lƣu lƣợng email qua hệ thống máy chủ thƣ của ISP này.

Các thƣ phàn nàn gửi đến ISP nếu khơng giải quyết, các khách hàng của ISP đĩ cĩ thể bị liệt vào danh sách đen, khơng gửi đƣợc email ra địa chỉ nƣớc ngồi. Một số

ISP cho biết, cuối năm ngối, khách hàng của nhiều ISP ở Việt Nam thƣờng xuyên bị tê liệt do bị liệt vào danh sách đen. Mỗi lần thốt ra khỏi danh sách này ISP phải mất khoảng 40 USD. Trang web Spamhaus.org (tổ chức theo dõi các nguồn gửi thƣ

rác) đã từng liệt kê tên miền vnn.vn trong danh sách top 10 ISP cung cấp nhiều thƣ

rác nhất.

Khơng chỉ gây thiệt hại về tiền bạc, thƣ rác cịn làm giảm hiệu quả làm việc, gây stress, tiêu tốn thời gian của nhân viên... Những điều này cũng đồng nghĩa với việc, năng suất lao động giảm, ảnh hƣởng tới tình hình kinh doanh và doanh thu của cơng ty.

Một số lời khuyên cho ngƣời dùng thƣ điện tử:

 Yêu cầu và địi hỏi nhà chức trách phải đƣa ra những luật lệ nghiêm cấm thƣ

rác và cĩ hình phạt đích đáng cho kẻ cố tình gửi thƣ rác.

 Mỗi ngƣời dùng nên tạo nhiều địa chỉ email, với mục đích khác nhau nên dùng địa chỉ email khác nhau.

 Hạn chế việc đăng kí các dịch vụ vơ ích: nên tìm hiểu kĩ thơng tin về dịch vụ trƣớc khi cung cấp địa chỉ email của mình.

 Kích hoạt các dịch vụ chống thƣ rác của ISP.

 Cài đặt một sốchƣơng trình xử lý thƣ trong máy tính cá nhân đểxĩa thƣ rác

ngay khi chuyển về máy.

 Bảo vệ mật khẩu của mình: chọn mật khẩu lạ, khĩ đốn chứa chữ cái, xen lẫn chữ số và chữ hoa xen lẫn chữthƣờng.

 Thƣờng xuyên ghi dự phịng dữ liệu quan trọng. Đồng thời cảnh giác với những thƣ từ ngƣời quen biết nhƣng khơng đƣợc báo trƣớc, bởi cĩ thểchúng đƣợc gửi đi mà ngƣời gửi khơng biết.

Số lƣợng Spam vẫn luơn luơn tăng và ngày càng tinh vi hơn, ngƣời ta nhận

định rằng việc chống Spam sẽ luơn luơn phải thực hiện, tùy vào ý thức của cƣ dân

Internet và sức mạnh của cơng nghệ mà việc Spam chỉđƣợc hạn chế phần nào.

Một phần của tài liệu Nghiên cứu phân loại thư rác dựa trên kỹ thuật học máy naive bayes (Trang 30 - 32)

Tải bản đầy đủ (PDF)

(49 trang)