Quy trình và thủ đoạn gửi thư rác

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân loại thư rác bằng phương pháp học máy (Trang 25 - 28)

Để phát tán thư rác, những người gửi thư rác phải cĩ được những điều kiện sau: một là cĩ danh sách địa chỉ thư nhận thư, hai là cĩ các server cho phép gửi thư, ba là phải soạn được nội dung thư theo yêu cầu quảng cáo và qua mặt được các bộ lọc nội dung, cuối cùng cần cĩ những chương trình để gửi thư đi.

1.2.5.1. Thu thập địa chỉ thư

Để gửi thư rác đi, người gửi thư rác cần phải cĩ một danh sách các địa chỉ thư cần gửi. Danh sách địa chỉ thư này cĩ thể thu thập được từ nhiều nguồn khác nhau, họ cĩ thể mua từ các trang web thương mại cĩ nhiều thành viên đăng ký hoặc sử dụng các kỹ thuật như trong ví dụ 1.3 để cĩ được địa chỉ thư của đối tượng cần gửi thư.

Người gửi thư rác (hoặc đối tác của họ) thường tung ra các trang web giả để bẫy người dùng gửi địa chỉ thư cho họ. Kỹ thuật này được gọi là Phishing email.

18

Người gửi thư rác cịn sử dụng các máy tìm kiếm chỉ để tìm kiếm địa chỉ thư trên các trang web. Các máy tìm kiếm này sẽ tìm kiếm những trang cĩ kí hiệu “@” và sẽ tách địa chỉ thư từ đĩ ra. Những chương trình tìm kiếm thư theo kiểu như vậy cịn được gọi là spambots.

Danh sách các địa chỉ cũng cĩ thể được sinh tự động theo một cơ chế nào đĩ để xác suất tồn tại của địa chỉ sinh tự động cĩ thể chấp nhận được. Địa chỉ thư thường được tạo ra nhờ kết hợp giữa các họ tên phổ biến với các domain nhiều người dùng và các con số cĩ nghĩa. Ví dụ như địa chỉ thư được sinh như sau: Từ địa chỉ gốc là: PhamKimDung+ @ + gmail.com.vn, cĩ thể sinh ra các địa chỉ sau:

 PhamKimDung1@gmail.com.vn,  PhamKimDung1976@gmail.com.vn,  PhamKimDung2015@gmail.com.vn...

Để xác định một địa chỉ thư cĩ tồn tại hay khơng, những người gửi thư rác sẽ gửi một bức thư tới tất cả các hịm thư trong danh sách sinh tự động. Nếu hịm thư đĩ tồn tại và chủ nhân của nĩ mở bức thư đĩ ra thì sẽ cĩ một chương trình được kích hoạt thơng báo về sự tồn tại của địa chỉ cho người gửi thư rác. Cách này cịn gọi là sinh địa chỉ thư theo kiểu từ điển.

1.2.5.2. Tìm kiếm các máy tính trên Internet cho phép gửi thư

Muốn gửi được thư rác, người gửi thư rác cần cĩ trong tay một danh sách các server để gửi thư đi. Các server này cĩ thể là những server chuyên để gửi thư rác do người gửi thư rác sở hữu hoặc thuê, hoặc là những server bị người gửi thư rác lợi dụng. Hình sau đưa ra một ví dụ về trang quảng cáo của một số cơng ty chuyên tung thư rác được Google liệt kê khi tìm kiếm hai từ “bulk mail”:

19

Người gửi thư rác thường khai thác lỗ hổng của những server cho phép chuyển tiếp thư (open relay) hoặc những proxy mở cho phép gửi thư (open proxy). Ví dụ quan sát hình trên minh họa cách gửi thư rác qua mail server (open relay).

Hình 1.5. Minh họa cách gửi thư rác qua máy chủ thư (open relay)

Trên mạng Internet thường cĩ rất nhiều mail server cho phép chuyển tiếp thư. Người gửi thư rác hay sử dụng các server này để chuyển tiếp thư rác vì khi đĩ họ sẽ khĩ bị phát hiện hơn và chuyển được các gánh nặng về đường truyền sang cho các server đĩ. Tuy nhiên những mail server dạng này thường sớm bị đưa vào danh sách đen (danh sách những địa chỉ IP bị chặn) của các bộ lọc thư rác và khơng thể tiếp tục gửi thư rác được nữa.

Một loại server khác là các proxy cho phép gửi thư cũng được người gửi thư rác đặc biệt yêu thích. Mục đích của những proxy này là giúp các trang web vượt qua được tường lửa (firewall). Một số proxy cho phép gửi thư và bất cứ ai cũng cĩ thể truy cập được. Người gửi thư rác lợi dụng điểm này để phát tán thư rác. Khi sử dụng những proxy này, người gửi thư rác hầu như khơng bị phát hiện. Mặt khác, việc lợi dụng này thường được lâu dài vì những người quản lý proxy khơng quan tâm tới việc proxy cĩ bị liệt kê trong danh sách đen của các bộ lọc hay khơng (vì mục đích chính của proxy khơng phải để gửi thư).

Ngồi hai cách trên, những người gửi thư rác cịn thuê các máy tính “ma” để gửi thư rác. Vì đây là các máy tính khơng được quản lý nên khĩ cĩ thể pháp hiện ra

20

tác giả của các bức thư rác. Thêm nữa việc thuê các máy tính này lại khá rẻ nên cĩ tới 40% - 60% người gửi thư rác bắt đầu từ chiêu thức này.

Khơng chỉ dừng lại ở việc đi thuê máy tính ma, những người gửi thư rác (và cũng là những tin tặc) cịn chiếm quyền kiểm sốt các máy tính hợp pháp để gửi thư rác. Tim Cranton, giám đốc bộ phận bảo mật Internet của Microsoft nhận định: ”Việc sử dụng các hệ thống máy tính ma để thực hiện các hành động tội phạm qua Internet hiện nay đang gia tăng chĩng mặt và gây nguy hại đến tồn bộ cộng đồng sử dụng máy tính trên thế giới”. Vào đầu năm 2005, Microsoft đã tiến hành khảo sát thử một máy tính bị nhiễm mã độc và đã bị tin tặc nắm quyền điều khiển từ xa, tức máy tính này đã trở thành một máy tính ma. Kết quả khảo nghiệm cho thấy rằng chỉ trong vịng 20 ngày, máy tính ma này đã nhận được 5 triệu yêu cầu kết nối từ những người thư rác và chính nĩ cũng đã gửi tới 18 triệu thư rác. Trong những ngày cao điểm nhất, máy tính ma này đã nhận được đến 470.000 yêu cầu kết nối và khoảng 1,8 triệu thư rác đã từ nĩ gửi đi.

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân loại thư rác bằng phương pháp học máy (Trang 25 - 28)