Một số kỹ thuật

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số kỹ thuật phát hiện trang web giả mạo và ứng dụng (Trang 31 - 34)

Các kẻ lừa đảo đều muốn nhắm đến những mục tiêu cĩ phần thƣởng cao với ít rủi ro, những mục tiêu này thƣờng là các tổ chức tài chính nhƣ ngân hàng, mơi giới, các cơng ty phát hành thẻ…Các kẻ lừa đảo thậm chí cịn nhắm đến những ngân hàng nhỏ hơn vì những ngân hàng này thƣờng khơng cĩ đủ

nguồn lực tài chính để chống lại những tấn cơng lừa đảo. Rủi ro thấp hơn khi nhắm đến những ngân hàng nhỏ. Một nhĩm mục tiêu it nguy hiểm khác nữa là các tài khoản email và các trang mạng xã hội. Một số kỹ thuật lừa đảo thƣờng đƣợc sử dụng:

Sử dụng thư điện tử giả mạo: Trong một kiểu tấn cơng điển hình, kẻ tấn cơng cĩ thể gửi một số lƣợng lớn nhƣ thƣ giả mạo tới các ngƣời sử dụng Internet một cách ngẫu nhiên mà các thƣ này tựa nhƣ các thƣ đến từ các tổ chức hợp pháp hoặc kinh doanh nổi tiếng ( nhƣ cơng ty tài chính, thẻ tín dụng,…). Nội dung các thƣ giả mạo này yêu cầu các nạn nhân cập nhật các thơng tin cá nhân nhƣ là điều kiện để tránh mất quyền truy nhập đến các dịch vụ nào đĩ (ví dụ nhƣ quyền truy nhập các tài khoản ngân hàng trực tuyến). Tuy nhiên, khi ngƣời dùng kích chuột vào các đƣờng link đƣợc cung cấp, họ sẽ đƣợc điều hƣớng đến các trang web giả mạo của kẻ tấn cơng xây dựng.

Sử dụng các trang web giả mạo: Phần lớn các trang web giả mạo đều cố gắng bắt trƣớc các trang web hợp lệ đến mức tốt nhất cĩ thể để ngƣời dùng cĩ đủ tự tin tiết lộ những thơng tin nhạy cảm. Hầu hết các trang lừa đảo đều làm tốt việc tạo giao diện hợp lệ bằng cách sao chép cách bố trí trang, font, kiểu, logo và thậm chí các thơng tin bảo mật của trang hợp lệ. Thực tế, nhiều liên kết trong trang lừa đảo vẫn thực sự kết nối đến trang hợp lệ, điều này khiến nĩ giống với các trang hợp lệ hơn.

Bắt trước URL: Ngồi việc mơ phỏng theo nội dụng thực tế, một số trang lừa đảo cịn cố gắng bắt trƣớc URL, chẳng hạn thay thế chữ W bằng hai chữ V hoặc thay chữ “l” bằng số “1”. Các trang web lừa đảo thƣờng sử dụng URL giả mạo URL hợp lệ hoặc bao gồm URL hợp lệ trong URL lừa đảo.

Cập nhật thơng tin cá nhân: Một vài trang lừa đảo khơng bắt trƣớc hồn tồn một trang hợp lệ, chúng cĩ thể chỉ cĩ logo hoặc con dấu chứng nhận là khớp với trang hợp lệ. Tuy nhiên những trang này lại hết sức nguy hiểm vì chúng yêu cầu những thơng tin nhạy cảm của ngƣời dùng, ví dụ yêu cầu ngƣời dùng cập nhật thơng tin tên, địa chỉ, số điện thoại, tài khoản, số thẻ tín dụng,…Những kiểu lừa đảo này thƣờng khĩ phát hiện hơn vì chúng khơng bắt trƣớc hồn tồn trang hợp lệ ngoại trừ một số từ khĩa và logo. Tuy nhiên

những trang này vẫn phải sử dụng một số kiểu trình bày của trang hợp lệ, vì vậy cúng vẫn cĩ thể bị phát hiện.

Che giấu URL: Một vài trang lừa đảo đã biết cách thử và ẩn URL thực của trang lừa đảo và thay thế nĩ bằng URL của trang hợp lệ. Khai thác lỗ hổng trình duyệt hoặc sử dụng Javascrip để ghi đè lên thanh địa chỉ một cái gì đĩ khác đi là một kỹ thuật lừa đảo cao cấp để ẩn URL thực của trang lừa đảo. Khi ngƣời dùng nhìn vào thanh đại chỉ của trình duyệt, họ sẽ chỉ nhìn thấy địa chỉ URL của trang hợp lệ, nhƣng bản chất đĩ lại là trang lừa đảo.

Nhiễm độc DNS: Một kỹ thuật lừa đảo khác nhiễm độc bằng DNS trên chính máy tính ngƣời dùng. Đây là sự kết hợp của phần mềm độc hại và lừa đảo vì thƣờng phần mềm độc hại đƣợc cài đặt để ghi đè lên bảng DNS của máy tính. Bảng DNS sẽ đổi địa chỉ IP của các trang web hợp lệ thành địa chỉ P của trang web lừa đảo. Khi ngƣời dùng truy cập những trang werb này sẽ tự động bị đẩy vào những trang lừa đảo.

Ngồi các kỹ thuật nêu trên, một số kỹ thuật khác cũng thƣờng đƣợc sử dụng là dựa vào các kỹ thuật xã hội để đạt đƣợc thơng tin nhạy cảm của nạn nhân, chẳng hạn gọi điện thoại đến các nạn nhân và đặt nạn nhân vào các tình huống cĩ khả năng cung cấp các thơng tin này cao…Tuy nhiên trong khuơn khổ của luận văn này, học viên chỉ tập trung nghiên cứu về web giả mạo.

Chƣơng 2

CÁC KỸ THUẬT PHÁT HIỆN WEBSITE GIẢ MẠO

2.1.Thuật tốn TF - IDF (Term Frequency/Inverse Document Frequency)

Trong mơ hình tần suất, ma trận W = {wij} đƣợc xác định dựa trên tần

số xuất hiện của từ khĩa ti trong văn bản dj hoặc tần số xuất hiện của từ khĩa ti

trong tồn bộ cơ sở dữ liệu. Sau đây là một số phƣơng pháp phổ biến [4]:

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số kỹ thuật phát hiện trang web giả mạo và ứng dụng (Trang 31 - 34)