Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
1,8 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Vũ Huy Thiện ĐÁNHGIÁMỨCĐỘPHỔBIẾNCỦAQUẢNGCÁOVÀQUẢNGCÁOĐỘCHẠITRÊNWEBSITE LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Vũ Huy Thiện ĐÁNHGIÁMỨCĐỘPHỔBIẾNCỦAQUẢNGCÁOVÀQUẢNGCÁOĐỘCHẠITRÊNWEBSITE Ngành: Công nghệ thông tin Chuyên ngành: Truyền liệu Mạng máy tính Mã số: LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Lê Đình Thanh HÀ NỘI - 2016 Lời cảm ơn Lời đầu tiên, xin cảm ơn TS Lê Đình Thanh, Phòng Thí nghiệm An toàn Thông tin, Khoa Công nghệ Thông tin, Trường Đại học Công nghệ, ĐHQGHN định hướng đề tài tận tình hướng dẫn, bảo suốt trình thực luận văn Tôi xin chân thành cảm ơn thầy, cô Trường Đại học Công nghệ, ĐHQGHN truyền đạt kiến thức tạo điều kiện thời gian học tập Cuối cùng, xin gửi lời cảm ơn tới gia đình bạn bè, người bên cạnh, giúp động viên trình học tập suốt trình thực luận văn Mặc dù nỗ lực, cố gắng chắn luận văn nhiều thiếu sót Tôi mong nhận ý kiến đóng góp, chia sẻ quý thầy cô, anh chị bạn Tôi xin chân thành cảm ơn! Hà Nội, ngày 05 tháng 12 năm 2016 Người thực Vũ Huy Thiện Lời cam đoan Tôi xin cam đoan luận văn cao học “Đánh giámứcđộphổbiếnquảngcáoquảngcáođộchại website” thực hướng dẫn giáo viên hướng dẫn TS Lê Đình Thanh Các nội dung luận văn ghi rõ nguồn gốc phía cuối luận văn Nếu có phát gian lận chép tài liệu, công trình nghiên cứu tác giả khác mà không ghi rõ phần tài liệu tham khảo, chịu hoàn toàn trách nhiệm kết luận văn Hà Nội, ngày 05 tháng 12 năm 2016 Người thực Vũ Huy Thiện MỤC LỤC DANHMỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT DANHMỤC HÌNH VẼ DANHMỤC BẢNG BIỂU MỞ ĐẦU CHƯƠNG QUẢNGCÁO TRỰC TUYẾN 10 1.1 Quảngcáo 10 1.2 Quảngcáo trực tuyến 10 1.3 Các tác nhân tham giaquảngcáo trực tuyến 10 1.4 Các hình thức quảngcáo trực tuyến 11 1.5 Phương pháp tính chi phí quảngcáo 19 1.6 Lợi ích quảngcáo trực tuyến 20 1.7 Những vấn đề lo ngại quảngcáo trực tuyến 21 1.8 Kỹ thuật đưa nội dung quảngcáo lên website 22 CHƯƠNG QUẢNGCÁOĐỘCHẠI .25 2.1 Khái niệm 25 2.2 Phương thức làm việc 25 2.3 Các loại quảngcáođộchại 25 2.4 Kỹ thuật thực mã độc 33 CHƯƠNG ĐÁNHGIÁMỨCĐỘPHỔBIẾNCỦAQUẢNGCÁOVÀQUẢNGCÁOĐỘCHẠI 36 3.1 Mục đích 36 3.2 Quy trình 36 3.3 Chi tiết bước thực 37 KẾT LUẬN 41 TÀI LIỆU THAM KHẢO 42 PHỤ LỤC 43 DANHMỤC CÁC THUẬT NGỮ VÀ TỪ VIẾT TẮT GPS: Global Positioning System URL: Uniform Resource Locator DOM: Document Object Model SOP: Same-Origin Policy XSS: Cross-site Scripting SQL: Structured Query Language CRM: Customer relationship management CMS: Content management systems BOM: Browser Object Model Publisher: Nhà xuất trang web Ad Network - Advertising Network: Mạng quảngcáo Advertiser: Nhà quảngcáoDANHMỤC HÌNH VẼ Hình 1.1: Mô hình hoạt động quảngcáo trực tuyến……………………… Hình 1.2: Hình ảnh minh họa quảngcáo hiển thị…………………………….9 Hình 1.3: Hình ảnh minh họa biểu ngữ quảng cáo………………………….10 Hình 1.4: Hình ảnh minh họa khung quảng cáo…………………………….10 Hình 1.5: Hình ảnh minh họa quảngcáo popup…………………………….11 Hình 1.6: Hình ảnh minh họa quảngcáo Float ad………………………… 11 Hình 1.7: Hình ảnh minh họa quảngcáo Expanding ad…………………….12 Hình 1.8: Hình ảnh minh họa Trick banners……………………………… 12 Hình 1.9: Hình ảnh minh họa Interstitial ads……………………………… 12 Hình 1.10: Hình ảnh minh họa Text ads…………………………………….13 Hình 1.11: Hình ảnh minh họa Search Engine Marketing………………… 13 Hình 1.12: Hình ảnh minh họa Social media marketing……………………14 Hình 1.13: Hình ảnh minh họa Mobile Advertising……………………… 14 Hình 1.14: Hình ảnh minh họa Email Advertising………………………….15 Hình 1.15: Hình ảnh minh họa phần mềm quảng cáo………………………15 Hình 1.16: Hình ảnh minh họa tiếp thị liên kết…………………………… 16 Hình 1.17: Ảnh hiển thị minh họa sử dụng HTML……… ………………… 19 Hình 1.18: Ảnh hiển thị minh họa sử dụng Javascript………… …………… 20 Hình 1.19: Ảnh hiển thị minh họa sử dụng XML………….………………… 20 Hình 1.20: Ảnh hiển thị minh họa sử dụng ActionScript… ………………… 21 Hình 2.1: Minh hoạ quảngcáo văn bản………………………………….23 Hình 2.2 Mô hình hoạt động tải tự động……………………………….24 Hình 2.3: Đăng ký widget lỗ hổng vùng quảng cáo………………… 25 Hình 2.4: Widget cài đặt………………………………………………….26 Hình 2.5: Nạn nhân trình duyệt chuyển hướng đến vùng độc hại……… 27 Hình 2.6: Thiết kế tập tin backdoor wmv…………………………………… 29 Hình 2.7: Tập tin WMV lây lan tập tin VBScript độc hại…………………… 29 Hình 3.1: Quá trình thu thập quảng cáo, quảngcáođộc hại………………… 33 DANHMỤC BẢNG BIỂU Bảng 3.1 Thống kê quảngcáo theo lĩnh vực……………………………39 Bảng 3.1 Thống kê quảngcáo theo tên miền………………………… 39 Biểu đồ 3.1 Thống kê quảngcáo theo lĩnh vực…………………………40 Biểu đồ 3.2 Thống kê quảngcáo theo tên miền……………………… 40 MỞ ĐẦU Ngày nay, với phát triển mạnh mẽ Internet, dịch vụ mạng Internet ngày phát triển không ngừng, dịch vụ quảngcáo trực tuyến website trở lên phổbiến trước Các tổ chức, doanh nghiệp, cá nhân muốn quảngcáo sản phẩm, dịch vụ trang Web tiếng, có lượng người dùng truy nhập lớn nhằm thu hút quan tâm người dùng, khách hàng Việc phân phối quảngcáo trực tuyến website thực qua nhiều phương thức khác nhau: thông qua thẻ HTML, mã kịch Javascript, Iframe,… Tuy nhiên, vấn đề đặt số quảngcáowebsite an toàn cho người dùng, gây hại (quảng cáođộc hại) cho người dùng họ click chuột vào chúng Quảngcáođộchại lây lan phần mềm độchại hay chuyển hướng người dùng đến websiteđộchại nhằm thực hành vi độchại kẻ công người dùng hệ thống Nhằm đánhgiámứcđộphổbiếnquảngcáoquảngcáođộc hại, luận văn tập trung vào việc khảo sát, đánhgiáwebsite Việt Nam theo số lĩnh vực dựa vào URL Luận văn sử dụng Adblock Plus để phát quảngcáo sử dụng VirusTotal để lọc quảngcáođộchại Kết thử nghiệm cho thấy, tỷ lệ quảngcáoquảngcáođộchại phát thấp CHƯƠNG QUẢNGCÁO TRỰC TUYẾN 1.1 QuảngcáoQuảngcáo hình thức tuyên truyền trả tiền để thực việc giới thiệu thông tin sản phẩm, dịch vụ, công ty hay ý tưởng Quảngcáo hoạt động truyền thông không trực tiếp người với người mà người muốn truyền thông phải trả tiền cho phương tiện truyền thông đại chúng để đưa thông tin đến thuyết phục hay tác động đến người nhận thông tin 1.2 Quảngcáo trực tuyến Quảngcáo trực tuyến [1], gọi tiếp thị trực tuyến quảngcáo Internet, hình thức tiếp thị quảngcáo sử dụng Internet để cung cấp thông điệp tiếp thị quảngcáo cho người tiêu dùng Nó bao gồm tiếp thị email, tiếp thị công cụ tìm kiếm (SEM), tiếp thị truyền thông xã hội, nhiều loại quảngcáo hiển thị (bao gồm biểu ngữ quảngcáo web), quảngcáo di động Giống phương tiện truyền thông quảngcáo khác, quảngcáo trực tuyến thường bao gồm nhà xuất bản, người kết hợp quảngcáo vào nội dung trực tuyến mình, nhà quảng cáo, người cung cấp quảngcáo hiển thị nội dung nhà xuất 1.3 Các tác nhân tham giaquảngcáo trực tuyến 1.3.1 Publisher Publisher nhà xuất trang web, thực việc bán không gian quảngcáo trang web mình, quản lý thu lợi nhuận từ việc bán quảngcáo Trước Ad Network - Advertising Network (mạng quảngcáo trực tuyến) đời, Publisher phải thực việc chào bán quảngcáo cách liên hệ với Advertiser để giới thiệu thuyết phục họ mua quảngcáowebsite Việc bán quảngcáo đòi hỏi phải có đội ngũ bán hàng thật chuyên nghiệp, đó, có Publisher lớn (Vnexpress, Dantri, Tuoitre,…) có khả đầu tư vào đội ngũ bán hàng chất lượng, việc cạnh tranh Publisher vừa nhỏ ngày khó khăn Do hội tiếp cận với Adveriser nên không gian quảngcáowebsite bị bỏ phí, lãng phí lượng truy cập từ người xem website Publisher 1.3.2 Advertiser Advertiser (nhà quảng cáo) công ty cá nhân có Website bán hàng hóa dịch vụ trực tuyến, Advertiser hợp tác với Publisher để quảngcáo hàng hóa, dịch vụ giúp họ Hay nói cách khác, Advertiser quảngcáo hình ảnh, sản phẩm, dịch vụ hoặc/và quảng bá thương hiệu website 10 Hình 2.6: Thiết kế tập tin backdoor wmv - Bước 2: Kẻ công tiêm tập tin wmv iframe tiêm vào đoạn mã khu vực CDN dễ bị tổn thương Khi tập tin phân phối qua khu vực, bắt đầu lây lan tập tin XSS độchại vượt qua lọc Internet Explorer XSS Như vậy, CDN có tiềm trở thành vấn đề lớn phần mềm độchại với web Hình 2.7: Tập tin WMV lây lan tập tin VBScript độchại 2.3.7 Biểu ngữ độchạiQuảngcáo biểu ngữ sử dụng rộng rãi để lây lan rộng rãi Chủ yếu, kẻ công khai thác máy chủ mà lưu trữ số trang web máy chủ - kịch phổbiến Như trên, công máy chủ cách dễ dàng để lây nhiễm số lượng lớn trang web Ngoài ra, từ quảngcáo biểu ngữ diện rộng, công thông qua chúng phổbiến rộng rãi Trong công này, kẻ công khai thác lỗ hổng XSS hay SQL injection trang web lưu trữ máy chủ để có toàn quyền kiểm soát Những kẻ công sau sử dụng hai kỹ thuật cụ thể để lây nhiễm trang web với biểu ngữ độchại sau: - Những kẻ công cập nhật sở liệu với iframe độchại cách khai thác tiêm SQL để kích hoạt lây nhiễm ổn định - Những kẻ công thỏa hiệp máy chủ lưu trữ chia sẻ sử dụng kịch tự động để làm cho mã độchại trang web host khác Khi người dùng truy cập trang web cụ thể, biểu ngữ độchại hiển thị với nội dung động Nhấp chuột vào biểu ngữ người sử dụng bị lây nhiễm, đơn giản hiển thị biểu ngữ dẫn đến lây nhiễm 32 2.3.8 Quảngcáo bên thứ ba Ở nói đến vai trò mạng quảngcáo (máy chủ quảng cáo) Thông thường, trang web có liên quan đến quảngcáo bên thứ ba nội dung, phương tiện truyền thông trang web truyền thông xã hội kiếm tiền thông qua quảngcáo Các kỹ thuật bên thứ ba nhà quảngcáo muốn đặt quảngcáo trang web để tiếp cận đối tượng Tuy nhiên, nhiều nhà quảngcáo công cụ để phục vụ quảngcáo mình, nhà xuất không muốn bán quảngcáo trực tiếp cho nhà quảngcáoDo đó, có xuất tham gia máy chủ quảngcáo bên thứ ba, kết nối nhà quảngcáo nhà xuất quảngcáo 2.3.9 Các ứng dụng bên thứ ba Chẳng hạn diễn đàn, hệ trợ giúp, CRM (customer relationship management) CMS (content management systems) ứng dụng khác ứng dụng web bị khai thác lỗ hổng không vá cách Khi cài đặt phần mềm không cẩn thận người dùng sẻ gặp rắc rối với phần mềm ăn theo bên thứ phần mềm adware (phần mềm quảng cáo), ứng dụng mà không mong muốn theo dõi người dùng bị thêm vào công cụ (tool bar) trình duyệt web Phần lớn trường hợp thêm vào ứng dụng bên thứ ba nguy hại cho người dùng người dùng nên lưu ý cài đặt phần mềm dính phải ứng dụng, hay phần mềm sẻ thấy vô khó chịu khó loại bỏ hoàn toàn khỏi hệ thống 2.3.10 Cướp liên kết Cướp liên kết cho phép quảngcáo tự động chuyển hướng người sử dụng tới website mà họ ý muốn thăm Các kịch quảngcáo truy nhập Document Object Model (DOM) trang web nhà xuất vi phạm Same-Origin Policy (SOP) Tuy nhiên, kịch độchại chứa quảngcáo chuyển hướng toàn trang tới đích lựa chọn trước cách thiết lập biến top.location Browser Object Model (BOM) Bằng cách này, nạn nhân chuyển đến vị trí tùy ý không lựa chọn theo ý ban đầu 2.4 Kỹ thuật thực mã độc 2.4.1 Che dấu mã Để trốn tránh việc phân tích phát hành vi nguy hiểm, số quảngcáođộchại sử dụng kỹ thuật che dấu để tránh quét dựa chữ ký phần mềm chống virus [4] Chẳng hạn như: 33 - Hàm eval() document.write() tiêm vào kịch để tiêm vào mã động - Để hình thành chuỗi dài không đọc được, sử dụng hàm escap() mã hóa ký tự, cuối sử dụng hàm unescape() kịch trình duyệt để giải mã - Để đạt thay chuỗi con, thường sử dụng hàm biến - Tùy biến thủ tục giải mã viết kịch 2.4.2 Chuyển hướng URL Nhiều quảngcáođộchại tự động chuyển hướng tới URL khác Khi trình duyệt truy cập URL, thời gian phản hồi URL tự động hướng dẫn trình duyệt để truy cập vào nhiều URL khác mà không ảnh hưởng đến nội dung hình vào người sử dụng Chuyển hướng sử dụng công nghệ sau: - Sử dụng mã phản hồi 301, 302 giao thức http để chuyển hướng - Sử dụng thẻ html bao gồm thuộc tính src iframe, khung khung thẻ kịch liên kết đến địa bên - Sử dụng hàm kịch bao gồm: window.location.replace(), window location.href() window.open() 2.4.3 Khai thác lỗ hổng Hệ thống Web độchại lỗ hổng trình duyệt nguy hiểm lợi chương trình, người dùng truy cập vào trang này, thủ tục tải trojan phần mềm độchại khác máy chủ dẫn đến tình trạng không an toàn máy chủ Để sử dụng trình duyệt Internet, lỗ hổng Internet Explorer rủi ro cao hơn, sử dụng phương pháp chung chia thành hai sau: - Do sơ hở dẫn lỗi cho việc thực shellcode mã nguồn trang có chứa shellcode - Sử dụng thành phần lỗ hổng khác để tải chạy chương trình Các hàm phổbiến hàm CreateObject(), hàm ActiveXObject() tập tin địa URL chứa thẻ object Cần haimức kiểm tra cho mã trang cho đặc điểm Mức mô hình chữ ký trích xuất phù hợp cho kịch Tập trung vào chức mã hóa, kịch mức rủi ro cao để kiểm tra Mức thứ hai, kiểm tra độ dài URL hậu tố tên tập tin iframe có mứcđộ rủi ro cao, khung, kịch 34 liên kết thẻ kiểm tra thẻ đối tượng chúng có chứa địa URL tập tin Một số đặc điểm mã nguồn URL độchại phân tích có chứa URL sở hữu đặc tính tải vào máy chủ sở liệu thông qua tìm kiếm hình ảnh web, công cụ tìm kiếm có sẵn cho người sử dụng URL, gây nhiễm độc PC người dùng phá hủy liệu người sử dụng, ăn cắp thông tin lưu trữ máy phục vụ người dùng, tên người dùng mật khẩu, chí gây hư hỏng phần cứng Mục đích phương pháp phát URL tĩnh URL độchại phát 35 CHƯƠNG ĐÁNHGIÁMỨCĐỘPHỔBIẾNCỦAQUẢNGCÁOVÀQUẢNGCÁOĐỘCHẠI 3.1 Mục đích Mục đích chương đánhgiámứcđộphổbiếnquảngcáoquảngcáođộchại websites quan tâm (trong phạm vi luận văn khảo sát website Việt Nam) Sau có danh sách website tiến hành khảo sát, đánhgiá nhằm đưa số thống kê quảng cáo, quảngcáođộchại theo lĩnh vực, tên miền Trên sở đó, tổ chức, cá nhân có giải pháp cụ thể nhằm giảm thiểu quảngcáođộchạiwebsite tổ chức Trên thực tế, nhiều trang web quảngcáođộchại Tuy nhiên, luận văn tập trung vào quảngcáo lý chủ yếu sau: - Quảngcáo gây ức chế, làm phiền khó chịu cho người dùng duyệt web - Quảngcáo nơi dễ bị kẻ xấu lợi dụng, trà trộn, giả mạo để thực hành vi xấu, ảnh hưởng đến người dùng 3.2 Quy trình Get href links from the anchor tags List of Adblock Plus Parser Phantomjs websites Get src links from the iframe tags Ads Statistics Macilious Ads VirusTotal Hình 3.1: Quy trình thu thập quảng cáo, quảngcáođộchại 36 Quy trình khảo sát quảngcáoquảngcáođộchại websites bao gồm bốn bước sau: - Đầu tiên, lập danh sách website cần khảo sát (là đầu vào), sau dùng PhantomJS để lấy URLs tài nguyên website - Tiếp theo, sử dụng EasyList AdblockPlus để lấy URLs quảngcáo số URL thu thập bước - Sau đó, sử dụng VirusTotal để nhận diện quảngcáođộchại số URL quảngcáo bước thứ hai - Cuối phân tích, đánhgiá kết 3.3 Chi tiết bước thực 3.3.1 Lập danh sách website khảo sát thu thập tài nguyên website Đầu tiên, thu thập tập URLs websites Việt Nam theo số lĩnh vực Tiếp theo, phát triển crawler (con bọ) để lấy tài nguyên website Crawler phát triển dựa vào Phantomjs Phantomjs “headless browser” (trình duyệt web không sử dụng giao diện đồ họa người dùng) Chúng thu thập tổng cộng 237 website thuộc lĩnh vực: mua bán, rao vặt (45 website); giáo dục, đào tạo (53 website); du lịch (51 website); y tế (33 website); báo chí (55 website) Dowebsite có số lượng tài nguyên lớn quảngcáo xuất chủ yếu tài nguyên cấp cao nên giới hạn độ sâu tìm kiếm crawler Với độ sâu đó, thu thập 7404 tài nguyên khác 3.3.2 Thu thập quảngcáo Chúng phát triển tiếp kich cho Phantomjs để phân tích trang web thu thập tất iframe; hầu hết trường hợp, quảngcáo nằm iframe Tuy nhiên, tất iframe nằm trang web chứa quảngcáo Vì vậy, để phân biệt iframe có liên quan đến quảng cáo, sử dụng EasyList EasyList bao gồm vùng mẫu URL cho máy chủ liên quan đến quảng cáo, sử dụng plugin trình duyệt Adblock Plus để chặn quảngcáo Sau thu hầu hết tất URL IFRAME webpage, sử dụng API Adblock Plus để xem URL iframe mà thu thập, URL URL quảngcáo Nếu kết trả mà URL bị block (khóa), URL URL quảng cáo, ngược lại URL quảngcáo * Bước cụ thể: 37 - Đầu tiên thu thập iframe dựa vào PhantomJS: Đầu bước danh sách URL iframe lưu vào tập tin daura.txt - Tiếp theo, đối chiếu nội dung tập tin daura.txt với nội dung tập tin easylist.txt cách sử dụng API AdblockPlus để lọc URL quảngcáo số URL tập tin daura.txt EasyList tập hợp quy tắc gốc thiết kế cho Adblock tự động loại bỏ nội dung không mong muốn từ internet, bao gồm quảngcáo gây phiền nhiễu, biểu ngữ khó chịu theo dõi phiền hà Đầu bước danh sách URL quảng cáo, lưu vào tập tin Ads.txt 3.3.3 Nhận diện quảngcáođộchại Sau có URL quảng cáo, thực gửi URL quảngcáo thu thập bước 3.3.2 lên VirusTotal [5] để biết quảngcáođộchại hay lành tính Ở đây, VirusTotal dịch vụ trực tuyến miễn phí, giúp phân tích tập tin URL nghi ngờ tạo điều kiện cho việc nhanh chóng phát virus, sâu máy tính, trojan tất loại phần mềm độchại khác Sản phẩm Antivirus giải pháp tốt cho loại Tuy nhiên, tất nhà cung cấp nhận phần mềm độchại tương tự Ngoài ra, việc tiếp cận với nhiều sản phẩm chống virus trình nhiều thời gian tốn nhiều nguồn lực Do đó, VirusTotal giải vấn đề VirusTotal dịch vụ trực tuyến phân tích file sử dụng 51 sản phẩm chống virus khác chế quét để kiểm tra phần mềm độchại Chúng ta gửi mẫu tới VirusTotal nhận báo cáo với việc phân loại mẫu công ty chống virus khác Bất quảngcáo cố gắng để buộc người dùng tải phần mềm, chuyển tiếp phần mềm tới VirusTotal lấy phân loại Bằng cách này, định xác phần mềm tải lành tính hay độchại 3.3.4 Tổng hợp phân tích kết Sau thu thu thập chạy kịch để nhận biết quảng cáo, quảngcáođộc hại; bảng thống kê tập URL, URL quảng cáo, URL quảngcáođộchạiwebsite theo lĩnh vực tên miền Thống kê dạng bảng: - Thống kê theo lĩnh vực: 38 Lĩnh vực Tỷ lệ (%) Số Tỷ lệ (%) URL URL Số lượng URL quảngquảng lượng URL quảngcáođộccáođộc URL quảng cáo/URL hại hại/URL cáoquảngcáo Tổng cộng 7404 364 Mua bán, rao vặt 798 32 4% 0% Báo chí 1668 90 5,4% 0% Du lịch 2022 78 3,9% 0% Giáo dục 1485 31 2,1% 0% Y tế 1431 133 9,3% 0% Bảng 3.1 Thống kê quảngcáo theo lĩnh vực - Thống kê theo tên miền: Tên miền Tỷ lệ (%) Số Tỷ lệ (%) URL URL Số lượng URL quảngquảng lượng URL quảngcáođộccáođộc URL quảng cáo/URL hại hại/URL cáoquảngcáo Tổng cộng 7404 364 Tên miền com 6321 345 5% 0% Tên miền edu 443 16 4% 0% Tên miền info 0 0% Tên miền org 341 1% 0% Tên miền net 295 0,3% 0% Bảng 3.2 Thống kê quảngcáo theo tên miền 39 Thống kê dạng biểu đồ trực quan - Thống kê theo lĩnh vực Biểu đồ 3.1 Thống kê quảngcáo theo lĩnh vực - Thống kê theo tên miền Biểu đồ 3.2 Thống kê quảngcáo theo tên miền 40 KẾT LUẬN Nhận xét Nội dung luận văn tập trung vào việc khảo sát, thống kê mứcđộphổbiếnquảng cáo, quảngcáođộchạiwebsite Việc khảo sát, thống kê tập trung vào website Việt Nam số lĩnh vực cụ thể Tuy nhiên, trình khảo sát thực tế nhận thấy website chưa có quảngcáođộchại Qua đó, nhận thấy rằng, việc thực phân phối quảngcáođộchạiwebsite “kẻ xấu” ngày tinh vi khó phát hiện, gây hại người dùng duyệt web Do đó, kết luận văn đóng góp phần nhỏ việc phát quảngcáođộchại website, mứcđộ khả phát chưa cao Ý nghĩa Kết luận văn giúp quan quản lý nhà nước lĩnh vực Thông tin Truyền thông (Bộ Thông tin Truyền thông Sở Thông tin Truyền thông tỉnh/thành phố trực thuộc Trung ương) theo dõi, kiểm tra danh sách websites tổ chức, cá nhân thuộc phạm vi quản lý quan mình; làm sở phục vụ cho công tác quản lý, đạo tổ chức, cá nhân chủ sở hữu tổ chức, cá nhân có liên quan đến thực quảngcáo website, cho việc quản lý, vận hành quảngcáowebsite tốt hơn, đảm bảo an toàn cho người dùng duyệt web Mặt khác, kết luận văn tư vấn giúp tổ chức, cá nhân việc lựa chọn đăng ký tên miền (.com, net, org,…), thuê hosting (trong nước hay nước ngoài) dựa tên miền có tỷ lệ % quảngcáođộchại nhiều nhất, 41 TÀI LIỆU THAM KHẢO [1] https://en.wikipedia.org/wiki/Online_advertising, theo Wikipedia website [2] https://en.wikipedia.org/wiki/Malvertising, theo Wikipedia website [3] Aditya K Sood, Richard J Enbody, Michigan State University, “Malvertising – exploiting web advertising”, Computer Fraud & Security, p11-p15, 2011 [4] Fuqiang Yu, “Malicious URL Detection Algorithm based on BM Pattern Matching”, International Journal of Security and Its Applications Vol.9, No.9 (2015) [5] The Dark Alleys of Madison Avenue, “Understanding Malicious Advertisements”, 2014 [6] ĐỗGia Quân, Phát ngăn chặn quảngcáođộchại dựa vào URL, Khoá luận tốt nghiệp 2016, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội, Hà Nội, 2016 42 PHỤ LỤC Mã nguồn để lọc URL, URL quảng cáo, URL quảngcáođộchại * Kịch để lấy URL "use strict" // variable var system = require('system'), fs = require('fs'), path = 'output2.txt', //file = 'url.txt', ifurls = [], // output iframe url list MAX_DEPTH = 2, // depth maximum can links = [], // link list in webpage depths = [],// depth list can visitedurls = [] ; // main if ( system.args.length = MAX_DEPTH) { return; phantom.exit(0); } var page = require('webpage').create(); console.log("Crawling " + d.toString() + " " + l); page.open(l, function(status) { console.log(status); if (status == "success" && document.body) { 43 // lay tat ca cac link "src" of "iframe" webpage var url = page.evaluate(function() { var nodes = []; var matches1 document.getElementsByTagName("iframe"); = for (var i=0 ; i < matches1.length ; i++) { if (matches1[i].src != '') nodes.push(matches1[i].src); } return nodes; }); // lay tat ca link "href" cua "a" webpage var urlSet = page.evaluate(function() { // l var urlnodes = []; var matches_urlSet document.getElementsByTagName("a"); = for 0;i 0: macilious.append(i.get('resource').encode('utf-8')) malicious_count += 46 ... CHƯƠNG QUẢNG CÁO ĐỘC HẠI 2.1 Khái niệm Quảng cáo độc hại [2] việc sử dụng quảng cáo trực tuyến để lây lan phần mềm độc hại Quảng cáo độc hại liên quan đến tiêm độc hại quảng cáo phần mềm độc hại vào... đến website độc hại nhằm thực hành vi độc hại kẻ công người dùng hệ thống Nhằm đánh giá mức độ phổ biến quảng cáo quảng cáo độc hại, luận văn tập trung vào việc khảo sát, đánh giá website Việt... việc 25 2.3 Các loại quảng cáo độc hại 25 2.4 Kỹ thuật thực mã độc 33 CHƯƠNG ĐÁNH GIÁ MỨC ĐỘ PHỔ BIẾN CỦA QUẢNG CÁO VÀ QUẢNG CÁO ĐỘC HẠI 36 3.1 Mục