Nghiên cứu công nghệ chống thư rác và ứng dụng Nghiên cứu công nghệ chống thư rác và ứng dụng Nghiên cứu công nghệ chống thư rác và ứng dụng luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - Nguyễn Đức Tuân NGHIÊN CỨU CÔNG NGHỆ CHỐNG THƯ RÁC VÀ ỨNG DỤNG Chuyên ngành: Kỹ thuật điện tử LUẬN VĂN THẠC SĨ KHOA HỌC Kỹ thuật điện tử NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS NGUYỄN THỊ VIỆT HƯƠNG Hà Nội – Năm 2012 Nghiên cứu công nghệ chống thư rác ứng dụng LỜI CAM ĐOAN Tôi tên Nguyễn Đức Tuân, mã số học viên: 005312C810, học viên cao học lớp Kỹ thuật Điện tử khóa 2008 Người hướng dẫn PGS.TS.Nguyễn Thị Việt Hương Tơi xin cam đoan tồn nội dung trình bày luận văn: “Nghiên cứu cơng nghệ chống thư rác ứng dụng” kết q trình tìm hiểu nghiên cứu tơi Các liệu viết luận văn trung thực Tơi xin hồn tồn chịu trách nhiệm với nội dung viết luận văn Hà Nội, ngày 28 tháng 03 năm 2012 Học viên Nguyễn Đức Tuân Nghiên cứu công nghệ chống thư rác ứng dụng MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC HÌNH VẼ LỜI MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ THƯ RÁC 10 1.1 Thư điện tử 10 1.1.1 Khái niệm thư điện tử đặc điểm 10 1.1.2 Cấu trúc thư điện tử 10 1.1.3 Trao đổi thư điện tử 14 1.1.4 Một số thống kê thư điện tử 20 1.2 Thư điện tử rác 21 1.2.1 Khái niệm thư điện tử rác 21 1.2.2 Các đặc điểm nhận dạng thư điện tử rác 21 1.2.3 Các cách thức giả mạo thông tin định danh thư điện tử 25 1.2.4 Phương pháp hệ thống phát tán thư rác 26 1.2.5 Một số thống kê thư điện tử rác 32 1.3 Kết luận 34 CHƯƠNG 2: CÔNG NGHỆ NGĂN CHẶN THƯ RÁC 35 2.1 Tổng quan công nghệ ngăn chặn thư rác 35 2.2 Kỹ thuật Challenge-Response 35 2.3 Kỹ thuật chứng thực thư điện tử 39 2.3.1 Sender Policy Framework(SPF) 40 2.3.2 Sender ID Framework 49 2.3.3 DomainKeys Identified Mail (DKIM) 52 2.4 Danh sách đen 61 2.5 Danh sách trắng 69 2.6 Kỹ thuật lọc thống kê Bayesian 71 2.7 Kỹ thuật lọc heuristic 80 2.8 Kết luận 82 CHƯƠNG 3: MỘT SỐ GIẢI PHÁP CHỐNG THƯ RÁC 83 Nghiên cứu công nghệ chống thư rác ứng dụng 3.1 Hệ thống chống thư rác Trend Micro 83 3.2 Hệ thống chống thư rác Symantec 85 3.3 Hệ thống chống thư rác IronPort 85 3.4 Hệ thống chống thư rác Sophos 86 3.5 Giải pháp chống thư rác Microsoft 86 3.6 Giải pháp chống thư rác Websense 87 3.7 Giải pháp chống thư rác Barracuda 88 3.8 Giải pháp chống thư rác McAfee 88 3.9 Giải pháp chống thư rác GFI 88 3.10 Giải pháp chống spam SPAMfighter 90 3.11 Kết luận 93 CHƯƠNG 4: XÂY DỰNG HỆ THỐNG THỐNG KÊ THƯ RÁC TIẾNG VIỆT 94 4.1 Giới thiệu 94 4.2 Mơ hình hoạt động chống thư rác SPAMfighter 94 4.3 Mơ hình hoạt động quản trị hệ thống 95 4.3.1 Mơ hình hoạt động 95 4.3.2 Quản trị hệ thống 96 4.4 Thiết kế liệu 96 4.4.1 Mơ hình liệu 96 4.4.2 Cập nhật liệu thư điện tử 97 4.4.3 Mơ hình cập nhật lưu trữ liệu 99 4.5 Một số kết 100 4.6 Kết luận 103 KẾT LUẬN 104 TÀI LIỆU THAM KHẢO 106 Nghiên cứu công nghệ chống thư rác ứng dụng DANH MỤC CÁC TỪ VIẾT TẮT STT TỪ VIẾT TẮT TỪ ĐẦY ĐỦ TIẾNG ANH NGHĨA TIẾNG VIỆT DNSBL DNS-based Blackhole List Danh sách đen DNSWL DNS-based whitelist Danh sách trắng DKIM DomainKeys Identified Mail Giao thức chứng thực thư điện tử dựa kết hợp IIM DomainKeys IIM Identified Internet Mail Giao thức chứng thực thư điện tử Cisco đề xuất SIDF Sender ID Framework Giao thức chứng thực thư điện tử Microsoft đề xuất SPF Sender Policy Framework Giao thức chứng thực thư điện tử CAPTCHA Completely Automated Public Turing test to tell Computers and Humans Apart Dạng kiểm định hỏi đáp máy tính người dùng C/R Challenge/response Giao thức chống thư rác dựa chế hỏi đáp ESMTP Extended SMTP SMTP mở rộng MT Mail Agent Phần mềm gửi thư máy người dùng cuối RFC Request for comment Tài liệu đề xuất tiêu chuẩn Internet 12 SMTP Simple Mail Tranfer Protocol Giao thức truyền thư điện tử 13 POP3 Post Office Protocol version Giao thức nhận thư điện tử IMAP Internet Message Access Protocol Giao thức truy cập thư điện tử 15 HTTP HyperText Transfer Protocol Giao thức truy nhập Web 16 VPN Virtual Private Network Mạng riêng ảo 17 IP Internet Protocol Giao thức liên mạng 10 11 14 Nghiên cứu công nghệ chống thư rác ứng dụng IRC Internet Relay Chat Một dạng liên lạc cấp tốc qua mạng Internet FTP File Tranfer Protocol Giao thức truyền tập tin ISP Internet Service Provider Nhà cung cấp dịch vụ Internet 21 DNS Domain Name System Hệ thống tên miền 22 LAN Local Area Network Mạng cục 23 DoS Denial-of-service Tấn công từ chối dịch vụ 24 Port Cổng Botnet Tập hợp máy tính bị cơng bị điều khiển 26 Spammer Người gửi thư rác 27 Client Máy trạm 28 Server Máy chủ 29 Black list Danh sách đen 30 White list Danh sách trắng 31 Antispam Ngăn chặn thư rác 32 Header Tiêu đề 18 19 20 25 Nghiên cứu công nghệ chống thư rác ứng dụng DANH MỤC HÌNH VẼ Hình 1-1: Cấu trúc thư điện tử .10 Hình 1-2: Định dạng tuyến đường thư điện tử 12 Hình 1-3: Cấu trúc đầy đủ trường Received 12 Hình 1-4: Ví dụ tuyến đường thư điện tử .13 Hình 1-5: Mơ hình trao đổi thư điện tử 14 Hình 1-6: Đặc điểm nhận dạng thư rác qua header, lời chào hỏi, qua URL 22 Hình 1-7: Giả mạo thư rác qua kết nối máy chủ 24 Hình 1-8: Giả mạo thư rác thông qua trường Received 24 Hình 1-9: Gửi thư rác qua open relay 28 Hình 1-10: Mơ hình open proxy 29 Hình 1-11: Mạng botnet 30 Hình 1-12: Hoạt động gửi thư rác qua mạng botnet 31 Hình 1-13: Thống kê thư rác SpamCop từ tháng 7/2009 đến 7/2010 33 Hình 2-1: Tóm tắt cơng nghệ chống thư rác 35 Hình 2-2: Mơ hình làm việc hệ thống C/R .36 Hình 2-3: Giả mạo hệ thống C/R 37 Hình 2-4: Mẫu thư điện tử yêu cầu xác nhận 38 Hình 2-5: Sử dụng mã CAPCHA 38 Hình 2-6: Thư mục chứa thư chưa xác nhận 38 Hình 2-7: Hệ thống SPF 39 Hình 2-8: Hệ thống DKIM 40 Hình 2-9: Thống kê SPF 40 Hình 2-10: Thống kê Nokia triển khai SPF .41 Hình 2-11: Mơ hình làm việc SPF 41 Hình 2-12: Tạo ghi SPF 43 Hình 2-13: Cơng cụ tạo ghi SPF Microsoft .49 Hình 2-14: Mơ hình làm việc SIDF 51 Hình 2-15: Thống kê việc triển khai DKIM Cisco 53 Hình 2-16: Thống kê việc triển khai DKIM Nokia 53 Hình 2-17: Mơ hình làm việc IIM 54 Hình 2-18: Thơng tin IIM tiêu đề thư điện tử 55 Hình 2-19: Hoạt động DomainKeys .55 Hình 2-20: Thơng tin DomainKeys tiêu đề thư điện tử .56 Hình 2-21: Mơ hình DKIM .57 Hình 2-22: Hoạt động Blacklist 63 Nghiên cứu công nghệ chống thư rác ứng dụng Hình 2-23: Quy trình làm việc DNSBL 64 Hình 2-24: Hoạt động Spamhaus 68 Hình 2-25: Chu trình xử lý tin SBL 68 Hình 2-26: Hoạt động lọc thư rác Bayesian .72 Hình 2-27: Áp dụng lý thuyết xác suất hệ thống lọc Bayesian 73 Hình 2-28: Phân loại thư rác thư 76 Hình 2-29: Bộ lọc Bogofilter 78 Hình 2-30:Thống kê lọc DSPAM 79 Hình 2-31: Bộ lọc SpamAssassin 79 Hình 3-1 Giải pháp chống thư rác Trend Micro máy chủ thư điện tử .83 Hình 3-2: Giải pháp chống thư rác Trend Micro theo mơ hình riêng .83 Hình 3-3: Hệ thống chống thư rác Symantec 85 Hình 3-4: Hệ thống chống thư rác Spam Sophos 86 Hình 3-5: Giải pháp chống thư rác Microsoft 87 Hình 3-6: Giải pháp chống thư rác Barracuda 88 Hình 3-7:Giải pháp chống Spam GFI .88 Hình 3-8: Giải pháp chống thư rác Spamfighter .90 Hình 4-1: Mơ hình chống thư rác Spamfighter .95 Hình 4-2: Sơ đồ hoạt động hệ thống thống kê thư rác tiếng Việt 95 Hình 4-3: Quy trình cập nhật liệu 97 Hình 4-4: Mơ hình cập nhật lưu trữ liệu 99 Hình 4-5: Mơ hình truy xuất liệu thống kê .99 Hình 4-6: Giao diện trang phần thống kê 100 Hình 4-7: Giao diện thống kê địa gửi thư rác nhiều 100 Hình 4-8: Giao diện thống kê 30 ngày qua 101 Hình 4-9: Giao diện thống kê theo tháng năm 101 Hình 4-10: Giao diện thống kê thư rác theo ISP năm .101 Hình 4-11: Giao diện thống kê ISP theo tháng 102 Hình 4-12: Giao diện thống kê AS qua năm 102 Hình 4-13: Giao diện thống kê tên miền qua năm 102 Hình 4-14: Giao diện thống kê địa IP qua năm .103 Hình 4-15: Giao diện thống kê theo quốc gia qua năm 103 Nghiên cứu công nghệ chống thư rác ứng dụng LỜI MỞ ĐẦU Thư rác vấn nạn lớn Internet Lượng thư rác giới chiếm tỉ lệ lớn, có lúc chiếm khoảng 90% lượng thư điện tử gửi gây thiệt hại hàng tỉ đô la giới hàng năm Nhiều tổ chức giới hình thành kêu gọi đối tượng sử dụng, khai thác Internet cần trọng vào hoạt động nhằm ngăn chặn thư rác như: Stop Spam Alliance, OECD, liên minh LAP, ITU,…Ngay quốc gia giới hình thành đơn vị chuyên biệt chống thư rác Korea Antispam Hàn Quốc, trung tâm Antispam Trung Quốc, phận chống thư rác JPCERT,… Đặc tính thư rác ln biến đổi với nhiều hình thức, thủ đoạn khác Vì chiến chống thư rác chiến lâu dài cần áp dụng nhiều biện pháp khác pháp lý, kỹ thuật, phối hợp quốc tế, nâng cao nhận thức, kỹ thuật giải pháp quan trọng cần thiết Nhiều công nghệ ngăn chặn thư rác nghiên cứu triển khai nhiên chưa có kỹ thuật có khả giải triệt để vấn nạn thư rác Vì lọc thư rác thường kết hợp nhiều công nghệ khác để đảm bảo hiệu ngăn chặn cao Tại Việt Nam, theo thống kê sơ năm 2007, lượng thư rác chiếm khoảng 72% lượng thư rác tiếng Việt chiếm khoảng 20%, có xu hướng ngày tăng mạnh Trong nhiều hệ thống thư điện tử Việt Nam không triển khai công nghệ ngăn chặn thư rác cần thiết Trên sở phân tích phạm vi đề tài, hướng dẫn PGS TS Nguyễn Việt Hương, học viên tập trung nghiên cứu vào trạng thư điện tử, thư điện tử rác công nghệ chống thư điện tử rác phổ biến Học viên nghiên cứu chủ trì triển khai xây dựng hệ thống thống kê thư rác tiếng Việt đưa vào thử nghiệm Cụ thể nội dung đề tài chia làm chương: Chương 1: Tổng quan thư rác Phần tập trung tìm hiểu vấn đề liên quan thư điện tử, thư điện tử rác như: khái niệm,đặc điểm cấu trúc thư điện tử; mơ hình trao đổi thư điện tử giao thức sử dụng; số thống kê thư điện tử, thư điện tử rác; thư điện tử rác phương thức phát tán; công nghệ chống thư điện tử rác Nghiên cứu công nghệ chống thư rác ứng dụng Chương Công nghệ chống thư rác Phần giới thiệu tổng quan công nghệ ngăn chặn thư rác tập trung nghiên cứu công nghệ chống thư rác qua thấy nhược điểm cơng nghệ Chương Một số giải pháp chống thư rác Mô tả số giải pháp chống thư rác lớn giới Chương Xây dựng hệ thống thống kê thư rác tiếng Việt Phân tích, thiết kế xây dựng hệ thống thống kê thư rác tiếng Việt sở hệ thống VinaCis Antispam Chương 3: Một số giải pháp chống thư rác Sau bước kiểm tra, mail gửi đến hoàn toàn thỏa mãn điều kiện mà chương trình đưa ra, người dùng yên tâm mail hợp lệ 3.11 Kết luận Chương giới thiệu tổng quan giải pháp, sản phẩm phòng chống, ngăn chặn thư điện tử rác hãng bảo mật lớn giới Một thực tế chưa có cơng nghệ ngăn chặn tất thư điện tử rác Chính vậy, giải pháp đề cập chương sử dụng kết hợp nhiều công nghệ ngăn chặn thư rác nhằm đạt hiệu chống thư rác cao Chương có đề cập đến cơng nghệ ngăn chặn thư điện tử rác Spamfighter, công nghệ sử dụng phổ biến giới cơng ty VinaCis địa hóa cung cấp cho người sử dụng Việt Nam Spamfighter công nghệ sử dụng để xây dựng hệ thống thống kê thư điện tử rác mô tả chương 93 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt CHƯƠNG 4: XÂY DỰNG HỆ THỐNG THỐNG KÊ THƯ RÁC TIẾNG VIỆT 4.1 Giới thiệu Để đưa giải pháp ngăn chặn thư rác hợp lý cần vào đánh giá, số liệu thống kê xác tình hình thư rác Việc nghiên cứu, tìm hiểu xây dựng hệ thống thống kê thư rác, đặc biệt thống kê thư rác tiếng Việt hỗ trợ tích cực cho hoạt động ngăn chặn thư rác Một nội dung đề tài nghiên cứu xây dựng hệ thống thống kê thư rác tiếng Việt dựa giải pháp chống thư rác VinaCiS Antispam VinaCiS Antispam giải pháp chống thư rác dựa kết hợp công ty VinaCIS Corporation công ty SPAMFighter – công ty chuyên sản phẩm bảo mật, có trụ sở đặt Đan Mạch VinaCIS AntiSPAM công cụ chống spam làm việc dựa thông tin thu thập từ cộng đồng người dùng: người dùng nhận thư rác cần nhấn chuột để thông báo cho hệ thống máy chủ Internet Hệ thống máy chủ dùng thuật toán tinh vi để phân tích nhận dạng mẫu thư rác Nếu nhiều người dùng thông báo mẫu thư rác, hệ thống chặn mẫu thư rác cho tất người dùng khác 4.2 Mơ hình hoạt động chống thư rác SPAMfighter Theo kết xếp hạng giới phần mềm chống thư điện tử rác, SPAMfighter đứng thứ năm 2010 Ngoài công nghệ chống thư rác chung phổ biến nay,SPAMfighter cịn có cơng nghệ chống thư rác đặc thù riêng biệt SPAMfighter cộng đồng sáng kiến đứng đầu Âu châu chương trình chống thư rác, bảo vệ cho người sử dụng từ 228 Quốc Gia/Địa điểm, có sở Đan Mạcḥ SPAMfighter sáng lập sở hữu Henrik Sorensen, Martin Thorborg (người sáng tạo Jubii- Internet Portal lớn Đan Mạch, phận Lycos Europe Network) 94 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt SPAMfighter Classification Network mạng lưới máy chủ tồn Hình 4-1: Mơ hình chống thư rác Spamfighter cầu, nơi tiếp nhận báo cáo thư rác đến từ hàng triệu người dùng cộng đồng SpamFighter Máy chủ VinaCIS đặt Việt Nam mắt xích hệ thống máy chủ SPAMfighter Classification Network, chuyên tiếp nhận báo cáo từ người dùng Việt Nam 4.3 Mơ hình hoạt động quản trị hệ thống 4.3.1 Mơ hình hoạt động Hình 4-2: Sơ đồ hoạt động hệ thống thống kê thư rác tiếng Việt 95 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt 4.3.2 Quản trị hệ thống Hệ thống thống kê thư rác tiếng Việt chia làm phần: Giao diện người dùng cuối: Chạy hệ điều hành mã nguồn mở LINUX với APACHE PHP Tất code PHP mã hóa ioncube Cơ sở liệu: SQL Express chạy Windows® Server 2008 kết nối nội với (1) (3), không kết nối trực tiếp với Internet Phần mềm phân tích: chạy nội trung tâm liệu Có thể truy cập từ đâu qua kết nối VPN 4.4 Thiết kế liệu 4.4.1 Mơ hình liệu Bảng: MSG_DB ID ID tự tăng CSDL Return Path Return path Mail IP IP: chuyển đổi kiểu long có định dạnh (A.B.C.D) = A.255^3 + B.255^2 + C.255^1 + D.255^0 Và so sánh quan hệ với ip2nation Message_ID Message ID mail From_info From mail (người gửi) (kêu chuổi) Mail_date Ngày gửi mail Mail_counter Số lượng mail gửi Mail_content Nội dung thư Date Ngày gửi (Kiểu ngày tháng, phục vụ việc so sánh CSDL) 96 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt Report Báo cáo nội dung xấu (giá trị hay 1) Domain Tên miền địa thư điện tử gửi đi, phục vụ cho việc tìm kiếm nhanh Bảng: ispvietnam Ipmin Dãy IP thấp Ipmax Dãy Ip cao Ispcode Mã nhận dạng (code, VD vng : VinaGame, FPT : FPT) Ispname Tên isAS Là AS hay ISP (với giá trị AS, ISP) Bảng: ip2nation Số kiểu long Ip (được dùng để so sánh việc tìm Ip quốc gia từ địa Ip thư) Country Mã quốc gia Dữ liệu bảng ispvietnam lấy từ VNNIC ip2nation lấy từ ip2nation.com nguồn có sẵn cập nhật thơng qua công cụ hệ quản trị sở liệu 4.4.2 Cập nhật liệu thư điện tử Hình 4-3: Quy trình cập nhật liệu 97 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt Dữ liệu đầu vào file có dạng *.eml chứa nội dung thư điện tử Khi thư điện tử đưa vào để phân tích, ta viết chương trình lọc lấy nội dung trường có Header thư điện tử bao gồm: địa người gửi, IP máy gửi, thời gian gửi thư,… • Thông tin Địa người gửi Dữ liệu đầu vào file nội dung thư điện tử có dạng *.eml Chương trình tạch lọc địa người gửi nằm trường Return-Path header thư điện tử Thơng tin chứa trường Return-Path thơng tin địa người gửi Lấy thông tin giúp ta thống kê nguồn gốc người gửi thư Vì trường Return-Path trường tùy chọn header mail, đôi lúc trường không xuất header mail, ta lấy thông tin trường From header mail Các thông tin nằm trường From thơng tin địa người gửi • Lấy thơng tin địa IP máy gửi Dữ liệu đầu vào file nội dung thư điện tử có dạng *.eml Chương trình tạch lọc IP máy gửi thư nằm header mail Đây thông tin quan trọng Lấy thông tin địa IP giúp ta thống kê nguồn gốc thư Lá thư gửi từ ? gửi từ máy chủ ? xuất phát từ quốc gia ? gửi từ ISP/AS Việt Nam ? gửi vào thời gian ? giúp ta có nhìn tồn cảnh nguồn gốc thư rác thuận tiện cho việc giám sát theo dõi • Lấy thông tin Ngày gửi Dữ liệu đầu vào file nội dung thư điện tử có dạng *.eml Chương trình tạch lọc ngày gửi thư nằm header mail Thông tin giúp ta biết thư rác gửi vào khoảng thời gian ? Phát tán thư rác mạnh vào thời điểm nào.? Năm phát tán thư rác nhiều ? Phát tán mạnh vào tháng nào? Ngày ? Thấy thời điểm phát tán thư rác giúp ta có nhìn bao qt đưa giải pháp ngăn chặn kịp thời • Lấy nội dung thư Dữ liệu đầu vào file nội dung thư điện tử có dạng *.eml Thơng tin tách lọc nội dung dạng văn (text) Thông tin cho người dùng biết thư rác thường gửi với nội dung ? Để tránh việc lưu trữ lớn cải thiện tốc độ lưu trữ, chương trình khơng tách lọc file đính kèm mà lấy nội dung dạng văn mail 98 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt 4.4.3 Mơ hình cập nhật lưu trữ liệu Hình 4-4: Mơ hình cập nhật lưu trữ liệu Bước 1: Spamfighter gửi tập tin thư rác tiếng Việt có dạng *.eml đến thư mục chứa thư rác theo ngày Bước 2: Phần mềm tách lọc thơng tin phân tích thư điện tử nhận để lấy thông tin cần thiết (Địa người gửi, IP gửi, Ngày tháng gửi…) lưu vào sở liệu Để tránh việc lưu trữ liệu lớn, Spamfighter gửi file mẫu spam kèm theo file excel để danh sách số lượng file mẫu theo ngày Bước 3: Hệ thống đọc file excel chưong trình tự viết lưu vào sở liệu Quy trình cập nhật ngày 4.4.4.Mơ hình truy xuất liệu phục vụ cho thống kê Hình 4-5: Mơ hình truy xuất liệu thống kê 99 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt Khi người dùng muốn xem thống kê, hệ thống kết nối với Web Server, truy vấn đến sở liệu để lấy liệu truy xuất đến Flash Chart hiển thị kết thống kê cho người dùng cuối 4.5 Một số kết Hình 4-6: Giao diện trang phần thống kê Hình 4-7: Giao diện thống kê địa gửi thư rác nhiều 100 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt Hình 4-8: Giao diện thống kê 30 ngày qua Hình 4-9: Giao diện thống kê theo tháng năm Hình 4-10: Giao diện thống kê thư rác theo ISP năm 101 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt Hình 4-11: Giao diện thống kê ISP theo tháng Hình 4-12: Giao diện thống kê AS qua năm Hình 4-13: Giao diện thống kê tên miền qua năm 102 Chương 4: Xây dựng hệ thống thống kê thư rác tiếng Việt Hình 4-14: Giao diện thống kê địa IP qua năm Hình 4-15: Giao diện thống kê theo quốc gia qua năm 4.6 Kết luận Thống kê đóng vai trị quan trọng việc đánh giá tình hình thư điện tử rác, qua đưa giải pháp quản lý, kỹ thuật hợp lý để phòng chống, ngăn chặn thư điện tử rác Chương mô tả việc xây dựng hệ thống thống kê thư rác tiếng Việt dựa công nghệ chống thư rác Spamfighter Hệ thống hỗ trợ việc theo dõi tình hình thư điện tử rác tiếng Việt toàn giới, thực việc thống kê thư rác dựa tiêu chí địa IP, tên miền, ISP,… Hệ thống xây dựng vận hành thử nghiệm 103 Nghiên cứu công nghệ chống thư rác ứng dụng KẾT LUẬN Việc số người sử dụng Internet gia tăng mạnh mẽ kéo theo phát triển dịch vụ thư điện tử cho hoạt động trao đổi thông tin, đặc biệt hoạt động quảng cáo Lượng thư rác phát tán ngày nhiều lên đến mức báo động Có thời điểm thư rác phát triển đột biến gây hậu đến mức thư điện tử gửi từ nhiều nhà cung cấp dịch vụ thư điện tử Việt Nam bị tổ chức lớn giới chặn lại làm cho việc trao đổi thư điện tử Việt Nam với giới bị đình trệ Việt Nam nước thường xuất danh sách nguồn phát tán thư rác lớn giới tổ chức quốc tế Vì vậy, việc nghiên cứu, triển khai biện pháp đặc biệt biện pháp kỹ thuật nhằm ngăn chặn thư rác cần thiết Đề tài “Nghiên cứu công nghệ chống thư rác ứng dụng” trình bày cách cụ thể chi tiết trạng thư rác công nghệ thư rác sử dụng rộng rãi Đề tài cho thấy vai trò việc thống kê thư rác xây dựng, thử nghiệm hệ thống thống kê thư rác Việt Nam Một số kết cụ thể thực gồm có: Mơ tả đặc điểm, nghiên cứu yếu tố kỹ thuật đặc trưng thư điện tử, thư điện tử rác; mơ hình, giao thức trao đổi thư điện tử; phương thức phát tán thư điện tử rác Nghiên cứu công nghệ chống thư rác ứng dụng rộng rãi SPF, DKIM, danh sách đen, lọc Bayesian,… Tìm hiểu giải pháp, sản phẩm chống thư điện tử rác hãng bảo mật lớn giới Trend Micro, Symantec, Microsoft,… Xây dựng hệ thống thống kê thư rác tiếng việt dựa công nghệ Spamfighter có khả thống kê theo thời gian, theo địa IP, tên miền, ISP,… Tuy nhiên, phạm vi đề tài luận văn cao học, tác giả mong muốn đưa nhìn tổng quan thực trạng thư rác, cung cấp nghiên cứu cách công nghệ ngăn chặn thư rác tạo công cụ thống kê nhằm hỗ trợ việc đánh giá thực trạng thư rác tiếng Việt Trong tương lai, đề tài phát triển theo số hướng sau để đưa vào ứng dụng hiệu thực tiễn: 104 Nghiên cứu công nghệ chống thư rác ứng dụng - Nghiên cứu sâu công nghệ ngăn chặn thư điện tử rác để xây dựng hướng dẫn triển khai công nghệ ngăn chặn thư rác cho cá nhân, tổ chức, doanh nghiệp nước - Phát triển hệ thống thống kê thư rác cho phép tập hợp liệu từ nhiều nguồn khác chia sẻ liệu cho nhiều đối tượng sử dụng; mở rộng tiêu chí thống kê, mở rộng phạm vi thống kê thư rác, không thư rác tiếng Việt 105 Nghiên cứu công nghệ chống thư rác ứng dụng TÀI LIỆU THAM KHẢO Ahmed Khorsi, An Overview of Content-Based Spam Filtering Techniques Anders Wiehes, Comparing Anti Spam Methods Andrew A Slack, Digital authentication for official bulk email Antispam Method – State of the art Barry Leiba, Jim Fenton, DomainKeys Identified Mail (DKIM): Using Digital Signatures for Domain Verification Marios Symeonidis, Challenge Response System for Spam Prevention Shrinivas Joshi, Megan Kirk, Wesley Reynolds, Leo Singleton, Comparison and evaluation of e-mail sender authentication technologies Stefan Görling, An overview of the Sender Policy Framework (SPF) as an antiphishing mechanism eCert, Sender Authentication Deployment 10 Exact Target, Sender ID Framework 11 GuidoSchryen, Antispam Measure Analys and Design 12 IETF Proposed Standard, RFC 4871, DKIM Signatures 13 IETF, Guidelines for Management of DNSBLs for email 14 OECD, Antispam Toolkit 15 Openspf.org 16 RFC 2821, Simple mail transfer protocol 17 RFC 4406, Sender ID: Authenticating E-Mail 18 RFC 4407, Purported Responsible Address in E-Mail Messages 19 RFC 4408, Sender Policy Framework for Authorizing Use of Domains in email 20 RFC 5585, DKIM Service Overview 21 RFC 586, DomainKeys Identified Mail (DKIM) Development, Deployment and Operations 22 Wikipedia.org 23 Dkim.org 106 ... tử, thư điện tử rác; thư điện tử rác phương thức phát tán; công nghệ chống thư điện tử rác Nghiên cứu công nghệ chống thư rác ứng dụng Chương Công nghệ chống thư rác Phần giới thiệu tổng quan công. .. PHÁP CHỐNG THƯ RÁC 83 Nghiên cứu công nghệ chống thư rác ứng dụng 3.1 Hệ thống chống thư rác Trend Micro 83 3.2 Hệ thống chống thư rác Symantec 85 3.3 Hệ thống chống thư rác. .. tổng quan công nghệ ngăn chặn thư rác tập trung nghiên cứu công nghệ chống thư rác qua thấy nhược điểm cơng nghệ Chương Một số giải pháp chống thư rác Mô tả số giải pháp chống thư rác lớn giới