Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,6 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Tiến Dũng NGHIÊN CỨU GIẢI PHÁP LỌC NỘI DUNG INTERNET TẠI MÁY TÍNH CÁ NHÂN VÀ XÂY DỰNG PHẦN MỀM LUẬN VĂN THẠC SĨ Hà Nội – 2009 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Tiến Dũng NGHIÊN CỨU GIẢI PHÁP LỌC NỘI DUNG INTERNET TẠI MÁY TÍNH CÁ NHÂN VÀ XÂY DỰNG PHẦN MỀM Ngành : Công nghệ Thông tin Chuyên ngành : Hệ thống Thông tin Mã số : 60 48 05 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS HÀ QUANG THỤY Hà Nội - 2009 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com LỜI CAM ĐOAN Tôi xin cam đoan nội dung luận văn chưa cơng bố hay xuất hình thức không chép từ cơng trình nghiên cứu Tồn ứng dụng thử nghiệm tự thiết kế xây dựng Nếu sai tơi xin hồn tồn chịu trách nhiệm Hà Nội, tháng 08 năm 2009 Người cam đoan Phạm Tiến Dũng LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com LỜI CẢM ƠN Em xin chân thành cảm ơn Thầy giáo, Cô giáo khoa Công nghệ thông tin cán bộ, nhân viên phòng Đào tạo Sau đại học, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội ln nhiệt tình giúp đỡ tạo điều kiện tốt cho em trình học tập trường Xin chân thành cảm ơn anh, chị bạn học viên lớp Cao học K12T3 trường Đại học Công nghệ - Đại học Quốc gia Hà Nội động viên, giúp đỡ nhiệt tình chia sẻ với em kinh nghiệm học tập, cơng tác suốt khố học Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS Hà Quang Thụy tận tình giúp đỡ em định hướng xây dựng, nghiên cứu phát triển hồn chỉnh luận văn Mặc dù có nhiều cố gắng, song luận văn không tránh khỏi khiếm khuyết hạn hẹp thời gian điều kiện nghiên cứu Em chân thành mong nhận ý kiến đóng góp q báu thầy giáo nhằm giúp đề tài luận văn ngày hồn thiện có tính phổ dụng tương lai LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com MỤC LỤC MỤC LỤC .i DANH SÁCH HÌNH VẼ ii MỞ ĐẦU iii Chương - TỔNG QUAN LỌC NỘI DUNG INTERNET .1 1.1 Đánh giá tình hình nghiên cứu thuộc lĩnh vực đề tài .1 1.1.1 Thế giới 1.1.2 Tại Việt Nam 1.2 Thực trạng lọc nội dung truy cập Chương - MỘT SỐ NỘI DUNG CƠ BẢN VỀ PHƯƠNG PHÁP LỌC INTERNET 2.1 Biện pháp lọc 2.2 Phương pháp lọc 2.2.1 Lọc địa IP 2.2.2 Lọc địa URL 2.2.3 Lọc từ khóa 2.2.4 Lọc cụm từ 10 2.2.5 Lọc ảnh 10 2.3 Vị trí thực lọc 11 2.3.1 Lọc cổng Internet quốc gia 11 2.3.2 Lọc cổng Internet mạng LAN 11 2.3.3 Lọc thông qua bên thứ ba .12 2.3.4 Lọc máy tính cá nhân 12 Chương - GIẢI PHÁP LỌC NỘI DUNG INTERNET 13 3.1 Giải pháp cổng Internet quốc gia .13 3.1.1 Kiến trúc hệ thống 13 3.1.2 Hoạt động 15 3.1.3 Phân tích thành phần 16 3.2 Giải pháp cổng Internet mạng LAN 19 3.2.1 Kiến trúc tổng quan 19 3.2.2 Giải thuật chế hoạt động .19 3.3 Giải pháp trực tiếp máy tính cá nhân .24 3.3.1 User mode: lấy nội dung từ lớp ứng dụng (Application) .25 3.3.2 User Mode: lấy nội dung từ lớp phiên (Session) 29 3.3.3 Kernel mode: lấy nội dung từ lớp mạng (IP) 32 3.3.4 Kernel mode: chế nghe (sniffer) 35 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 3.4 Đề xuất giải pháp 36 3.4.1 Đánh giá giải pháp trực tiếp 36 3.4.2 Đề xuất 37 Chương - GIẢI PHÁP LỌC NỘI DUNG VÀ XÂY DỰNG PHẦN MỀM TẠI MÁY TÍNH CÁ NHÂN 39 4.1 Giải thuật 39 4.2 Hoạt động 40 4.3 Phân tích thành phần 41 4.3.1 Thành phần lấy liệu 41 4.3.2 Thành phần phân tích nội dung gói tin 45 4.3.3 Thành phần tách, tổng hợp gói tin thành phiên giao dịch 48 4.3.4 Thành phần lọc cụ thể, lọc loại trừ 51 4.3.5 Thành phần lọc nội dung 52 4.3.6 Thành phần quản lý ứng dụng 54 4.3.7 Thành phần ghi log truy cập 56 4.3.8 Thành phần quản lý luật truy cập 56 4.4 Chương trình thử nghiệm .57 4.4.1 Kết chương trình thử nghiệm 57 4.4.2 So sánh với chương trình loại 58 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO .61 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com DANH SÁCH HÌNH VẼ Hình 2.1 Lọc cổng Internet quốc gia 11 Hình 2.2 Lọc thơng qua bên thứ ba 12 Hình 2.3 Lọc máy tính cá nhân 12 Hình 3.1 Hệ thống tưởng lửa ISP 14 Hình 3.2 Kiến trúc hệ thống lọc nội dung Internet ISP 15 Hình 3.3 Gateway Filter lọc cho mạng LAN 19 Hình 3.4 Sơ đồ giải thuật lọc cho mạng LAN 20 Hình 3.5 Sơ đồ giải thuật lọc cho mạng LAN 22 Hình 3.6 Sơ đồ giải thuật lọc cho mạng LAN 23 Hình 3.7 Sơ đồ giải thuật lọc cho mạng LAN 24 Hình 3.8 Nội dung kiểm sốt lấy từ cửa sổ trình duyệt 26 Hình 3.9 Sơ đồ giải thuật User mode (lấy nội dung lớp ứng dụng) 27 Hình 3.10 Hook Firewall User Mode 30 Hình 3.11 Sơ đồ giải thuật User mode (lấy nội dung lớp phiên) .31 Hình 3.12 Các chế độ Hook Firewall Windows 33 Hình 3.13 Sơ đồ giải thuật Kernel mode (lấy nội dung lớp IP) .34 Hình 4.1 Sơ đồ giải thuật lọc nội dung trực tiếp máy tính cá nhân 39 Hình 4.2 Phân lớp xử lý gói tin 41 Hình 4.3 Sơ đồ xử lý tổng quát giải pháp lọc nội dung 42 Hình 4.4 Quy trình ghi log truy cập .42 Hình 4.5 Cấu trúc liệu tầng Transport .43 Hình 4.6 Cấu trúc liệu tầng Network .44 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Hình 4.7 Cấu trúc liệu tầng DataLink 44 Hình 4.8 Cấu trúc gói tin lấy liệu 45 Hình 4.9 Các gói tin dạng thơ phân tích theo lớp mạng 47 Hình 4.10 Dữ liệu tầng TCP/IP gói tin 48 Hình 4.11 Header file ảnh 48 Hình 4.12 Header file text/html 49 Hình 4.13 Gói tin phiên giao dịch 49 Hình 4.14 Tham số Seq Ack 49 Hình 4.15 Tham số Seq Ack gói tin .50 Hình 4.16 Tổng hợp gói tin đơn lẻ thành phiên giao dịch .50 Hình 4.17 Trích đoạn danh sách lọc áp dụng cho mạng VNN .51 Hình 4.18 Gói tin request(Get) .52 Hình 4.19 Ánh xạ tên tiến trình cổng tương ứng 55 Hình 4.20 Ánh xạ chi tiết PID (Process number) số cổng 55 Hình 4.21 Tổng hợp ghi log 56 Hình 4.22 Cập nhật luật truy cập từ server .57 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com MỞ ĐẦU Mạng Internet đời phát triển thành kho liệu khổng lồ, bao gồm đầy đủ khía cạnh văn hố, trị, khoa học - kỹ thuật, Với đa sắc màu văn hố giới, đa tín ngưỡng, đa lối sống, đa tư duy,… làm cho thông tin Internet ln song hành tính tích cực tiêu cực nội Ưu từ công nghệ Internet làm cho sức thâm nhập kênh thông tin quan trọng người sử dụng rộng lớn nhanh chóng Các khía cạnh xấu - độc hại xã hội theo đường Internet để thâm nhập vào gia đình, người Chính lý đó, công việc hỗ trợ quản lý đảm bảo an tồn – an ninh thơng tin mạng Internet trở thành mối quan tâm gia đình, tổ chức, quốc gia Về phương diện gia đình, mối quan tâm bậc phụ huynh ngăn ngừa việc thâm nhập trang Web độc hại em Về phía cá nhân người sử dụng, khai thác thơng tin tích cực ngăn ngừa tiếp xúc web độc hại vơ tình hay cố ý Trong năm gần đây, lĩnh vực nghiên cứu phát triển hệ thống lọc nội dung hỗ trợ quản lý đảm bảo an toàn – an ninh thông tin mạng Internet nhận quan tâm đặc biệt hầu hết quốc gia giới Tại Việt Nam, giải pháp cấp quốc gia Nhà nước đạo ban ngành liên quan nghiên cứu đề xuất Tuy nhiên trước thực tế nhu cầu cần giải pháp lọc nội dung truy cập người sử dụng Internet, tìm hiểu xây dựng giải pháp lọc nội dung truy cập trực tiếp máy tính cá nhân mục tiêu nghiên cứu nhiều cá nhân, tập thể mục tiêu luận văn Chương thứ luận văn trình bày tổng quan lọc nội dung Internet giới Việt Nam, phân tích thực trạng lọc nội dung truy cập phương diện sách quy định Nhà nước yêu cầu đặt công cụ phần mềm Chương thứ hai luận văn trình bày nội dung liên quan đến vấn đề lọc nội dung truy cập Internet, bao gồm: biện pháp lọc, phương pháp lọc vị trí thực lọc LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Dựa việc phân tích vị trí thực lọc nội dung trình bày chương hai, chương thứ ba trình bày giải pháp lọc nội dung truy cập cổng Internet Quốc gia, cổng Internet mạng LAN giải pháp trực tiếp máy tính cá nhân Cuối cùng, chương thứ tư trình bày giải pháp xây dựng chương trình lọc nội dung truy cập Internet máy tính cá nhân Trong trường hợp thử nghiệm, chương trình hoạt động chức đặt LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com o FIN: No more data from the sender Phần liệu lại gói tin HTTP Phần liệu cịn lại sau tách IP header TCP header liệu tầng ứng dụng Dữ liệu tầng ứng dụng chia thành phần: tiêu đề nội dung phân cách cặp thẻ “\r\n” xuất lần liên tiếp tính từ đầu gói tin Cấu trúc tiêu đề gói tin HTTP có dạng: “tên trường” + “: ” + “giá trị thuộc tính” + “\r\n” Một số “tên trường” sử dụng lấy liệu đầu vào thành phần lọc cụ thể, lọc loại trừ: GET/POST: giao thức sử dụng Accept-Language: ngôn ngữ sử dụng Host: địa tên miền truy cập Refered: địa URL truy cập Phần liệu lại kết hợp với thơng tin trích rút từ IP header TCP header tổng hợp thành phiên giao dịch đầy đủ, phục vụ kiểm sốt nội dung Hình 4.9 Các gói tin dạng thơ phân tích theo lớp mạng Cùng thời điểm có nhiều phiên giao dịch tương ứng với đối tượng trang web (text, ảnh…) Các phiên phân biệt tham số cấu trúc liệu TCP/IP (ở trên), bao gồm: địa ip, số cổng, số ACK, SEQUENT (xem hình dưới) 47 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Hình 4.10 Dữ liệu tầng TCP/IP gói tin 4.3.3 Thành phần tách, tổng hợp gói tin thành phiên giao dịch Ở phần trên, module phân tích nội dung gói tin thực xử lý gói tin tầng TCP để thu phiên giao dịch Khi thu liệu phiên giao dịch, nhiệm vụ module tổng hợp phân tích nội dung giao dịch để biết giao dịch theo dạng Dạng phiên giao dịch có ý nghĩa là: trang web vốn có nhiều thành phần, gồm ảnh, phim, flash file, javascript, text file… Do cần phân loại đối tượng này, để phân tích nội dung tương ứng Dưới quy trình tổng hợp liệu dạng text Dưới ví dụ nội dung gói tin phân tích Hình 4.11 Header file ảnh 48 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Trong hình ta thấy cấu trúc header, với nội dung cho biết gói tin chứa nội dung ảnh gif, với kích thước 12755 bytes Hình 4.12 Header file text/html Trên tiêu đề phiên giao dịch nội dung gói tin text/html, với trang text có nội dung 46071 bytes Tiếp theo, gói tin tổng hợp để trang web hồn chỉnh Như nội dung gói tin cho biết phiên giao dịch có kích thước text file 46071 bytes, với kích thước tương đối gói tin khoảng 1500 bytes, phiên giao dịch có khoảng 30 gói tin Trọn vẹn gói tin HTTP phiên giao dịch có nội dung sau: Hình 4.13 Gói tin phiên giao dịch Công việc tập hợp gói tin phiên giao dịch Thành phần thực tổng hợp, xếp gói tin lại thành phiên giao dịch đầy đủ dựa vào tham số: địa ip, số cổng, số ACK, SEQUENT Hình 4.14 Tham số Seq Ack 49 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Thực kiểm tra gói tin có tham số Seq theo qui luật, để ghép nội dung gói vào phiên Cụ thể ví dụ này, gói sau, tham số Ack gói tin trước nó, tham số Seq tổng Seq gói tin trước kích thước gói tin trước (1+1460=1461): Hình 4.15 Tham số Seq Ack gói tin Thực tương tự gói tin nhận đủ gói tin cần thiết: tổng số Len kích thước phiên giao dịch (46071 bytes) gói tin đến cổng ACK bị thay đổi Hình mơ tả thứ tự gói tin phiên giao dịch Hình 4.16 Tổng hợp gói tin đơn lẻ thành phiên giao dịch Sau tổng hợp hoàn chỉnh phiên giao dịch Text, bước phân tích nội dung phiên giao dịch đó, cụ thể phân tích nội dung text file 50 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 4.3.4 Thành phần lọc cụ thể, lọc loại trừ Lọc cụ thể, lọc loại trừ: IP Đối sốt trực tiếp thơng tin trích rút từ thành phần phân tích nội dung với kho liệu lọc IP Cung cấp kết kiểm tra cho module Bộ định để thực lọc cụ thể, lọc loại trừ gói tin truy cập Như ví dụ hình 4.10, danh sách lọc cụ thể, lọc loại trừ IP đối soát với địa IP trích rút từ tiêu đề tầng IP Lọc cụ thể, lọc loại trừ: URL Quy trình thực tương tự lọc IP, nhiên thơng tin để đối sốt với kho liệu tương ứng khơng thuộc vị trí định tiêu đề gói tin IP TCP mà phần liệu gói tin HTTP Thành phần phân tích nội dung gói tin (3.2) thực phân tích nội dung cung cấp thơng tin URL để thành phần lọc cụ thể lọc loại trừ URL thực đối soát Áp dụng thực với danh sách lọc URL (hiện sử dụng cho quản lý đại lý Internet công cộng Công ty VDC) sau: 'anhuynh.freehomepage.com', 'bangboat.com', 'bdqvn.org', 'butvang.org', 'canhen.de', 'canhsatquocgia.com', 'canhtan.choao.com', 'caodai.net', 'conong.com', 'congly.com', 'crfvn.org', 'ctnb.org', 'chantroi.net', 'ChaocoVNCH.8m.com', 'chinhnghia.org', 'chuyenluan.com', 'daichung.com', 'daihoccuunuoc.com', 'daiviet.org', 'danchimviet.com', 'danchu.net', 'danchuqueme.free.fr', 'danuoc.org', 'danguyen.org', 'datviet.com', 'dddcvn.org', 'diendanpaltalk.com', 'diendangiaodan.com', 'dungday.tripod.com', 'ebonyjoy.com', 'emviet.com', 'groups.yahoo.com/group/cpcmvntd-bc', 'groups.yahoo.com/group/chinhluan', 'groups.yahoo.com/group/dangcongsanvietnam', 'groups.yahoo.com/group/diendanchinhtri', 'groups.yahoo.com/group/diendandautranh', 'groups.yahoo.com/group/diendantintuc', 'groups.yahoo.com/group/freevietnam', 'groups.yahoo.com/group/hanoivietnam', 'groups.yahoo.com/group/hoinghi', 'groups.yahoo.com/group/nghiluan', 'groups.yahoo.com/group/nhanquyenchovietnam', 'groups.yahoo.com/group/tiengchuong1', 'groups.yahoo.com/group/tinhlam', 'groups.yahoo.com/group/tinhmuonmau', 'groups.yahoo.com/group/tinhthuong36', 'groups.yahoo.com/group/toiacdangcongsanvietnam', 'groups.yahoo.com/group/vietnamdiendan', Hình 4.17 Trích đoạn danh sách lọc áp dụng cho mạng VNN 51 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Tường lửa lọc nội dung kiểm tra gói tin đi/đến máy tính phiên truy cập (hoặc kiểm tra tất gói tin đi/đến, tùy thuộc lựa chọn người sử dụng) trích rút thơng tin trường Referer Content-Type: Hình 4.18 Gói tin request(Get) Đối với ví dụ trên, trường Referer gói tin cho biết có tiến trình truy cập đến địa http://tintuc.vnn.vn/forum/ Nếu địa nằm danh sách ‘đen’ trên, tường lửa lọc nội dung tác động vào trình duyệt truy cập trang web 4.3.5 Thành phần lọc nội dung Lọc cổng truy cập Đối sốt trực tiếp thơng tin trích rút từ thành phần phân tích nội dung với kho liệu lọc cổng Cung cấp kết kiểm tra cho module Bộ định để thực lọc gói tin truy cập Để nâng cao lực hoạt động cho tường lửa lọc nội dung, việc kiểm soát tốt danh sách cổng sử dụng cho ứng dụng window hay số hãng phần mềm lớn đăng ký hạn chế nhiều việc kiểm sốt gói tin khơng cần thiết Thơng thường truy cập web có cổng nguồn 80, thực lọc nội dung với thành phần thực thi gói tin đến có cổng nguồn 80 Lọc kiểu liệu Thành phần phân tích nội dung gói tin phân tích tiêu đề gói tin HTTP, trích rút thơng tin kiểu liệu (content-type) cung cấp thơng tin gói tin đến để thành phần lọc nội dung kiểu liệu thực kiểm sốt Thơng qua thành phần này, kiểu liệu không phép lọc 52 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com trước tới trình duyệt người sử dụng Kiểm sốt thơng tin cổng kiểu liệu lấy từ trực tiếp gói tin riêng biệt (header lớp TCP, HTTP), nhiên đặc thù thông tin cung cấp khả lọc nội dung truy cập người sử dụng nên hai kiểu lọc coi tính thành phần lọc nội dung Các chức lọc cịn lại: lọc từ khóa, lọc từ khóa có trọng số, lọc cụm từ, lọc biểu thức Các chức cịn lại module lọc nội dung có điểm khác biệt với module lọc cụ thể, lọc loại trừ: nội dung khơng trích rút từ gói tin vị trí định mà tổng hợp từ gói tin thuộc phiên giao dịch Kho liệu lọc từ khóa, từ khóa có trọng số cụm từ: kho liệu bao gồm từ khóa (cụm từ) cần lọc kèm theo trọng số (số lần xuất nội dung truy cập), lọc từ khóa trường hợp riêng lọc từ khóa có trọng số với trọng số Kho liệu lọc biểu thức: kho liệu bao gồm từ khóa (cụm từ) có tính điểm biểu thức đặt với ngưỡng cho trước Các kho liệu lọc nội dung xây dựng dựa kết phân tích thử nghiệm lượng lớn trang web Internet, kết toán lớn như: khai phá liệu web, trích chọn thơng tin, phân lớp, phân cụm,… Kho liệu lọc sau: STT Từ khóa xxx sex adult education Trọng số -1 Điểm 30 20 -30 Quy trình lọc nội dung thực sau: (gói tin quy trình cung cấp thành phần phân tích gói tin, thực loại bỏ phần tiêu đề IP, TCP) Bước 1: o Gói tin đầu phiên giao dịch: lấy liệu cặp thẻ meta cặp thẻ body, chuyển sang bước o Những gói tin tiếp theo: xác định tồn phần liệu thuộc thẻ body, 53 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com chuyển sang bước Bước 2: kiểm tra liệu thẻ meta (nếu có), ví dụ hình 29 thực trích rút thông tin trường “content” với trường name “keywords” Chuyển thông tin sang bước với cờ báo tất từ khóa (cụm từ) có trọng số Bước 3: đối sốt từ khóa (cụm từ) thẻ meta với kho liệu lọc, chuyển kết sang bước có từ khóa tìm thấy Bước 4: loại bỏ cặp thẻ html phần liệu thẻ body Bắt đầu từ byte đầu tiên, byte byte cuối cần kiểm tra Lần lượt lấy số byte khoảng minLength(keyword) maxLength(keyword) – độ dài nhỏ lớn từ khóa hay cụm từ lọc có kho liệu Với từ khóa (cụm từ) tìm chuyển sang bước 5, tới byte cuối cần kiểm tra khơng tìm thấy từ khóa kết thúc Bước (lọc từ khóa, lọc từ khóa có trọng số lọc cụm từ): kết hợp kết bước số liệu kiểm tra gói tin trước phiên giao dịch; tổng số gói tin nhận phiên giao dịch đến thời điểm kiểm tra có số từ “xxx” >=2 “sex” >= chuyển sang bước Bước (lọc biểu thức): đối soát với ngưỡng 100; với số từ “xxx” xuất α “sex” β α*30 + β*20 >= 100 chuyển sang bước Bước 7: cập nhật thông tin Kho liệu thread, quay trở lại bước Bước 8: thành phần Lọc nội dung cung cấp thông tin cần lọc cho thành phần Bộ định: o Cập nhật thông tin kho liệu thread o Quyết định thực lọc truy cập o Kết thúc phiên truy cập Trong số trường hợp, để giảm thiểu dung lượng đường truyền nội dung truy cập text nén dạng gzip nên để thực quy trình cần xử lý giải nén trước 4.3.6 Thành phần quản lý ứng dụng Như phân tích trên, kernel mode hook tác động lên ứng dụng không đạt hiệu user mode hook nên tường lửa lọc nội dung cần có thành 54 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com phần thực việc quản lý ứng dụng Tại mức user mode, window quản lý ứng dụng thông qua định danh PID (process id) Để xác định gói tin truy cập thuộc ứng dụng nào, window sử dụng trình quản lý ánh xạ Port PID tương ứng Thông qua trình quản lý tiến trình window, tường lửa lọc nội dung thực user mode hook kiểm soát truy cập ứng dụng: Kết thúc tiến trình truy cập Gửi thơng báo đến tiến trình truy cập Thay đổi nội dung truy cập Hình 4.19 Ánh xạ tên tiến trình cổng tương ứng Hình 4.20 Ánh xạ chi tiết PID (Process number) số cổng 55 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 4.3.7 Thành phần ghi log truy cập Do tường lửa lọc nội dung kiểm sốt tồn gói tin vào/ra người sử dụng đáp ứng thông tư 02/2005/TTLT-BCVT-VHTT-CA-KHĐT, nội dung truy cập ghi lại Các log file ghi file cách đầy đủ sau, gồm gói tin gửi nhận lại: Các gói tin gửi Các gói tin nhận Hình 4.21 Tổng hợp ghi log 4.3.8 Thành phần quản lý luật truy cập Các kho liệu lọc cập nhật hai cách: Người sử dụng chủ động điều chỉnh Cập nhật từ máy chủ tập trung 56 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Hình 4.22 Cập nhật luật truy cập từ server Trong trình sử dụng luật truy cập tường lửa lọc nội dung sửa đổi thay người sử dụng hệ thống cập nhật tự động Tùy thuộc trường hợp, sửa đổi người sử dụng hệ thống luật lọc bị thay cập nhật từ máy chủ 4.4 Chương trình thử nghiệm 4.4.1 Kết chương trình thử nghiệm Dựa vào giải thuật lọc nội dung truy cập Internet máy tính cá nhân đây, luận văn thực xây dựng chương trình thử nghiệm đạt số kết quả: Đã có phần mềm lọc nội dung truy cập Internet máy tính cá nhân với luật lọc ban đầu xây dựng dựa yêu cầu quan quản lý (Bộ Cơng an) kết hợp luật lọc có [ 15 ] Trong điều kiện thử nghiệm: sử dụng công cụ tự động truy cập 1000 địa website chứa danh sách địa cấm Bộ Cơng an, chương trình thử nghiệm đạt số kết quả: o Đối với danh sách lọc Bộ Cơng an: hiệu suất lọc đạt 100%, chương trình hoàn toàn lọc truy cập tới địa cấm có danh sách o Đối với địa truy cập ngẫu nhiên (một số địa trang tìm kiếm với 57 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com từ khóa danh sách cấm): hiệu suất lọc đạt 100%, đối chiếu danh sách địa lọc (log ghi lại chương trình) với danh sách trang bị lọc đưa vào ban đầu, chương trình lọc nội dung luận văn thực lọc hoàn toàn o Đối với lọc nội dung theo biểu thức tính điểm: áp dụng thử nghiệm số trang web giáo dục giới tính với biểu thức tính điểm sử dụng theo [ 15 ], kết cho thấy cần nghiên cứu điều chỉnh biểu thức tính điểm cho phù hợp khơng dẫn đến tỷ lệ lọc nhầm tương đối cao 4.4.2 So sánh với chương trình loại Hiện nay, Việt Nam có số phần mềm lọc nội dung truy cập Internet cho người dùng cá nhân nhiều người biết đến như: VwebFilter (VWF), DWK , Trong VWF sản phẩm phần mềm Công ty Điện tốn Truyền số liệu VDC có lượng người sử dụng lớn, sau tháng kể từ phần mềm cung cấp ngồi xã hội có khoảng triệu lượt người sử dụng 80% phản hồi nhận xét đánh giá sản phẩm tốt Do đó, phần mềm VWF coi thước đo phần mềm lọc nội dung khác đáp ứng đối phần mềm với người sử dụng Do phần mềm luận văn (Web Filter) chưa cung cấp xã hội nên việc so sánh đặc trưng phần mềm lọc nội dung với phần mềm VWF thực điều kiện thí nghiệm: (mức -1: khơng có, mức 0: trung bình, mức 1: tốt) Đặc điểm so sánh Đánh giá chung Chức Tính dễ sử dụng Tính dễ cài đặt Đánh giá người dùng Thuật toán lọc Phân tích đối tượng Lọc cụ thể lọc loại trừ Lọc nội dung WF VWF 1 -1 1 1 -1 1 -1 Ghi Phần mềm luận văn chưa cung cấp cho người sử dụng nên khơng có đánh giá Điểm khác biệt bản: VWF lọc nội dung có đủ gói thuộc phiên giao dịch, phần 58 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com mềm luận văn lọc gói tin Khả lọc Lọc IP Lọc URL Lọc từ khóa Lọc cụm từ Lọc biểu thức Lọc nội dung mail Lọc ảnh Sửa danh sách lọc Lọc nội dung chat Lọc lớp mạng Lọc FTP Lọc cổng chat Tính khác Mật quản lý Cập nhật luật lọc tự động Hỗ trợ trình duyệt Internet Explorer Firefox Netscape Opera Khác Hệ điều hành Windows 2000 Windows 2003 Windows XP Windows Vista Linux 1 1 1 1 0 0 -1 -1 1 -1 -1 -1 -1 -1 -1 1 -1 1 1 1 1 1 1 1 -1 -1 1 -1 -1 VWF chặn nội dung truy cập có đủ gói tin phiên giao dịch, phần mềm luận văn thực chặn phần nội dung nhận nằm phạm vi lọc VWF chưa thực tính 59 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com KẾT LUẬN Kết đạt luận văn: Thơng qua việc khảo sát, phân tích tình hình lọc nội dung truy cập Internet giới Việt Nam, luận văn hoàn thành số kết sau đây: Thống kê số liệu lĩnh vực lọc nội dung truy cập Internet giới Việt Nam (mục 1.1) Phân tích thực trạng lọc nội dung truy cập Internet (mục 1.2) Theo kết phân tích thực trạng lọc nội dung truy cập Internet cho thấy yêu cầu đặt giải pháp lọc nội dung truy cập cần thiết, luận văn thực hiện: Phân tích nội dung bản, kỹ thuật việc thực lọc nội dung truy cập Internet (chương 2) Trình bày giải pháp lọc nội dung cổng Internet quốc gia, cổng Internet mạng LAN trực tiếp máy tính cá nhân (chương 3) Từ thông tin sở để thực lọc nội dung truy cập trình bày chương hai giải pháp lọc nội dung chương ba, luận văn thực phân tích, đánh giá đề xuất giải pháp lọc nội dung truy cập Internet trực tiếp máy tính cá nhân xây dựng phần mềm thử nghiệm theo giải pháp đề Trong trường hợp thử nghiệm, chương trình hoạt động với chức đề Phương hướng nghiên cứu Lĩnh vực nghiên cứu lọc nội dung truy cập Internet lĩnh vực thời Các phương pháp lọc nghiên cứu phát triển nhằm lọc nội dung truy cập hiệu Vấn đề nghiên cứu, xây dựng phần mềm lọc nội dung đạt hiệu cao vấn đề nghiên cứu luận văn 60 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com TÀI LIỆU THAM KHẢO Tiếng Việt Cục Công nghệ Tin học nghiệp vụ Bộ Công An (03/2008), “Nghiên cứu, phát triển hệ thống lọc nội dung hỗ trợ quản lý đảm bảo an toàn – an ninh thông tin mạng Internet”, tài liệu kỹ thuật Trường Đại học Công nghệ - ĐHQGHN (2008), “Nghiên cứu, phân tích đánh giá giải thuật lọc hình ảnh Internet”, tài liệu kỹ thuật Công ty Điện toán Truyền số liệu (12/2006), “Giải pháp ngăn chặn truy cập nội dung Internet độc hại”, tài liệu kỹ thuật Tiếng Anh Paul Greenfield, Peter Rickwood, Huu Cuong Tran (2001) Effectiveness of Internet Filtering Software Products NetAlert and the Australian Broadcasting Authority Sara Carro Martínez (2004) POESIA: Public Open-source Environment for a Safer Internet Access (Evaluation of POESIA Beta Release) In Workshop Present and Future of Open-source Content-based Web Filtering, Pisa, Italia Yi Zhang (2005) Bayesian Graphical Models for Adaptive Filtering PhD Thesis, School of Computer Science, Carnegie Mellon University http://www.faqs.org/rfcs/rfc1331.html http://www.faqs.org/rfcs/rfc1340.html http://www.freesoft.org/CIE/Course/Section3/7.htm 10 http://www.comsci.us/datacom/tcppacket.html 11 http://www.ndis.com/papers/winpktfilter.htm 12 http://msdn.microsoft.com/en-us/library/ms795077.aspx 13 http://msdn.microsoft.com/en-us/library/ms795118.aspx 14 http://www.ntkernel.com/forum/viewtopic.php?f=1&t=1653&start=0 15 http://dansguardian.org/ 16 http://www.squid-cache.org/ 17 http://kernel.org/ 18 http://www.vnnic.vn/ 19 http://www.agnitum.com/download/pr/Kernel_mode_hooks_or_user_mode _hooks.pdf 61 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... luanvanchat@agmail.com Chương - GIẢI PHÁP LỌC NỘI DUNG VÀ XÂY DỰNG PHẦN MỀM TẠI MÁY TÍNH CÁ NHÂN 4.1 Giải thuật Hình 4.1 Sơ đồ giải thuật lọc nội dung trực tiếp máy tính cá nhân 39 LUAN VAN CHAT LUONG... phần Lấy nội dung o Thành phần Bộ định o Thành phần Lọc cụ thể, lọc loại trừ o Thành phần Lọc nội dung Về tường lửa lọc nội dung cá nhân xây dựng gồm thành phần áp dụng biện pháp khác thành phần. .. thái lọc biện pháp lọc, phương pháp lọc vị trí thực Từ xây dựng chương trình lọc nội dung truy cập Internet 2.1 Biện pháp lọc Căn vào yêu cầu đặt lọc nội dung truy cập Internet, chia biện pháp lọc