Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
1,59 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Tiến Dũng
NGHIÊN CỨUGIẢIPHÁP
LỌC NỘIDUNGINTERNETTẠIMÁYTÍNHCÁNHÂN
VÀ XÂYDỰNGPHẦNMỀM
LUẬN VĂN THẠC SĨ
Hà Nội – 2009
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Tiến Dũng
NGHIÊN CỨUGIẢIPHÁP
LỌC NỘIDUNGINTERNETTẠIMÁYTÍNHCÁNHÂN
VÀ XÂYDỰNGPHẦNMỀM
Ngành : Công nghệ Thông tin
Chuyên ngành : Hệ thống Thông tin
Mã số : 60 48 05
LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS. TS. HÀ QUANG THỤY
Hà Nội - 2009
LỜI CAM ĐOAN
Tôi xin cam đoan nộidung bản luận văn chưa từng được công bố hay xuất bản
dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công trình
nghiên cứu nào.
Toàn bộ ứng dụng thử nghiệm đều do tôi tự thiết kế vàxây dựng.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Hà Nội, tháng 08 năm 2009
Người cam đoan
Phạm Tiến Dũng
LỜI CẢM ƠN
Em xin chân thành cảm ơn các Thầy giáo, Cô giáo trong khoa Công nghệ
thông tin và các cán bộ, nhân viên phòng Đào tạo Sau đại học, trường Đại học
Công nghệ, Đại học Quốc gia Hà Nội đã luôn nhiệt tình giúp đỡ và tạo điều kiện tốt
nhất cho em trong quá trình học tập tại trường.
Xin chân thành cảm ơn các anh, chị và các bạn học viên lớp Cao học K12T3 -
trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã luôn động viên, giúp đỡ
và nhiệt tình chia sẻ với em những kinh nghiệm học tập, công tác trong suốt khoá
học.
Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS. Hà Quang
Thụy đã tận tình giúp đỡ em định hướng xây dựng, nghiêncứu phát triển và hoàn
chỉnh luận văn.
Mặc dù đã có nhiều cố gắng, song bài luận văn không tránh khỏi những khiếm
khuyết do sự hạn hẹp về thời gian và điều kiện nghiên cứu. Em chân thành mong
nhận được những ý kiến đóng góp quý báu của các thầy cô giáo nhằm giúp đề tài
của luận văn ngày một hoàn thiện và có tính phổ dụng trong tương lai.
MỤC LỤC
MỤC LỤC i
DANH SÁCH HÌNH VẼ ii
MỞ ĐẦU iii
Chương 1 - TỔNG QUAN LỌCNỘIDUNGINTERNET 1
1.1. Đánh giá tình hình nghiêncứu thuộc lĩnh vực đề tài 1
1.1.1. Thế giới 1
1.1.2. Tại Việt Nam 3
1.2. Thực trạng lọcnộidung truy cập hiện nay 4
Chương 2 - MỘT SỐ NỘIDUNG CƠ BẢN VỀ PHƯƠNG PHÁPLỌCINTERNET 7
2.1. Biện pháplọc 7
2.2. Phương pháplọc 8
2.2.1. Lọc địa chỉ IP 8
2.2.2. Lọc địa chỉ URL 9
2.2.3. Lọc từ khóa 9
2.2.4. Lọc cụm từ 10
2.2.5. Lọc ảnh 10
2.3. Vị trí thực hiện lọc 11
2.3.1. Lọctại cổng Internet quốc gia 11
2.3.2. Lọctại cổng Internet mạng LAN 11
2.3.3. Lọc thông qua bên thứ ba 12
2.3.4. Lọctạimáytínhcánhân 12
Chương 3 - GIẢIPHÁPLỌCNỘIDUNGINTERNET 13
3.1. Giảipháptại cổng Internet quốc gia 13
3.1.1. Kiến trúc hệ thống 13
3.1.2. Hoạt động 15
3.1.3. Phân tích các thành phần 16
3.2. Giảipháptại cổng Internet của mạng LAN 19
3.2.1. Kiến trúc tổng quan 19
3.2.2. Giải thuật và cơ chế hoạt động 19
3.3. Giảipháp trực tiếp trên máytínhcánhân 24
3.3.1. User mode: lấy nộidung từ lớp ứng dụng (Application) 25
3.3.2. User Mode: lấy nộidung từ lớp phiên (Session) 29
3.3.3. Kernel mode: lấy nộidung từ lớp mạng (IP) 32
3.3.4. Kernel mode: cơ chế nghe lén (sniffer) 35
3.4. Đề xuất giảipháp 36
3.4.1. Đánh giá giảipháp trực tiếp 36
3.4.2. Đề xuất 37
Chương 4 - GIẢIPHÁPLỌCNỘIDUNGVÀXÂYDỰNGPHẦNMỀMTẠIMÁY
TÍNH CÁNHÂN 39
4.1. Giải thuật 39
4.2. Hoạt động 40
4.3. Phân tích các thành phần 41
4.3.1. Thành phần lấy dữ liệu 41
4.3.2. Thành phầnphân tích nộidung gói tin 45
4.3.3. Thành phần tách, tổng hợp gói tin thành phiên giao dịch 48
4.3.4. Thành phầnlọc cụ thể, lọc loại trừ 51
4.3.5. Thành phầnlọcnộidung 52
4.3.6. Thành phần quản lý ứng dụng 54
4.3.7. Thành phần ghi log truy cập 56
4.3.8. Thành phần quản lý luật truy cập 56
4.4. Chương trình thử nghiệm 57
4.4.1. Kết quả chương trình thử nghiệm 57
4.4.2. So sánh với chương trình cùng loại 58
KẾT LUẬN 60
TÀI LIỆU THAM KHẢO 61
DANH SÁCH HÌNH VẼ
Hình 2.1. Lọctại cổng Internet quốc gia 11
Hình 2.2. Lọc thông qua bên thứ ba 12
Hình 2.3. Lọctạimáytínhcánhân 12
Hình 3.1. Hệ thống tưởng lửa hiện tại của các ISP 14
Hình 3.2. Kiến trúc hệ thống lọcnộidungInternettại ISP 15
Hình 3.3. Gateway Filter lọc cho một mạng LAN 19
Hình 3.4. Sơ đồ giải thuật lọc cho mạng LAN 1 20
Hình 3.5. Sơ đồ giải thuật lọc cho mạng LAN 2 22
Hình 3.6. Sơ đồ giải thuật lọc cho mạng LAN 3 23
Hình 3.7. Sơ đồ giải thuật lọc cho mạng LAN 4 24
Hình 3.8. Nộidung kiểm soát lấy từ cửa sổ trình duyệt 26
Hình 3.9. Sơ đồ giải thuật User mode (lấy nộidung lớp ứng dụng) 27
Hình 3.10. Hook Firewall ở User Mode 30
Hình 3.11. Sơ đồ giải thuật User mode (lấy nộidung lớp phiên) 31
Hình 3.12. Các chế độ Hook Firewall trên Windows 33
Hình 3.13. Sơ đồ giải thuật Kernel mode (lấy nộidung lớp IP) 34
Hình 4.1. Sơ đồ giải thuật lọcnộidung trực tiếp trên máytínhcánhân 39
Hình 4.2. Phân lớp xử lý gói tin 41
Hình 4.3. Sơ đồ xử lý tổng quát giảipháplọcnộidung 42
Hình 4.4. Quy trình ghi log truy cập 42
Hình 4.5. Cấu trúc dữ liệu tầng Transport 43
Hình 4.6. Cấu trúc dữ liệu tầng Network 44
Hình 4.7. Cấu trúc dữ liệu tầng DataLink 44
Hình 4.8. Cấu trúc gói tin lấy dữ liệu 45
Hình 4.9. Các gói tin dạng thô và được phân tích theo từng lớp mạng 47
Hình 4.10. Dữ liệu tầng TCP/IP của một gói tin 48
Hình 4.11. Header file ảnh 48
Hình 4.12. Header file text/html 49
Hình 4.13. Gói tin đầu tiên của một phiên giao dịch 49
Hình 4.14. Tham số Seq và Ack 49
Hình 4.15. Tham số Seq và Ack gói tin kế tiếp 50
Hình 4.16. Tổng hợp các gói tin đơn lẻ thành phiên giao dịch 50
Hình 4.17. Trích đoạn danh sách lọc đang được áp dụng cho mạng VNN 51
Hình 4.18. Gói tin request(Get) 52
Hình 4.19. Ánh xạ tên tiến trình và cổng tương ứng 55
Hình 4.20. Ánh xạ chi tiết PID (Process number) và số cổng 55
Hình 4.21. Tổng hợp ghi log 56
Hình 4.22. Cập nhật luật truy cập từ server 57
MỞ ĐẦU
Mạng Internet ra đời và phát triển thành một kho dữ liệu khổng lồ, bao gồm
đầy đủ các khía cạnh về văn hoá, chính trị, khoa học - kỹ thuật, Với sự đa sắc
màu văn hoá trên thế giới, đa tín ngưỡng, đa lối sống, đa tư duy,… đã làm cho
thông tin trên Internet luôn song hành tính tích cực và tiêu cực trong nội tại. Ưu thế
từ công nghệ Internet làm cho sức thâm nhập của kênh thông tin quan trọng này đối
với người sử dụng rất rộng lớn và nhanh chóng. Các khía cạnh xấu - độc hại trong
xã hội cũng theo đường Internet để thâm nhập vào mỗi gia đình, mỗi con người.
Chính vì lý do đó, công việc hỗ trợ quản lý và đảm bảo an toàn – an ninh thông tin
trên mạng Internet đã trở thành mối quan tâm của mỗi gia đình, mỗi tổ chức, mỗi
quốc gia.
Về phương diện gia đình, mối quan tâm của các bậc phụ huynh là ngăn ngừa
việc thâm nhập các trang Web độc hại đối với con em mình. Về phía cánhân người
sử dụng, khai thác được những thông tin tích cực và ngăn ngừa tiếp xúc web độc
hại do vô tình hay cố ý.
Trong những năm gần đây, lĩnh vực nghiêncứu phát triển hệ thống lọcnội
dung hỗ trợ quản lý và đảm bảo an toàn – an ninh thông tin trên mạng Internetnhận
được sự quan tâm đặc biệt ở hầu hết các quốc gia trên thế giới.
Tại Việt Nam, giảipháp cấp quốc gia đã được Nhà nước chỉ đạo các ban
ngành liên quan nghiêncứuvà đề xuất. Tuy nhiên trước thực tế nhu cầu cần giải
pháp lọcnộidung truy cập của người sử dụng Internet, tìm hiểu vàxâydựnggiải
pháp lọcnộidung truy cập trực tiếp trên máytínhcánhân hiện đang là mục tiêu
nghiên cứu của nhiều cá nhân, tập thể và đây chính là mục tiêu của luận văn này.
Chương thứ nhất của luận văn trình bày tổng quan về lọcnộidungInternet
trên thế giới vàtại Việt Nam, phân tích thực trạng về lọcnộidung truy cập hiện nay
trên phương diện về chính sách quy định của Nhà nước cũng như yêu cầu đặt ra đối
với các công cụ phần mềm.
Chương thứ hai của luận văn trình bày các nộidung cơ bản liên quan đến vấn
đề lọcnộidung truy cập Internet, bao gồm: biện pháp lọc, phương pháplọcvà vị trí
thực hiện lọc.
Dựa trên việc phân tích về vị trí thực hiện lọcnộidung đã trình bày trong
chương hai, chương thứ ba trình bày về các giảipháplọcnộidung truy cập tại cổng
Internet Quốc gia, tại cổng Internet của mạng LAN vàgiảipháp trực tiếp trên máy
tính cá nhân.
Cuối cùng, chương thứ tư trình bày về giảiphápvàxâydựng chương trình lọc
nội dung truy cập Internettạimáytínhcá nhân. Trong các trường hợp thử nghiệm,
chương trình đã hoạt động đúng chức năng đặt ra.
[...]... 2.3.4 Lọctạimáytínhcánhân Đa số các giảipháplọc hiện nay được thiết kế để chạy trên các máytínhcánhân Kỹ thuật lọc thực hiện kết hợp các phương pháplọc phổ biến trên (mục 1.2) Bộ luật lọc mới nhất được cập nhật định kỳ từ các nhà cung cấp phầnmềmLọctạimáytínhcánhân ưu điểm về nguồn lực dư thừa máy tính, thời gian xử lý thực, tiết kiệm chi phí đầu tư phần cứng Tuy nhiên, lọctạimáy tính. .. tạimáytínhcánhân là giảipháp ít tin cậy nhất do phầnmềm hoạt động trong môi trường không bảo mật, dễ bị vô hiệu hóa Hình 2.3 Lọctạimáytínhcánhân 12 Chương 3 - GIẢIPHÁPLỌCNỘIDUNGINTERNET Trong chương hai đã trình bày về một số nộidung cơ bản của phương pháplọc nội dung Internet: biện pháp lọc, phương pháplọc và vị trí thực hiện lọc Với mỗi nộidung đã trình bày đặc trưng vàphân tích... hết phải hiểu rõ bản chất của nộidungInternet Vì vậy, chương này sẽ tập trung nghiêncứu những nộidung liên quan đến hình thái lọc như biện pháp lọc, phương pháplọc và vị trí thực hiện Từ đó có thể xâydựng được chương trình lọcnộidung truy cập Internet 2.1 Biện pháplọc Căn cứ vào các yêu cầu đặt ra đối với lọcnộidung truy cập Internet, có thể chia biện pháplọc thành một số loại cụ thể như... vàphân tích về kỹ thuật Đó là cơ sở cho phần tiếp sau, phần trình bày về các giảipháplọcnộidungInternettại ba cấp độ khác nhau: cổng Internet quốc gia, cổng Internet cho mạng LAN vàtạimáytínhcánhân 3.1 Giảipháptại cổng Internet quốc gia 3.1.1 Kiến trúc hệ thống Hệ thống tường lửa tại các ISP hiện tại Hiện nay các nhà cung cấp dịch vụ Internettại Việt Nam đều đang sử dụng hệ thống tường... vào cache o Forward header từ Proxy tới client o Kiểm tra xem phần body đã được tải xuống và lưu trữ hay chưa Nếu rồi thì gửi cho client phầnnộidung bypass Nếu chưa thì forward body từ proxy tới client 3.3 Giảipháp trực tiếp trên máytínhcánhânGiảipháp tường lửa lọcnộidung trên máytínhcánhân là giảipháp triển khai trực tiếp trên từng máy tính, nó thực hiện kiểm soát nộidung truy cập Internet. .. Thành phầnLọc cụ thể, lọc loại trừ o Thành phầnLọcnộidung Về cơ bản tường lửa lọcnộidungcánhân được xâydựng gồm các thành phần như trên nhưng do áp dụng biện pháp khác nhau tại thành phần Lấy nộidung nên có thể chia ra thành những loại sau: 3.3.1 User mode: lấy nộidung từ lớp ứng dụng (Application) Việc kiểm soát nộidung truy cập Internet của người sử dụng sẽ được thực hiện trực tiếp trên các... cập Internet vào/ra trên máytính đó Có thể nói đây là giảipháp có tính ‘phân tán’ cao nhất, vì hoạt động quản lý trực tiếp trên một máytính thay vì cổng Internet mạng LAN, cổng Internet quốc gia Phầnmềmlọcnộidung truy cập Internet sẽ được cài đặt trực tiếp trên hệ điều hành của người dùng Thành phần của tường lửa lọcnộidungcánhân bao gồm: 24 o Thành phần Lấy nộidung o Thành phần Bộ quyết... TỔNG QUAN LỌCNỘIDUNGINTERNET 1.1 Đánh giá tình hình nghiêncứu thuộc lĩnh vực đề tài 1.1.1 Thế giới Hầu hết các nước trên thế giới đều xâydựngvà thực hiện các chính sách quốc gia về an toàn – an ninh Internet, trong đó đặc biệt chú ý tới vấn đề lọcnộidung trên Internet Ngoài một số công bố về vấn đề lọcnộidung đối với nước Mỹ [ 1 ], một số công trình nghiêncứu về lọcnộidung trên Internet. .. máytínhcá nhân, trên một máy chủ của doanh nghiệp, tại một công ty cung cấp dịch vụ internet, hoặc trên một hệ thống lọc của bên thứ ba 2.3.1 Lọctại cổng Internet quốc gia Các giảipháplọc cũng được thiết kế để hoạt động tại ISP nhưng do đặc tính về đảm bảo hoạt động tại ISP nên hiện nay các giảipháplọc hiện chỉ thực hiện hạn chế đối với danh sách địa chỉ IP đen Hình 2.1 Lọctại cổng Internet. .. có nộidung hoàn chỉnh cung cấp đầu vào cho thành phầnlọcnộidung o Tăng tốc độ trong việc phân tích các trang web khác trên cùng một site: do không phải lấy lại những file đã có o Giảm thiểu thời gian bị trì hoãn khi duyệt web của người dùng do hệ thống lọcnộidung gây ra Lọcnội dung: Thành phầnLọcnộidung là thành phần chính của tường lửa lọcnộidung Một tường lửa thông thường sẽ thực hiện lọc . HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Tiến Dũng
NGHIÊN CỨU GIẢI PHÁP
LỌC NỘI DUNG INTERNET TẠI MÁY TÍNH CÁ NHÂN
VÀ XÂY DỰNG PHẦN MỀM.
Chương 4 - GIẢI PHÁP LỌC NỘI DUNG VÀ XÂY DỰNG PHẦN MỀM TẠI MÁY
TÍNH CÁ NHÂN 39
4.1. Giải thuật 39
4.2. Hoạt động 40
4.3. Phân tích các thành phần 41
4.3.1.