Khái niệm về an ninh nội dung

Một phần của tài liệu Xây dựng công cụ lọc nội dung dịch vụ Web (Trang 36 - 88)

1.3.1. Khái niệm

An ninh nội dung bên cạnh việc đảm bảo tính toàn vẹn nội dung thông tin trong suốt chu kỳ sống của nó (tạo lập, truyền tải, quảng bá) khi tham gia vào mạng Internet là việc ngăn ngừa sự phân phát và tiếp cận thông tin có nội dung được cho là độc hại tùy theo chính sách đánh giá của mỗi quốc gia, tổ chức hoặc cá nhân.

Bảo đảm an ninh nội dung thông tin cũng có nghĩa là kiểm soát nội dung thông tin trao đổi qua các kênh trao đổi thông tin nhằm chặn lại không cho chuyển các thông tin không đƣợc phép ra bên ngoài, làm lộ lọt thông tin và không cho các thông tin không đƣợc phép từ bên ngoài vào gây tác động xấu.

Đối với mỗi quốc gia, khi xét trên phƣơng diện an ninh quốc gia thì an ninh nội dung có nghĩa là không cho kẻ xấu cũng nhƣ các thế lực thù địch thực hiện “Âm mƣu diễn biến hòa bình”, lợi dụng các phƣơng tiện truyền thông mà đặc biệt là mạng Internet để truyền bá các thông tin có nội dung xấu, nội dung độc hại, ảnh hƣởng nghiệm trọng đến an ninh chính trị và trật tự an toàn xã hội. Đối với nƣớc ta hiện nay, các thế lực thù địch đang tích cực lợi dụng việc trao đổi thông tin qua mạng Internet để truyền những nội dung thông tin không có lợi nhằm truyền bá lối sống, sinh hoạt văn hoá không lành mạnh, phổ biến các tài liệu có nội dung xuyên tạc sự thật, vu cáo, kích động, chống đối lại Đảng và Nhà nƣớc ta hay nhằm mua chuộc các bí mật về an ninh chính trị, kinh tế, công nghệ. Vì vậy việc quản lý sử dụng mạng Internet phải bảo đảm an toàn nội dung thông tin khi đƣa vào mạng, cũng nhƣ khi nhận thông tin từ mạng. Nhà nƣớc phải có những biện pháp quản lý chặt chẽ từ khâu khai thác, lƣu giữ đến khâu truyền tải, phổ biến các thông tin đó nhằm ngăn chặn những thông tin xấu, độc hại.

Trên phƣơng diện văn hóa, xã hội, Internet đem lại một khối lƣợng thông tin phong phú, đa dạng, góp phần phát triển nhiều lĩnh vực. Tuy nhiên sự bùng nổ Internet cũng mang đến không ít những nguy cơ mới. Chỉ với một vài từ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

khóa qua các công cụ tìm kiếm, hàng nghìn website với nội dung đồi trụy đã sẵn sàng mời đón ngƣời duyệt web, hoặc chỉ đơn giản là những đƣờng link với lời mời hấp dẫn trên những trang web mà ngƣời dùng ghé thăm. Số lƣợng các web đen bằng tiếng Việt thời gian gần đây xuất hiện ngày càng nhiều. Các giải pháp kỹ thuật cùng những đợt kiểm tra đã đƣợc xúc tiến nhƣng số lƣợng website xấu vẫn không có dấu hiệu giảm sút. Internet là không biên giới, nếu những nội dung đồi trụy, phi đạo đức, vi phạm pháp luật đƣợc đặt (hosting) tại các máy chủ ở nƣớc ngoài thì việc xử lý gặp nhiều khó khăn. Do đó, đây không chỉ là một vấn đề hết sức khó khăn đối với những nhà quản lý Internet, mà còn là mối lo chung của toàn xã hội, đặc biệt là các bậc cha mẹ học sinh. Vì cùng với việc con em họ đƣợc tiếp xúc với Internet là việc chúng có thể bị dụ dỗ, lôi kéo bởi những nội dung xấu trên Internet mà các bậc cha mẹ khó có thể kiểm soát đƣợc.

Vì vậy, có thể hiểu an ninh nội dung giống nhƣ một biện pháp quản lý nội dung trên Internet, một giải pháp để kiểm soát, theo dõi, đánh giá và báo cáo việc truy cập tới những Websites cụ thể nào đó và những nhóm Websites có cùng kiểu nội dung, dựa trên địa chỉ IP, đồng thời ngăn chặn đƣợc việc truy cập các trang web có nội dung xấu.

1.3.2. Một số hình thức lợi dụng vấn đề an ninh nội dung phục vụ mục đích xấu. đích xấu.

Internet là con đƣờng nhanh nhất để truyền bá thông tin đến nhiều ngƣời trên diện rộng. Vì vậy nên hiện nay các thế lực thù địch đang lợi dụng một cách triệt để việc sử dụng Internet để gây phƣơng hại cho một quốc gia trên mọi phƣơng diện: an ninh chính trị, phá hoại kinh tế, trật tự an toàn xã hội, quảng bá thông tin, phổ biến văn hóa phẩm đồi trụy, phá hoại bản sắc dân tộc, v.v... Có thể chỉ ra một số hình thức mà kẻ địch hay lợi dụng nhất đó là:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Lợi dụng hệ thống thông tin mạng toàn cầu world wide web (WWW), hiện là hệ thống thông tin lớn nhất thế giới, với tỷ lệ sử dụng cao nhất (khoảng 80%), bao trùm toàn bộ Internet, các thế lực phản động nƣớc ngoài đã và đang xây dựng rất nhiều các trang thông tin có nội dung khiêu khích, lôi kéo, kích động, chống phá nhà nƣớc ta. Các trang tin này đƣợc thiết kế sử dụng tiếng Việt, với nhiều hình thức thông tin có tác dụng thu hút, lôi kéo ngƣời dân trong nƣớc truy nhập vào, để rồi sau đó cài vào đó các thông tin phản động, chống đối. Loại hình nói trên đều có đặc điểm chung là sử dụng nhiều phƣơng thức, hình thức dịch vụ tin tức, trao đổi khác nhau để lôi kéo định hƣớng ngƣời sử dụng Internet đến với các nội dung cần tuyên truyền. Đôi khi sử dụng các thông tin đánh lạc hƣớng là những thông tin rất có giá trị (nhƣ các tin tức kinh tế, thƣơng mại, các tài liệu tra cứu, sách vở, v.v.. trong kho tàng tri thức chung) để nhằm làm ngƣời đọc mất cảnh giác khi đến với các nội dung phản động. Các nội dung liên quan đến tình hình thời sự, chính trị trong nƣớc thƣờng bị bóp méo, xuyên tạc dẫn đến làm sai lệch cách nhìn nhận của ngƣời dân về Đảng và Nhà nƣớc. Với một số lƣợng lớn máy chủ web trên thế giới, chứa hàng trăm triệu trang tin tức, việc xác định đƣợc các trang tin nào bị lợi dụng để phá hoại là một việc rất khó khăn.

Một thực tế đang diễn ra là sự bùng nổ của các website với đủ loại nội dung sex, bạo lực, phản động khiến các nhà quản lý bối rối vì khó kiểm soát, các chuyên gia an ninh mạng thì cho rằng không thể tận diệt, phụ huynh thì lo lắng. Chỉ với một vài từ khóa thông qua các công cụ tìm kiếm phổ dụng, hàng nghìn website với nội dung “đen” đã sẵn sàng chờ đón ngƣời duyệt web vào thế giới “đen” của mình. Từ đó mà các nội dung phản động, độc hại, phi đạo đức, vi phạm pháp luật dễ dàng đƣợc phát tán.

1.3.2.2. Sử dụng dịch vụ thƣ điện tử

Phƣơng thức phổ biến thứ 2 thƣờng đƣợc kẻ xấu sử dụng là thƣ điện tử. Thƣ điện tử (email) là một dịch vụ nguyên thủy của mạng Internet, trên thực

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

tế nó chính là dịch vụ cơ bản và đƣợc sử dụng nhiều nhất trong suốt quá trình phát triển của Internet. Mỗi ngày có hàng tỷ email đƣợc truyền đi qua Internet. Thƣ điện tử đã trở thành một dạng dịch vụ không thể thiếu đối với ngƣời sử dụng Internet. Có rất nhiều giao dịch, kể cả giao dịch thƣơng mại đã sử dụng email nhƣ một phƣơng pháp truyền thông hiệu quả và tin cậy. Thậm chí địa chỉ email đã trở thành sở hữu quan trọng, đôi khi đƣợc sử dụng nhƣ nhận dạng cá nhân trong các sở hữu liên quan Internet. Do đó thông qua email để tiếp cận đối tƣợng tuyên truyền là một hình thức rất hiệu quả trong thời đại Internet. Hiện tại việc lạm dụng email để quảng cáo, tuyên truyền, thậm chí lừa đảo (còn gọi là spam, phishing) đã trở thành một vấn nạn toàn cầu. Trong trào lƣu đó, các phần tử xấu đã nhanh chóng áp dụng các phƣơng pháp tiếp cận bằng email vào âm mƣu

“diến biến hòa bình”, phá hoại an ninh quốc gia, tuyên truyền văn hóa phẩm đồi trụy...

Công tác ngăn chặn các email “đen” gặp nhiều khó khăn, bởi kẻ xấu thƣờng gửi các tài liệu đi với số lƣợng lớn, địa chỉ ngƣời gửi rất dễ dàng để giả mạo; việc cung cấp miến phí các hòm thƣ nhƣ yahoo, gmail, hotmail tạo điều kiện cho kẻ xấu dễ dàng tạo lập nhiều hộp thƣ phục vụ cho mục đích xấu. Ngoài ra, việc ngăn chặn một hộp thƣ có thể ảnh hƣởng đến ngƣời dùng do chặn nhầm vì địa chỉ ngƣời gửi là giả mạo

1.3.2.3. Sử dụng các diễn đàn (forum) và dịch vụ hội thoại (chat)

Một phƣơng thức nữa đƣợc kẻ địch sử dụng trên mạng Internet để truyền bá thông tin độc hại là thông qua các dịch vụ hội thoại, trao đổi trực tuyến, các diễn đàn trao đổi,.. Việc lợi dụng các hình thức này có thuận lợi lớn, vì không những chúng có tính phổ biến cao, khả năng liên kết nhiều ngƣời với nhau một cách thuận tiện, mà còn vƣợt qua cả không gian và thời gian, với chi phí rất rẻ (có cả hình thức miễn phí). Thông qua các kênh hội thoại trực tuyến, các phần tử xấu có thể truyền bá tƣ tƣởng phản động, kích động các phần tử khác, nhất là các thanh thiếu niên có tƣ tƣởng chống đối; hoặc truyền bá văn

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

hóa phẩm đồi trụy. Bên cạnh đó, đây cũng là một kênh thông tin cho hoạt động gián điệp, nơi tổ chức hội họp bàn các biện pháp chống phá nhà nƣớc Việt Nam.

Việc sử dụng loại hình này rất đơn giản. Chỉ cần đăng ký một bí danh, nickname, là có thể đăng nhập vào các diễn đàn trao đổi, lên mạng chat hoặc gửi thƣ điện tử… do đó gây rất nhiều khó khăn trong việc giám sát và ngăn chặn của các cơ quan chức năng. Chƣa kể đến nhiều dịch vụ dạng này đƣợc ngụy trang thành các dịch vụ web thông thƣờng, không thể phân biệt để ngăn chặn.

1.3.3. Một số phƣơng pháp đảm bảo an ninh nội dung thông tin

1.3.3.1. Giải pháp phân tích lọc nội dung thông tin

Đối với vấn đề quản lý luồng dữ liệu Internet, do tính đồ sộ của thông lƣợng tin luân chuyển tại một cổng Internet quốc gia và để đảm bảo tính tức thời của thông tin, tất cả các luồng dữ liệu vào/ra tại đó sẽ đƣợc phân tích và xử lý theo nhiều mức khác nhau. Việc quản lý luồng thông tin sẽ đƣợc thao tác trên cả 3 tầng của kiến trúc mạng: vật lý, liên kết và mạng. Vì vậy, kết hợp thế mạnh xử lý phần cứng cùng một hệ thống phần mềm thông minh, có tính thích nghi cao, sẽ là cách tiếp cận chính trong việc quản lý luồng thông tin Internet.

Lọc nội dung thông tin là một công cụ hữu ích đƣợc dùng để điều chỉnh những nội dung trên Internet đƣợc phép đến với ngƣời dùng. Chúng còn cung cấp một khả năng ngăn chặn những nội dung “xấu” đƣợc gửi đến máy của ngƣời dùng qua các dịch vụ trên Internet hoặc bằng e-mail.

Lọc Internet nói chung (lọc nội dung nói riêng) liên quan tới việc hạn chế khả năng thâm nhập Internet của ngƣời dùng để ngăn chặn việc truy nhập tới các trang Web có nội dung xấu. Việc lọc nội dung về hình thức có vẻ mâu thuẫn với quan niệm tự do khai thác thông tin trên Internet, vì vậy việc hạn chế khả năng thâm nhập Internet cần đƣợc đảm bảo bằng pháp luật. Chính vì lẽ đó, cùng với việc nghiên cứu, phát triển các phƣơng tiện lọc nội dung trên Web, mỗi quốc gia cũng cần xây dựng một hệ thống văn bản pháp lý đối với việc lọc thông tin nhằm đảm bảo tính hợp thức của mọi hoạt động cần thiết liên quan.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Cổng Internet quốc gia chính là trạm trung chuyển dữ liệu giữa nơi gửi và nơi nhận. Vì vậy tại đây, ta có thể thiết lập một hệ thống lọc tự động các luồng dữ liệu vào/ra, hỗ trợ cho công tác quản lý và bảo đảm an toàn-an ninh trên mạng Internet. (adsbygoogle = window.adsbygoogle || []).push({});

Để có thể quản lý và bảo đảm an toàn an ninh thông tin qua cổng Internet quốc gia thì điều kiện tiên quyết là ta phải kiểm soát đƣợc các luồng dữ liệu đi qua đó nhƣ các luồng dữ liệu sử dụng giao thức HTTP, FTP và SMTP. Điều này sẽ đƣợc thực hiện thông qua cả các thiết bị phần cứng (router, switch) và phần mềm (firewall, transparent proxy, phần mềm kiểm soát và lọc nội dung).

Công cụ lọc có thể đƣợc cài đặt trên một vài vị trí nhƣ máy tính cá nhân, trên máy chủ của các tổ chức thông qua các dịch vụ đƣợc cung cấp bởi ISP hoặc các cách thức khác của “ngƣời trung gian”… cung cấp những nền tảng cơ bản cho sự cùng nhau chia sẻ.

1.3.3.2. Bộ lọc nội dung web

Một thiết bị lọc nội dung Web (bộ lọc WEB) gồm những chức năng sau:

Nhận dạng (Identification): Nhận dạng ngƣời dùng qua địa chỉ IP và liên kết địa chỉ IP với tên ngƣời dùng qua LDAP hoặc AD

Theo dõi (Monitoring): Theo dõi những hoạt động của ngƣời dùng khi online, những Websites đƣợc truy cập, những links trong Websites đó và các hoạt động nhƣ download, upload files…

Kiểm soát (Control): Giới hạn việc truy cập vào Websites hoặc phân loại Websites, ngăn chặn một số những hoạt động nhƣ download, upload…

Đánh giá (Measurement): Ghi log và lƣu dữ liệu đối với những Website truy cập và những hoạt động trên đó bao gồm ngày, giờ, thời lƣợng truy cập…

Báo cáo (Reporting): Tạo báo cáo dựa vào những thông tin đã ghi lại trên Logfile.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Do đặc thù của những dịch vụ trên Internet hiện nay mà các yêu cầu lọc đối với từng thành phần là khác nhau.

1.3.3.3. Giải pháp lọc web

Giải pháp quản lý nội dung web phải đảm bảo kiểm soát, theo dõi, đánh giá và báo cáo việc truy cập tới những Websites cụ thể nào đó và những nhóm Websites có cùng kiểu nội dung, dựa trên địa chỉ IP, đồng thời ngăn chặn đƣợc việc truy cập các trang web có nội dung xấu. Các thiết bị lọc Web thông thƣờng sử dụng một cơ sở dữ liệu bao gồm các URL, mà nội dung đã đƣợc phân loại, danh sách các Websites đuợc phép truy cập hay cấm (White list & Black list), và những trang để kiểm soát ngƣời dùng liên kết đến những Websites khác. Cơ sở dữ liệu này luôn đƣợc đồng bộ và cập nhật thƣờng xuyên từ máy chủ của nhà cung cấp.

Một số yêu cầu đối với việc lọc trang web:

 Từ chối không cho truy vấn đến nơi có những thông tin bị cấm mà ngƣời dùng nào đó yêu cầu (thông tin đồi truỵ, thông tin bạo lực.v.v.).

 Cho phép sửa đổi lại một phần nội dung thông tin, dữ liệu đƣợc yêu cầu (loại bỏ các Spam, virus, đoạn mã... đi kèm, thay đổi một phần nội dung kết quả tìm kiếm từ các trang tìm kiếm.v.v.).

 Định hƣớng lại luồng dữ liệu tới các đích an toàn đặt sẵn (các trang quảng cáo popup, các trang thông báo.v.v.).

 Phát hiện, kiểm soát, ngăn chặn các cookies, các đoạn mã có hại.v.v. Hiện nay đã có một số phần mềm lọc nội dung thông tin trên giao dịch web dựa trên nhiều phƣơng pháp lọc khác nhau cụ thể nhƣ: lọc theo địa chỉ IP, lọc theo địa chỉ URL, lọc theo tên miền, lọc theo các từ khoá hay cụm từ xuất hiện trên website, lọc theo các tệp tin có phần mở rộng mà trên các website có đính kèm (MIME), lọc theo các chủ đề các nội dung tồn tại trên website (PICS - Platform for Internet Content Selection), lọc theo các kết nối giới hạn cho phép đẩy các thông tin đính kèm lên server.v.v.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

1.3.3.4. Giải pháp lọc thƣ điện tử

Mỗi bức thƣ điện tử cũng bao gồm đầy đủ các thành phần nhƣ các bức thƣ thông thƣờng khác. Phần phong bì mô tả thông tin ngƣời nhận và ngƣời gửi. Phần tiêu đề (header) chứa các nội dung về địa chỉ ngƣời gửi, ngƣời nhận, về chủ đề thƣ.v.v. Phần nội dung (body) chứa nội dung bức thƣ đƣợc viết ra từ trình soạn thảo. Ngoài ra thƣ điện tử còn có thể đính kèm một số file định dạng khác nhau.

Một phần của tài liệu Xây dựng công cụ lọc nội dung dịch vụ Web (Trang 36 - 88)