PHẦN 8: ÁP DỤNG AN TOÀN CƠ SỞ DỮ LIỆU THỐNG KÊ.

Một phần của tài liệu ĐỀ tài dự án QUẢN lý SINH VIÊN (Trang 26 - 29)

Cơ sở dữ liệu thống kê là một loại cơ sở dữ liệu chứa những thông tin cơ bản nhưng không cho phép các câu truy vấn tiết lộ dữ liệu riêng tư của các đối tượng hay cá nhân trong cơ sở dữ liệu.

Một cơ sở dữ liệu thống kê (SDB) là một cơ sở dữ liệu chứa các bản ghi mô tả về các cá nhân nhưng chỉ các thông tin thống kê mới sẵn dùng, có nghĩa là chỉ các câu truy vấn thống kê (như: COUNT, SUM, MEAN, MAX, MIN…) mới được trả lời, ngoài các câu truy vấn này thì những truy vấn vào các mục dữ liệu riêng sẽ không được đáp lại..

Có 2 dạng SDB cơ bản:

Áp dụng SDB về KeHoachDaoTao ở dạng CSDL vĩ mô. COUNT

Đếm số lượng lớp học có maKhoa là AT.

Select count(*) from LOP Where maKhoa = ‘AT’

Đếm số lượng lớp học có maKhoa là DT-VT.

Select count(*) from LOP Where maKhoa = ‘DT-VT’ SUM

Tính tổng số lượng sinh viên của tất cả các lớp.

Vấn đề bảo vệ CSDL thống kê

Vấn đề chính trong bảo vệ SDB là dàn xếp giữa các yêu cầu cá nhân và quyền của các tổ chức để biết và xử lý thông tin. Nghĩa là bắt buộc phải chia sẻ thông tin thống kê để các tổ chức có thể biết và xử lý thông tin thống kê, trong khi vẫn đảm bảo giữ bí mật các thông tin của cá nhân trong SDB.

Nói đến bảo vệ một SDB là nói đến việc ngăn chặn hay tránh khả năng suy diễn thống kê (statistical inference). Suy diễn trong một SDB có nghĩa là có thể thu được các thông tin bí mật trong các thực thể đơn lẻ, bằng cách lợi dụng các câu truy vấn thống kê.

Biện pháp an toàn đầu tiên là xây dựng một bộ lọc thống kê (statistical filter), chỉ cho phép các câu truy vấn thống kê và ngăn chặn truy nhập trực tiếp vào các thực thể xác định trong SDB. Tuy nhiên, bộ lọc thống kê không đủ ngăn chặn suy diễn. Các thống kê đưa ra thường chứa một dấu vết về dữ liệu và sử dụng nó khi tính toán, người sử dụng có kỹ năng có thể thu được các thông tin không được phép. Ví dụ, trước tiên người sử dụng đưa ra câu truy vấn về mức lương trung bình của các nữ nhân công trong một bộ phận nào đó, sau đó đưa ra câu truy vấn tiếp theo về số lượng. các nữ nhân công. Nếu phép tính này trả lại giá trị 1 thì người sử dụng thu được (suy diễn) lương của nữ nhân công này thông qua các câu truy vấn thống kê hợp lệ (đây chính là các câu truy vấn mà bộ lọc cho phép đi qua).

Việc phát triển một kỹ thuật kiểm soát suy diễn hiệu quả phụ thuộc vào các kiến thức mà nhà phát triển có được, kiến thức này bao hàm các kỹ thuật mà một snooper (kẻ tấn công theo kiểu đánh hơi) đã sử dụng để tấn công vào SDB. Để đối phó với các kỹ thuật tấn công tinh vi, các cơ chế bảo vệ cũng cần tinh xảo hơn. Hơn nữa, cần kết hợp các kỹ thuật nhằm ngăn chặn suy diễn trên SDB, do đó cần thiết kế các kỹ thuật đơn lẻ để đối phó lại các kiểu tấn công cụ thể.

Thống kê nhạy cảm

Một khái niệm quan trọng trong các SDB là khái niệm thống kê nhạy cảm. Thống kê nhạy cảm là một thống kê có thể được sử dụng để nhận dạng thông tin bí mật về một cá nhân được biểu diễn trong SDB.

Thống kê được tính toán trên một thuộc tính bí mật trong tập truy vấn là thống kê nhạy cảm. Ví dụ, khi ta dùng truy vấn COUNT(AGE >50) để đếm số công nhân có tuổi lớn hơn 50 chẳng hạn, và số lượng này chỉ là một, tiếp theo ta có thể dễ dàng tìm ra lương của người công nhân này bằng câu truy vấn SUM(Salary, age>50), như vậy truy vấn SUM trên là thống kê nhạy cảm, và thông tin bí mật ở đây chính là lương (salary). Do đó, nên hạn chế các thống kê nhạy cảm, có nghĩa là không nên để lộ chúng.

Một phần của tài liệu ĐỀ tài dự án QUẢN lý SINH VIÊN (Trang 26 - 29)

Tải bản đầy đủ (DOCX)

(29 trang)
w