Nghiên cứu - Trao đổi Số 5/2007 BÀN VỀ PHƯƠNG PHÁP BẢO VỆ CƠ SỞ DỮ LIỆU
VÀ CÁC CHIÉN LƯỢC BẢO QUẢN TÀI LIỆU ĐIỆN TỬ
ừa qua, Nhà nước đã ban hành một số văn bản về giao dịch điện tử giữa các cơ quan, tổ chức Điều này đặt ra một số ván đề liên quan tới công tác văn thư, lưu trữ Trách nhiệm của các cán bộ ngành văn thư, lưu trữ càng nặng nề và cần có sự đổi mới Do cơ sở dữ liệu (CSDL) là hạt nhân cốt lõi nhất của lưu trữ điện tử, nên vấn đề về bảo vệ
cơ sở dữ liệu và bảo quản tài liệu điện tử ngày càng được đặt
ra cấp thiết Trong bài viết này,
chúng tôi xin đưa ra một số ý kiến về vấn đề này l- Bảo vệ
cơ sở dữ liệu (CSDL):
Bảo mật thông tín trong các hệ cơ sở dữ liệu là gì ?
Người làm công tác văn
thư, lưu trữ trong thời đại công
nghệ thông tín hiện nay, chắc chắn sẽ phải làm việc với một vài CSDL (bao gồm việc quản trị, truy cập, tìm kiếm thông tin, cập nhật thông tin) Bảo mật trong CSDL là việc ngăn chặn các truy cập không được phép và hạn chế tối đa các sai sót của
người dùng, đảm bảo thông tin
không bị mắt hoặc bị thay đổi ngoài ý muốn, không tiết lộ nội dung dữ liệu cũng như chương
trình xử lý
Các giải pháp bảo vệ chủ
yếu là:
- Tạo lập dữ liệu con hoặc sơ đồ truy cập hạn ché tới dữ liệu trong CSDL;
ThS Lê Thị Mùi
Trung tâm Thông tin Tư liệu, Viện Khoa học và Công nghệ Việt Nam Xây dựng bảng phân quyền truy cập; - Xây dựng các thủ tục thực hiện truy cập hạn chế theo bảng phân quyền đã xác định;
- Mã hóa thông tin và biểu
diễn thông tin theo các cấu trúc đã được mã hóa; - Nhận dạng người dùng để cung cấp đúng những gì mà họ được phép sử dụng Khái niệm vé “Bảng phân quyên truy cập” Bảng phân quyền truy cập cũng là dữ liệu của CSDL; nó được tỗ chức và xây dựng như những dữ liệu khác Đặc điểm
duy nhất là nó được quản lí chặt
chẽ, không giới thiệu công khai
và chỉ có những người quản trị
hệ thống mới có quyền truy cập, bổ sung, sửa đổi Mỗi bản ghi của Bảng phân quyền truy cập xác định quyền của một nhóm người sử dụng từng loại dữ liệu của CSDL Các quyền đó thường là: ai Quyền được đọc; b/ Quyền được sửa, c/ Quyền được bổ sung, d/ Quyền được xóa;
e/ Không được truy cập Muốn triển khai được điều này thì Hệ thống phải nhận biết được đúng người dùng Có nghĩa là Hệ thống phải khẳng định được người truy cập có thực sự đúng là: người mà họ thông báo cho hệ thống này hay không Đảm bảo được điều đó
là rất khó khăn Một trong các
giải pháp thường được sử dụng
« là mật khẩu - mỗi người dùng được cấp phát một mật khẩu
Đối với nhóm người có quyền truy cập cao thì cơ chế nhận dạng có thể phức tạp hơn
Bảo vệ các thông tin quan
trọng và nhậy cảm bằng cách nào? Các thông tin quan trọng thường được lưu trữ dưới dạng mã hóa để giảm nguy cơ rò rỉ Các bản sao dữ liệu thường được mã hóa và nén bằng các môđun chương trình riêng
Biên bản hệ thống dùng để làm gì ?
Ngoài các giải pháp bảo vệ dữ liệu nêu trên, người ta còn phải tổ chức lưu Biên bản hệ thống Biên bản hệ thống cho chúng ta biết: 1/ Số lần truy cập vào hệ thống, vào từng thành phần của hệ thống, vào từng yêu cầu tra cứu, ; 2/ Thông tin về K lần cập nhật cuối cùng: phép cập nhật, người thực hiện, thời điểm cập nhật, Biên bản hệ thống hỗ trợ đáng kể cho việc khôi phục hệ thống khi có sự cố kỹ thuật, đồng thời cung cấp thông tin cho phép đánh giá mức độ quan tâm (tần suất sử dụng) của người dùng đối với hệ
thống nói chung và với từng
thành phần của hệ thống nói riêng Dựa trên Biên bản hệ
Trang 2Nghiên cứu - Trao đổi
thống này người ta có thé phat hiện ra những truy cập không bình thường (wí dụ ai đó quá thường xuyên quan tâm đến
một số loại dữ liệu nào đó vào một số thời điểm nhất định), từ đó chúng ta sẽ thiết lập những biện pháp phòng ngừa thích hợp I Các biện pháp bảo quản tài liệu số:
Dựa trên định nghĩa của Từ điển Bách khoa Toàn thư mở (Wkipedia, the free encyclopedia), chúng ta cũng sẽ xem xét 5 biện pháp bảo quản tài liệu điện tử
1 Lam mới dữ lệu: Refreshing
Làm mới dữ liệu là quy trình copy lại dữ liệu sang hệ thống hoặc phương tiện mang tin mới hơn Xét sơ bộ quá trình tiến
hóa của các hệ điều hành mà
chúng ta đã và đang sử dụng trong lưu trữ điện tử: Hay chính
xác hơn là chúng ta dùng máy
tính có Hệ điều hành phát triển
theo hướng sau: CP/M > DOS
> WINDOWS hoac tir UNIX >
Windows, hoặc từ PCs > MACs
Ví dụ: chúng ta chuyển đổi
dữ liệu lưu trữ về điều tra dân
số từ một cuộn băng từ cũ sang một băng từ mới, hoặc chuyển
khối hình ảnh MP3 từ một đĩa cứng sang một đĩa CD mới Chúng ta có thể kết hợp chiến lược này với việc di chuyển dữ liệu (migraton) khi mà phần mềm hoặc phần cứng cần thiết cho việc đọc dữ liệu, không còn được sử dụng hoặc chúng không có khả năng hiểu fomat của dữ liệu 2 Di chuyén dữ liệu: Migration (hay con goi la di dot dữ liệu)
Di chuyển dữ liệu là quá trình chuyển dời dữ liệu sang các môi trường có hệ điều hành
mới hơn (theo định nghĩa của
Garret et al., 1996) Quy trình này phải bao gồm 1/ việc
chuyển đổi các nguồn tài
nguyên thông tin từ một loại fomat cũ sang một loại format
mới (ví dụ: ta chuyển đổi từ
Microsoft Word sang PDF hoặc sang OpenDocument); 2/ hoac chuyển đổi từ một loại hệ điều hành này sang hệ điều hành khac (vi du: tle Solaris sang
Linux - hệ điều hành mở}; 3/
hoặc từ một loại ngôn ngữ lập trình này sang một loại ngôn ngữ lập trình khác (ví dụ: từ ngôn ngữ C ta chuyển sang ngôn ngữ Java), sao cho nguồn tài nguyên thông tin ban đầu vẫn giữ nguyên được tính truy cập và đặc tính của nó Các nguồn tài nguyên chuyển dịch hoạt động có nguy cơ bị mất một vài chức năng, bởi vì các fomat mới hơn có thể không có
khả năng thâu tóm được tất cả
các chức năng của fomat gốc
(he original fomat), hoặc là
chính bản thân bộ chuyển đổi
không có khả năng phiên dịch
các “sac thai tinh vi’ cita format gốc Và việc bộ chuyển đổi không có khả năng phiên dịch hết ngữ nghĩa này thường liên quan đến các format dữ liệu có
tính độc quyền sở hữu
3 Da phục chễ dữ liệu - thiết
lập nhiều bản sao (Replicafion) ở các vị trí khác nhau:
Quy trình làm nhiều bản sao
dữ liệu trên một hoặc nhiều hệ
điều hành được gọi là Replication (tạm gọi là đa phục ché) Dữ liệu tồn tại ở dạng chỉ có 1 bản và chỉ ở một địa điểm, sẽ có nguy cơ bị tổn thương Số 5/2007 cao Nguyên nhân làm hỏng dữ liệu có thé do: hỏng phần cúng máy tính hoặc phần mém máy tính, những biên đổi do hỏng hóc ngẫu nhiên hoặc cố tình,
hoặc hỏng do thảm họa môi
trường (hỏa hoạn, lũ lụt) vxv Dữ liệu sỐ sẽ "gống dai” hơn nếu nó được sao ra - cùng một
lúc nó đồng thời tồn tại ở nhiều
địa chỉ khác nhau Dữ liệu đa nhân bản có thể sẽ gây ra một số khó khăn cho các quy trình như làm mới dữ liệu
(refreshing), chuyển dời dữ liệu
(migration), tao phién ban mdi (versioning) va kiểm tra truy cập,
bởi vì dữ liệu được đặt ở nhiều
chỗ khác nhau
4 Mô phỏng (bắt chuóc): Mô phỏng (bắt chước) là
quy trình đa nhân bản chức
năng của một hệ điều hành đã lạc hậu (dinh nghĩa của Rothenberg, 1998) Ví dụ chúng ta mô phỏng Atari 2600 trên một
hệ điều hành Windows hoặc mô phỏng WordPerfect 1/0 trên Macintosh Bộ mô phỏng (Emulator) là gì? Đó là phần cứng hoặc phân mềm phỏng theo hoặc sao chép đặc tính của một thành phần khác, thiết kế bên trong có thể khác nhưng đầu vào và đầu ra giống với phần tử nó mô phỏng
Đối với lưu trữ điện tử thì bộ
mô phỏng có thể được xây dựng cho các ứng dụng, các hệ điều hành, hoặc các hệ thống phần cứng cơ bản (Platfom- hay còn gọi là “mặt bằng”) Mô phỏng đã và đang là một chiến lược phổ biến đã duy trì đặc tính của các hệ game video cũ Tính
khả thi của mô phỏng như là
một phương pháp lượm (vo) tật (a catch-all solution) hién dang
Trang 3Nghiên cứu - Trao đổi Số 5/2007
nhà tin học và các nhà lưu trữ học LƯU TRỮ TÀI LIÊU
Raymond A Lore đã đề xướng một kiểu (Tiếp theo trang 7)
may tinh ao da nang (a Universal Virtual
Computer — UVC): No 6 thể được sử dụng để
chạy bắt kì phần mềm nào trong tương lai trên
một Platform còn chưa được biết tới Chiến lược
UVC sử dụng kết hợp cả hai phương pháp: mô
phỏng và di dời dữ liệu Tuy nhiên, hiện tại thì
chiến lược UVC côn chưa được cộng đồng các nhà bảo quản dữ liệu số chấp nhận một cách
rộng rãi
5, Chiến lược dùng các thục thê số dang tin
cay (Trustworthy digital objects - TDOs):
Định nghĩa: Các thực thê số đáng tin cậy là các thực thể số có thể tự nói (tự mô tả) về tinh xác thực của chính bản thân chúng Khái niệm TDOs được đề xướng bởi Henry M Gladney, nhằm cung cấp những đối tượng số có khả năng duy trì “hồ sơ lý lịch” về lịch sử thay đổi của chính chúng, sao cho những người sử dụng trong tương lai có thể biết một cách chắc chắn rằng: những nội dung của thực thẻ số này là xác thực
Những chiến lược bảo quản dữ liệu số khác
như: đa phục chế và di dời dữ liệu, đều rất cần thiết để bảo quản lâu dài các thực thể số đáng tin
cậy (TDOs)
Xét một ví dụ cụ thể: xét dịch vụ lưu trữ điện tử có tên gọi là Portico (địa chỉ trên mạng như sau http: www.portico Org) Portico ban dau được thiết lập bởi JSTOR vào năm 2002 Nó cung cấp lưu trữ điện tử về hàng loạt các tạp chí
điện tử phục vụ giảng dạy và học tập
II Kết luận:
Công tác bảo mật thông tin trong các hệ cơ sở dữ liệu phụ thuộc vào nhiều tham số bảo vệ Để nâng cao hiệu quả, các tham số của hệ thống bảo vệ phải thường xuyên được thay đổi Cần lưu ý rằng không thể có các biện pháp đảm bảo an toàn tuyệt đối nếu chỉ dựa đơn thuần vào phần mềm
Cớ nhiều biện pháp dé bảo quản tài liệu điện tử, 5 biện pháp nêu trên là những biện pháp cơ
bản nhất Hy vọng rằng với tốc độ phát triển
không ngừng của công nghệ thông tin, chúng ta Sẽ còn có nhiều phương pháp bảo quản nguồn
dữ liệu số tốt hơn Tùy hoàn cảnh tài chính và
quy mô của từng ,phông lưu trữ điện tử mà ta chọn một hoặc kết hợp một số phương pháp
nêu trên với nhau./
10
và hướng phat triển đó, có thể suy nghĩ đến những vấn đề trước mắt sau đây:
Một là, việc đào tạo cán bộ lưu trữ cần phải
trở thành một nhu cầu cấp bách của các địa
phương hiện nay Dựa vào hệ thống lưu trữ quốc gia đóng trên địa bàn, các địa phương nên xây dựng đội ngũ cán bộ chuyên trách hoặc bán
chuyên trách về văn thư, lưu trữ; các tổ chức
chính trị, đoàn thể, tôn giáo ở địa phương cũng nên có bộ phận lưu trữ văn bản với cán bộ bán chuyên trách nhưng phải có trình độ nghiệp vụ lưu trữ
Hai là, cần đa dạng hóa các hình thức lưu trữ văn bản đề tạo nên sự phong phú về nguồn thông tin Cần kết hợp nhiều phương pháp lưu trữ văn bản, nhất là kết hợp phương pháp lưu trữ truyền thống — lưu trữ tài liệu giấy, với các phương pháp và công cụ hiện đại như sử dụng phim, files kỹ thuật số dé lưu trữ văn bản
Ba là, cần thường xuyên hệ thống nội dụng các văn bản ở cơ sở theo từng chủ đề ấn hành
các "bộ sưu tập" Toàn bộ công việc này của công
tác lưu trữ văn bản chỉ có thể thực hiện được khi các địa phương có đội ngũ cán bộ, nhân viên làm công tác lưu trữ chuyên trách, được đào tạo nghiệp vụ lưu trữ và được trang bị những phương tiện tối thiểu để lưu giữ, bảo quản văn bản
Bốn là, cần có sự đầu tư thích đáng hơn nữa
của Nhà nước và cơ quan quản lý lưu trữ cho các
địa phương, trước hết là ở cơ sở, dé tổ chức các phông lưu trữ cơ sở ở các địa phương thật quy mô và thống nhất Sự đầu tư thích đáng này bắt đầu từ việc ban hành những chủ trương chính sách về lưu trữ ở cơ sở, cấp kinh phí (ngân sách) hàng năm cho lưu trữ ở cơ sở và phân cấp phụ trách lưu trữ các địa phương
Nhu cầu nghiên cứu của các địa phương trong quá trình phát triển và hội nhập là rất lớn Phương pháp nghiên cứu nào cũng cần phải bắt đầu từ nguồn tài liệu lưu trữ, nhất là lưu trữ ở cơ sở Thiết nghĩ, sự quan tâm đến vị trí vai trò và thực trạng
của công tác lựu trữ ở cơ sở có ý nghĩa không