Электронные документы и архивы по данным международных конференций и публикаций 1998–1999 гг.
Trang 1Khai thác s d ng tài li u l u tr đi n t ử ụ ệ ư ữ ệ ử
TS Nguy n L Nhung ễ ệ
Có th th y r ng, công tác khai thác, s d ng tài li u là công tác t ch c toàn bể ấ ằ ử ụ ệ ổ ứ ộ
nh ng công vi c liên quan đ n vi c đáp ng m t cách k p th i, đ y đ , chínhữ ệ ế ệ ứ ộ ị ờ ầ ủ xác các nhu c u v s d ng tài li u l u tr c a các c quan, cá nhân.ầ ề ử ụ ệ ư ữ ủ ơ
Công tác khai thác là ph n vi c cu i cùng c a công tác l u tr , ph n ánh k tầ ệ ố ủ ư ữ ả ế
qu c a các khâu nghi p v l u tr nh : thu th p, ch nh lý, đánh giá, b o qu n,ả ủ ệ ụ ư ữ ư ậ ỉ ả ả
th ng kê, xây d ng c s d li u, ố ự ơ ở ữ ệ
M c đích c a công tác khai thác, s d ng tài li u là cung c p tài li u ph c vụ ủ ử ụ ệ ấ ệ ụ ụ công tác lãnh đ o, ch đ o c a c quan qu n lý nhà nạ ỉ ạ ủ ơ ả ước có th m quy n đẩ ề ể nghiên c u, tham kh o đ ra các quy t đ nh qu n lý, vi t báo cáo, xây d ng kứ ả ề ế ị ả ế ự ế
ho ch công tác, ; cung c p tài li u cho vi c nghiên c u t ng h p, rút kinhạ ấ ệ ệ ứ ổ ợ nghi m công tác; cung c p ngu n t li u chính xác đ nghiên c u l ch s , l chệ ấ ồ ư ệ ể ứ ị ử ị
s cách m ng, l ch s ho t đ ng c a các c p, các ngành.ử ạ ị ử ạ ộ ủ ấ
V i s phát tri n c a khoa h c công ngh , đ c bi t là công ngh thông tin vàớ ự ể ủ ọ ệ ặ ệ ệ nhu c u ng d ng công ngh thông tin trong th c ti n đã s n sinh ra m t lo iầ ứ ụ ệ ự ễ ả ộ ạ hình tài li u m i Đó là tài li u đi n t N i dung thông tin mà tài li u đi n tệ ớ ệ ệ ử ộ ệ ệ ử
ph n ánh r t đa d ng và phong phú nh chính ho t đ ng đa d ng và phong phúả ấ ạ ư ạ ộ ạ
c a các c quan, t ch c nhà nủ ơ ổ ứ ước Cũng gi ng nh tài li u ghi trên ch t li uố ư ệ ấ ệ
gi y, tài li u đi n t ch a đ ng thông tin r t đa d ng nh thông tin v ho tấ ệ ệ ử ứ ự ấ ạ ư ề ạ
đ ng qu n lý Nhà nộ ả ước, thông tin v ho t đ ng nghiên c u, thông tin v ho tề ạ ộ ứ ề ạ
đ ng s n xu t, ho t đ ng kinh doanh Tuy nhiên, khác v i tài li u truy n th ngộ ả ấ ạ ộ ớ ệ ề ố
là thông tin được ghi trên gi y và đ c đấ ọ ược b ng m t thằ ắ ường thì đ i v i tài li uố ớ ệ
đi n t , thông tin đệ ử ược ghi trên c ng, đĩa m m, băng t , đĩa CD, thi t b l uổ ứ ề ừ ế ị ư
tr và ch có th khai thác, s d ng đữ ỉ ể ử ụ ược thông qua máy tính có ch a ph nứ ầ
m m tề ương thích
Cùng v i s phát tri n c a công ngh thông tin, nhu c u ti p c n, khai thác, sớ ự ể ủ ệ ầ ế ậ ử
d ng tài li u đi n t ngày càng tăng Đ có th đ a ra đụ ệ ệ ử ể ể ư ược nh ng ý ki n banữ ế
đ u v các nguyên t c khai thác, s d ng tài li u đi n t , bài vi t c a chúng tôiầ ề ắ ử ụ ệ ệ ử ế ủ xin cung c p m t s thông tin v kh năng và phấ ộ ố ề ả ương pháp chung đ b o đ mể ả ả cho vi c ti p c n khai thác nh ng tài li u đi n t cũng nh nh ng nguyên t cệ ế ậ ữ ệ ệ ử ư ữ ắ
ti p c n khai thác d ng tài li u đ c thù này.ế ậ ạ ệ ặ
Th c hi n quá trình khai thác, s d ng tài li u l u tr đi n t bao g m c haiự ệ ử ụ ệ ư ữ ệ ử ồ ả phía cung và c u Tài li u l u tr t o nên ph n ầ ệ ư ữ ạ ầ cung còn các yêu c u ti p c nầ ế ậ khai thác tài li u là ph n ệ ầ c u ầ Công ngh máy tính chính là phệ ương ti n đ cungệ ể
c p tài li u cho nh ng ngấ ệ ữ ười có yêu c u khai thác s d ng tài li u ầ ử ụ ệ
Phía cung c a ch c năng ti p c n khai thác tài li u có tính ch t xác đ nh và củ ứ ế ậ ệ ấ ị ố
đ nh Tài li u l u tr ph i đị ệ ư ữ ả ược gi l i nguyên tr ng nh nó đữ ạ ạ ư ượ ảc s n sinh ra trong quá trình ho t đ ng c a c quan, t ch c hay cá nhân và giá tr c a chúngạ ộ ủ ơ ổ ứ ị ủ
được c quan l u tr l a ch n, đánh giá Vi c cung c p b gi i h n b i nh ngơ ư ữ ự ọ ệ ấ ị ớ ạ ở ữ nhu c u ho t đ ng c a c quan, t ch c hay cá nhân s n sinh tài li u, đ ng th iầ ạ ộ ủ ơ ổ ứ ả ệ ồ ờ
mô hình t ch c, các quy trình và các ho t đ ng c a c quan đ th c hi n ch cổ ứ ạ ộ ủ ơ ể ự ệ ứ
Trang 2năng và nhi m v c a mình cũng có nh hệ ụ ủ ả ưởng không nh đ n vi c cung c pỏ ế ệ ấ tài li u cho nhu c u khai thác, s d ng.ệ ầ ử ụ
Nhu c u ti p c n khai thác tài li u l u tr đi n t r t đa d ng, phong phú Vàoầ ế ậ ệ ư ữ ệ ử ấ ạ
b t kỳ th i đi m xác đ nh nào cũng có th có nhi u lo i yêu c u và tính ch tấ ờ ể ị ể ề ạ ầ ấ
c a các yêu c u cũng có th thay đ i theo th i gian Nh ng yêu c u ti p c nủ ầ ể ổ ờ ữ ầ ế ậ khai thác tài li u ph c v cho vi c nghiên c u, biên so n l ch s c a c quan, tệ ụ ụ ệ ứ ạ ị ử ủ ơ ổ
ch c s n y sinh t quá trình hình thành tài li u; tuy nhiên, cũng ph i nói r ngứ ẽ ả ừ ệ ả ằ
v th c ch t, đa s các yêu c u đ c l p v i m c đích ban hành và b o qu n tàiề ự ấ ố ầ ộ ậ ớ ụ ả ả
li u đi n t M c tiêu c th c a nh ng yêu c u ti p c n khai thác tài li u đi nệ ệ ử ụ ụ ể ủ ữ ầ ế ậ ệ ệ
t s nh m khai thác, s d ng nh ng thông tin ch a đ ng trong tài li u Tínhử ẽ ằ ử ụ ữ ứ ự ệ
ch t ch ng c c a tài li u v n là y u t quy t đ nh trong nh ng trấ ứ ứ ủ ệ ẫ ế ố ế ị ữ ường h pợ
nh v y, b i l vi c hi u chính xác nh ng thông tin ch a đ ng trong tài li u cóư ậ ở ẽ ệ ể ữ ứ ự ệ
th là đi u không th th c hi n để ề ể ự ệ ược n u nh không hi u đế ư ể ược tính ch t c aấ ủ các thông tin tài li u nh nh ng tài li u đích th c.ệ ư ữ ệ ự
Công ngh thông tin - phệ ương ti n đ ti p c n khai thác tài li u s thay đ i theoệ ể ế ậ ệ ẽ ổ
th i gian và nh ng thay đ i c a công ngh thông tin s tác đ ng t i kh năng cóờ ữ ổ ủ ệ ẽ ộ ớ ả
th ti p c n khai thác để ế ậ ược c a tài li u cũng nh nhu c u khai thác Tài li uủ ệ ư ầ ệ
đi n t s tr nên không th ti p c n khai thác đệ ử ẽ ở ể ế ậ ược n u nh chúng l thu cế ư ệ ộ vào công ngh l i th i H n n a, khi công ngh thông tin cung c p nh ngệ ỗ ờ ơ ữ ệ ấ ữ
phương ti n ti p c n khai thác nhanh và linh ho t thì ngệ ế ậ ạ ười nghiên c u s mu nứ ẽ ố
s d ng các công c đó đ khai thác s d ng tài li u l u tr Có th tin r ng sử ụ ụ ể ử ụ ệ ư ữ ể ằ ố
lượng các nhà nghiên c u s tăng khi công ngh làm cho kh năng ti p c n khaiứ ẽ ệ ả ế ậ thác tài li u t xa ngày càng tr nên ph bi n và hi u qu v m t chi phí Cu iệ ừ ở ổ ế ệ ả ề ặ ố cùng, có th hy v ng r ng yêu c u ngày càng cao c a các nhà nghiên c u mu nể ọ ằ ầ ủ ứ ố
t n d ng c h i mà công ngh thông tin đem l i trong vi c ti p c n khai thác tàiậ ụ ơ ộ ệ ạ ệ ế ậ
li u s làm cho l u tr có vai trò trung gian cho vi c ti p c n khai thác tài li u.ệ ẽ ư ữ ệ ế ậ ệ
Nh v y, ch c năng b o đ m cho vi c ti p c n khai thác tài li u l u tr đi nư ậ ứ ả ả ệ ế ậ ệ ư ữ ệ
t có th đử ể ược nhìn nh n nh là m t ch c năng cung ng nh ng đ i tậ ư ộ ứ ứ ữ ố ượng cố
đ nh cho m t th trị ộ ị ường luôn thay đ i và h t s c đa d ng Đ có th đáp ngổ ế ứ ạ ể ể ứ nhu c u khai thác tài li u m t cách h u hi u, ch c năng ti p c n khai thác sầ ệ ộ ữ ệ ứ ế ậ ẽ
ph i thích ng v i nh ng thay đ i v nhu c u và t n d ng đả ứ ớ ữ ổ ề ầ ậ ụ ược nh ng uữ ư
đi m và l i th c a ti n b c a khoa h c công ngh Đ ng th i, ch c năng nàyể ợ ế ủ ế ộ ủ ọ ệ ồ ờ ứ còn ph i có kh năng b o đ m tính xác th c c a nh ng s n ph m mà nó cungả ả ả ả ự ủ ữ ả ẩ
c p Đ gi i quy t tình tr ng trên, đòi h i ph i có s ki m soát tri th c thíchấ ể ả ế ạ ỏ ả ự ể ứ
h p đ i v i tài li u, các phợ ố ớ ệ ương pháp b o đ m ti p c n khai thác và s thíchả ả ế ậ ự
ng k p th i tr c nh ng thay đ i v nhu c u và v công ngh Chúng tôi s
bàn đ n v n đ này ph n ti p theo.ế ấ ề ở ầ ế
Ti n đ cho vi c ti p c n khai thác tài li u l u tr đi n t là ph i b o đ m tàiề ề ệ ế ậ ệ ư ữ ệ ử ả ả ả
li u luôn trong tình tr ng s n sàng có th ti p c n và hi u đệ ở ạ ẵ ể ế ậ ể ược Ngoài ra, các
phương pháp được áp d ng, xét v khía c nh n i dung, c u trúc và b i c nhụ ề ạ ộ ấ ố ả
c a tài li u ph i b o đ m r ng chúng đủ ệ ả ả ả ằ ược cung c p d ng xác th c.ấ ở ạ ự
1 Ki m soát v tri th c ể ề ứ
S ki m soát tri th c b o đ m kh năng ti p c n khai thác tài li u thông quaự ể ứ ả ả ả ế ậ ệ
vi c xác đ nh và mô t tài li u B ng cách đó, s ki m soát tri th c xác đ nh rõệ ị ả ệ ằ ự ể ứ ị
Trang 3các yêu c u đ i v i vi c ti p c n khai thác nh ng tài li u xác th c (Thông tinầ ố ớ ệ ế ậ ữ ệ ự này còn được s d ng nh m t công c ki m soát nh ng quy t đ nh v vi cử ụ ư ộ ụ ể ữ ế ị ề ệ
l u gi /chuy n đ i tài li u đi n t qua các th h công ngh ) ư ữ ể ổ ệ ệ ử ế ệ ệ
Vi c mô t tài li u đi n t , cũng nh tài li u nói chung, c n ph i bao g m cệ ả ệ ệ ử ư ệ ầ ả ồ ả thông tin b i c nh và metadata Thông tin b i c nh, trong đó tài li u đố ả ố ả ệ ượ ạ c t o
l p và bao g m m c đích c a vi c t o l p tài li u, tác gi tài li u, các ch cậ ồ ụ ủ ệ ạ ậ ệ ả ệ ứ năng và ho t đ ng mà qua quá trình đó tài li u đạ ộ ệ ược hình thành; nh ng hoànữ
c nh/đi u ki n l ch s có nh hả ề ệ ị ử ả ưởng đ n vi c t o l p hay duy trì tài li u.ế ệ ạ ậ ệ Metadata là nh ng d li u k thu t v tài li u đi n t , ch ng h n nh d li uữ ữ ệ ỹ ậ ề ệ ệ ử ẳ ạ ư ữ ệ
mô t v t ch c và c u trúc bên trong c a tài li u và các quy t c đi u ch nhả ề ổ ứ ấ ủ ệ ắ ề ỉ
vi c b sung, xoá b hay thay đ i tài li u ho c là vi c di n gi i n i dung c aệ ổ ỏ ổ ệ ặ ệ ễ ả ộ ủ tài li u.ệ
Vi c nh n di n hay xác đ nh tài li u b t đ u b ng vi c xác đ nh các phệ ậ ệ ị ệ ắ ầ ằ ệ ị ươ ng
ti n v t lý mà trên đó tài li u đệ ậ ệ ượ ưc l u tr và các t p c th đữ ệ ụ ể ược ghi trên m iỗ
đ n v c a v t mang tin Đ i v i tài li u đi n t , vi c nh n di n còn đòi h iơ ị ủ ậ ố ớ ệ ệ ử ệ ậ ệ ỏ
ph i ch ra đả ỉ ược các m i quan h gi a tài li u và các t p v t lý (th c th ) đố ệ ữ ệ ệ ậ ự ể ượ c ghi trên v t mang tin Đó có th là m t m i quan h đ n gi n, 1-1 (ch ng h nậ ể ộ ố ệ ơ ả ẳ ạ
nh m t lá th có th đư ộ ư ể ượ ưc l u dướ ại d ng m t t p x lý văn b n riêng bi t).ộ ệ ử ả ệ
Nh ng các m i quan h đó cũng r t ph c t p (ví d , m t b n báo cáo có th làư ố ệ ấ ứ ạ ụ ộ ả ể
m t văn b n ph c h p độ ả ứ ợ ượ ưc l u trong nhi u t p th c th khác nhau) M c đề ệ ự ể ứ ộ xác đ nh đó là c n thi t, nh ng nh v y là ch a đ và ch a phù h p v i cácị ầ ế ư ư ậ ư ủ ư ợ ớ
m c tiêu ki m soát tri th c Đ h tr cho ngụ ể ứ ể ỗ ợ ườ ử ụi s d ng xác đ nh đị ược nh ngữ tài li u nào hi n có, tài li u có đáp ng đệ ệ ệ ứ ược yêu c u c a h hay không thì đòiầ ủ ọ
h i ph i có s ki m soát tri th c và mô t n i dung, b i c nh và c u trúc c a tàiỏ ả ự ể ứ ả ộ ố ả ấ ủ
li u.ệ
Vi c mô t tài li u đi n t đòi h i ph i xác đ nh m t cách đ y đ và chính xácệ ả ệ ệ ử ỏ ả ị ộ ầ ủ
c u trúc bên trong c a m t tài li u và m i quan h gi a các tài li u Trongấ ủ ộ ệ ố ệ ữ ệ
trường h p m t văn b n d ng ASCII đ n gi n thì vi c mô t c u trúc bênợ ộ ả ở ạ ơ ả ệ ả ấ trong ch c n mô t th lo i văn b n (nh th tín, k ho ch, báo cáo ) Trongỉ ầ ả ể ạ ả ư ư ế ạ
nh ng trữ ường h p ph c t p h n thì vi c mô t c u trúc bên trong có th baoợ ứ ạ ơ ệ ả ấ ể
g m các thông tin k thu t v c u trúc đó đồ ỹ ậ ề ấ ược th hi n trong các t p th c thể ệ ệ ự ể
nh th nào và ho t đ ng x lý c n có đ th c hi n c u trúc đó khi tài li uư ế ạ ộ ử ầ ể ự ệ ấ ệ
được ti p c n khai thác (ch ng h n nh đ i v i m t văn b n mà c u trúc bênế ậ ẳ ạ ư ố ớ ộ ả ấ trong c a nó theo các mã SGML (Standard Generalired Mark up Language) thìủ
đi u c n thi t là ph i có đ nh nghĩa v các mã đề ầ ế ả ị ề ượ ử ục s d ng trong th c t vàự ế
nh ng thông tin ch d n đ có th ti p c n khai thác văn b n thì ph i có ph nữ ỉ ẫ ể ể ế ậ ả ả ầ
m m có th d ch các mã đó sao cho văn b n hi n th nh nó v n có) Còn trongề ể ị ả ể ị ư ố
nh ng trữ ường h p ph c t p h n n a thì c u trúc bên trong không đợ ứ ạ ơ ữ ấ ược th hi nể ệ trong các t p có ch a n i dung c a tài li u Thay vào đó, c u trúc s đệ ứ ộ ủ ệ ấ ẽ ược đ aư
ra vào th i đi m ti p c n khai thác (ch ng h n nh m t t p CSDL có th ch aờ ể ế ậ ẳ ạ ư ộ ệ ể ứ
đ ng m t chu i liên ti p các d li u nh ng không h có các mã đ ch d n n iự ộ ỗ ế ữ ệ ư ề ể ỉ ẫ ơ nào m t tài li u d li u hay m t ph n t d li u b t đ u và m t tài li u/ph nộ ệ ữ ệ ộ ầ ử ữ ệ ắ ầ ộ ệ ầ
t d li u khác k t thúc C u trúc lô gíc c a t p d li u đó s đử ữ ệ ế ấ ủ ệ ữ ệ ẽ ược mô t trongả
m t t p khác và t p này s xác đ nh s đ s p x p tài li u lô gíc) Trong nh ngộ ệ ệ ẽ ị ơ ồ ắ ế ệ ữ
trường h p nh v y, vi c mô t c n ph i xác đ nh đợ ư ậ ệ ả ầ ả ị ược lo i d li u c u trúcạ ữ ệ ấ
Trang 4nào c n ph i có, có th tìm th y chúng đâu và c n ph i x lý nh th nào đầ ả ể ấ ở ầ ả ử ư ế ể
áp d ng c u trúc khi mà tài li u đụ ấ ệ ược ti p c n khai thác.ế ậ
M t s thông tin c n thi t đ xác đ nh và mô t tài li u đi n t s độ ố ầ ế ể ị ả ệ ệ ử ẽ ược tìm
th y trong các tài li u c a c quan s n sinh ra tài li u Các thông tin mô t khácấ ệ ủ ơ ả ệ ả
s ph i đẽ ả ượ ạ ậc t o l p theo đúng các tiêu chu n l u tr , nh t là trong trẩ ư ữ ấ ường h pợ
mà các h th ng hay các nhóm tài li u liên quan vệ ố ệ ượt ra ngoài các ranh gi i c aớ ủ
c quan, t ch c.ơ ổ ứ
M i m t l u tr có nh ng đòi h i riêng v vi c ki m soát tri th c đ i v i tàiỗ ộ ư ữ ữ ỏ ề ệ ể ứ ố ớ
li u Tuy nhiên, trong t t c các trệ ấ ả ường h p, s ki m soát tri th c là v n đợ ự ể ứ ấ ề thi t y u đ i v i tài li u đi n t Ki m soát tri th c đ i v i tài li u đi n t cònế ế ố ớ ệ ệ ử ể ứ ố ớ ệ ệ ử đòi h i vi c xác đ nh b t kỳ m t gi i h n pháp lý nào liên quan đ n tài li u.ỏ ệ ị ấ ộ ớ ạ ế ệ
2 Kh năng thích ng tr ả ứ ướ c nh ng thay đ i ữ ổ
Cũng gi ng nh công ngh đố ư ệ ược dùng đ t o l p và l u tr tài li u, b t kỳ hể ạ ậ ư ữ ệ ấ ệ
th ng nào đố ược xây d ng đ cung c p vi c ti p c n khai thác tài li u l u tr sự ể ấ ệ ế ậ ệ ư ữ ẽ
tr nên l c h u T c đ l c h u nhanh chóng c a h th ng ti p c n khai thácở ạ ậ ố ộ ạ ậ ủ ệ ố ế ậ
ch c ch n s ph thu c vào áp l c c a nh ng kỳ v ng ngày càng cao c a ngắ ắ ẽ ụ ộ ự ủ ữ ọ ủ ườ i
s d ng Cùng v i s phát tri n c a công ngh , ngử ụ ớ ự ể ủ ệ ườ ử ụi s d ng luôn mu n nh nố ậ
được nhi u ti n ích t nh ng kh năng ngày càng đề ệ ừ ữ ả ược c i ti n và nâng caoả ế trong vi c ti p c n khai thác tài li u đi n t Đ có th đáp ng đệ ế ậ ệ ệ ử ể ể ứ ược nh ng đòiữ
h i c a ngỏ ủ ườ ử ụi s d ng thì h th ng ti p c n khai thác tài li u s ph i đệ ố ế ậ ệ ẽ ả ượ c nghiên c u xây d ng v i nh ng tính toán h t s c linh ho t Vi c thi t k m tứ ự ớ ữ ế ứ ạ ệ ế ế ộ
h th ng ti p c n khai thác có kh năng thích nghi còn t o đi u ki n cho l u trệ ố ế ậ ả ạ ề ệ ư ữ đáp ng k p th i nh ng yêu c u luôn thay đ i c a ngứ ị ờ ữ ầ ổ ủ ười nghiên c u Đ thíchứ ể
ng v i các đòi h i luôn thay đ i theo th i gian c a ng i s d ng thì vi c s
d ng các công c chung nh các ph n m m tra tìm toàn văn đ i v i các tài li uụ ụ ư ầ ề ố ớ ệ văn b n và ph n m m tra tìm d li u m nh đ i v i các c s d li u thay vìả ầ ề ữ ệ ạ ố ớ ơ ở ữ ệ các chương trình tra tìm ch hỉ ướng t i các seri tài li u riêng l s làm cho vi cớ ệ ẻ ẽ ệ
đi u ch nh h th ng ti p c n khai thác tr nên d dàng h n.ề ỉ ệ ố ế ậ ở ễ ơ
3 Nh ng công vi c liên quan đ n ti p c n khai thác xuyên su t vòng đ i ữ ệ ế ế ậ ố ờ tài li u ệ
3.1 Giai đo n chu n b ạ ẩ ị
Vi c ti p c n khai thác tài li u đi n t , cũng nh các ho t đ ng khác trong ch cệ ế ậ ệ ệ ử ư ạ ộ ứ năng l u tr , c n đư ữ ầ ược xem xét gi i quy t càng s m càng t t trong vòng đ i tàiả ế ớ ố ờ
li u Lý tệ ưởng nh t là nên b t đ u ngay t giai đo n chu n b Các phấ ắ ầ ừ ạ ẩ ị ươ ng pháp xác đ nh hay nh n di n và ti p c n tài li u l u tr c n ph i đị ậ ệ ế ậ ệ ư ữ ầ ả ược xác đ nhị
rõ càng s m càng t t và đ a vào thi t k h th ng Vi c thi t k c n ph i xácớ ố ư ế ế ệ ố ệ ế ế ầ ả
đ nh rõ t t c các lo i tài li u l u tr , k c metadata và các thông tin k thu tị ấ ả ạ ệ ư ữ ể ả ỹ ậ
c n thi t khác đ tra tìm và di n gi i tài li u cũng nh nh ng tài li u ghi l iầ ế ể ễ ả ệ ư ữ ệ ạ
ho t đ ng tác nghi p công vi c H th ng có th đạ ộ ệ ệ ệ ố ể ược thi t k đ tiêu chu nế ế ể ẩ hoá và t đ ng hoá vi c t o ra metadata và nh ng thông tin b i c nh.ự ộ ệ ạ ữ ố ả
Nh ng h n ch khi ti p c n khai thác tài li u cũng c n đữ ạ ế ế ậ ệ ầ ược ch rõ và vi c thi tỉ ệ ế
k h th ng c n có các bi n pháp thi t th c và hi u qu kh c ph c nh ng h nế ệ ố ầ ệ ế ự ệ ả ắ ụ ữ ạ
ch nh v y Vi c l p k ho ch cho toàn b vòng đ i c a h th ng cũng c nế ư ậ ệ ậ ế ạ ộ ờ ủ ệ ố ầ
Trang 5ph i tính đ n vi c xoá b các h n ch khi chúng không còn c n thi t n a Khiả ế ệ ỏ ạ ế ầ ế ữ
mà tài li u l u tr đệ ư ữ ược đánh giá giai đo n chu n b thì h th ng có th đở ạ ẩ ị ệ ố ể ượ c thi t k sao cho các yêu c u v ti p c n khai thác lâu dài ch đế ế ầ ề ế ậ ỉ ược áp d ng đ iụ ố
v i nh ng tài li u c n ph i đớ ữ ệ ầ ả ược gi l i b o qu n ngoài nh ng nhu c u côngữ ạ ả ả ữ ầ
vi c th c ti n trệ ự ễ ước m t c a c quan.ắ ủ ơ
3.2 Giai đo n hình thành tài li u ạ ệ
Cũng nh vi c đánh giá và b o qu n, khi mà các yêu c u l u tr đư ệ ả ả ầ ư ữ ược xem xét
gi i quy t giai đo n chu n b thì vi c hình thành và duy trì b o qu n tài li uả ế ở ạ ẩ ị ệ ả ả ệ
s c n ph i đẽ ầ ả ược giám sát sao cho các tác nghi p c th ph i tuân theo đúngệ ụ ể ả
nh ng quy t đ nh đữ ế ị ược đ a ra giai đo n chu n b và còn đ nh n bi t b t kỳư ở ạ ẩ ị ể ậ ế ấ
nh ng c i ti n nào có th đòi h i các quy t đ nh đó ph i đữ ả ế ể ỏ ế ị ả ược xem xét, đánh giá
l i Đi u đ c bi t quan tr ng là tài li u l u tr ph i đạ ề ặ ệ ọ ệ ư ữ ả ược nh n di n, xác đ nhậ ệ ị đúng nh khi chúng đư ược hình thành; nh ng thông tin b i c nh và metadata c nữ ố ả ầ thi t và phù h p ph i đế ợ ả ược n m b t, g n k t v i tài li u đó.ắ ắ ắ ế ớ ệ
3.3 Giai đo n duy trì, b o qu n ạ ả ả
Khi mà các yêu c u l u tr đầ ư ữ ược xem xét gi i quy t trong giai đo n chu n b vàả ế ạ ẩ ị
được g n k t vào vi c thi t k h th ng thì nh ng tác nghi p b o đ m khắ ế ệ ế ế ệ ố ữ ệ ả ả ả năng có th ti p c n lâu dài trong su t giai đo n duy trì b o qu n s là vi cể ế ậ ố ạ ả ả ẽ ệ
th c thi thi t k đó và làm theo đúng nh ng k ho ch đã đự ế ế ữ ế ạ ược xây d ng tự ừ
trước C n ph i ti n hành các bầ ả ế ước đi tích c c đ b o đ m r ng nh ng thôngự ể ả ả ằ ữ tin b i c nh và metadata c n thi t đố ả ầ ế ược cung c p trong vi c thi t k h th ngấ ệ ế ế ệ ố
được gi l i trong su t th i gian t n t i c a tài li u.ữ ạ ố ờ ồ ạ ủ ệ
N u nh trế ư ước đó tài li u ch a đệ ư ược đánh giá thì toàn b tài li u trong h th ngộ ệ ệ ố
s ph i đẽ ả ược duy trì b o qu n toàn b Tả ả ộ ương t nh v y, n u các phự ư ậ ế ươ ng pháp nh n di n, xác đ nh và mô t tài li u không đậ ệ ị ả ệ ược g n k t vào thi t k hắ ế ế ế ệ
th ng thì chúng ph i đố ả ược xây d ng sau Thông tin b i c nh và metadata c nự ố ả ầ thi t đ tra tìm và di n gi i v tài li u có th s r t khó ho c không th thi tế ể ễ ả ề ệ ể ẽ ấ ặ ể ế
l p đậ ược n u nh các yêu c u trên không đế ư ầ ược quan tâm chú ý t i ngay t đ u.ớ ừ ầ
Vi c ti p c n khai thác s đệ ế ậ ẽ ược th c hi n trong giai đo n duy trì b o qu n c aự ệ ạ ả ả ủ vòng đ i tài li u M t khi tài li u đờ ệ ộ ệ ược duy trì, b o qu n đ ph c v cho cácả ả ể ụ ụ
m c đích hi n hành trong h th ng qu n lý tài li u c a c quan thì vi c ti pụ ệ ệ ố ả ệ ủ ơ ệ ế
c n khai thác có th đậ ể ược b o đ m b i h th ng đó Tuy nhiên, đi u mongả ả ở ệ ố ề
mu n là vi c th c hi n ti p c n khai thác tài li u bên ngoài h th ng hi n hànhố ệ ự ệ ế ậ ệ ệ ố ệ
nh m b o đ m hi u qu ho t đ ng c a h th ng ho c b o v h th ng kh iằ ả ả ệ ả ạ ộ ủ ệ ố ặ ả ệ ệ ố ỏ
nh ng nguy c phát sinh t vi c cho phép nh ng cá nhân bên ngoài c quan sữ ơ ừ ệ ữ ơ ử
d ng tài li u Đi u này có th th c hi n đụ ệ ề ể ự ệ ược b ng cách tách bi t tài li u l uằ ệ ệ ư
tr kh i h th ng hi n hành ho c t o ra b n sao c a tài li u n u nh tài li uữ ỏ ệ ố ệ ặ ạ ả ủ ệ ế ư ệ
l u tr v n còn giá tr hi n hành.ư ữ ẫ ị ệ
Vi c ki m soát tri th c đ i v i tài li u đi n t đã đệ ể ứ ố ớ ệ ệ ử ược chuy n giao vào kho l uể ư
tr c n ph i k t h p vi c ki m soát tri th c đ i v i các tài li u liên quan khácữ ầ ả ế ợ ệ ể ứ ố ớ ệ trong l u tr Nh ng thông tin b i c nh và metadata liên quan mà c quan s nư ữ ữ ố ả ơ ả sinh tài li u t o ra cũng c n ph i đệ ạ ầ ả ược chuy n giao cho l u tr cùng v i tàiể ư ữ ớ
li u Khi tài li u đi n t ch a đệ ệ ệ ử ư ược chuy n giao vào l u tr thì v n c n ph iể ư ữ ẫ ầ ả thi t l p và duy trì vi c ki m soát tri th c m c c n thi t đ giám sát vi c b oế ậ ệ ể ứ ở ứ ầ ế ể ệ ả
qu n và kh năng có th ti p c n khai thác tài li u m t cách liên t c L u trả ả ể ế ậ ệ ộ ụ ư ữ
Trang 6c n ph i n l c đ t o l p và duy trì m t h th ng th ng nh t nh ng thông tinầ ả ỗ ự ể ạ ậ ộ ệ ố ố ấ ữ
v toàn b tài li u l u tr cho dù chúng đề ộ ệ ư ữ ược b o qu n đâu, sao cho ngả ả ở ườ ử i s
d ng có đ đi u ki n đ khai thác, s d ng đụ ủ ề ệ ể ử ụ ượ ấ ảc t t c nh ng tài li u mà hữ ệ ọ
c n.ầ
4 Các ph ươ ng pháp b o đ m cho vi c ti p c n khai thác tài li u ả ả ệ ế ậ ệ
C n xem xét các phầ ương th c b o đ m cho vi c ti p c n khai thác nh ng tàiứ ả ả ệ ế ậ ữ
li u đi n t không còn đệ ệ ử ược ti p t c b o qu n trong h th ng qu n lý tài li uế ụ ả ả ệ ố ả ệ
mà c quan s n sinh đã l u gi chúng nh m ph c v cho các nhu c u công vi c.ơ ả ư ữ ằ ụ ụ ầ ệ
Đ đáp ng các nhu c u ti p c n khai thác c a c quan s n sinh tài li u thìể ứ ầ ế ậ ủ ơ ả ệ
nh ng tài li u đữ ệ ượ ưc l u gi trong h th ng qu n lý tài li u ban đ u có th ti pữ ệ ố ả ệ ầ ể ế
c n khai thác đậ ược thông qua các phương ti n mà h th ng đã cung c p ệ ệ ố ấ
Có 3 phương pháp chung đ b o đ m cho vi c ti p c n khai thác nh ng tài li uể ả ả ệ ế ậ ữ ệ
đi n t không còn đệ ử ưọc b o qu n trong h th ng qu n lý tài li u ban đ u: (1)ả ả ệ ố ả ệ ầ dùng các b n sao trên các phả ương ti n mang tin th c th ; (2) các b n sao đệ ự ể ả ượ c cung c p qua các phấ ương ti n truy n thông, và (3) tr c tuy n trên m t h th ngệ ề ự ế ộ ệ ố máy tính
4.1 S d ng các b n sao trên các ph ử ụ ả ươ ng ti n mang tin th c th ệ ự ể
Có th cung c p b n sao tài li u đi n t cho các nhà nghiên c u trên các phể ấ ả ệ ệ ử ứ ươ ng
ti n mang tin k thu t s Các phệ ỹ ậ ố ương ti n đệ ượ ử ục s d ng cho m c đích này c nụ ầ
ph i thu n ti n cho các nhà nghiên c u s d ng Khi mà các yêu c u v b n saoả ậ ệ ứ ử ụ ầ ề ả tài li u nh n đệ ậ ượ ừc t các c quan, t ch c hay các công ty thì phơ ổ ứ ương ti n phùệ
h p nh t s là nh ng b n sao tài li u đợ ấ ẽ ữ ả ệ ược dùng trong các máy tính l n và cácớ
h th ng máy tính l n khác, thệ ố ớ ường là m t d ng băng t nào đó Đ i v i cácở ộ ạ ừ ố ớ nhà nghiên c u, nh ng ngứ ữ ườ ử ụi s d ng các máy tính cá nhân thì các đĩa m m làề phù h p h n đ i v i m t lợ ơ ố ớ ộ ượng nh tài li u và các CD-ROM đ i v i lỏ ệ ố ớ ượng tài
li u l n Khi mà các b n sao đệ ớ ả ược cung c p trên các phấ ương ti n k thu t s thìệ ỹ ậ ố
ph n c ng và ph n m m c n thi t đ truy nh p và s d ng tài li u thầ ứ ầ ề ầ ế ể ậ ử ụ ệ ường là
do nhà nghiên c u t ch u trách nhi m.ứ ự ị ệ
L u tr có th cung c p các d ch v khác ngoài vi c sao ch p theo cách 1 - 1 cácư ữ ể ấ ị ụ ệ ụ
t p k thu t s có ch a m t ho c nhi u tài li u đi n t Nh ng d ch v đó cóệ ỹ ậ ố ứ ộ ặ ề ệ ệ ử ữ ị ụ
th bao g m vi c cho phép các yêu c u ch ch n l c m t ph n trong toàn b t pể ồ ệ ầ ỉ ọ ọ ộ ầ ộ ệ
và sau đó t o ra m t b n sao c a riêng ph n đã đạ ộ ả ủ ầ ược ch n Các d ch v khác cóọ ị ụ
th c n đ n đ t o ra m t b n sao c a b t kỳ m t tài li u nào để ầ ế ể ạ ộ ả ủ ấ ộ ệ ượ ưc l u giữ trong các t p.ệ
M t s nhà nghiên c u có th không có đi u ki n ti p c n t i máy tính hayộ ố ứ ể ề ệ ế ậ ớ
ph n m m phù h p đ truy nh p tài li u đi n t Đ i v i nh ng khách hàngầ ề ợ ể ậ ệ ệ ử ố ớ ữ
nh v y thì vi c cung c p các b n sao trên các v t mang tin nh gi y hayư ậ ệ ấ ả ậ ư ấ microfilm có th là th c t h n Ph ng pháp này có t t c các nhể ự ế ơ ư ấ ả ược đi m v nể ố
có trong vi c s d ng các phệ ử ụ ương ti n mang tin “c ng” đó; h n n a, còn có m tệ ứ ơ ữ ộ
s lo i tài li u đi n t nh các c s d li u ph c t p và không th bi u di nố ạ ệ ệ ử ư ơ ở ữ ệ ứ ạ ể ể ễ chúng m t cách xác th c m t d ng (format) tu n t theo chi u d c M c dùộ ự ở ộ ạ ầ ự ề ọ ặ
v y, vi c t o ra các b n sao b ng cách in ra s là phù h p đ i v i m t s lo iậ ệ ạ ả ằ ẽ ợ ố ớ ộ ố ạ yêu c u nh t đ nh nh trong trầ ấ ị ư ường h p đ i v i m t lợ ố ớ ộ ượng nh t đ nh các dấ ị ữ
li u t m t c s d li u hay đ i v i các tài li u d ng văn b n Vi c cung c pệ ừ ộ ơ ở ữ ệ ố ớ ệ ạ ả ệ ấ
Trang 7các b n sao d ng vi b n hay b ng cách in ra s đòi h i kh năng đ nh d ngả ở ạ ả ằ ẽ ỏ ả ị ạ
đ u ra tài li u đi n t d ng mà con ngầ ệ ệ ử ở ạ ười có th đ c để ọ ược
4.2 Cung c p b n sao thông qua các ph ấ ả ươ ng ti n truy n thông ệ ề
S phát tri n nhanh chóng c a Internet đã làm cho vi c s d ng các m ng đi nự ể ủ ệ ử ụ ạ ệ
t đ cung c p b n sao tài li u đi n t tr thành m t phử ể ấ ả ệ ệ ử ở ộ ương pháp ngày càng
h p d n N u nh l u tr hay các nhà cung c p tài li u khác có th ti p c nấ ẫ ế ư ư ữ ấ ệ ể ế ậ
đượ ớc t i Internet hay các phương ti n truy n thông k thu t s d ng quay s thìệ ề ỹ ậ ố ạ ố khi đó, phương pháp này s r t gi ng v i phẽ ấ ố ớ ương pháp cung c p các b n saoấ ả trên các phương ti n mang tin k thu t s Vi c s d ng các phệ ỹ ậ ố ệ ử ụ ương ti nệ truy n thông có nh ng đi m u vi t nh t đ nh so v i các phề ữ ể ư ệ ấ ị ớ ương ti n mang tinệ
k thu t s Ngỹ ậ ố ười ta không c n ph i mua hay l u tr các phầ ả ư ữ ương ti n mang tinệ
đó Ngoài ra, cũng không c n ph i đóng gói và chuy n g i nh ng phầ ả ể ử ữ ương ti nệ
đó t i các nhà nghiên c u, ki m tra vi c th t l c nh ng th đã g i hay gi iớ ứ ể ệ ấ ạ ữ ứ ử ả quy t các v n đ liên quan t i s h h ng trong quá trình v n chuy n Vi cế ấ ề ớ ự ư ỏ ậ ể ệ cung c p thông tin qua các m ng thấ ạ ường r t nhanh chóng và đáng tin c y.ấ ậ
4.3 Ti p c n s d ng tr c tuy n ế ậ ử ụ ự ế
Ti p c n s d ng tr c ti p tài li u đi n t có th đế ậ ử ụ ự ế ệ ệ ử ể ược th c hi n qua m t hự ệ ộ ệ
th ng máy tính đ t t i c s l u tr hay m t c s nghiên c u khác ho c thôngố ặ ạ ơ ở ư ữ ộ ơ ở ứ ặ qua các phương ti n vi n thông, qua Internet hay các phệ ễ ương ti n truy n thôngệ ề
k thu t s khác Phỹ ậ ố ương pháp này đòi h i c quan l u tr hay nhà cung c pỏ ơ ư ữ ấ khác ph i có ngu n l c máy tính đ y đ và thích h p cho vi c tra tìm, x lý vàả ồ ự ầ ủ ợ ệ ử
hi n th tài li u Ngoài ra, phể ị ệ ương pháp này còn đòi h i cung c p s tr giúp kỏ ấ ự ợ ỹ thu t cho nh ng nhà nghiên c u s d ng h th ng Vi c s d ng m t h th ngậ ữ ứ ử ụ ệ ố ệ ử ụ ộ ệ ố
n i mà vi c ti p c n khai thác đơ ệ ế ậ ược cung c p và có s n trên các phấ ẵ ương ti nệ thi t b đế ị ược b trí trong l u tr hay m t c s nghiên c u ch c ch n s dố ư ữ ộ ơ ở ứ ắ ắ ẽ ễ
qu n lý h n là cung c p, b o đ m vi c ti p c n h th ng qua các phả ơ ấ ả ả ệ ế ậ ệ ố ương ti nệ truy n thông Tuy nhiên, vi c s d ng các phề ệ ử ụ ương ti n truy n thông cho phépệ ề các nhà nghiên c u ti p c n v i tài li u mà không b l thu c vào n i tài li u đóứ ế ậ ớ ệ ị ệ ộ ơ ệ
đượ ưc l u tr và không nh t thi t ph i t i c s l u tr Các phữ ấ ế ả ớ ơ ở ư ữ ương ti n truy nệ ề thông còn m ra m t kh năng là nhi u nhà nghiên c u có th đ ng th i ti pở ộ ả ề ứ ể ồ ờ ế
c n s d ng tài li u h n là trong trậ ử ụ ệ ơ ường h p m t h th ng đóng Tuy nhiên,ợ ộ ệ ố
vi c hi n th c hoá kh năng này s ph thu c vào ngu n l c máy tính có s nệ ệ ự ả ẽ ụ ộ ồ ự ẵ cho vi c ti p c n khai thác t xa.ệ ế ậ ừ
Ti p c n s d ng tr c tuy n, cho dù đế ậ ử ụ ự ế ược th c hi n t i ch hay thông qua cácự ệ ạ ỗ
phương ti n truy n thông, không nh t thi t là tài li u ph i đệ ề ấ ế ệ ả ược duy trì b oả
qu n trên m ng Các yêu c u ti p c n khai thác t i các seri tài li u l u trả ạ ầ ế ậ ớ ệ ư ữ không ph i là thả ường xuyên nên vi c l u tr tr c tuy n trên m ng s là m t sệ ư ữ ự ế ạ ẽ ộ ự lãng phí không c n thi t Ch duy trì trên m ng các thông tin c p 2 mô t vầ ế ỉ ạ ấ ả ề
nh ng tài li u hi n có và t o đi u ki n cho h cân nh c và đ a ra nh ng quy tữ ệ ệ ạ ề ệ ọ ắ ư ữ ế
đ nh v vi c h c n khai thác nh ng tài li u nào ị ề ệ ọ ầ ữ ệ
Nh trên đã trình bày, có 3 phư ương pháp b o đ m cho vi c ti p c n khai thácả ả ệ ế ậ
nh ng tài li u đi n t : (1) dùng các b n sao trên các phữ ệ ệ ử ả ương ti n mang tin th cệ ự
th ; (2) các b n sao để ả ược cung c p qua các phấ ương ti n truy n thông, và (3)ệ ề
tr c tuy n trên m t h th ng máy tính Các phự ế ộ ệ ố ương pháp đó có th để ược sử
d ng k t h p theo nhi u nguyên t c khác nhau tuỳ thu c vào đ c tính c a tàiụ ế ợ ề ắ ộ ặ ủ
Trang 8li u, b n ch t c a các nhu c u khai thác và ngu n l c c a c quan l u tr ch uệ ả ấ ủ ầ ồ ự ủ ơ ư ữ ị trách nhi m v khai thác s d ng tài li u.ệ ề ử ụ ệ
Tuy nhiên, chúng ta cũng d dàng nh n th y, vi c qu n lý và cung c p thông tinễ ậ ấ ệ ả ấ tài li u l u tr đi n t cho khai thác s d ng ch a đ ng r t nhi u r i ro nh :ệ ư ữ ệ ử ử ụ ứ ự ấ ề ủ ư
C s d li u b xóa, thông tin b ch nh s a… Chính vì v y c n thi t k m t hơ ở ữ ệ ị ị ỉ ử ậ ầ ế ế ộ ệ
th ng l u gi tránh tình tr ng xâm nh p trái phép, th c hi n ch đ qu n lý tàiố ư ữ ạ ậ ự ệ ế ộ ả
li u đi n t nh là m t b ph n t ng th các h s tài li u, thông tin c a cệ ệ ử ư ộ ộ ậ ổ ể ồ ơ ệ ủ ơ quan và ph i có khuôn kh chi n lả ổ ế ược đ i v i tài li u l u tr đi n t b i hố ớ ệ ư ữ ệ ử ở ệ
th ng l u gi tài li u đi n t là m t quy trình khép kín đ m b o cho các tài li uố ư ữ ệ ệ ử ộ ả ả ệ
được qu n lý an toàn cùng v i thông tin, hoàn c nh và c u trúc c a nó ả ớ ả ấ ủ
TÀI LI U THAM KH O Ệ Ả
1 Козлов В.П Какие принципы положены в основу “Основ
законодательства Российской Федерации об Архивном фонде Российской Федерации и архивах” / Kozlov VP - Nh ng nguyên t c d a trên n n t ngữ ắ ự ề ả
"Pháp lu t c b n c a Liên bang Nga v Phông l u tr Liên bang Nga và cácậ ơ ả ủ ề ư ữ
l u tr " T/c L u tr Nga, s 2/1997.ư ữ ư ữ ố
2 Кузнецова И.В О Европейской конференции по электронным документам
и организации электронного доступа / Kuznetsova IV V h i ngh châu Âuề ộ ị
“Tài li u đi n t và t ch c truy c p tài li u đi n t ” T/c L u tr Nga sệ ệ ử ổ ứ ậ ệ ệ ử ư ữ ố 2+3/1999
3 Михайлов О.А Электронные документы и архивы (по данным международных конференций и публикаций 1998–1999 гг.) / Mikhailov О.А
Tài li u đi n t và các tài li u l u tr (theo tài li u h i ngh qu c t và các nệ ệ ử ệ ư ữ ệ ộ ị ố ế ấ
ph m 1998-1999) T/c L u tr Nga s 1/2000ẩ ư ữ ố
4 Киселев И.Н Электронные документы: основные направления
исследований / Kiselev I Tài li u đi n t : các hệ ệ ử ướng nghiên c u chính T/c L uứ ư
tr Nga s 3 + 4/2000ữ ố
5 Формирование нормативной базы обеспечения доступа пользователей
к архивным документам с конфиденциальными сведениями о гражданах 1991-2007 гг./ T o l p m t hành lang pháp lý đ đ m b o ngạ ậ ộ ể ả ả ười dùng truy c pậ tài li u l u tr có thông tin bí m t v công dân 1991-2007 T/c L u tr Nga sệ ư ữ ậ ề ư ữ ố 2/2008
6 И.Н Киселев Архивные информационные технологии на современном
этапе / Ki-si-lov I N Công ngh thông tin l u tr trong th i kỳ hi n đ i T/cệ ư ữ ờ ệ ạ
L u tr Nga s 4/2008, trang 24 – 30ư ữ ố
7 М.Ю Киселев Электронный научно-справочный аппарат к документам
Архива Российской академии наук: этапы создания / Ki-si-lov M Iu H th ngệ ố công c tra c u đi n t cho tài li u l u tr Vi n hàn lâm khoa h c Nga: nh ngụ ứ ệ ử ệ ư ữ ệ ọ ữ giai đo n hình thành tr 42 – 45 t/c L u tr Nga s 4/2008ạ ư ữ ố