8. Bố cục của đề tài
2.4.3. Phòng đọc ảo áp dụng tại Lưu trữ quốc gia Anh
Lưu trữ quốc gia của Vương Quốc Anh hiện đang bảo quản hơn 1000 năm lịch sử với các khối tài liệu khổng lồ. Những tài liệu này xuất phát từ Chính phủ Anh, được thu thập, xác định giá trị và đưa vào bảo quản vĩnh viễn trong lưu trữ. Trong tổng số tài liệu được bảo quản, các chuyên gia lưu trữ, cán bộ lưu trữ lựa chọn một lượng tài liệu nhất định và tiến hành số hóa. Khối tài liệu ở dạng số này trở thành tài nguyên thông tin phục vụ hoạt động của phòng đọc ảo đáp ứng nhu cầu khai thác, sử dụng TLLT trong môi trường mạng. Phòng đọc ảo cho phép tìm kiếm tài liệu thuộc phạm vi quản lý của Lưu trữ quốc gia và hơn 2.500 các lưu trữ khác trên khắp Vương quốc Anh. Lượng tài liệu mà độc giả có thể tải về lên đến con số 9 triệu, kèm theo 32 triệu bản mô tả tài liệu. Đây là các bản mô tả của toàn bộ tài liệu được bảo quản tại Lưu trữ quốc gia và hơn 2.500 lưu trữ khác trên cả nước.
Về cách thức tra tìm và sử dụng tài liệu, độc giả có thể truy cập vào cổng thông tin phòng đọc ảo discovery.nationalarchives.gov.uk. Khi thực hiện tìm kiếm thông tin, phòng đọc ảo sẽ cung cấp các kết quả tìm kiếm sau khi độc giả gõ từ khóa cần tìm. Kết quả tìm kiếm sẽ hiển thị tổng số tài liệu liên quan đến từ khóa và cho phép độc giả lựa chọn các tài liệu ở 3 nhóm khác nhau bao gồm: nhóm tài liệu được phép tải về; nhóm tài liệu đang được bảo quản tại Lưu trữ quốc gia; nhóm tài liệu đang được bảo quản tại các lưu trữ khác. Bên cạnh đó, độc giả cũng có thể lựa chọn các nhóm tài liệu theo tiêu chí thời gian nhằm tìm kiếm tài liệu dễ dàng và nhanh chóng hơn. Các nhóm tài liệu này đều được thống kê số lượng tài liệu cụ thể. Chẳng hạn, độc giả tìm kiếm từ khóa Vietnam như tại ví dụ tại phòng đọc ảo của Lưu trữ quốc gia Mỹ.
Kết quả tìm kiếm sẽ hiển thị tổng số tài liệu được tìm thấy là 4.157 tài liệu. Trong đó,
64
- Tài liệu thuộc Lưu trữ quốc gia: 3.772 - Tài liệu thuộc các lưu trữ khác: 385 - Tài liệu được phép tải về: 230
Tài liệu được phân loại theo thời gian: - Tài liệu không xác định được thời gian: 73 - Tài liệu từ năm 1950 đến nay: 3996
- Tài liệu từ năm 1925 đến 1949: 66 - Tài liệu từ năm 1900 đến 1924: 19 - Tài liệu từ năm 1800 đến 1899: 32 - Tài liệu từ năm 1700 đến 1799: 3
Mọi tài liệu được phép xem và tải về đều kèm theo bản mô tả chi tiết về tài liệu bao gồm: số/ký hiệu bảo quản, số hồ sơ, tiêu đề, thời gian, nơi bảo quản... Ngoài ra, phòng đọc ảo cũng mô tả khái quát bối cảnh của tài liệu giúp độc giả hiểu được nội dung tài liệu trong mối tương quan với các tài liệu khác có cùng một chủ đề hoặc cùng một đơn vị/cơ quan sản sinh ra tài liệu.
Độc giả của phòng đọc ảo thuộc Lưu trữ quốc gia Anh bao gồm hai loại chính:
- Một là, độc giả tự do: Được phép tìm kiếm thông tin trong cổng thông tin điện tử của phòng đọc ảo. Đây là những thông tin mô tả chi tiết về tài liệu, không bao gồm bản toàn văn tài liệu.
- Hai là, độc giả có tài khoản đăng ký: Được phép tìm kiếm thông tin mô tả chi tiết về tài liệu và tải về các tài liệu thuộc nhóm các tài liệu được phép tải. Lệ phí cho một lần tải tài liệu được quy định là 3.3 bảng Anh (tương đương 113.000 VNĐ).
65
Hình 2.3: Giao diện của phòng đọc ảo áp dụng tại Anh
Tóm lại, qua ba mô hình phòng đọc ảo phục vụ khai thác, sử dụng TLLT, có thể đưa ra những nhận xét chung sau:
- Mục đích cao nhất của phòng đọc ảo là phát huy tối đa giá trị của TLLT, mở rộng "cầu nối" giữa lưu trữ với xã hội. Trong đó, phòng đọc ảo cũng có thể được xây dựng với mục đích riêng là phục vụ trực tiếp cho một lĩnh vực cụ thể của đời sống xã hội (tại Úc);
- Đối tượng độc giả của phòng đọc ảo không nhất thiết là toàn bộ cá nhân, cơ quan/tổ chức trong và ngoài nước mà có thể chỉ nhằm hướng tới một bộ phận nhất định;
- Quy mô của phòng đọc ảo được đánh giá chủ yếu qua số lượng bản văn tài liệu chứa trong phòng đọc ảo; sự liên kết với các cơ quan lưu trữ khác; các dịch vụ của phòng đọc...
66
- Giao diện của phòng đọc thân thiện, tạo điều kiện cho người sử dụng tiếp cận thông tin một cách dễ dàng. Điều này thực sự cần thiết đối với các đối tượng độc giả phổ thông bởi cách tổ chức tài liệu lưu trữ có những đặc thù mang tính chuyên ngành.
* TIỂU KẾT CHƯƠNG 2
Trong chương này, đề tài phân tích các cơ sở nghiên cứu bao gồm cơ sở lý thuyết, cơ sở pháp lý và cơ sở kỹ thuật như là các điều kiện cần để có thể nghiên cứu xây dựng phòng đọc ảo. Trong đó, về cơ sở lý thuyết, chúng tôi tập trung xây dựng khái niệm phòng đọc ảo được áp dụng tại các cơ quan lưu trữ. Đây là khái niệm mang tính mới hoàn toàn trong hệ thống lý luận về lưu trữ của Việt Nam tại thời điểm hiện tại. Bên cạnh đó, các kinh nghiệm xây dựng phòng đọc ảo của một số nước phát triển cũng góp phần quan trọng trong việc xây dựng hình thức tổ chức khai thác, sử dụng này. Nếu như các cơ sở nghiên cứu trên đóng vai trò là tiền đề xây dựng phòng đọc ảo thì các kinh nghiệm thực tiễn của nước ngoài sẽ góp phần xây dựng loại hình phòng đọc mới này được hoàn thiện nhất có thể.
67
CHƯƠNG 3
MÔ HÌNH PHÒNG ĐỌC ẢO PHỤC VỤ KHAI THÁC, SỬ DỤNG TÀI LIỆU LƯU TRỮ BẢO QUẢN TẠI TRUNG TÂM LƯU TRỮ
QUỐC GIA III 3.1. Mô hình hệ thống
3.1.1. Tạo lập cơ sở dữ liệu
Phòng đọc ảo phục vụ khai thác, sử dụng TLLT là nơi đáp ứng nhu cầu của người dùng thông qua việc cung cấp những nội dung thông tin lưu trữ. Động cơ đầu tiên để người dùng truy cập vào phòng đọc ảo là có được những nội dung thông tin TLLT hoặc những dịch vụ có liên quan. Trong đó, những thông tin TLLT đóng vai trò quan trọng hơn cả so với các yếu tố khác thuộc phòng đọc ảo. Nội dung thông tin không đầy đủ, không phù hợp thì cho dù phòng đọc ảo có thiết kế được các yếu tố nổi trội thì cũng không thể thu hút độc giả đúng với mục tiêu của việc xây dựng hình thức tổ chức khai thác, sử dụng mới này. Để xây dựng và phát triển nội dung thông tin, phòng đọc ảo buộc phải được trang bị một hệ thống các CSDL. Hay nói cách khác, CSDL chính là nòng cốt của một phòng đọc ảo, phục vụ nhu cầu tra tìm và khai thác thông tin của độc giả. Trong đó, CSDL là tập hợp các dữ liệu được sắp xếp, tổ chức để truy cập, khai thác, quản lý và cập nhật thông qua phương tiện điện tử. [27] Việc tạo lập các CSDL này có thể được chia thành 2 phạm vi:
Một là, tạo lập các CSDL trong phạm vi cơ quan lưu trữ xây dựng phòng đọc ảo (cụ thể là TTLTQG III)
Các CSDL này đóng vai trò chính yếu trong tổng thể tài nguyên thông tin của phòng đọc ảo. Độc giả có thể khai thác các thông tin đa dạng về thể loại và phong phú về nội dung được truy xuất từ các nhóm CSDL này, bao gồm:
68
- Cơ sở dữ liệu phông/công trình/sưu tập lưu trữ; - Cơ sở dữ liệu hồ sơ;
- Cơ sở dữ liệu văn bản;
- Cơ sở dữ liệu toàn văn của văn bản.
(Tên gọi CSDL trên được sử dụng theo Hướng dẫn số 169/HĐ- VTLTNN về Xây dựng cơ sở dữ liệu lưu trữ, ngày 10 tháng 3 năm 2010 của Cục Văn thư và Lưu trữ Nhà nước)
Về nguồn tài liệu để tạo lập các cơ sở dữ liệu, đối với cơ sở dữ liệu phông/công trình/sưu tập lưu trữ, cơ sở dữ liệu hồ sơ và cơ sở dữ liệu văn bản thì tài liệu được thu thập ở đây chính là Sách chỉ dẫn các phông lưu trữ bảo quản tại Trung tâm Lưu trữ quốc gia III được xuất bản năm 2006; các quyển mục lục hồ sơ; danh mục tài liệu trong hồ sơ. Riêng đối với cơ sở dữ liệu toàn văn của văn bản, đầu vào của cơ sở dữ liệu chính là nội dung văn bản của hồ sơ. Đầu vào này cần được khoanh vùng phạm vi cho phép khai thác sử dụng rộng rãi, đặc biệt là khi bản toàn văn của văn bản được số hóa nhằm mục đích phục vụ nhu cầu của độc giả qua mạng Internet. Phạm vi tài liệu có thể được
khoanh vùng như sau:
+ Xét khía cạnh loại hình: TLLT được phép phục vụ độc giả qua phòng đọc ảo gồm tất cả các loại hình tài liệu không phân biệt tài liệu hành chính, tài liệu nghe - nhìn, tài liệu khoa học - công nghệ... Điều đặc biệt là các dạng tài liệu này đã được số hóa (nếu tài liệu tồn tại trên vật mang tin là giấy, băng, đĩa, phim...). Những tài liệu đã ở dạng số ngay từ khi được sản sinh cũng sẽ được cung cấp dưới dạng số.
+ Xét khía cạnh nội dung: phòng đọc ảo cho phép độc giả có thể tiếp cận các tài liệu trong cơ sở dữ liệu của phòng đọc theo Điều 30, luật Lưu trữ về
69
việc sử dụng tài liệu lưu trữ tại Lưu trữ lịch sử: "Tài liệu lưu trữ tại Lưu trữ lịch sử được sử dụng rộng rãi, trừ tài liệu thuộc Danh mục tài liệu hạn chế sử dụng và Danh mục tài liệu có đóng dấu chỉ các mức độ mật." Trong đó, tài liệu hạn chế sử dụng có một trong các đặc điểm: tài liệu lưu trữ không thuộc Danh mục tài liệu có đóng dấu chỉ các mức độ mật nhưng có nội dung thông tin nếu sử dụng rộng rãi có thể ảnh hưởng nghiêm trọng đến lợi ích của Nhà nước, quyền, lợi ích hợp pháp của cơ quan, tổ chức, cá nhân; tài liệu lưu trữ bị hư hỏng nặng hoặc có nguy cơ bị hư hỏng chưa được tu bổ, phục chế; tài liệu lưu trữ đang trong quá trình xử lý về nghiệp vụ lưu trữ. Tài liệu lưu trữ thuộc Danh mục tài liệu có đóng dấu chỉ các mức độ mật được sử dụng rộng rãi trong các trường hợp sau đây: Được giải mật theo quy định của pháp luật về bảo vệ bí mật nhà nước; Sau 40 năm, kể từ năm công việc kết thúc đối với tài liệu có đóng dấu mật nhưng chưa được giải mật; Sau 60 năm, kể từ năm công việc kết thúc đối với tài liệu có đóng dấu tối mật, tuyệt mật nhưng chưa được giải mật. Tài liệu liên quan đến cá nhân được sử dụng rộng rãi sau 40 năm, kể từ năm cá nhân qua đời, trừ một số trường hợp đặc biệt theo quy định của Chính phủ.
Bên cạnh đó, với đặc thù về nhiều phương diện khác nhau, các tài liệu cá nhân, gia đình, dòng họ chỉ được phép đưa ra phục vụ trên mạng diện rộng ở dạng thông tin cấp hai, đồng nghĩa với việc độc giả chỉ có thể khai thác trong nhóm CSDL phông/công trình/sưu tập lưu trữ. Việc khai thác và sử dụng các tài liệu này ở dạng bản văn chỉ có thể được diễn ra tại phòng đọc truyền thống với các thủ tục và quy định hiện hành.
+ Xét khía cạnh tần suất được khai thác, sử dụng tại phòng đọc truyền thống: Qua thống kê định kỳ về tình hình khai thác, sử dụng tài liệu tại phòng đọc truyền thống, TTLTQG III sẽ xác định được các khối/nhóm tài liệu, hồ sơ được khai thác, sử dụng thường xuyên. Điều này đồng nghĩa với một thực tế
70
là nhu cầu của độc giả đối với các tài liệu này cao hơn so với các tài liệu khác, đòi hỏi phải có một hình thức tổ chức sử dụng mới đáp ứng nhu cầu độc giả và cũng góp phần hạn chế mức độ hư hại tới bản gốc của tài liệu.
Về cách thức tạo lập, đối với bốn cơ sở dữ liệu là cơ quan lưu trữ; phông/công trình lưu trữ; hồ sơ; văn bản thì cơ quan lưu trữ có thể thực hiện dựa trên kết quả thống kê và tiến hành nhập dữ liệu. Tuy nhiên, việc xây dựng CSDL toàn văn của văn bản lại đòi hỏi một quy trình phức tạp và quy mô bởi yêu cầu phải thực hiện số hóa các văn bản của hồ sơ lưu trữ trên vật mang tin truyền thống. Quy trình này được thể hiện như sau:
71
Trong đó,
- Lập kế hoạch, chuẩn bị tài liệu để tạo lập cơ sở dữ liệu bao gồm các khâu: khảo sát, lựa chọn, thống kê tài liệu để tạo lập cơ sở dữ liệu; xây dựng, trình duyệt kế hoạch tạo lập cơ sở dữ liệu; bàn giao tài liệu cho bộ phận biên mục phiếu tin; vận chuyển tài liệu từ kho bảo quản đến nơi biên mục phiếu tin; làm vệ sinh tài liệu.
- Dữ liệu đặc tả (siêu dữ liệu hoặc metadata) là những thông tin mô tả các đặc tính của dữ liệu như nội dung, định dạng, chất lượng, điều kiện và các đặc tính khác nhằm tạo thuận lợi cho quá trình tìm kiếm, truy nhập, quản lý và lưu trữ dữ liệu.
- Xây dựng dữ liệu đặc tả là công việc xây dựng các trường thông tin và nội dung các trường thông tin mô tả về dữ liệu được số hóa trong cơ sở dữ liệu, phục vụ tìm kiếm, khai thác sử dụng nội dung dữ liệu, đáp ứng mục tiêu và yêu cầu sử dụng dữ liệu.
- Nhập dữ liệu là công việc đưa các dữ liệu vào trong cơ sở dữ liệu để quản lý và khai thác sử dụng, bao gồm nhập phiếu tin; bàn giao tài liệu, phiếu tin, dữ liệu đặc tả cho bộ phận thực hiện số hóa; bàn giao tài liệu và thực hiện số hóa (số hóa là việc biến đổi các loại hình thông tin sang thông tin số.)
- Chuẩn hóa và chuyển đổi dữ liệu là công việc chuyển đổi dữ liệu dạng số sang dạng có cùng cấu trúc thiết kế với sơ sở dữ liệu.
- Kiểm tra dữ liệu đã tạo lập là công việc kiểm tra dữ liệu nhằm bảo đảm dữ liệu được nhập đầy đủ, chính xác, phù hợp với yêu cầu xây dựng cơ sở dữ liệu.
72
- Nghiệm thu và bàn giao sản phẩm là công việc nghiệm thu kết quả tạo lập cơ sở dữ liệu trên cơ sở đã được kiểm tra. Sau khi nghiệm thu, đơn vị tạo lập cơ sở dữ liệu tiến hành bàn giao kết quả cho đơn vị vận hành và sử dụng.
Sau khi được tạo lập theo lưu đồ trên, cơ sở dữ liệu được tích hợp vào cổng thông tin điện tử (tức phòng đọc ảo)
Hai là, tạo lập các cơ sở dữ liệu trong phạm vi toàn bộ hệ thống các cơ quan lưu trữ (mạng lưới lưu trữ từ trung ương đến địa phương)
: Thu thập và kết nối nguồn tài nguyên thông tin Lưu đồ 3.2: Mô hình kết nối các hệ thống cơ sở dữ liệu số hóa của các
cơ quan lưu trữ các cấp và các cơ quan khác
Xét ở phạm vi rộng hơn, TTLTQG III sẽ huy động các cơ sở dữ liệu của các cơ quan lưu trữ và các cơ quan khác như trên. Mục tiêu của việc kết nối cơ sở dữ liệu này là tạo nên một mạng lưới nguồn thông tin lưu trữ khổng lồ và bao quát nhiều lĩnh vực được tích hợp trong phòng đọc ảo của Trung tâm. Mục tiêu này nhằm tạo điều kiện thuận lợi cho độc giả có thể khai thác được
Hệ thống CSDL của Lưu trữ lịch sử các tỉnh/thành phố trực