Phương pháp này đã tạo cơ hội mới cho ngành lưu trữ trong việc bảo quản an toàn tài liệu quý hiếm nói riêng, tài liệu lưu trữ nói chung đang trong tình trạng bị xuống cấp nặng hoặc có tầ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
-
SOULISOUK THOW
NGHIÊN CỨU TRIỂN KHAI SỐ HÓA TÀI LIỆU LƯU TRỮ ĐANG BẢO QUẢN TẠI CỤC LƯU TRỮ QUỐC GIA LÀO
LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH LƯU TRỮ
Hà Nội – 2013
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI VÀ NHÂN VĂN
-
SOULISOUK THOW
NGHIÊN CỨU TRIỂN KHAI SỐ HÓA TÀI LIỆU LƯU TRỮ ĐANG BẢO QUẢN TẠI CỤC LƯU TRỮ QUỐC GIA LÀO
LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH LƯU TRỮ
MÃ SỐ: 60 32 24
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN LỆ NHUNG
Hà Nội – 2013
Trang 3MỤC LỤC
Trang
MỞ ĐẦU 3
1 Lý do chọn đề tài 3
2 Mục tiêu và nhiệm vụ nghiên cứu 5
3 Đối tượng và phạm vi nghiên cứu 6
4 Lịch sử nghiên cứu 7
5 Phương pháp nghiên cứu 10
6 Nguồn tài liệu tham khảo 11
7 Đóng góp của đề tài 13
8 Bố cục của đề tài 13
CHƯƠNG 1: TỔNG QUAN VỀ SỐ HÓA TÀI LIỆU LƯU TRỮ 15
1.1 Một số khái niệm, thuật ngữ cơ bản về số hóa tài liệu lưu trữ 15
1.2 Mục tiêu áp dụng kỹ thuật số hóa đối với tài liệu lưu trữ 24
1.3 Những ưu điểm và hạn chế của kỹ thuật số hóa tài liệu lưu trữ 31
1.3.1 Ưu điểm 31
1.3.2 Hạn chế 32
1.4 Tổng quan về kỹ thuật số hóa 33
1.4.1 Một số loại máy quét và máy chụp ảnh số 34
1.4.2 Thuộc tính của tài liệu 36
1.4.3 Kỹ thuật quét tài liệu 37
1.4.4 Những yếu tố tác động đến chất lượng ảnh số 38
CHƯƠNG 2: THỰC TRẠNG TÀI LIỆU LƯU TRỮ ĐANG BẢO QUẢN TẠI CỤC LƯU TRỮ QUỐC GIA LÀO 47
2.1 Tổng quan về sự hình thành và phát triển của Cục Lưu trữ Quốc gia Lào 47
2.1.1 Quá trình hình thành và phát triển 47
2.1.2 Chức năng và nhiệm vụ 49
Trang 42.1.3 Cơ cấu tổ chức 49
2.1.4 Tình hình tổ chức cán bộ 50
2.2 Tình hình tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào 50
2.2.1 Tổng quan về lịch sử tài liệu lưu trữ 51
2.2.2 Tình hình chung của tài liệu lưu trữ 53
2.2.3 Tình hình tổ chức tài liệu lưu trữ 56
2.2.4 Tình trạng vật lý và mức độ hư hỏng nội dung thông tin trong tài liệu lưu trữ 64
2.2.5 Tình hình cơ sở vật chất, trang thiết bị 66
2.2.6 Tình hình tổ chức khai thác sử dụng tài liệu lưu trữ 69
2.3 Nhận xét chung 71
CHƯƠNG 3: GIẢI PHÁP TRIỂN KHAI SỐ HÓA TÀI LIỆU LƯU TRỮ ĐANG BẢO QUẢN TẠI CỤC LƯU TRỮ QUỐC GIA LÀO 74
3.1 Tăng cường sự chỉ đạo của Đảng và quản lý của Nhà nước với công tác lưu trữ 75
3.2 Xây dựng kế hoạch về số hóa tài liệu lưu trữ 77
3.3 Xây dựng và từng bước hoàn thiện hệ thống văn bản quản lý nhà nước về công tác lưu trữ 80
3.4 Củng cố, nâng cao chất lượng tổ chức khoa học tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào 86
3.5 Xây dựng quy trình triển khai số hóa tài liệu lưu trữ tại Cục Lưu trữ Quốc gia Lào 87
3.6 Giải pháp cân bằng giữa chất lượng, chi phí, nguồn nhân lực, phương tiện thiết bị và thời gian 100
3.7 Một số đề xuất và định hướng nghiên cứu trong tương lai 102
KẾT LUẬN 105
DANH MỤC TÀI LIỆU THAM KHẢO 108
PHỤ LỤC 114
Trang 5MỞ ĐẦU
1 Lý do chọn đề tài
Tài liệu lưu trữ là di sản văn hoá quý giá của dân tộc, là tài sản vô giá không có gì thay thế được Cho nên, tài liệu lưu trữ cần phải được bảo quản an toàn, kéo dài tuổi thọ lâu dài nhất có thể và tổ chức khai thác sử dụng giá trị thông tin của tài liệu lưu trữ phục vụ nhu cầu chính đáng của toàn thể xã hội, góp phần xây dựng và bảo vệ tổ quốc
Nước Lào có lịch sử hình thành và phát triển lâu đời Trong quá trình
đó đã hình thành nhiều loại hình tài liệu, phong phú, đa dạng và có giá trị rất cao về các mặt Đây là một trong những nguồn sử liệu quan trọng phản ánh quá trình hình thành và phát triển của nhân dân các bộ tộc Lào qua các thời kỳ lịch sử, đồng thời là nguồn thông tin rất quý giá phục vụ cho việc phát triển kinh tế – xã hội Nhưng do hoàn cảnh lịch sử và bị ảnh hưởng bởi nhiều nguyên nhân khác nhau như: chiến tranh, điều kiện bảo quản không đảm bảo, ý thức bảo vệ, sự hiểu biết về giá trị của tài liệu lưu trữ vẫn còn hạn chế… đã và đang đe dọa đến số phận của tài liệu lưu trữ quý, hiếm, có giá trị cao về lịch sử Lào Những tài liệu này một phần đang được
tổ chức bảo quản tại Cục Lưu trữ Quốc gia trực thuộc Bộ Nội Vụ Lào, là đơn vị thực hiện chức năng quản lý nhà nước về công tác văn thư – lưu trữ, đồng thời thực hiện chức năng sự nghiệp về lưu trữ Mặt khác, trong thời gian vừa qua phần lớn tài liệu lưu trữ đang bảo quản tại Cục chưa thực sự phát huy được giá trị vốn có của nó Nhiều tài liệu không được khai thác một cách rộng rãi Điều đó cũng do nhiều nguyên nhân khách quan và chủ quan Một trong số đó là do sự hạn chế về thời gian (thời gian trong việc khai thác, tiếp cận tài liệu…), không gian (vị trí của nơi khai thác hạn chế, khó khăn với những độc giả ở xa…) và hình thức tổ chức khai thác sử dụng tài liệu lưu trữ của Cục chưa thực sự đáp ứng với nhu cầu của độc giả trong việc tiếp cận, khai thác các nguồn thông tin đó
Trang 6Tình trạng tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào, đòi hỏi cơ quan nhà nước có thẩm quyền cần phải có biện pháp khẩn cấp và kịp thời để bảo quản tài liệu lưu trữ quý hiếm và những tài liệu có tần số sử dụng cao đang có nguy cơ bị hư hỏng bằng phương pháp phù hợp, đáp ứng hai yêu cầu cơ bản của công tác lưu trữ Đó là vừa bảo quản
an toàn và kéo dài tuổi thọ tài liệu lưu trữ gốc vừa tổ chức khai thác sử dụng tài liệu lưu trữ phục vụ cho các nhu cầu của xã hội một cách hiệu quả nhất Đây thực sự là một vấn đề rất khó giải quyết và nó tồn tại trong nhiều năm qua Do sự phát triển, tiến bộ của khoa học – kỹ thuật, công nghệ – thông tin, chúng đã tạo ra các giải pháp mới để giải quyết những tồn tại trên Một trong số đó là giải pháp số hoá tài liệu lưu trữ bằng phương pháp quét ảnh (Scan) Phương pháp này đã tạo cơ hội mới cho ngành lưu trữ trong việc bảo quản an toàn tài liệu quý hiếm nói riêng, tài liệu lưu trữ nói chung đang trong tình trạng bị xuống cấp nặng hoặc có tần số sử dụng cao với tính ưu việt như: tăng cường khả năng bảo quản tài liệu lưu trữ gốc bằng cách tạo ra bản sao số hóa chất lượng cao và sử dụng chúng trong việc tổ chức khai thác sử dụng; tăng cường khả năng quản lý, truy cập tài liệu lưu trữ của phía cơ quan lưu trữ lịch sử và độc giả vốn bị hạn chế về mặt không gian và thời gian được tổ chức một cách nhanh chóng, tiết kiệm… Do đó, theo chúng tôi đây là một trong những phương pháp đáp ứng được nguyện vọng mà tình hình thực tế đang đặt ra hiện nay Cho nên, việc triển khai công nghệ số hóa tài liệu lưu trữ đã trở nên một nhu cầu tất yếu, khách quan và cấp thiết mà nhiều cơ quan nhà nước nói chung, Cục Lưu trữ quốc gia Lào nói riêng đang hướng tới
Tuy nhiên, công nghệ số hóa tài liệu lưu trữ đối với ngành lưu trữ Lào còn đang là vấn đề rất mới mẻ, chưa có nhiều kinh nghiệm trong việc triển khai thực hiện Để triển khai số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào được tiến hành một cách hiệu quả, đảm bảo chất lượng theo tiêu chuẩn quốc tế, mang lại lợi ích thiết thực cho xã hội đòi hỏi phải nghiên cứu một cách kỹ càng, toàn diện về các vấn đề,
Trang 7bối cảnh, quy trình công việc… liên quan tới việc triển khai số hóa tài liệu lưu trữ, nhằm tránh những rủi ro, lãng phí tiền của, thời gian, sức lực
để đem lại lợi ích thiết thực cho xã hội Vì vậy, để làm cơ sở khoa học và thực tiễn cho việc triển khai số hóa tài liệu lưu trữ dự kiến sẽ tiến hành
trong thời gian sắp tới, chúng tôi đã chọn đề tài “Nghiên cứu triển khai
số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào”
làm nội dung nghiên cứu luận văn thạc sĩ của mình
2 Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu chính của đề tài là nghiên cứu đề xuất các giải pháp để triển khai số hóa khối tài liệu lưu trữ hành chính đang bảo quản tại Cục Lưu trữ Quốc gia Lào bằng máy quét phẳng (Flatbed Scanner) Ngoài ra, đề tài còn hướng tới mục tiêu lâu dài là làm cơ sở cho việc lập bản sao bảo hiểm cho khối tài liệu lưu trữ này trong tương lai
Để có thể thực hiện mục tiêu, chúng tôi đã xác định nhiệm vụ nghiên cứu của đề tài bao gồm:
- Nghiên cứu, tổng hợp cơ sở lý luận, kinh nghiệm về số hóa tài liệu lưu trữ với mục đích bảo quản và tổ chức khai thác sử dụng tài liệu lưu trữ của các nước có nền lưu trữ tiến bộ như: Mỹ, Nga, Úc Trên cơ sở đó khái quát một cách hệ thống, lựa chọn hợp lý và vận dụng sáng tạo vào hoàn cảnh thực tế của Lào và làm nền tảng trong suốt quá trình nghiên cứu luận văn
- Tiến hành khảo sát thực tế tình hình tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào và việc triển khai số hóa tài liệu lưu trữ tại một số cơ quan lưu trữ ở Việt Nam làm đối tượng so sánh, rút kinh nghiệm
để áp dụng vào Lào
- Trên cơ sở đó đề xuất các giải pháp nhằm định hướng và tổ chức triển khai số hóa khối tài liệu lưu trữ hành chính đang bảo quản tại Cục Lưu trữ Quốc gia Lào đảm bảo theo mục tiêu đã đề ra
Trang 83 Đối tƣợng và phạm vi nghiên cứu
+ Đối tượng nghiên cứu của đề tài bao gồm:
- Các phông tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia
Bộ Nội Vụ Lào
- Các tài liệu của nước ngoài liên quan đến việc thực hiện dự án số hóa trong ngành lưu trữ như: tài liệu về tiêu chuẩn, báo cáo thực hiện dự
án, cẩm nang thực hiện và quản lý dự án số hóa
- Các phương pháp, công nghệ, quy trình số hóa tài liệu
- Khảo sát quá trình thực hiện nghiệp vụ số hóa tại một số cơ quan lưu trữ Việt Nam như: Trung tâm Lưu trữ Quốc gia I và Trung tâm Lưu trữ Quốc gia III
+ Phạm vi nghiên cứu của đề tài:
- Đối với tài liệu lưu trữ: Đề tài tập trung nghiên cứu việc số hóa khối tài liệu lưu trữ hành chính trên vật mang tin bằng giấy đang bảo quản tại Cục Lưu trữ Quốc gia Lào (vì đây là tài liệu lưu trữ chiếm số lượng nhiều nhất trong các loại hình đang bảo quản tại Cục) Các loại hình tài liệu lưu trữ trên vật mang tin khác như: phim, ảnh, ghi âm, băng, tài liệu xây dựng cơ bản, tài liệu khoa học-kỹ thuật… sẽ không thuộc phạm vi nghiên cứu của đề tài này
- Đối với phương pháp số hóa: chủ yếu tập trung nghiên cứu và sử dụng phương pháp số hóa bằng máy quét phẳng (Flabed Scanner) để triển khai số hóa (vì đây là loại máy có khả năng ứng dụng cao trong hoàn cảnh của Cục), còn các loại máy, thiết bị số hóa khác sẽ không được đề cập chi tiết tại đề tài này
- Ngoài ra, đề tài còn đề cập đến vấn đề lập bản sao bảo hiểm khối tài liệu lưu trữ này trong tương lai
Trang 94 Lịch sử nghiên cứu
Công nghệ kỹ thuật số hóa đã hình thành vào cuối thế kỷ XX và phát triển rất nhanh vào đầu thế kỷ XXI Công nghệ kỹ thuật số nói chung, kỹ thuật số hóa nói riêng đã mở ra kỷ nguyên mới về sự tiến bộ của nhân loại,
là thời đại kỹ thuật số Với ưu điểm nổi bật của nó đã làm cho kỹ thuật mới này nhanh chóng phổ biến trên toàn thế giới, nhiều nước đã và đang nghiên cứu và tiến hành dự án số hóa tài liệu với quy mô khác nhau Trong số đó phải kể đến một số nước tiêu biểu với quy mô lớn như: Mỹ, Nga, Đức, Trung Quốc, Úc… Lĩnh vực tiêu biểu đi đầu trong việc áp dụng công nghệ này là thư viện, bảo tàng và lưu trữ với mục tiêu bảo quản, bảo hiểm tài liệu nguyên bản gốc, sách, phim, ảnh, ghi âm… đang trong tình trạng bị xuống cấp, có yêu cầu sử dụng cao… và tăng cường, tạo điều kiện cho việc khai thác sử dụng, chia sẻ nguồn thông tin một cách nhanh chóng, hiệu quả Ví dụ:
- Cục Lưu trữ Quốc gia Liên bang Nga đã triển khai dự án số hóa
“Tài liệu trong kỷ nguyên Xô Viết”, nhân kỷ niệm ngày Nước Nga
12/6/2013 với số lượng khoảng 300.000 bản điện tử các tài liệu của Bộ Chính trị Liên Xô từ năm 1919-1932 và những tư liệu về Stalin được sử dụng rộng rãi qua mạng internet1
- Cuốn sách chuyên khảo: “Phục hồi văn bản mờ dần và phục chế tài
liệu lưu trữ của A.G Kharitonov” 2
năm 2006 đã dành 1 chương giới thiệu
về “Sử dụng công nghệ kỹ thuật số trong phục chế tài liệu hư tổn” và 1
chương hướng dẫn kỹ thuật hiệu chỉnh hình ảnh của tài liệu nhập vào máy
- Báo cáo kỹ thuật “Resolution as it Relates to Photographic and Electronic Imaging (AIIM TR26-1993)” do Uỷ ban tiêu chuẩn về quản lý chất lượng ảnh và thông tin của Mỹ đưa ra năm 1993 - C10 Standards Committee of the Association of image and Information Management
1 Nguồn http://vtv.vn/Thoi-su-quoc-te/Nga-so-hoa-Tai-lieu-trong-ky-nguyen-Xo-Viet/71336.vtv, ngày cập nhật [25/8/2013 3:00 PM]
2 Nguồn http://vanthuluutru.com/index.php?option=com_ccboard&view=postlist&forum=9&topic=108&Itemid=41
Trang 10(AIIM) Đây được coi là nền tảng quan trọng trong việc xác định chuẩn chất lượng của tài liệu số hóa cho đến nay
Tại Việt Nam, nhiều dự án số hóa đã được tiến hành tiêu biểu là trong ngành lưu trữ, thư viện và phim điện ảnh Về lĩnh vực lưu trữ, một số
dự án cấp quốc gia đã được tiến hành như: dự án số hóa tài liệu châu bản
và mộc bản Triều Nguyễn năm 1993-2003, Đề án bảo hiểm tài liệu lưu trữ Quốc gia, các Trung tâm lưu trữ Quốc gia I, II, III đều có dự án số hóa tài liệu lưu trữ nhằm mục đích bảo hiểm, tăng cường việc tổ chức khai thác sử dụng, tại một số lưu trữ tỉnh, huyện cũng đã bắt đầu thực hiện dự án số hóa tài liệu lưu trữ Nhiều văn bản quy phạm pháp luật và hướng dẫn nghiệp vụ
đã được ban hành như: Luật lưu trữ, Nghị định số 01/2013/NĐ-CP ngày 03/01/2013 của Chính phủ quy định chi tiết thi hành một số điều của Luật lưu trữ… Trong lĩnh vực nghiên cứu có một số luận văn nghiên cứu liên quan đến vấn đề số hóa tài liệu lưu trữ Ví dụ:
- Luận văn thạc sĩ do tác giả Nguyễn Thị Tâm, tên đề tài “Các giải
pháp bảo hiểm tài liệu giấy tại các Trung tâm Lưu trữ Quốc gia” thực hiện
năm 2003, nội dung đề tài này đã đề cập, phân tích đến các giải pháp có khả năng áp dụng trong bảo hiểm tài liệu giấy như: giải pháp công nghệ microfilm, số hóa, microfilm-số hóa và một số giải pháp khác Đề tài cũng
có đề cập đến việc áp dụng công nghệ số hóa nhưng chỉ mang tính chất giới thiệu, không đi sâu trong việc triển khai số hóa tài liệu lưu trữ
- Gần đây có đề tài khoa học cấp Bộ: “Nghiên cứu các giải pháp số
hóa tài liệu lưu trữ giấy quý, hiếm có tình trạng mờ chữ để lập bản sao bảo hiểm” do Ths Nguyễn Thị Hà làm chủ nhiệm đề tài, được nghiệm thu vào
cuối tháng 7/2013 Đề tài này chủ yếu tập trung trong việc nghiên cứu cơ
sở lý luận và đề xuất các giải pháp lựa chọn công nghệ để số hóa phù hợp đối với tài liệu lưu trữ giấy quý, hiếm có tình trạng mờ chữ để lập bản sao bảo hiểm Ngoài ra còn có nhiều bài viết trên tạp chí chuyên ngành cũng đề
Trang 11cập đến vấn đề số hóa nhưng phần lớn chỉ mang tính chất giới thiệu, chưa
đi sâu về vấn đề triển khai cụ thể
Trong lĩnh vực thư viện, hiện nay các cơ quan quản lý, cơ quan sự nghiệp… đang có xu hướng triển khai xây dựng thư viện điện tử, trong đó việc số hóa nguồn tài liệu, sách, ấn phẩm… là một trong những nội dung quan trọng để chuyển đổi từ hình thức thư viện truyền thống sang thư viện điện tử Do đó, việc nghiên cứu để xây dựng mô hình và tổ chức triển khai các dự án số hóa các nguồn tài nguyên thông tin này ngày càng được quan tâm và diễn ra một cách rộng rãi Ví dụ:
- Dự án “Số hóa kho tàng thư tịch cổ Hán - Nôm” do Hội Bảo tồn di
sản chữ Nôm và Thư viện Quốc gia Việt Nam phối hợp thực hiện từ năm 2007-2009, kết quả của dự án: lập biên mục sách chọn số hóa; chụp và xử
lý 1158 cuốn sách Hán-Nôm với 78536 file ảnh; tạo lập cơ sở dữ liệu các cuốn sách đã được số hóa và đưa lên mạng internet.3
- Đề tài nghiên cứu cấp Bộ “Nghiên cứu xây dựng mô hình thư viện
điện tử về khoa học công nghệ tại cơ quan thông tin khoa học công nghệ địa phương” do Thạc sĩ Nguyễn Tiến Đức làm chủ nhiệm đề tài năm 2005
Đề tài đề cập về vấn đề xây dựng mô hình thư viện điện tử bằng cách áp dụng phương pháp số hóa tài liệu đối với các tài liệu thuộc lĩnh vực khoa học công nghệ hình thành trong hoạt động của các cơ quan thông tin khoa
học công nghệ ở cấp địa phương của Việt Nam
Đối với nước Lào, việc ứng dụng công nghệ số hóa vào công tác lưu trữ vẫn đang là vấn đề rất mới Trong thời gian vừa qua tại Cục Lưu trữ Quốc gia Lào đã bắt đầu thử nghiệm số hóa một số phông tài liệu lưu trữ giai đoạn trước năm 1975 Tuy nhiên, do không có sự nghiên cứu về lý luận và thực tiễn công nghệ số hóa vào trong lĩnh vực lưu trữ, cho nên hiện nay công việc này đang tạm dừng Sau khi tìm hiểu và khảo sát lịch sử nghiên cứu vấn đề số hóa tài liệu lưu trữ ở nước ngoài nói chung và ở Việt
3 Nguồn: http://www.cinet.gov.vn/ArticleDetail.aspx?articleid=46214&sitepageid=52, ngày cập nhật [23/8/2013
Trang 12Nam, Lào nói riêng, chúng tôi thấy rằng từ trước đến này chưa có công trình
nghiên cứu nào nghiên cứu về đề tài “Nghiên cứu triển khai số hóa tài liệu
lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào” Vì vậy, đây là một
đề tài nghiên cứu hoàn toàn mới và chưa có công trình nào đề cập đến
5 Phương pháp nghiên cứu
Trong quá trình thực hiện đề tài, chúng tôi đã vận dụng phương pháp của chủ nghĩa duy vật biện chứng và chủ nghĩa duy vật lịch sử để làm kim chỉ nam cho quá trình thực hiện đề tài, có thể khái quát như sau :
+ Phương pháp phân tích và tổng hợp: trong quá trình nghiên cứu, chúng
tôi đã thu thập được nhiều nguồn tài liệu của các tác giả khác nhau trong và ngoài nước Phương pháp này được vận dụng để vạch ra nội dung cốt lõi của vấn đề từ các nguồn tài liệu đó và tổng hợp chúng một cách hệ thống, khách quan
+ Phương pháp khảo sát: chúng tôi đã áp dụng phương pháp này để khảo
sát thực tế tình hình tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào, quá trình thực hiện nghiệp vụ số hóa của Trung tâm Lưu trữ Quốc gia I
và Trung tâm Lưu trữ Quốc gia III ở Việt Nam để thu thập dữ liệu thực tế
+ Phương pháp so sánh: do nội dung liên quan đến quy trình thực hiện số
hóa tài liệu tương đối đa dạng, cho nên chúng tôi đã vận dụng phương pháp này để so sánh sự tương đồng và sự khác nhau của các quy trình số hóa tài liệu Trên cơ sở đó chúng tôi rút ra được những ưu điểm và hạn chế để lựa chọn quy trình số hóa tài liệu hợp lý nhất phù hợp với điều kiện của Cục Lưu trữ quốc gia Lào
+ Phương pháp phỏng vấn: Trong quá trình khảo sát thực tế, chúng tôi đã
áp dụng phương pháp phỏng vấn trực tiếp với một số lãnh đạo, cán bộ chủ chốt đang đảm nhiệm nhiệm vụ triển khai số hóa tài liệu lưu trữ tại Trung tâm Lưu trữ Quốc gia I, Trung tâm Lưu trữ Quốc gia III và một số nơi khác Đây là nguồn thông tin rất quý giúp chúng tôi hiểu sâu hơn về tình
Trang 13hình, kết quả trong việc triển khai số hóa của họ, đồng thời rút ra bài học kinh nghiệm khi vận dụng vào quá trình nghiên cứu luận văn của mình
Ngoài ra, các phương pháp thống kê, phương pháp lô gíc… cũng được chúng tôi kết hợp sử dụng trong quá trình nghiên cứu Chúng đã giúp chúng tôi nhìn nhận các vấn đề trong quá trình triển khai số hóa tài liệu lưu trữ một cách toàn diện, đầy đủ và khách quan về mọi khía cạnh của vấn đề
6 Nguồn tài liệu tham khảo
Việc ứng dụng công nghệ số hóa vào công tác lưu trữ là vấn đề mới đối với ngành lưu trữ Lào Còn các nước có nền lưu trữ phát triển, họ đã đi trước và có rất nhiều bài học kinh nghiệm trong quá trình triển khai các dự
án số hóa tài liệu lưu trữ Cho nên trong quá trình nghiên cứu chúng tôi đã
sử dụng các nguồn tài liệu chủ yếu viết bằng tiếng Anh, Việt và Lào về các vấn đề như :
+ Tài liệu về lý luận:
- Đào Xuân Chúc – Nguyễn Văn Hàm – Vương Định Quyền – Nguyễn Văn Thâm (1990), Lý luận và thực tiễn công tác lưu trữ, NXB Đại học và
Giáo dục chuyên nghiệp, Hà Nội
- Cornell University Library (2003), Moving Theory into Practice Digital
Imaging Tutorial Tài liệu tiếng Anh, có thể tìm đọc tại địa chỉ:
http://www.library.cornell.edu/preservation/tutorial/contents.html
+ Tài liệu quy phạm pháp luật:
- Luật Lưu trữ số: 01/2011/QH13 ban hành ngày 11/11/2011
- Nghị định số 01/2013/NĐ-CP ngày 03 tháng 01 năm 2013 của Chính phủ quy định chi tiết thi hành một số điều của Luật Lưu trữ
+ Tài liệu hướng dẫn thực hiện nghiệp vụ :
- Tài liệu hướng dẫn do tác giả: Sitts, Maxine K (2000), Handbook for
Digital Projects: A Management Tool for Preservation and Access,
Andover, Northeast Document Conservation Center, Massachusetts
Tài liệu tiếng Anh, có thể tìm đọc tại địa chỉ:
www.nedcc.org/assets/media/documents/dman.pdf
Trang 14+ Tiêu chuẩn kỹ thuật số hóa:
- Tiêu chuẩn kỹ thuật số hóa do nhóm tác giả Anne R Kenney and Stephen Chapman, Department of Preservation and Conservation Cornell
University (1995), Digital Resolution Requirements for Replacing
Text-Based Material: Methods for Benchmarking Image Quality, Washington,
DC Tài liệu tiếng Anh, có thể tìm đọc tại địa chỉ:
http://www.clir.org/pubs/reports/pub53
- Nhóm tác giả Steven Puglia, Jeffrey Reed, and Erin Rhodes, (2004), Technical
Guidelines for Digitizing Archival Materials for Electronic Access: Creation of Production Master files – Raster Images, National Archives and Records
Administration of US (NARA) Tài liệu tiếng Anh, có thể tìm đọc tại địa chỉ: http://www.digitizationguidelines.gov/guidelines/digitize-technical.html
+ Các sách chuyên khảo:
- Viện nghiên cứu toàn Nga về văn bản học và công tác lưu trữ (2006),
Phục hồi văn bản mờ dần và phục chế tài liệu lưu trữ, Matxcơva,
(TS.Nguyễn Lệ Nhung dịch tháng 11/2011), có thế tìm đọc tại địa chỉ: http://vanthuluutru.com/index.php?option=com_ccboard&view=postlist&f
orum=9&topic=108&Itemid=41
+ Luận án tiến sĩ, luận văn thạc sĩ, đề tài nghiên cứu khoa học, các bài viết đăng trên tạp chí khoa học :
- PGS.TS Dương Văn Khảm (2013), Số hóa tài liệu lưu trữ - yêu cầu thực
tiễn, bài đăng trên trang tin điện tử Có thể tìm đọc tại địa chỉ:
http://my.opera.com/duongvankham/blog/show.dml/59069102
+ Các trang thông tin điện tử… có nội dung liên quan đến lĩnh vực số hóa tài liệu lưu trữ :
- www.archives.gov; www.archives.gov.vn; www.vanthuluutru.com
Ngoài ra, còn sử dụng các nguồn tài liệu khác như: ảnh chụp, các thông tin thông qua phỏng vấn trực tiếp với cán bộ lưu trữ trong quá trình khảo sát thực tế tại Cục Lưu trữ Quốc gia Lào và một số cơ quan lưu trữ của Việt Nam
Trang 157 Đóng góp của đề tài
- Trước tiên, kết quả nghiên cứu của đề tài sẽ là cơ sở để áp dụng vào việc triển khai số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào trong thời gian tới Ngoài ra, kết quả nghiên cứu còn làm cơ sở cho việc nghiên cứu, triển khai bảo hiểm tài liệu lưu trữ sau này
- Thứ hai, kết quả nghiên cứu của đề tài sẽ là nguồn tài liệu tham khảo hữu ích cho việc triển khai các dự án số hóa không chỉ tài liệu lưu trữ
mà còn các loại tài liệu khác sẽ được triển khai trong tương lai trên phạm
vi cả nước Lào
- Thứ ba, kết quả nghiên cứu của đề tài sẽ là nguồn tài liệu tham khảo bổ ích cho sinh viên muốn tìm hiểu, đi sâu trong lĩnh vực số hóa tài liệu lưu trữ hiện đang là vấn đề rất mới đối với sinh viên Đặc biệt được biết thêm nguồn thông tin về tình trạng tài liệu lưu trữ và các giải pháp, cách thức triển khai số hóa tài liệu lưu trữ trong bối cảnh của Cục Lưu trữ Quốc gia Lào
8 Bố cục của đề tài
Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo, phụ lục, phần nội dung của đề tài được trình bày trong 3 chương:
Chương 1: Tổng quan về số hóa tài liệu lưu trữ
Nội dung chương 1, tác giả tập trung làm rõ những khái niệm, quan điểm liên quan đến một số khái niệm, thuật ngữ cơ bản về số hóa tài liệu lưu trữ, các từ ngữ chuyên môn; mục đích sử dụng kỹ thuật số hóa đối với tài liệu lưu trữ ; trình bày khái quát, tổng quan về kỹ thuật số hóa, những
ưu điểm, hạn chế của nó Đây là nền tảng về lý thuyết cơ bản của luận văn, đồng thời là cơ sở để áp dụng cho việc triển khai số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào được đề cập tại chương III
Chương 2 : Thực trạng tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào
Nội dung chương 2 như tên gọi của chương, chúng tôi tập trung trình bày khái quát về lịch sử hình thành, chức năng, nhiệm vụ, cơ cấu tổ chức
Trang 16của Cục Lưu trữ Quốc gia Lào ; kết quả khảo sát thực tế về tình hình tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào từ khi thành lập cho đến thời điểm thực hiện đề tài Đây là số liệu thực tế rất quan trọng làm cơ sở cho việc đề ra các giải pháp, xây dựng cách thức triển khai số hóa tài liệu lưu trữ phù hợp và hiệu quả
Chương 3: Giải pháp triển khai số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào
Nội dung chương 3 là phần trọng tâm của luận văn, chúng tôi tập trung trình bày và đề xuất các giải pháp để làm cơ sở cho việc triển khai số hóa tài liệu lưu trữ của Cục Lưu trữ Quốc gia Lào dự kiến sẽ được tiến hành trong tương lai gần Các giải pháp này nhằm triển khai số hóa tài liệu lưu trữ đảm bảo tính hiệu quả cao, mang lại lợi ích thiết thực cho Cục và
xã hội Đồng thời đảm bảo sự cân bằng giữa chất lượng, chi phí, nguồn nhân lực, thời gian, nhu cầu của người sử dụng và khả năng kỹ thuật phù hợp theo tiêu chuẩn quốc tế tại Cục Lưu trữ Quốc gia Lào
Đề tài mang tính kỹ thuật, thực tiễn cao Do trình độ nghiên cứu, kinh nghiệm thực tế còn hạn chế cho nên nội dung được trình bày trong luận văn sẽ không tránh khỏi khiếm khuyết, sai sót Vì vậy, chúng tôi rất
hy vọng sẽ nhận được những góp ý của các thầy cô giáo và bạn đọc, để tiếp tục nghiên cứu cho hoàn thiện hơn
Trang 17CHƯƠNG 1 TỔNG QUAN VỀ SỐ HÓA TÀI LIỆU LƯU TRỮ
1.1 Một số khái niệm, thuật ngữ cơ bản về số hóa tài liệu lưu trữ
Để nghiên cứu quá trình số hóa tài liệu lưu trữ một cách đầy đủ về các khía cạnh, một trong những công việc rất quan trọng đầu tiên là chúng
ta cần tìm hiểu, tham khảo và đưa ra quan điểm của mình về các khái niệm liên quan đến nội dung nghiên cứu Việc số hóa tài liệu lưu trữ là một lĩnh vực liên quan tới việc áp dụng kỹ thuật – công nghệ Do đó, nó sẽ có những khái niệm, thuật ngữ mang tính chất chuyên môn riêng Vì vậy, việc làm rõ những khái niệm, thuật ngữ cơ bản trong lĩnh vực số hóa tài liệu lưu trữ là một việc cần thiết trước khi đi vào nội dung cụ thể, đồng thời đây là nền tảng được chúng tôi áp dụng trong suốt quá trình nghiên cứu luận văn
Trên cơ sở nghiên cứu, tham khảo một số định nghĩa có liên quan đến lĩnh vực số hóa tài liệu lưu trữ trong và ngoài nước, chúng tôi đã khái quát một số định nghĩa tiêu biểu và đưa ra quan điểm của mình cụ thể như sau:
+ Một số khái niệm cơ bản (thông tin, tài liệu, tài liệu lưu trữ, số hóa, số hóa tài liệu lưu trữ):
Mục đích của phần này nhằm làm rõ khái niệm số hóa tài liệu lưu trữ Nhưng để hiểu được một cách đầy đủ, chúng ta cần làm rõ một số khái niệm liên quan như: thông tin, tài liệu, tài liệu lưu trữ, số hóa, đồng thời đây thể hiện quan điểm của chúng tôi với các thuật ngữ này, cụ thể như sau:
* “Thông tin” (Information):
Theo nghĩa thông thường: thông tin là tất cả các sự việc, sự kiện, ý tưởng, phán đoán làm tăng thêm sự hiểu biết của con người Trên quan
điểm triết học: “Thông tin là sự phản ánh của tự nhiên và xã hội (thế giới
vật chất) bằng ngôn từ, ký hiệu, hình ảnh… hay nói rộng hơn bằng tất cả các phương tiện tác động lên giác quan của con người” [25;tr14]
Trang 18Tóm lại, chúng ta có thể hiểu thuật ngữ thông tin là tri thức mà con người nhận biết được thông qua giác quan của con người Nó không thể sờ thấy được, là một thứ gì đó rất trừu tượng, chỉ khi nó được biểu diễn trong một hình thức nhất định (ngôn ngữ, ký hiệu, hình ảnh…) được phản ánh vào giác quan của con người thì chúng ta mới nhận thấy được nó Khi nó được thể hiện bằng dữ liệu trong một tài liệu, thông tin mới có thể được lưu giữ, truyền đạt và sử dụng Do đó, thông tin là tri thức được truyền đạt (Information: Knowledge that is communicated) [49; page 5]
* “Tài liệu” (Records):
Nghiên cứu các định nghĩa về tài liệu của các nước từ trước đến nay thấy rằng thuật ngữ tài liệu được định nghĩa sớm hơn nhấn mạnh về sự chú
ý vào đối tượng vật chất – vật mang thông tin như tiêu chuẩn quốc gia đầu tiên ở nước Nga về thuật ngữ GOST 16487-70 “Văn thư và công tác lưu
trữ, các thuật ngữ và định nghĩa”, “Tài liệu là phương tiện để giữ lại các
tin tức về những sự việc, sự kiện, hiện tượng của thực tiễn khách quan và hoạt động tư duy của con người”.4
Còn những định nghĩa muộn hơn lại dành sự chú ý nhiều hơn tới thành tố thông tin của tài liệu như định nghĩa
của tiêu chuẩn quốc tế ISO 15489 “Tài liệu là thông tin được tạo ra, nhận
được và lưu trữ như là các bằng chứng và thông tin được tạo ra bởi một tổ chức hoặc cá nhân trong quá trình thực hiện nghĩa vụ pháp lý hoặc giải quyết công việc 5 ”[46;9]
Dù định nghĩa khác nhau nhưng tài liệu có hai đặc trưng nổi bật Đặc trưng thứ nhất là thông tin được cố định trong tài liệu có sự tham gia có ý thức của con người Cho nên tài liệu phản ánh quá trình quản lý hoặc hoạt động của cá nhân; tài liệu không chỉ là một tập hợp đơn giản các dữ liệu
mà là kết quả hoặc sản phẩm của một sự kiện nào đó Đặc trưng thứ hai có
4 TS Nguyễn Lệ Nhung, Vài nét về khái niệm “tài liệu”, “tài liệu điện tử”, địa chỉ:
http://www.archives.gov.vn/content/Lists/Tin%20nghin%20cu%20trao%20i/DispForm.aspx?ID=17
ngày đăng 24/3/2009 [8.00 AM]
5 “Records: Information created, received, and maintained as evidence and information by an organization or
Trang 19vai trò không kém phần quan trọng trong hoạt động quản lý và hoạt động của cá nhân là một phần nội dung tạo nên tài liệu có tính chất pháp lý Đó
là khả năng làm bằng chứng của tài liệu
Tài liệu phải đảm bảo 3 yếu tố thông tin như: nội dung (Content), cấu trúc (Structure) và bối cảnh (Context)
Điều này giúp chúng ta phân biệt với thuật ngữ Bản ghi (Document)6
mà đặc trưng cơ bản của bản ghi là tính năng động của nó Các bản ghi có thể được thành lập bởi tổ hợp nhiều người lập, có thể tồn tại ở nhiều phiên bản khác nhau trên các bước soạn thảo trong các thời kỳ khác nhau Đặc trưng then chốt của tài liệu là tính không thay đổi Cho nên, tài liệu khác với bản ghi ở chỗ nó là chứng cứ hoạt động của cơ quan hoặc cá nhân trong xã hội, nó có hiệu lực pháp lý Chính sự khác biệt này sẽ giúp chúng
ta phân biệt rõ ràng về ranh giới của tài liệu lưu trữ (bản gốc trên vật mang tin bằng giấy) với bản sao tài liệu lưu trữ đó bằng kỹ thuật khác nhau như: bản sao bằng kỹ thuật số, bản sao bằng kỹ thuật in, bản sao microfilm những bản sao này có được coi như là tài liệu theo nghĩa này hay không? câu trả lời nó phụ thuộc ở yếu tố thể hiện tính pháp lý làm bằng chứng của tài liệu đó Nếu bản sao đó được sao y nguyên bằng các kỹ thuật sao chụp nhưng không có yếu tố pháp lý làm bằng chứng cho bản sao này thì nó cũng chỉ là một bản sao, không có giá trị về mặt pháp lý Vì vậy, tài liệu khác với thông tin và các dữ liệu ở chỗ nó là bằng chứng hoạt động của một tổ chức hoặc một cá nhân trong xã hội Bằng chứng của tài liệu thể hiện thông qua các yếu tố đảm bảo về tính pháp lý như: chữ ký của người
có thẩm quyền, dấu của cơ quan
* “Tài liệu lưu trữ” (Archives, historical value record, enduring record):
Hiện nay, do sự xuất hiện của nhiều loại hình tài liệu lưu trữ khác nhau đặc biệt là tài liệu lưu trữ điện tử Điều này dẫn đến các nhà lưu trữ
Trang 20hiện nay quan niệm và nhìn nhận về khái niệm tài liệu lưu trữ có phần khác nhau, chưa thống nhất Trong đó tồn tại hai quan điểm chủ yếu:
Một, quan điểm tài liệu lưu trữ mang tính chất nhấn mạnh về yếu tố vật lý, cố định thống nhất với nhau giữa vật mang tin và nội dung thông tin Coi tài liệu lưu trữ chỉ có duy nhất bản gốc, bản chính hoặc trường hợp không có bản gốc, bản chính thì được thay thế bằng bản sao hợp pháp Đối với quan niệm này các phiên bản sao bảo hiểm mọi hình thức (sao bằng kỹ thuật số, chụp microfilm…) từ tài liệu lưu trữ trên vật mang tin bằng giấy… không được coi là tài liệu lưu trữ, chỉ được coi như là bản sao Ví dụ: bản sao tài liệu lưu trữ bằng kỹ thuật số hóa từ tài liệu trên vật mang tin bằng giấy không được coi là tài liệu lưu trữ điện tử
Hai, quan điểm tài liệu lưu trữ không nhấn mạnh về yếu tố vật lý của tài liệu nhưng nhấn mạnh yếu tố thông tin chứa trong tài liệu Đây là quan niệm mới về tài liệu lưu trữ Điều này xuất phát từ sự xuất hiện và đặc điểm của tài liệu điện tử Vì vật mang tin và nội dung thông tin không
cố định với nhau Do đó, việc quan niệm tài liệu lưu trữ nhấn mạnh về yếu tố vật mang tin sẽ không còn phù hợp với trường hợp của tài liệu điện
tử Mặt khác, sự xuất hiện của công nghệ hiện đại đã tạo điều kiện, sự lựa chọn mới đối với công tác bảo hiểm tài liệu lưu trữ Những phiên bản bảo hiểm này được sao từ tài liệu lưu trữ gốc trên vật mang tin bằng giấy… bằng kỹ thuật số, microfilm… vẫn được coi là tài liệu lưu trữ khi nội dung thông tin đã đáp ứng đầy đủ các yếu tố pháp lý, chứng cứ, độ tin cậy, độ xác thực của tài liệu đó Tuy nhiên, xét về giá trị của các bản gốc, bản chính và bản sao đó thì bản gốc, bản chính vẫn là bản có giá trị cao nhất về mọi khía cạnh Do đó, các bản sao không có giá trị thay thế hoàn toàn bản gốc, bản chính Chỉ có giá trị như tài liệu gốc trong các quan hệ, giao dịch khi được cơ quan có thẩm quyền chứng thực, cho phép theo luật định hoặc trong trường hợp tài liệu gốc đã bị mất đi, phá hủy hoàn toàn
Trang 21do thiên tai, chiến tranh… thì bản sao bảo hiểm sẽ được sử dụng như bản chính theo luật định
Dù quan điểm khác nhau thì một trong những yếu tố quan trọng nhất của tài liệu lưu trữ vẫn là thông tin có giá trị cao và khả năng làm bằng chứng, độ tin cậy, độ xác thực của nội dung thông tin chứa trong tài liệu trên bất kỳ vật mang tin được pháp luật công nhận trong mọi quan hệ, giao dịch trong xã hội
Trên cơ sở nghiên cứu các quan điểm, chúng tôi đã mạnh dạn đưa ra quan điểm của mình đối với tài liệu lưu trữ như sau:
“Tài liệu lưu trữ là khái niệm chỉ những tài liệu có giá trị ở các mức
độ khác nhau về chính trị, khoa học, kinh tế, xã hội và các lĩnh vực khác không phụ thuộc vào vật mang tin, thời gian hình thành, nơi bảo quản, thuộc sử hữu của nhà nước hoặc tư nhân được lựa chọn để lưu trữ phục vụ hoạt động thực tiễn, nghiên cứu khoa học và lịch sử
Tài liệu lưu trữ bao gồm bản gốc, bản chính, bản sao hợp pháp không phụ thuộc vào kỹ thuật sao (bao gồm bản sao bằng công nghệ kỹ thuật số, microfilm hoặc bất kỳ hình thức sao khác được công nhận, đáp ứng yếu tố pháp lý theo pháp luật quy định) Trong trường hợp tài liệu lưu trữ tồn tại nhiều phiên bản như: bản gốc, bản chính (bằng kỹ thuật tạo lập nguyên bản) và các loại bản sao hợp pháp thì bản sao hợp pháp không có giá trị thay thế bản gốc, bản chính nhưng có giá trị như bản gốc,bản chính được sử dụng trong các quan hệ, giao dịch khi được các cơ quan lưu trữ hoặc cơ quan có thẩm quyền cho phép theo luật định”
Hiện nay, thuật ngữ bản gốc, bản chính và bản sao hợp pháp của tài liệu lưu trữ phần lớn vẫn được hiểu và áp dụng theo nghĩa truyền thống để phân biệt, chủ yếu trên vật mang tin bằng giấy Nhưng nếu áp dụng vào trong trường hợp của tài liệu lưu trữ điện tử sẽ gặp một số vấn đề bất cập
để phân biệt với nhau do tính không cố định của vật mang tin với nội dung thông tin hoặc đối với tài liệu tồn tại nhiều phiên bản do kỹ thuật tạo lập
Trang 22khác nhau như trường hợp số hóa tài liệu lưu trữ trên giấy Để giải quyết vấn
đề này, chúng ta nên hiểu thuật ngữ này theo nghĩa của “kỹ thuật đầu tiên
được sử dụng để tạo lập nguyên bản gốc có đầy đủ yếu tố pháp lý, bằng chứng và đảm bảo độ tin cậy làm yếu tố phân biệt tài liệu cùng loại hoặc các loại hình tài liệu tồn tại nhiều phiên bản được tạo lập bằng kỹ thuật khác nhau” Cách hiểu như vậy sẽ giúp chúng ta phân biệt được cái nào là
đầu tiên, nguyên vẹn với những gì nó đã được tạo lập ban đầu, phân biệt tài liệu đang tồn tại có nhiều phiên bản khác nhau… Ví dụ: chúng ta đang có tài liệu được tạo lập trong môi trường điện tử, có đầy đủ các yếu tố pháp lý như chữ ký điện tử – là tài liệu điện tử Nhưng đồng thời bản này đã được in ra giấy và cũng có đầy đủ yếu tố pháp lý Đối với trường hợp này, tài liệu nào
sẽ là bản gốc, tài liệu nào sẽ là bản sao? Giá trị bản nào cao hơn? Theo cách hiểu này, bản gốc sẽ là bản đã được tạo lập bằng kỹ thuật đầu tiên có đầy đủ yếu tố pháp lý và sẽ có giá trị cao hơn Còn bản in ra giấy sẽ là bản sao hợp pháp, giá trị của nó cũng tương đương với bản sao hợp pháp, không có giá trị thay thế bản gốc như trường hợp xác định giá trị của tài liệu lưu trữ trên vật mang tin bằng giấy Vì nhiều trường hợp tính năng của tài liệu điện tử (như tính năng hiển thị, liên kết…) sẽ đảm bảo tính nguyên vẹn, đầy đủ chỉ trong môi trường điện tử Còn khi in ra giấy các tính năng khác sẽ không thể hiển thị được một cách đầy đủ trong môi trường giấy Tương tự như vậy, đối với tài liệu nguyên bản gốc được tạo lập trên vật mang tin bằng giấy có đầy
đủ yếu tố pháp lý Sau đó được số hóa để bảo hiểm hoặc phục vụ mục đích khác thì bản gốc sẽ là tài liệu trên giấy và bản sao sẽ là tài liệu số hóa Tuy nhiên, việc phân biệt như vậy là phục vụ cho việc xác định giá trị tài liệu nhưng về cơ bản cả bản gốc, bản chính và bản sao của tài liệu lưu trữ nếu có đầy đủ yếu tố pháp lý đảm bảo nội dung thông tin là xác thực thì chúng vẫn được coi là tài liệu lưu trữ
Riêng đối với tài liệu lưu trữ điện tử, do đặc điểm của chúng là thông tin không cố định với vật mang tin, tài liệu có thể nhân bản với số lượng bất kỳ vẫn đảm bảo nội dung thông tin nguyên vẹn như bản gốc Mặt
Trang 23khác, do sự lỗi thời của công nghệ và phần mềm, bản thân tài liệu lưu trữ điện tử phải được nâng cấp, chuyển sang phiên bản mới để đảm bảo khả năng tiếp cận, sử dụng và bảo quản Cho nên việc phân biệt cái nào là tài liệu gốc đã trở nên khó khăn Cho nên, đối với tài liệu lưu trữ điện tử người
ta không quan tâm về yếu tố vật mang tin, thay vào đó sẽ quan tâm đến yếu
tố thông tin được tạo lập phải đảm bảo đầy đủ về thông tin đầu vào, yếu tố pháp lý, tính kế thừa, tính thống nhất, độ xác thực trong suốt vòng đời của
nó, được bảo quản trong hệ thống lưu trữ thông tin, được thiết kế đáp ứng nhu cầu đã nêu và áp dụng phương pháp quản lý một cách nghiêm ngặt, khoa học trong suốt vòng đời của chúng Chính các biện pháp này sẽ hỗ trợ, củng cố trong việc đảm bảo yếu tố pháp lý, độ tin cậy, độ xác thực của nội dung thông tin chứa trong tài liệu, nguyên vẹn như chúng đã được tạo lập ban đầu, đồng thời đảm bảo khả năng tiếp cận nội dung thông tin một khi có nhu cầu Việc phân biệt tài liệu nào là bản gốc trong môi trường số chỉ mang tính chất tương đối, nó phụ thuộc vào việc quản lý về mặt kỹ thuật của hệ thống bảo quản thông tin và biện pháp quản lý tài liệu trong suốt vòng đời của chúng Nếu thực hiện tốt, tài liệu điện tử sẽ được bảo quản một cách an toàn Nó chỉ tồn tại một số phiên bản như: bản chính và bản sao để phòng ngừa (bản Backup) Đối với bản phòng ngừa có thể có đến 2-3 bản Những bản này thực chất nội dung thông tin không có gì khác biệt với bản gốc của nó Nhưng nó được coi là bản sao khi phân biệt với bản chính trong hệ thống
Với vấn đề nêu trên, chúng tôi muốn thể hiện quan niệm của mình về một số vấn đề liên quan đến tài liệu lưu trữ nói chung và tài liệu lưu trữ điện tử nói riêng Vì nó có một số vấn đề liên quan đến việc số hóa tài liệu lưu trữ trên vật mang tin bằng giấy sẽ được luận văn đề cập đến Một trong
số đó, theo quan điểm của chúng tôi, bản sao hoặc tài liệu bảo hiểm được
số hóa từ tài liệu lưu trữ trên các vật mang tin bất kỳ (trên giấy…) vẫn được coi là tài liệu lưu trữ khi đáp ứng yếu tố pháp lý theo luật định Khi phân biệt với nhau thì bản số hóa này được gọi là bản sao ở dạng điện tử
Trang 24(do thông tin của nó được thể hiện dưới dạng điện tử) nhưng chúng vẫn là tài liệu lưu trữ - thuộc loại tài liệu lưu trữ điện tử, được bảo quản vĩnh viễn với chế độ đặc biệt Vì vậy, quan niệm này đã được chúng tôi áp dụng suốt quá trình nghiên cứu làm luận văn
* “Số hóa” (Digitising):
Số hoá là hình thức chuyển đổi dữ liệu truyền thống bên ngoài (Analog) thành dạng dữ liệu số (Digital) mà máy tính có thể hiểu được
* “Số hóa tài liệu lưu trữ”:
Theo nghĩa thông thường, số hoá tài liệu lưu trữ là hình thức chuyển đổi thông tin tài liệu lưu trữ ở dạng truyền thống bên ngoài (Analog) thành những thông tin dưới dạng số (Digital) bằng phương tiện điện tử chuyển đổi tín hiệu (máy quét/chụp hình) mà máy tính có thể hiểu được
Để làm rõ khái niệm này chúng ta xem hình minh họa dưới đây:
Hình 1.1: Quy trình số hóa tài liệu lưu trữ trên vật mang tin bằng giấy
Đây là quá trình chuyển đổi tài liệu lưu trữ từ dạng truyền thống thành dạng số Đầu tiên tài liệu lưu trữ sẽ được quét hình bằng máy quét/máy chụp ảnh kỹ thuật số với độ phân giải theo tiêu chuẩn của ngành lưu trữ Sau đó tài liệu sẽ được chuyển từ dạng truyền thống thành dạng số
mà máy tính hiểu được và biểu hiện như hình minh hoạ trên
Trên đây là cách hiểu theo nghĩa hẹp Tuy nhiên, nếu hiểu theo nghĩa rộng, số hóa tài liệu lưu trữ không dừng lại chỉ quét và lưu tài liệu lưu trữ ở Tài liệu lưu trữ Máy quét Scanner Máy vi tính Tài liệu dạng số sau
khi quét
Trang 25dạng số trên phương tiện điện tử mà chúng là một quá trình bao gồm nhiều giai đoạn khác nhau từ giai đoạn chuẩn bị số hóa (xây dựng kế hoạch dự án, mục tiêu, chuẩn bị tài liệu…), giai đoạnh tiến hành số hóa (quét tài liệu, hiệu chỉnh, lưu tài liệu…) và giai đoạn quản lý, sử dụng tài liệu số hóa (xây dựng
hệ thống quản lý, sử dụng cơ sở dữ liệu an toàn, tin cậy, bảo trì, nâng cấp hệ thống…) Chúng gắn kết với mục tiêu được xác định như: tăng cường việc bảo quản bản gốc và phát huy giá trị tài liệu lưu trữ bằng cách tăng khả năng tiếp cận tài liệu lưu trữ ở dạng số thay việc sử dụng bản gốc của tài liệu Vì vậy, số hóa tài liệu lưu trữ là việc thực hiện các công việc của chuỗi số hóa hoặc quy trình số hóa tài liệu lưu trữ từ giai đoạn chuẩn bị cho đến giai đoạn quản lý, sử dụng theo mục tiêu đã định, đảm bảo độ chính xác, độ tin cậy và
độ xác thực của bản sao dạng số so với nguyên bản gốc
+ Một số thuật ngữ chuyên môn về ảnh số, máy quét và máy tính:
Hình 1.2:Yếu tố cấu thành của ảnh số mành (Bitmap image)
- Ảnh số (Digital image): ảnh số là hình ảnh được ghi nhận bởi bộ
cảm biến điện tử (bằng máy quét, máy chụp ảnh số hoặc thiết bị tương tự)
từ văn bản, ảnh được lưu lại dưới dạng dữ liệu trong bộ nhớ của phương tiện điện tử (có thể là thẻ nhớ, đĩa cứng, đĩa mềm…) Ảnh số được tạo nên bởi các điểm ảnh (Pixel), mỗi điểm ảnh nhận một giá trị thông tin màu sắc lấy được từ sự kết hợp của số nhị phân (Bit) để biểu thị màu trong một
Trang 26điểm ảnh (có thể là màu đen, màu xám, đỏ…) Ảnh số có thể được tạo bởi màu đen trắng, màu dải xám hoặc màu thực
- Điểm ảnh (Pixel): là đơn vị nhỏ nhất cấu tạo nên một ảnh số được
biểu thị trên màn hình điện tử (màn hình máy tính, màn hình tivi…)
- Số Bit (Bit): Đơn vị nhỏ nhất của thông tin trong hệ thống nhị
phân Bit có thể được biểu diễn như là một biến chỉ có hai giá trị: 0 hoặc 1 Trong ảnh số, Bit là thông tin biểu thị giá trị màu trong một điểm ảnh
- Số Byte: là một sự kết hợp các bit để biểu hiện một ký tự Một byte
thường bao gồm 8 bit, tức là 8 bit = 1 byte 1 byte có thể thể hiện 256 trạng thái của thông tin Byte được sử dụng để đo dung lượng thông tin trong ổ đĩa như: 1 kilobyte = 1.024 byte (nếu tính theo chuẩn của Microsoft – dùng
hệ nhị phân) hoặc = 1.000 byte (nếu tính theo chuẩn của IBM - dùng hệ thập phân)
- Nén (Compression): là phương pháp xử lý dữ liệu để làm giảm
kích cỡ của tệp file
- DPI (Dots per inch): là số lượng điểm trên mỗi inch: DPI được
tính bằng điểm trên mỗi inch (đơn vị đo chiều dài của nước Anh, 1 inch = 2,54 cm) Đây là số điểm mà máy quét có thể nhận biết được trên 1 inch Đây còn được gọi là độ phân giải quang học của máy quét Ví dụ: 300 dpi
có nghĩa là có 300 điểm trên mỗi 1 inch hoặc 2,54 cm Thông thường thuật ngữ này được áp dụng với máy in, máy quét, cũng có thuật ngữ tương đương với nó là PPI (Pixels Per Inch) nhưng nó thường được áp dụng với ảnh số, màn hình của máy tính
1.2 Mục tiêu áp dụng kỹ thuật số hóa đối với tài liệu lưu trữ
Xuất phát với nhu cầu quản lý, sử dụng thông tin ngày càng nhiều của các bộ phận trong xã hội, chúng đòi hỏi việc tìm kiếm, xử lý, lưu trữ… nguồn thông tin phải được tiến hành một cách nhanh chóng, chính xác, tin cậy và chất lượng hơn Đối với yêu cầu mới đặt ra này, các hình thức tổ chức thông tin truyền thống nói chung đã bộc lộ những mặt hạn chế, phần
Trang 27lớn không còn đáp ứng những vấn đề thực tiễn đang đặt ra, trong đó hình thức tổ chức quản lý, sử dụng tài liệu lưu trữ truyền thống cũng không nằm ngoài điều này Do sự phát triển, tiến bộ của khoa học-công nghệ, chúng đã
mở ra cơ hội mới đồng thời cũng là thách thức mới đối với các ngành liên quan đến công tác quản lý nguồn thông tin nói chung, cơ quan lưu trữ - là
cơ quan tổ chức quản lý, bảo quản và sử dụng tài liệu lưu trữ nói riêng, đó
là việc áp dụng kỹ thuật số hóa đối với tài liệu
Đối với tài liệu lưu trữ, mục tiêu trong việc áp dụng kỹ thuật số hóa chủ yếu tập trung vào 3 mục tiêu chính như sau:
+ Mục tiêu 1: Đồng nhất các loại hình tài liệu lưu trữ từ dạng tương tự sang dạng số:
Như chúng ta đã biết, tài liệu lưu trữ bao gồm nhiều loại hình trên các vật mang tin khác nhau như: trên giấy, ảnh, băng, phim, gỗ… mỗi loại hình đều có đặc trưng, thuộc tính riêng tượng trưng cho bản thân chúng, chính điều này đã đặt ra các yêu cầu khác nhau về vấn đề quản lý, bảo quản và tổ chức sử dụng chúng Do đó, đòi hỏi chúng ta cần áp dụng các biện pháp phù hợp để bảo quản, kéo dài tuổi thọ và tổ chức phát huy giá trị thông tin của chúng Các biện pháp truyền thống được sử dụng như: bố trí, bảo quản từng loại hình tài liệu lưu trữ tại kho, phòng lưu trữ chuyên dụng khác nhau với các hệ thống phương tiện, thiết bị, chế độ bảo quản, tổ chức
sử dụng phù hợp Xét về ba phương diện như: bảo quản, quản lý và sử dụng sẽ thấy rằng đây là quy trình tách biệt, có khoảng cách với nhau khiến cho công tác lưu trữ chậm chễ, rườm rà và mất nhiều thời gian
Nếu tất cả các loại hình tài liệu lưu trữ trên được số hóa, tức chuyển
từ các dạng tương tự của vật mang tin khác nhau thành dạng tín hiệu số trong hệ thống cơ sở dữ liệu trong máy tính bằng phương tiện, thiết bị số hóa thì khoảng cách giữa ba phương diện này sẽ thu hẹp đáng kể và tập trung chỉ trong một dạng – dạng số Điều này có thể được biểu hiện như sơ
đồ dưới đây:
Trang 28Hình1.3: Mô hình các loại hình tài liệu lưu trữ được đồng nhất với nhau
trong định dạng số bằng phương pháp số hóa
Chính việc đồng nhất các loại hình tài liệu lưu trữ từ dạng tương tự sang tập trung với một dạng - dạng số trong một hệ thống cơ sở dữ liệu số hóa sẽ tạo khả năng vượt trội chưa từng có về mặt bảo quản, quản lý và tổ chức sử dụng tài liệu lưu trữ cho cơ quan lưu trữ Đồng thời tăng cường khả năng tiếp cận nguồn thông tin lưu trữ của độc giả ngày càng rộng rãi, thuận lợi hơn và thu hẹp khoảng cách giữa cơ quan lưu trữ và độc giả, làm cho hai bên xích lại gần nhau hơn Điều này sẽ được đề cập cụ thể trong các mục tiêu tiếp theo
Băng video
Đồng nhất các loại hình tài liệu vào với nhau trong định dạng số bằng phương pháp số hóa (Digital)
Tài liệu lưu trữ trên giấy
Băng ghi âm – tài liệu lưu trữ nghe nhìn
Tài liệu vi phim (microfilm)
Bản đồ - TLLT
khoa học kỹ thuật
Bản vẽ - TLLT xây dựng cơ bản
Trang 29+ Mục tiêu 2: Kéo dài tuổi thọ của tài liệu lưu trữ bản gốc:
Trên cơ sở của mục tiêu đầu tiên, sau khi đã chuyển tài liệu lưu trữ
từ dạng tương tự sang dạng số thì cơ quan lưu trữ sẽ có tài liệu lưu trữ ở hai dạng: dạng tương tự (dạng truyền thống của tài liệu) và dạng số Nếu quá trình chuyển đổi đảm bảo yêu cầu như: tính xác thực, toàn vẹn đối với nguyên bản gốc thì về cơ bản cả 2 dạng này không có gì quá khác biệt
về nội dung thông tin, chỉ khác về hình thức thể hiện thông tin Một mặt, phần lớn nhu cầu sử dụng tài liệu lưu trữ chủ yếu là khai thác nội dung thông tin chứ không phải vật mang thông tin và khi nào cần làm căn cứ pháp lý, bằng chứng thì bản gốc mới được sử dụng đến Do đó, nếu đảm bảo yếu tố tính xác thực và toàn vẹn của nội dung thông tin với nguyên bản gốc bằng các hình thức chứng thực với bản số thì chúng ta có thể sử dụng bản sao số hóa này thay thế trong việc tổ chức khai thác sử dụng mà trước đây chủ yếu sử dụng bản gốc Chính điều này đã tạo điều kiện thuận lợi đối với bản gốc của các loại hình tài liệu lưu trữ mà phần lớn đã và đang trong tình trạng xuống cấp ở các mức độ nặng nhẹ khác nhau Trên
cơ sở đó, chúng sẽ được bảo quản an toàn trong kho lưu trữ chuyên dụng, được hạn chế tiếp xúc với các yếu tố gây hư hỏng tài liệu (như: con người, môi trường, vi sinh vật…) trong quá trình vận chuyển, khai thác sử dụng Ngoài ra, còn tạo điều kiện trong việc áp dụng các biện pháp nâng cao chất lượng tài liệu lưu trữ đang trong tình trạng xuống cấp và kéo dài tuổi thọ của tài liệu như: tu bổ phục chế, chụp microfilm, sử dụng hóa chất để lấy nét chữ đối với tài liệu chữ mờ… Bằng các biện pháp này sẽ tạo điều kiện trong việc kéo dài tuổi thọ của tài liệu lưu trữ gốc Vì vậy, chúng ta sẽ giải quyết một trong hai nhiệm vụ chính của công tác lưu trữ
là bảo quản an toàn và kéo dài tuổi thọ của tài liệu lưu trữ bản gốc
Trang 30+ Mục tiêu 3: Quản lý và khai thác tập trung nguồn tài liệu số hóa:
Mục tiêu này có thể được thể hiện ở 2 cấp độ: một, trong phạm vi của một cơ quan lưu trữ (lưu trữ lịch sử); hai, trong phạm vi của hệ thống các cơ quan lưu trữ (mạng lưới lưu trữ từ trung ương đến địa phương)
Một, trong phạm vi của một cơ quan lưu trữ được thể hiện như sau:
Như hình trên, các loại hình tài liệu lưu trữ khác nhau đang được bảo quản trong một trung tâm lưu trữ sẽ được số hóa và đưa vào tổ chức quản
lý và khai thác sử dụng trong hệ thống cơ sở dữ liệu tập trung So với hình thức truyền thống, chúng ta sẽ thấy rằng các loại hình tài liệu lưu trữ này thông thường phải nằm ở các kho, phòng bảo quản chuyên dụng khác nhau, thậm chí nằm ở những vị trí địa lý khác nhau Điều này gây khó khăn trong việc quản lý tài liệu và tổ chức khai thác sử dụng tài liệu của
cơ quan lưu trữ cũng như việc tiếp cận nguồn tài liệu của độc gia Nhưng khi chúng đã được số hóa thì cơ quan lưu trữ có thể:
- Cung cấp nguồn thông tin cho độc gia đa dạng hơn bằng nhiều loại hình tài liệu lưu trữ cùng một chủ đề hoặc có liên quan với nhau một cách nhanh chóng Ví dụ: tài liệu lưu trữ về sự kiện giải phóng đất nước Lào ngày 02/12/1975, cơ quan lưu trữ có thể cung cấp tài liệu số hóa không
Hình 1.4: Mô hình quản lý và khai thác tập trung hệ thống
cơ sở dữ liệu số hóa của các loại hình tài liệu lưu trữ
Quản lý thống nhất
Khai thác tập trung
Hệ thống cơ sở dữ liệu số hóa của các loại hình tài liệu lưu trữ
Tài liệu lưu trữ
Sô hóa bằng phương tiện, thiết
bị kỹ thuật số hóa
Trang 31chỉ tài liệu mà bản gốc của nó là tài liệu lưu trữ trên giấy, hơn nữa có thể cung cấp các loại tài liệu lưu trữ ở dạng khác như: tài liệu trên ảnh, ghi âm, video cùng với sự kiện đó
- Quản lý, thống kế, báo cáo, tìm kiếm về cơ sở dữ liệu cũng như các quy trình cung cấp tài liệu cho độc giả sẽ được diễn ra một cách nhanh chóng, chính xác, tiết kiệm thời gian và sức lực bằng sự hỗ trợ của hệ thống phần cứng và phần mềm quản lý chuyên dụng như: công cụ tra cứu, tra tìm tự động, trang thông tin điện tử…
- Tổ chức phục vụ nguồn thông tin lưu trữ dưới dạng số với nhiều hình thức đa dạng, phong phú vượt qua giới hạn về không gian và thời gian như: tổ chức giới thiệu, công bố, trao đổi và cung cấp nguồn thông tin, tổ chức triển lãm tài liệu lưu trữ trên mạng nội bộ, internet…
Vì vậy, việc quản lý và tổ chức khai thác sử dụng tài liệu lưu trữ đã
được nâng cao rõ rệt
Hai, trong phạm vi của hệ thống các cơ quan lưu trữ được thể hiện
như sau:
Xét trong phạm vi rộng hơn, nếu các cơ quan lưu trữ các cấp đều có nguồn cơ sở dữ liệu số hóa của tài liệu lưu trữ có giá trị cao về các mặt và được tổ chức khai thác rộng rãi thì mục tiêu lớn hơn của chúng ta là kết nối
Hình 1.5: Mô hình kết nối các hệ thống cơ sở dữ liệu số hóa
của các cơ quan lưu trữ các cấp và cơ quan khác
Kết nối và trao đổi nguồn tài nguyên thông tin với nhau
Hệ thống cơ sở dữ liệu số hóa của Trung tâm lưu trữ Quốc gia
Hệ thống CSDLSH
Lưu trữ cơ quan (các Bộ, cơ quan ngang
bộ, tổng công ty của nhà nước…)
Hệ thống CSDLSH Lưu trữ lịch sử các tỉnh
Hệ thống CSDLSH của các cơ quan, lĩnh vực khác có liên quan (Thư viện, bảo tàng…)
Trang 32chúng vào với nhau như mô hình trên Hơn nữa chúng còn được kết nối, trao đổi cơ sở dữ liệu hoặc giới thiệu với các lĩnh vực khác có liên quan như: thư viện, bảo tàng… thông qua các trang thông tin của họ Việc kết nối và trao đổi như vậy sẽ tạo nên một hệ thống mạng lưới nguồn thông tin lưu trữ khổng lồ, bao quát nhiều lĩnh vực Mục tiêu này nhằm tạo điều kiện thuận lợi cho các đối tượng sử dụng nguồn thông tin lưu trữ hoặc độc giả, điều này thể hiện rõ rệt ở hai phương diện: không gian và thời gian trong việc tiếp cận nguồn tài liệu lưu trữ
Thứ nhất về không gian, độc giả không còn phụ thuộc vào các kho
bảo quản tài liệu lưu trữ riêng biệt để tiếp cận được nguồn thông tin đó Tức là dù tài liệu lưu trữ bản gốc sẽ phân tán ở những nơi bảo quản khác nhau về địa lý thì độc giả chỉ cần đến một trung tâm lưu trữ cũng có thể tiếp cận được toàn bộ dữ liệu thông tin đó thông qua hệ thống cơ sở dữ liệu
số hóa được kết nối tập trung, hơn nữa còn được mở rộng đến các lĩnh vực của nguồn tài nguyên số khác có liên quan như: thư viện, bảo tàng… Ngoài
ra, độc giả có thể ngồi ở nhà cũng có thể tiếp cận được chúng thông qua trang thông tin điện tử của cơ quan lưu trữ nếu cơ sở dữ liệu đó được tổ chức khai thác sử dụng phổ biến Điều này sẽ giúp độc giả tiết kiệm được thời gian, kinh phí và sức lực
Thứ hai về thời gian, việc tra cứu và truy cập nguồn thông tin tài
liệu lưu trữ số hóa sẽ được diễn ra một cách nhanh chóng, chính xác và tiện lợi vượt trội hơn bằng các chương trình phần mềm tra cứu tự động và hệ thống cơ sở dữ liệu số hóa tập trung Nếu cơ sở dữ liệu được sử dụng phổ biến trên trang thông tin điện tử thì độc giả có thể tiếp cận nguồn thông tin mọi lúc, mọi nơi 24/24 giờ mà điều này không thể diễn ra đối với hình thức
tổ chức khai thác sử dụng truyền thống Ngoài ra, độc giả vẫn có thể yêu cầu cung cấp thông tin theo chuyên đề, sự kiện… đối với cơ quan lưu trữ
và được cung cấp thông qua hệ thống mạng theo sự thỏa thuận hợp pháp của hai bên
Trang 33Cả hai quy mô này sẽ tạo điều kiện, tiền đề quan trọng trong việc tiến tới một xã hội thông tin, mọi người có thể tiếp cận đến nguồn thông tin lưu trữ một cách thuận lợi, nhanh chóng Điều này là sự mong chờ lâu này của
cơ quan lưu trữ cũng như độc giả Như vậy, sức mạnh của nguồn thông tin lưu trữ sẽ được truyền bá một cách rộng rãi và mạnh mẽ hơn bao giờ hết Điều này sẽ tạo điều kiện thuận lợi đối với cơ quan lưu trữ trong việc phát huy giá trị tài liệu lưu trữ, đồng thời độc giả cũng tiếp cận đến nguồn thông tin đó rất thuận lợi hơn
Vì vậy, chúng ta sẽ giải quyết nhiệm vụ thứ hai của công tác lưu trữ
là tăng cường khả năng phát huy giá trị nguồn thông tin tài liệu lưu trữ một cách rộng rãi, đáp ứng nhu cầu của xã hội
Trên đây là ba mục tiêu chính trong việc áp dụng kỹ thuật số hóa đối với tài liệu lưu trữ, đồng thời cũng là mục tiêu mà chúng tôi đang hướng tới trong tương lai đối với tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào nói riêng, ngành lưu trữ Lào nói chung Mặc dù việc đồng nhất các loại hình tài liệu lưu trữ và quản lý tập trung hệ thống cơ sở dữ liệu số hóa chưa được diễn ra cùng một lúc do điều kiện, hoàn cảnh thực tế của Cục thì việc triển khai số hóa tài liệu lưu trữ khối tài liệu hành chính (là khối tài liệu chiếm số lượng nhiều nhất tại Cục hiện nay) cũng là việc rất cần thiết, là bước đầu để tiến tới mục tiêu chung đó Trong khuôn khổ của luận văn, chúng tôi chỉ đề cập đến việc nghiên cứu triển khai số hóa khối tài liệu lưu trữ hành chình này
1.3 Những ưu điểm và hạn chế của kỹ thuật số hóa tài liệu lưu trữ
1.3.1 Ưu điểm
Trong ngành lưu trữ, hai nhiệm vụ quan trọng hàng đầu, đồng thời là nhiệm vụ quyết định đến sự tồn tại của các trung tâm lưu trữ là việc bảo quản an toàn, kéo dài tuổi thọ của tài liệu lưu trữ và tổ chức khai thác sử dụng, phát huy giá trị thông tin trong tài liệu lưu trữ ngày càng rộng rãi, đa dạng, phong phú về nội dung và hình thức phục vụ nhu cầu chính đáng,
Trang 34hợp pháp của độc giả Việc số hóa tài liệu lưu trữ có thể đáp ứng trong việc giải quyết những nhiệm vụ đặt ra này một cách hiệu quả như đã trình bày ở phần trên Do đó, ưu điểm chủ yếu của kỹ thuật số hóa tài liệu lưu trữ có thể khái quát như sau:
- Giúp nâng cao trong việc bảo quản an toàn tài liệu lưu trữ bản gốc đang trong tình trạng hư hỏng về tình trạng vật lý và nội dung thông tin bằng cách sử dụng tài liệu số hóa thay thế việc sử dụng trực tiếp, thường xuyên tài liệu gốc và áp dụng các biện pháp củng cố, nâng cao chất lượng đối với tài liệu gốc để kéo dài tuổi thọ
- Nâng cao việc quản lý và tổ chức sử dụng nguồn tài liệu lưu trữ của cơ quan lưu trữ phục vụ việc chia sẻ, tra tìm, truy cập nguồn thông tin của các đối tượng độc giả một cách nhanh chóng, chính xác, thuận tiện vượt qua giới hạn về không gian và thời gian
- Nâng cao chất lượng hiển thị của nguồn thông tin từ tài liệu lưu trữ bản gốc (có tình trạng vật lý, nội dung kém như: mờ, vết bẩn, thủng…) tốt hơn bằng chương trình phần mềm hiệu chỉnh/đồ họa chuyên dụng như: tăng độ nét, độ sáng tối, xóa vết bẩn trên bề mặt tài liệu gốc…
- Góp phần hiện đại hóa công tác lưu trữ của cơ quan lưu trữ
- Kỹ thuật số hóa có thể được sử dụng để hỗ trợ lẫn nhau với các phương pháp khác để tăng cường khả năng bảo quản và tổ chức khai thác
sử dụng tài liệu lưu trữ một cách hiệu quả hơn
1.3.2 Hạn chế
Tuy việc số hóa tài liệu lưu trữ mang lại nhiều lợi ích đối với cơ quan lưu trữ và độc giả, nhưng chúng cũng có những mặt hạn chế cần phải cân nhắc, thận trọng trước khi quyết định áp dụng phương pháp này Những điều này được thể hiện qua các mặt sau:
- Để áp dụng thành công phương pháp này, đòi hỏi phải nghiên cứu, tính toán rất kỹ và khách quan, trên cơ sở đó lập kế hoạch phát triển cho phù hợp trong từng giai đoạn
Trang 35- Phải đầu tư kinh phí tương đối nhiều trong quá trình triển khai cũng như quản lý, sử dụng
- Tài liệu số hoá có thời hạn tuổi thọ không cao vì nó phụ thuộc vào vật mang tin, phần cứng, phần mềm tương ứng Do công nghệ thông tin thay đổi rất nhanh, cho nên tài liệu số hóa cũng không ngừng phải nâng cấp theo Điều này dẫn đến phải sử dụng kinh phí tương đối nhiều Mặt khác, để tiếp cận được dạng tài liệu này, chúng ta phải có thiết bị điện tử, phương tiện kết nối thích hợp
- Đòi hỏi cán bộ có trình độ chuyên môn giỏi đáp ứng các yêu cầu công việc khác nhau trong từng khâu của chuỗi số hoá tài liệu
- Tài liệu số hóa dễ bị sửa đổi, thay đổi nội dung và hình thức bởi những kẻ gian bất hợp pháp với mục đích xấu Tính bảo mật của hệ thống
cơ sở dữ liệu về tính ổn định của chúng so với hệ thống cơ sở dữ liệu truyền thống còn đang là một vấn đề tranh cãi Vì vậy, để đảm bảo giải quyết tốt vấn đề này, đòi hỏi phải có biện pháp quản lý chặt chẽ về mặt kỹ thuật và phương thức làm việc
- Vấn đề thời hạn giải mật, bản quyền của tài liệu lưu trữ luôn là một trong những trở ngại lớn trong việc số hóa tài liệu lưu trữ
Tóm lại, bất kỳ phương pháp kỹ thuật nào dù truyền thống hay hiện đại đều có tính hai mặt của nó, tức là có ưu điểm thì phải có hạn chế luôn
đi đôi với nhau Phương pháp số hóa tài liệu lưu trữ cũng không nằm ngoài điều này Vì vậy, chúng ta phải nghiên cứu để phát huy tối đa ưu điểm của phương pháp này, đồng thời khắc phục hạn chế, giảm bớt rủi ro đến mức thấp nhất có thể
1.4 Tổng quan về kỹ thuật số hóa
Kỹ thuật số hóa là việc áp dụng những tri thức, các phương pháp, phương tiện, thiết bị điện tử phù hợp để chuyển đổi thông tin dạng tương
tự (analog) sang dạng số (digital) Mục đích của phần này, chúng tôi
Trang 36muốn tập hợp một số vấn đề kỹ thuật cơ bản trong việc số hóa tài liệu lưu trữ trên vật mang tin bằng giấy, chủ yếu tập trung trong việc áp dụng máy quét phẳng (Flatbed Scanner) để số hóa tài liệu lưu trữ Vì máy này có khả năng áp dụng vào việc số hóa tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào mà luận văn sẽ hướng tới
Về cơ bản trước khi chuyển đổi thông tin từ tài liệu lưu trữ dạng truyền thống sang dạng số, chúng ta cần tìm hiểu, lưu ý về một số vấn đề
kỹ thuật như: các loại máy quét/ máy chụp ảnh số, kỹ thuật quét tài liệu lưu trữ, xác định độ phân giải đầu vào, đầu ra cần thiết của tài liệu… được áp dụng trong lĩnh vực lưu trữ Những vấn đề này sẽ được khái quát lần lượt dưới đây
1.4.1 Một số loại máy quét và máy chụp ảnh số
Hiện nay, để số hóa tài liệu ở dạng truyền thống sang dạng số có thể được thực hiện một cách dễ dàng với nhiều thiết bị như: máy quét, máy chụp ảnh (camera số) và các thiết bị điện tử khác gắn tính năng chụp ảnh Trong lĩnh vực lưu trữ, thư viện và bảo tàng thì máy quét và máy chụp ảnh số vẫn là hai thiết bị chính được áp dụng để số hóa tài liệu Do sự phát triển, cải tiến thiết bị cho phù hợp với các đối tượng sử dụng khác nhau đã tạo nên nhiều loại máy quét và máy chụp ảnh số khác nhau với các tính năng ưu điểm và hạn chế riêng
+ Đối với máy quét (scanner) có một số loại chủ yếu được sử dụng trong lĩnh vực lưu trữ như:
- Máy quét phẳng (Flatbed Scanner), còn được gọi là máy quét để bàn, là loại máy đa năng và được sử dụng phổ biến nhất, phù hợp với tài liệu có kích thước không lớn, giá thành thấp, chất lượng tương đối cao Tuy nhiên, không phù hợp với tài liệu có tình trạng vật lý kém, dễ bị rách hoặc hư hỏng nặng vì có khả năng làm hư hỏng thêm với tài liệu trong quá trình quét, vận hành bằng tay
Trang 37Hình 1.6: Máy quét phẳng –Flatbed Scanner
- Máy quét Overhead Flatbed Scanner, được sử dụng rộng rãi để quét quyển sách, tài liệu có tình trạng hư hỏng như: giấy dễ bị rách, uốn cong…
Hình 1.7:Máy quét Overhead Flatbed Scanner
+ Đối với máy ảnh số (Digital Camera) được sử dụng trong ngành lưu trữ là loại máy được thiết kế với sự kết hợp giữa máy quét và máy ảnh
số Chúng có hình dáng giống như máy quét overhead scanner nhưng chúng khác nhau về phương pháp, nguyên lý thu ảnh Bộ phận của máy ảnh số có thể dịch chuyển được để thu hình tài liệu cho phù hợp với khổ giấy và có nguồn cung cấp ánh sáng Do đó máy ảnh số có thể chụp ảnh tài liệu với bất kỳ cỡ giấy Chúng được sử dụng với tài liệu có kích thước lớn hoặc tài liệu dễ bị rách Tuy nhiên, để đạt chất lượng ảnh cao đòi hỏi kinh nghiệm, tay nghề cao và cần nguồn ánh sáng nhiều Đôi khi nguồn ánh sáng nhiều như vậy có thể gây hư hỏng tài liệu do tác động của quang học vào bề mặt tài liệu, mực dẫn đến tài liệu bị giòn, phai mực Vì vậy, trước khi sử dụng phương tiện này cần lựa chọn tài liệu phù hợp để giảm thiểu sự
hư hỏng đối với tài liệu
Trang 38Hình 1.8:Máy ảnh số - Digital camara
Như đã nêu, có nhiều loại máy quét và máy ảnh số được sử dụng trong ngành lưu trữ Mỗi loại máy đều có ưu điểm, hạn chế khác nhau về tính năng, giá thành… phù hợp với từng đối tượng tài liệu nhất định, mục tiêu đã đề ra Do đó, ngoài việc am hiểu về tính năng, đặc điểm của các loại máy khác nhau thì việc hiểu biết sâu sắc về thuộc tính, tình trạng vật lý của tài liệu sẽ số hóa là một trong những yêu cầu bắt buộc để đảm bảo chất lượng sản phẩm số và bảo vệ an toàn tài liệu gốc Vì vậy, việc lựa chọn thiết bị phù hợp với đối tượng tài liệu, mục tiêu và khả năng của mình đóng vai trò quan trọng đảm bảo sự thành công trong việc triển khai số hóa tài liệu lưu trữ
1.4.2 Thuộc tính của tài liệu
Thuộc tính của tài liệu là một bộ phận quan trọng cần xác định trước để đưa ra các biện pháp số hóa phù hợp, vì mỗi thuộc tính khác nhau của tài liệu yêu cầu cách thức xử lý phù hợp để đảm bảo chất lượng sản phẩm ảnh số Về cơ bản tất cả các tài liệu hiện nay được chia thành 4 loại như sau:
+ Bản văn/ dòng (Text/line art): gồm những hình ảnh đồng màu có
ranh giới rõ ràng, thường đơn sắc, có thể được tạo ra bằng tay, máy chữ hoặc máy in, bao gồm: bản văn, bản viết tay, đồ thị, bản khắc gỗ, văn bản được đánh máy hay in laser, bản thiết kế, bản đồ và bản chép nhạc Tài liệu lưu trữ đang bảo quản tại Cục Lưu trữ Quốc gia Lào phần lớn thuộc loại tài liệu này
Trang 39+ Tông màu chuyển tiếp (continuous tone): những tài liệu gồm các
gam chuyển tiếp nhau, có thể đơn sắc hoặc đa sắc, bao gồm ảnh chụp, một số loại tranh như bản phác họa bằng chì, tranh màu nước) và các tác phẩm đồ họa có các thuộc tính gam chuyển tiếp như: bản khắc đồng, in
đá, in chụp
+ Nửa tông hoặc kiểu nửa tông (Halftone or halftone-like): những
hình ảnh tạo thành từ các điểm hoặc đường nằm cách đều, có thể đơn hoặc đa sắc, bao gồm những ảnh đồ họa được tạo thành từ các nét hoặc đường kẻ song song sít nhau nằm cách đều
+ Hỗn hợp (Mixed): tổng hợp cả 3 loại tài liệu trên, đơn hoặc đa
sắc, bao gồm báo, tạp chí sách có tranh minh họa
1.4.3 Kỹ thuật quét tài liệu
Để quét các loại tài liệu có thuộc tính khác nhau và phù hợp với yêu cầu đầu ra thì có ba kỹ thuật quét tài liệu được sử dụng, đó là kỹ thuật quét đen trắng, kỹ thuật quét dải xám và kỹ thuật quét màu Mỗi kỹ thuật quét đều có tính đặc trưng riêng, phù hợp với thuộc tính tài liệu nhất định
Có thể khái quát dưới đây:
+ Kỹ thuật quét đen trắng (Bitonal)
Một pixel gồm 1 số nhị phân thể hiện màu trắng hoặc đen, thích hợp với các loại bản văn/ dòng và một số loại nửa tông
+ Kỹ thuật quét dải xám (Grayscale)
Một pixel gồm nhiều số nhị phân thể hiện các gam màu xám khác nhau, thích hợp với các văn bản gam chuyển tiếp đen trắng, nửa tông, hỗn
hợp và một số bản viết tay
+ Kỹ thuật quét màu (Color)
Một pixel gồm nhiều số nhị phân thể hiện các màu sắc khác nhau, thích hợp với tất cả các loại văn bản trong đó màu sắc giữ vai trò quan trọng
Trang 401.4.4 Những yếu tố tác động đến chất lượng ảnh số
Chất lượng của ảnh số phụ thuộc vào 6 yếu tố cơ bản đó là:
+ Tình trạng của tài liệu (Condition of records)
+ Độ phân giải, độ ngưỡng và độ sâu màu (Resolution, Threshold and Bit depth)
+ Hiệu chỉnh ảnh (Image Enhancement)
+ Quá trình nén và định dạng file (Compression and File Format)
+ Thiết bị sử dụng và hiệu suất của thiết bị đó (System Performance)
+ Quyết định của người vận hành (Operator Judgement)
Những ảnh hưởng của các yếu tố này đối với chất lượng ảnh số sẽ được trình bày lần lượt dưới đây:
1.4.4.1 Tình trạng của tài liệu
Tình trạng của tài liệu được chia thành 2 bộ phận: tình trạng về vật lý
và tình trạng về nội dung thông tin của tài liệu Cả 2 bộ phận này đều tác động đến chất lượng của ảnh, phương pháp xử lý và các vấn đề khác Đối với tình trạng vật lý của tài liệu, phần lớn là vật mang tin trên giấy bị rách, thủng, mốc, ố vàng, giòn, gỉ… những yếu tố này làm cho giấy bẩn khiến cho độ tương phản của giấy bị giảm xuống, giảm khả năng phản quang của giấy đối với máy quét… tác động đến chất lượng của ảnh quét
Hình 1.9:Tình trạng vật lý của tài liệu