DOÃN ANH ĐỨC
ỨNG DỤNG PHP/MySQL XÂY DỰNG PHAN MEM QUAN TRI TAI LIEU SO
HOA CHO HE THONG THU VIEN
CONG
LUAN VAN THAC Si KHOA HQC THU VIEN NGUOI HUONG DAN KHOA HOC: TS NGUYEN VIET NGHIA
Trang 2Loi cam on
Đề hoàn thành bản luận văn này, tôi đã nhận được sự hướng dẫn và giúp đỡ tận tình của TS Nguyễn Viết Nghĩa Tôi xin bày tỏ lòng biết ơn sâu sắc tới TS Nguyễn Viết Nghĩa về sự giúp đỡ quí báu này
Tôi xin chân thành cảm ơn kỹ sư Tô Trọng Đức, người đã giúp đỡ tơi xây dựng và hồn thiện phan mém DLS
Tôi xin chân thành cảm ơn Ban Giám đốc và tập thể cán bộ,
nhân viên thư viện tỉnh Lạng Sơn đã giúp tôi trong quá trình thử
nghiệm phần mém DLS
Tôi xin chân thành cảm ơn các thấy cô giáo tham gia giảng dạy tại khoa sau đại học, Trường Đại học Văn hóa Hà Nội, các bạn bè đồng nghiệp và người thân - những người đã quan tâm động viên, cổ vũ và giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này
Trang 3
MUC LUC
CAC TU VIET TAT TRONG LUẬN VĂN, 4
DANH MUC BANG BIEU 5
PHAN MO DAU 6
1 Tính cấp thiết của đề tai 6
2 Tình hình nghiên cứu 8
3 Mục tiêu và nhiệm vụ nghiên cứu 10
4 Đối tượng và phạm vi nghiên cứu 10
5 Phương pháp nghiên cứu "
6 Ý nghĩa khoa học và ứng dụng của đề tài "
7 Cấu trúc của luận văn i
Chuong 1: TAI LIEU SO VA PHAN MEM QUAN TRI TAI LIEU SO TRONG HE THONG THU V CÔNG CỘNG LI Tàiliệu số 12
1.1.1 Khái niệm tải liệu số 12
1.1.2 Khái niệm thư viện số 15
1.13 Khái niệm siêu dữ liệu 16
1.1.4 Tầm quan trọng của tài liệu số và việc quản lý tài liệu số 19 1.2 Công tác số hóa tài liệu và việc ứng dụng phần mềm quản trị tài
liệu số ở các thư viện công cộng 26
Trang 41.3.2 Lý do lựa chon PHP va MySQL xây dựng phần mềm quản trị tài
liệu số 36
Chương 2: GIẢI PHÁP ỨNG DỤNG PHP/MYSQL XÂY DỰNG PHÀN MEM QUAN TRI TAI LIEU SO AL 2.1 Lựa chọn công nghệ hỗ trợ 4I 21.1 AJAX 4I 2.12 JAVASCRIPTS 4 2.13 CSS 44 2.2 Thiết kế hệ thống, 45
2.2.1 Bai toán quản lý, khai thác tài liệu số ở các thư viện công cộng45
2.2.2 Thiết kế cơ sở dữ liệu 46
2.2.3 Bảo mật và an toàn dữ liệu 52
2.3 _ Thiết kế các module của phần mềm quản lý 54
Trang 53.2.2 Đào tạo cán bộ thư viện 84
3.23 Biên mục dữ liệu số 86
3.2.4 Thử nghiệm trong mạng nội bộ (LAN), 89
3.2.5 Thử nghiệm qua Internet 89
3.2.6 Đào tạo người dùng tin 9đ"
3.2.7 Xuất bản thông tin ra CD-ROM, ổ cứng di động 92
3.3 Danh gid két qua thir nghigm 92
3.3.1 Những kết quả đã đạt được 9
3.3.2 Một số tồn tại sau khi thử nghiệm phần mềm DLS 95
3.4 Các kiến nghị và giải pháp hoàn thiên phần mềm 95
Trang 6
TU VIET TAT TRONG LUAN VAN
AJAX Asynchronous JavaScript
ASP Môi trường kịch bản trên máy chủ
(Active Server Pages)
CD-ROM Đĩa quang chỉ đọc
(Compaet Dirk- Read Only Memory) CNNDS Công nghiệp nội dung số
CSDL Cơ sở dữ liệu
Css Cascading Style Sheets
DLS Phần mềm giải pháp thư viện số
(Digital Library Solutions)
GUI Giao diện đồ họa người dùng
(Graphical User Interface)
lib Hệ quản trị thư viện điện tử tích hop
(Intergrated Library Solutions)
LAN Mạng nội bộ
(Local Network Area)
Libol Phần mềm giải pháp Thư viện điện tử
(LIBrary OnLine)
MARC Biên mục máy tính đọc được (Machine Readable Catalog ) MySQL Hệ quản trị cơ sở dữ liệu
(My Structured Query Language)
OPAC Mục lục công cộng truy cập trực tuyến
(Online Public Access Catalog)
PHP Ngôn ngữ lập trình
Trang 7DANH MUC BANG BIEU
Trang Bảng 1.1: Diéu tra tinh hình số và ứng dụng phần mềm quản trị tài liệu
số tại một số thư viện tỉnh, thành phố 29 Bảng 2.1: Bảng Users 4 Bảng 2.2: Bảng Bo_su tap, 47 Bảng 2.3: Bang Sach 48 Bảng 2.4: Bảng Ban doc 49 Bảng 2.5: Bảng Thong tỉn 50 Bảng 2.6: Bảng File tai lieu sl Bảng 2.7: Bảng Lien he 52
Bảng 2.8: Bảng phân quyền người sử dụng 59 Bảng 2.9: Mô tả cấp độ bảo mật tài liệu số 65
Trang 8PHAN MO DAI
1 Tính cắp thiết của đề tài
Trong thời đại ngày nay, sự phát triển bùng nỗ của công nghệ thông tin
đã tác động lớn đến cuộc sống cũng như sự phát triển của xã hội Nhận thức rõ tầm quan trọng của của công nghệ thông tin đối với sự phát triển của đất nước Bộ Chính trị đã ban hành chỉ thị số 5§-CT/TƯ về “Đẩy mạnh công
hóa, hiện đại hóa” Chỉ thị
58 khẳng định “Ứng dụng và phát triển công nghệ thông tin là một nhiệm vụ
nghệ thông tin phục vụ sự nghiệp công ngi
ru tiên trong chiến lược phát triển kinh tế - xã hội, là phương tiện chủ lực để đi tắt đón đầu, rút ngắn khoảng cách phát triển so với các nước đi trước °'
Công nghệ thông tin dang thay thế dần các phương tiện thủ công, mọi
loại hình từ quản trị một bộ máy đến cách thức tiếp nhận kiến thức của mỗi cá
nhân cũng đang từng bước được số Trong bối cảnh đó, công tác thông tin - thư viện cũng đã, đang và sẽ tiếp tục có những biến đổi sâu sắc với sự hiện hữu của môi trường số trong hoạt động Xây dựng thư viện số đã trở thành xu
hướng phát triển của hoạt động thông tin - thư viện toàn cầu Thư viện số đã
giúp cho các thư viện triển khai phục vụ vượt ra khỏi khuôn viên của mình,
các giới hạn về hạn chế người sử dụng, hạn chế thời gian phục vụ, hạn chế tài liệu phục vụ đã được vượt qua Bất cứ người dùng tin nào, dù ở bất cứ nơi đâu, tại bất kỳ thời điểm nào đều có thê được phục vụ thông tin nếu truy cập vào một thư viện số Với những đặc điểm đó, thư viện số còn được gọi là thư
viện không nóc, thư viện không tường
Trong bối cảnh hội nhập quốc tế đang diễn ra sôi động, xu hướng liên
Trang 9
thành nên một mạng cung cấp thơng tin tồn cầu Vấn đề đặt ra là, làm sao đẻ cho sự liên kết ấy ngày càng trở nên hữu ích hơn Sự liên kết sẽ không thể đạt hiệu quả như mong muốn, nếu các cơ quan thông tin — thư viện không xây
dựng được các thư viện số, chia sẻ toàn văn của tài liệu, vì chỉ có thư viện số mới giúp cho các cơ quan thông tin — thư viện trao đổi thông tin thuận tiện, nhanh chóng Đó cũng là minh chứng cho sự phát triển về khoa học, công
nghệ của một quốc gia, vùng lãnh thỏ
Xây dựng thư viện số nhằm thoả mãn nhu cầu tìm kiếm, khai thác và sử
dụng thông tin của con người trong kỷ nguyên mới - kỷ nguyên của tri thức, từng bước đưa thư viện Việt Nam hòa nhập với mạng thông tin - thư viện các
nước trong khu vực và thé giới
‘Van đề xây dựng thư viện hiện đại ở Việt Nam đã được Đảng và Nhà
nước quan tâm chỉ đạo Ngày 4 tháng 5 năm 2007, Bộ Văn hóa - Thông tin
(nay là Bộ Văn hóa, Thể thao và Du lịch) đã ban hành quyết định số
10/2007/QĐ-BVHTT phê duyệt “Quy hoạch phát triển ngành thư viện tới năm 2020” trong đó
Việt Nam tới năm 2010 và định hướng phát ti
có nội dung: Ứng dựng khoa học công nghệ cao nhằm tự động hóa, hiện đại
hóa hoạt động của thư viện Phát triển thư viện điện tứ, thư viện kỹ thuật số
Sưu tầm, bảo tôn và phát huy vốn di sản văn hoá trong thư viện theo phương
pháp hiện đại dựa vào công nghệ thông tin phát triển ở mức cao Thư viện công cộng phải là nguồn lực giúp nâng cao dân trí và phổ cập giáo dục của
cộng đồng, là cơ quan giáo dục thường xuyên dành cho mọi người Phần đấu
đến năm 2010, toàn bộ thư viện các tỉnh, hành phố được nói mạng với Thư
Trang 10Dưới sự chỉ đạo đó hệ thống thư viện công cộng đã tiến hành số hóa tài
liệu, xây dựng thư viện diện tử, thư viện số Tuy nhiên, vấn đề này còn mới
mẻ, do thiếu kinh nghiệm, gặp khó khăn trong công tác lựa chọn phần mềm
quản trị tài liệu số nên vấn đề xây dựng thư viện điện tử, thư viện số mới chỉ
mang tính phong trào chưa đạt hiệu quả như mong muốn Yêu cầu cấp thiết hiện nay là cần nghiên cứu, xây dựng một phần mềm quản trị tài liệu số gọn
nhẹ, giao diện thân thiện, đáp ứng chuẩn nghiệp vụ, phủ hợp với hệ thống thư
viện công cộng Vì vậy tôi chọn đề tài “Ứng dụng PHP/MySOL xây dựng phân mềm quản trị tài liệu số cho hệ thông thư viện công cộng ”
2 Tình hình nghiên cứu
Vấn đề tạo lập nguồn tài liệu số, ứng dụng phần mềm xây dựng thư
viện điện tử đã có một số công trình nghiên cứu được thực hiện trong những
năm gần đây:
s# Cao Minh Kiểm (2000), “Thư viện số - định nghĩa - vấn đề “, Tạp chí
Thông tin & Tư liệu, (3), tr 5-11 Bài báo phân tích những đặc điểm
chủ yếu của thư viện số, xây dựng kho tài liệu số, xây dựng siêu dữ
liệu
+ Nguyễn Minh Hiệp (2006), “Xây dựng thư viện số với hệ thống mã
nguồn mở”, Kỹ yếu hội tháo tổ chức và hoạt động thư viện điện tử, Phú Yên tr 35-43 Bài viết nêu định nghĩa thư viện số, giới thiệu một số phần mềm quản trị tài liệu số tiêu biểu
“+ Nguyễn Hoàng Sơn (2003), Xây dựng mô hình thư viện điện tử ở Việt Nam trong giai đoạn hiện nay, Luận văn thạc sĩ Đề tài đề cập tới các
Trang 11tử, khảo sát các yếu tố cấu thành thư viện điện tử; đề xuất một số
giải pháp xây dựng mô hình thư viện điện tử ở Việt Nam từ việc
lập dự án đến thực thi dự án
+ Pham Thi Mai (2009), Nghiên cứu phát triển thư viện điện tử trong các trường đại học trên địa bàn Hà Nội hiện nay, Luận văn
thạc sĩ Công trình đề cập tới một số vấn để như các khái niệm
liên quan đến thư viện điện tử, các yếu tố cấu thành thư viện điện
tử, vai trò của thư viện điện tử với phát triển giáo dục đại học ở Việt Nam
Lê Đức Thắng (2010), Phát triển nguôn lực tài liệu số tại Thư viện Quốc gia Việt Nam, Luận văn thạc sĩ Trong công trình của mình, tác giả đề cập tới các khái niệm về tài liệu số, thư viện số; quy trình số hóa tài liệu ở Thư viện Quốc gia Việt Nam, đề xuất
các giải pháp hoàn thiện quy trình số hóa tài liệu
Nhìn chung, các công trình trên mới chỉ đề cập tới một số khía
cạnh của vấn dé xây dựng mô hình thư viện điện tử ở Việt Nam, xây
dựng, phát triển nguồn tài liệu số Trong công trình của tác giả Nguyễn Minh Hiệp có giới thiệu một số phần mềm nguồn mở của nước ngoài, tuy nhiên trong thực tế ứng dụng các phần mềm này vẫn còn nhiều hạn
chế như Việt hóa chưa triệt để, cài đặt, quản trị không thuận tiện, giao
diện thiếu thân thiện Như vậy, có thể nói, cho đến nay chưa có một
công trình nào nghiên cứu một cách toàn diện về việc ứng dụng mã
nguồn mở xây dựng phần mềm quản trị tài liệu số trong hệ thống thư
Trang 123 Mục tiêu và nhiệm vụ nghiên cứu Mục tiêu
Ứng dụng ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL
xây dựng phần mềm quản trị tài liệu số cho hệ thống thư viện công cộng
Nhiệm vụ nghiên cứa
s* Xác định các yêu cầu xây dựng phần mềm quản trị tài liệu số s* Thiết kế, xây dựng phần mềm quản trị tài liệu số
* Chạy thử nghiệm phần mềm tại một thư viện công cộng tỉnh, thành
phố
s* Đề xuất giải pháp hoàn thiện phần mềm và đưa vào áp dụng trong thực tiễn
4 Đối tượng và phạm vỉ nghiên cứu
Đối tượng nghiên cứu: phần mềm quản trị tài liệu số trong hệ thống thư
viện công cộng
Pham vi nghién cửa
- Céng tac s6 héa tai ligu va thyc trang img dung phần mềm quản trị tài liệu số tại một số thư viện công cộng cấp tỉnh, thành phố: Bình Dương, Cần
Thơ, Gia Lai, Hải Dương, Hải Phòng, Hòa Bình, Lạng Sơn, Phú Yên, Son La, Thừa Thiên ~ Huế
Trang 135 Phương pháp nghiên cứu
- Phương pháp phân tích tổng hợp - Phương pháp chuyên gia
- Phương pháp thực nghiệm ~ Phương pháp nghiên cứu tài liệu
6 Ý nghĩa khoa học và ứng dụng của đề tài
~ Về mặt khoa học: góp phần hoàn thiện lý luận khi tiến hành xây dựng,
quản trị, khai thác nguồn tài liệu số phù hợp với điều kiện của các thư viện
công cộng ở Việt Nam
- Về mặt ứng dụng: đề tài có ý nghĩa thực tiễn bởi kết quả của đề tài có thé được ứng dụng tại các thư viện cấp tỉnh, cấp huyện trong hệ thống thư viện công cộng Ứng dụng PHP/MySQL (mã nguồn mở - miễn phí) để xây
dựng phần mềm giúp các thư viện công cộng tiết kiệm chỉ phí trong quá trình
xây dựng, quản lý và khai thác nguồn tài liệu số
Án trúc của liên văi 7 Cấu trúc của luận văn
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, phụ lục, luận văn
được chia làm ba chương:
Chương 1: Tài liệu số và phần mềm quản trị tài liệu số trong hệ
thống thư viện công cong
Chương 2: Giải pháp ứng dụng PHP/MYSQL xây dựng phần mềm quản trị tài liệu số
Trang 14Chuong 1: TAI LIEU SO VA PHAN MEM QUAN TRI TAI LIEU SO TRONG HE THONG THU VIEN CONG CONG
1.1.1 Khái niệm tài liệu số
Sự phát triển cực kỳ mau lẹ của công nghệ thông tin và truyền thông
trong những năm gần đây đang tác động mạnh mẽ tới mọi phương diện của
đời sống xã hội, trong đó có lĩnh vực hoạt động thông tin — thư viện Để sử dụng được các phương tiện, kỹ thuật lưu trữ và truyền tải thông tin hiện dai, không thể không có những vật mang tin phủ hợp Do đó, việc nghiên cứu, ứng dụng và hoàn thiện các vật mang tin mới là điều được nhiều nhà khoa học hoạt động trong lĩnh vực thông tin, công nghệ và truyền thông quan tâm Đó
chính là khởi đầu cho sự xuất hiện và phát triển không ngừng của một loại
hình tài liệu mới: Tài liệu só
Cho đến nay, đã có không ít định nghĩa vẻ tài liệu số được dua ra
Điểm chung của các định nghĩa này đều cho rằng: tài liệu số là tài liệu mà thông tin chứa đựng trong đó đã được biểu diễn dưới dạng mã nhị phân, tức là
mã chỉ gồm hai số 0 và 1 Nói cách khác, những thông tin về tài liệu, một
phần hay toàn bộ nội dung của tài liệu đã được chuyển thành các bit thông tin dữ liệu và được lưu trữ, khai thác trên máy vi tính, với sự hỗ trợ của một hay
một vài thiết bị chuyên dụng, phần mềm ứng dụng và hệ thống mạng máy
tính Như vậy, tài liệu được tạo lập trực tiếp từ máy vi tính, được lưu trữ thành các tệp dữ liệu (file), với những định dạng khác nhau như: doc, exe,
jPg, pdf và các tài liệu có nội dung là kết quả của quá trình số các loại
Trang 15thể coi nguồn tài liệu số là tập hợp có tô chức những bộ sưu tập thông tin số
và thông tin trong tài liệu đã được số
Do bản chất tồn tại và lưu trữ hoàn toàn khác biệt so với loại hình tài liệu truyền thống, nguồn tài liệu số chỉ có thể được truy cập và khai thác trên
máy tính hay hệ thống mạng máy tính Một trong số các phương tiện cầu nối
đưa người dùng tin tới với nguồn tài liệu số chính là hệ thống các mục lục công cộng tra cứu trực tuyến (tiếng Anh là Online Public Access Catalog,
được viết tắt là OPAC) Theo Từ điền Thông tin — Thư viện học trực tuyến -
ODILIS, OPAC là một cơ sở dữ liệu (CSDL) bao gồm các biểu ghi thư mục, mô tả sách hoặc các tài liệu khác được sở hữu bởi một thư viện, trung tâm thông tin, cơ quan lưu trữ hoặc một hệ thống các đơn vị này và người dùng
có thể truy cập qua mạng máy tính đề biết thêm về nguồn tin họ cần Sự truy
cập này ban đầu chỉ hạn chế trong phạm vi các máy tính đặt tai thư viện, trung tâm thông tin, cơ quan lưu trữ Tuy nhiên, ngày nay, nhờ sự tiến bộ không ngừng của công nghệ, người dùng tin có thể thông qua OPAC để tra cứu thông tin ngay trên máy tính tại nhà, tại cơ quan, tại trường học thông qua các kết nối Intemet có dây và không dây Đặc biệt, trong thời gian gần đây,
rất nhiều loại điện thoại di động đời mới có hỗ trợ kết nối Internet được tung
ra thị trường, một trong những ứng dụng của các thiết bị này là tạo điều kiện
đưa người dùng tin đến gần hơn với OPAC, với nguồn tin mà họ đang tim kiếm Chính điều này cũng đang tạo nên một làn sóng mới trong hoạt động
thông tin - thư viện, đó là quảng bá hình ảnh, marketing nguồn tin của mình trên mạng Internet và mạng điện thoại di động
Đối với một tài liệu ở dạng truyền thống: sách, báo, luận văn, việc số
hóa tài
Trang 16
Tài liệu số hóa thư mục là tài liệu chỉ được số phần thư mục Các yếu tố thư mục được đưa vào số bao gồm một số hoặc tất cả các yếu tố sau: Tên
tác giả (có thể có nhiều tên tác giả, tên cơ quan hay tổ chức xuất bản tài liệu), tên người dịch, tên người sưu tầm, tên người hiệu dính ; Tên tài liệu (có thể
bao gồm cả tên tài liệu bằng nhiều thứ tiếng khác nhau nếu tài liệu được xuất
bản đa ngôn ngữ); Nơi xuất bản, Nhà xuất bản, Năm xuất bản; Khổ cỡ của tài liệu; Số trang của tài liệu; Chỉ số ISBN hoặc ISSN Ngoài ra, còn một số
các yếu tổ khác là: Ký hiệu phân loại tài liệu, Ký hiệu xếp giá tài liệu (có thể có cả ký hiệu tên thư viện, trung tâm thông tin, cơ quan lưu trữ tài liệu nếu là mục lục liên hợp); Ký hiệu định chủ đề; Các từ khoá; Bản tóm tắt nội dung tài
liệu
Tài liệu số hóa dữ kiện, dữ liệu là tài liệu ngoài phần số thư mục còn có thêm phần số một số dữ kiện, dữ liệu của tài liệu gốc nhưng khơng phải là
tồn bộ các thông tin chứa đựng trong tài liệu gốc Các dữ kiện, dữ liệu này
có thể là thông tin lịch sử; số liệu thống kê; biểu đồ tăng trưởng; thành phần
cấu tạo; công thức điều chế hoá học; một số nhận định, phân tích và dự báo
được nêu trong tài liệu gốc;
Tài liệu số hóa toàn văn có nội dung là toàn bộ nội dung của tài liệu
gốc đã được số hóa Đây là loại hình tài ố trọn vẹn nhất, có giá trị sử
dụng lớn nhất trong số các loại hình tài liệu số Bởi giá trị của thông tin, nằm
ngay ở chính thông tin đó, chứ không phải được quy định bởi tên tác giả, tên
tài liệu hay một vài dòng xuất hiện trong nguồn tin Nếu có trong tay tài
liệu số thư mục, người dùng tin chỉ biết thông tin về tài liệu (nghĩa là thông
tin về thông tin) Nếu có được tài liệu số dữ kiện, dữ liệu thì người dùng tin
cũng mới chỉ chạm được vào một phần của kho báu thông tin Nghĩa là, để có
được tồn bộ thơng tin mình cần, người dùng tin phải trải qua ít nhất một
Trang 17điều này, có thể người dùng tin phải tới tận nơi lưu giữ thông tin đề tìm kiếm
tài liệu gốc (nếu tài liệu đó chưa được số toàn văn) hoặc đưa ra yêu cầu được
truy cập tới nguồn toàn văn (nếu người dùng tin chưa được cấp quyền truy cập, hoặc chưa đủ điều kiện đề được truy cập tới các nguồn toàn văn của tài liệu quý, hiếm và chỉ lưu hành nội bộ, hay chưa thực hiện các nghĩa vụ cần
thiết như: trả phí truy cập, đăng ký thông tin người dùng ) Nhưng nếu chỉ
sau một thao tác click chuột, người dùng tin truy cập được đến nguồn tài liệu
số toàn văn - điều đó cũng đồng nghĩa với việc họ được sử dụng toàn bộ
thông tin đó, rất nhanh chóng và thuận tiện mà không cần phải tính đến các
trở lực lớn như: khoảng cách địa lý, giới hạn thời gian hay những ức chế trong
khi chờ đợi để được đến lượt tiếp cận với toàn văn tài liệu Đó là niềm mơ:
ước lớn lao nhất của mọi người dùng tin trên thế giới và cũng là điểm đích mà
mọi thư viện, trung tâm thông tin, cơ quan lưu trữ trên toàn cầu đang nỗ lực
hướng tới
1.1.2 Khái niệm thư viện số
Nhiều định nghĩa đã được công bố trong giới học giả toàn cầu về thư viện nhằm định nghĩa rõ ràng một thư viện số Dưới đây là một số định nghĩa
tiêu biểu về thư viện số:
Hai hoc giả người Nga là Sokolova và Liyabev cho rằng thư viện số là một hệ thống phân tán có khả năng lưu trữ và tận dụng hiệu quả các loại tài liệu điện tử khác nhau, và giúp người dùng có thể truy cập và được chuyển
giao thông tin dễ dàng qua mạng máy tính
Nhiều học giả Trung Quốc lại có cùng quan điềm rằng “Một thư viện
số trên thực tế không phải là một thư viện ở góc độ mở rộng không gian của nó; thay vào đó nó là trung tâm tài nguyên thông tin số chứa đựng tài nguyên
Trang 18chẳng hạn như văn bản, ký tự, chữ viết, hình ảnh, video và âm thanh, đồng thời cung cấp cho người dùng các dịch vụ thông tin nhanh chóng và thuận
tiện thông qua Internet, nhằm chuyền giao một hệ thống thông tin số mà trong đó việc chia sẻ nguồn tài nguyên luôn sẵn sàng”
Theo định nghĩa của Liên hiệp Thư viện số Hoa Kỳ năm 1999: Thư
viện số là các cơ quan, tô chức có các nguồn lực, kể cả các nguồn nhân lực chuyên hóa, đề lựa chọn, cấu trúc, cung cấp việc truy cập đến, diễn giải, phố
biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu
tập công trình số mà chúng ở dạng sẵn sàng đề sử dụng một cách kinh tế cho một hoặc một số cộng đồng nhát định
Theo tác giả Vũ Văn Sơn: “Thư viện số là hình thức kết hợp giữa thiết
bị tính toán, lưu trữ và truyền thông số với nội dung và phần mềm cần thiết để
tái tạo, thúc đây và mở rộng các dịch vụ của các thư viện truyền thống vốn
dựa trên các biện pháp thu thập, biên mục và phổ biến thông tin trên giấy và các vật liệu khác”
Tóm lại: Thư viện số được hiểu là nơi lưu trữ nguôn thông tin số, đặc
biệt là thông tin toàn văn, đồng thời sử dụng các phương tiện số trong thu
thập, lưu trữ, xử lJ, tìm kiếm và phổ biến thông tin
1.1.3 Khái niệm siêu dữ liệu
Trang 19những quy tắc biến đổi Siêu dữ liệu bao quát tất cả các phương diện của kho
dữ liệu
Thuật ngữ siêu dữ liệu được định nghĩa là sự mô tả các nguồn thông tin
điện tử nhằm mục đích nhận diện, quản lý, phân loại và tra cứu nguồn thông
tin khi làm việc với tập hợp các nguồn thông tin Siêu dữ liệu là những dữ liệu
mô tả về ngữ cảnh, nội dung, cấu trúc và sự quản lý tài liệu theo dòng chảy
của thời gian
Siêu dữ liệu phải chứa những thông tin:
œ Cấu trúc của dữ liệu
« _ Thuật tốn sử dụng để tổng hợp dữ liệu
© Ánh xạ xác định sự tương ứng dữ liệu từ môi trường tác nghiệp sang kho dữ liệu
Siêu dữ liệu là dữ liệu để mô tả dữ liệu Khi dữ liệu được cung cấp cho người dùng cuối, thông tin siêu dữ liệu sẽ cung cấp những thông tin cho phép họ hiểu rõ hơn bản chất về dữ liệu mà họ đang có Những thông tin này sẽ
giúp cho người dùng có được những quyết định sử dụng đúng đắn và phù hợp
về dữ liệu mà họ có
'Tuỳ thuộc vào từng mục đích sử dụng khác nhau, từng loại dữ liệu khác nhau mà cấu trúc và nội dung dữ liệu metadata có thể có những sự khác biệt
Song, nhìn chung sẽ bao gồm một số loại thông tin cơ bản sau: « Thông tin mô tả về bản thân dữ liệu metadata
«_ Thông tin về dữ liệu mà metadata mơ tả
« Thông tin về cá nhân, tổ chức liên quan đến dữ liệu metadata và dữ liệu Dublin Core Metadata là một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và được nhiều người biết đến Bộ yếu tố này được hình thành lần đầu
Trang 20Core Metadata Element Initiative) Tap hop yéu t6 siéu dữ liệu này được gọi
là “cốt lõi” (core) vì nó được thiết kế đơn giản và chỉ bao gồm 15 yếu tố mô tả cốt lõi nhất (trong khi Marc21 có hơn 200 trường và rất nhiều trường con)
1 ĐC Creater (Tác giả): Tác giả của tài liệu, bao gồm cả tác giả cá nhân và tác giả tập thé
2 DC Title (Nhan đẻ): Nhan đề của tài liệu
3 DC Subjeet (Chủ đề): Chủ đề tài liệu đề cập dùng để phân loại tài
liệu Có thê thể hiện bằng từ, cụm từ/(Khung chủ đề), hoặc chỉ số
phân loại/ (Khung phân loại)
4 DC Contributor (Cộng tác, đóng góp): Tên những người cùng tham gia cộng tác đóng góp vào nội dung tài liệu, có thể là cá nhân, tổ chức
5 DC Date (Năm xuất bản): Ngày, tháng, năm ban hành tài liệu
6 ĐC Publisher (Nhà xuất bản): Nhà xuất bản, nơi ban hành tài liệu có thể là tên cá nhân, tên cơ quan, tổ chức, dịch vụ
7 DC Description (Trich dan, trích yếu nội dung): Tóm tắt, mô tả nội
dung tài liệu Có thể bao gồm tóm tắt, chú thích, mục lục, đoạn văn bản để làm rõ nội dung
8 DC Type (Kiểu tài liệu): Mô tả bản chất của tài liệu Dùng các thuật ngữ mô tả phạm trù kiểu: trang chủ, bài báo, báo cáo, từ điển
9 ĐC Format (Mô tả vật lý, định dạng): Mô tả sự trình bày vật lý của tài liệu, có thể bao gồm; vật mang tin, kích cỡ độ dài, kiểu dữ liệu (doc, html, jpg, xls, phần mềm )
10 DC Identifiers (Định danh tư liệu): Là một dãy ký tự hoặc số
Trang 2111 ĐC Source (Nguồn gốc tài liệu): Nguồn gốc mà tư liệu được tạo thành, yếu tố này có thê gồm siêu dữ liệu về nguồn thông tin thứ hai
nhằm khai thác tư liệu hiện hành
12 DC Language (Ngôn ngừ): Ngôn ngữ của nội dung tư liệu, được thành lập theo quy tắc RFC1766
13 DC Relation (Liên kết toàn văn): Một định danh cho nguồn thứ
hai và mối quan hệ của nó với tư liệu hiện hành Yếu tố này thể hiện
sự kết nối giữa các nguồn tư liệu có liên quan
14 ĐC Coverage (Diện bao quát): Các thông tỉn liên quan đến phạm vi, quy mô hoặc mức độ bao quát của tài liệu Phạm vi đó có thể là địa điểm, không gian hoặc thời gian, tọa độ
15 DC Right (Bản quyền): Các thông tin liên quan đến bản quyền của
tài liệu
Tầm quan trọng và ý nghĩa đặc biệt của siêu dữ liệu càng rõ nét khi quản lý tài liệu trong môi trường điện tử Trong môi trường điện tử, tài liệu chính thức luôn luôn kèm theo các siêu dữ liệu Không có siêu dữ liệu không thể xác định một cách chính xác những đặc tính cơ bản của tài liệu điện tử Siêu dữ liệu đảm bảo tính bắt biến, độ tin cậy và chứng cứ pháp lý của tài liệu
điện tử
1.1.4 Tầm quan trọng của tai liệu số và việc quản lý tài liệu số
Ngày nay, nguồn tài liệu số đang giữ vai trò quan trọng, làm thay đổi
Trang 22- Tài liệu số vừa là hệ quả vừa là cơ sở phát triển ngành xuất bản điện tử:
Tài liệu số ra đời đã góp phần làm thay đổi diện mạo ngành xuất bản
với hàng loạt sản phẩm mới được tung ra thị trường với tên gọi loại hình là ấm
phẩm điện tử hay xuất bản phẩm điện tứ Ý tường đầu tiên về xuất bản điện
tử được ông Vanner Bush đưa ra tại một hội thảo khoa học ở Viện Công nghệ Massachusertte (Mỹ) vào năm 1945 Sau đó ít lâu, đã có một sự bùng nỗ hàng loạt các sản phẩm kỳ thuật số và các lợi thế về kỹ thuật không thể phủ nhận
Năm 1991, cuốn sách điện tử đầu tiên chào đời tại Mỹ Từ năm 1998, sách
điện tử được xuất bản ở dạng đĩa và có thể được tải xuống máy tính cá nhân từ Internet Không còn nghỉ ngờ gì nữa, điều này có ý nghĩa vô cùng quan trọng cả về mặt học thuật cũng như trên phương diện kinh doanh
'Vào năm 1995, F.W Lancaster đã phác thảo một lịch sử ngắn gọn về việc xuất bản các ấn phẩm điện tử như sau: Sử dụng máy tính để tạo ra những
ấn bản như bản in trên giấy thông thường -> Phân phối văn bản bằng hình
thức điện tử (số) nơi mà phiên bản điện tử tương đương chính xác với phiên
bản in ấn -> Xuất bản những ấn bản nhỏ gọn hơn bản in dưới hình thức số
hoá, có thêm những đặc điểm phụ trội để mở rộng khả năng nghiên cứu, điều khiển dữ liệu (qua sự tương xứng hình ảnh) -> Tạo ra những ấn bản hoàn toàn
mới và khai thác thêm nhiều tính năng của các phương tiện kỹ thuật số, như
ứng dụng các kết nối siêu văn bản, tích hợp các chức năng truyền thông
Các loại hình xuất bản phẩm điện tử có trên thị trường hiện nay là sách điện tử (E-Book) và các báo, tạp chí điện tir (E-Journal),
Có thể hiểu một cách đơn giản, sách điện tử là sự trình bày các tệp tin
trên màn hình số, có thể là trên mạng hoặc trên CD ~ ROM hay một thiết bị
Trang 23hiện nhờ một thiết bị chuyên dụng nào đó (Kindle của Amazon, Geimei,
Floyer ) Từ điển tiếng Anh rút gọn của nhà xuất bản Oxford — The New
Concise Oxford English Dictionary (2001) có đưa ra định nghĩa sách điện tử là: “Một phiên bản điện tử của một quyển sách in có thẻ đọc được trên máy:
tính cá nhân hay một thiết bị cằm tay được thiết kế cho mục đích này"
Cũng giống như nguyên lý ra đời của sách điện tử, các loại báo và tap chí điện tử cũng được ra đời và ngày cảng trở nên phổ biển
Có một số cách thông dụng để khách hàng sử dụng ấn phẩm diện tử lên mạng đọc từ website, dùng tài khoản đăng nhập hệ thống và tai v may tính cá nhân để đọc chúng, đăng nhập tài khoản trên mạng và tải về các máy
trợ giúp cá nhân (personal digital assistan:) hay thiết bị cằm tay (handheld- computer), in ra giây đễ đọc
Sự phát triển của công nghệ thông tin và truyền thông đã thúc đẩy sự
phát triển của ngành xuất bản điện tử Theo số liệu thống kê, năm 2004 chỉ có
36.000 tên tạp chí điện tử, nguồn tin điện tử là 5,4 triệu tên Năm 2009, con số
này là 159.000 tên tạp chí điện tử, nguồn tin điện tử tăng lên tới 42,1 triệu tên (Theo OCLC 2004 Information format: content, not containers)
Sự xuất hiện của các xuất bản phẩm điện tử một lần nữa khẳng định
việc tài liệu số ra đời đã làm thay đồi diện mạo ngành xuất bản toàn cầu
- Tài liệu số là cơ sở của sự hình thành và phát triển ngành công nghiệp
nội dung số
Sự phát triển có tính chất bùng nỗ của các nguồn tài liệu số trong những năm gần đây đã dẫn đến hình thành khái niệm “ndi dung số” và kéo
Trang 24Nội dung số (tiếng Anh là E-Content hay Digital Content) la thuật ngữ được dùng để chỉ các thông tin hữu ích chứa đựng trong các tài liệu số Các thông tin này có thể tồn tại trên website, hay thông tin chứa trong các tệp dữ liệu ở dạng văn bản, hình ảnh, âm thanh hoặc dạng đa phương tiện, tích hợp văn bản, âm thanh, video Đây là một khái niệm rộng, bao quát nhiều lĩnh
vực và phát triển liên tục, bao gồm phần mềm nội dung, trò chơi điện tử, học tập trực tuyến (E-leaming), xuất bản điện tử, quảng cáo trên Intemet
Các sản phẩm chứa đựng nội dung số, khi tham gia thị trường, sẽ làm hình thành nên ngành công nghiệp nội dung số (CNNDS) Công nghiệp nội
dung sé (tiéng Anh la Digital Content Industry - DCI) là một khái niệm còn
rất mới và trên thế giới vẫn chưa tìm ra được một định nghĩa thống nhất Theo
quan điểm của Bộ Bưu chính- Viễn thông Việt Nam: CNNDS là ngành thiết
kế, sản xuất, xuất bản, lưu trữ, phân phối, phát hành các sản phẩm nội dung số
và dịch vụ liên quan Tập hợp các hoạt động liên quan đến số hố thơng tin ở quy mơ lớn, có sản phẩm hoàn chỉnh và có khả năng đem lại lợi nhuận thì được gọi là ngành CNNDS Các hoạt động trong CNNDS bao gồm: thu thập thông tin; phân tích nội dung để phân loại, lưu trong bộ nhớ máy tính hoặc hiển thị nội dung trên mạng; bao gói thông tin thành các CSDL trên vật mang tin mong muốn: CD - ROM, DVD, thiết bị lưu trữ di động; nhân bản và cung cấp (bán) các sản phẩm thuộc CSDL đó hoặc toàn bộ CSDL
Nhiều người cho rằng, CNNDS là một nhánh của công nghệ thông tin vì nó gắn liền với công nghệ thông tin [7, tr.14] San pham của CNNDS chính
là sản phẩm của quá trình ứng dụng công nghệ thông tin, từ công nghệ phần
mềm, thu thập thông tin, xử lý, lưu trữ thông tin đến cung cấp thông tin
CNNDS không chỉ liên quan đến phần cứng, phần mềm máy tính hay hệ thống mạng mà còn liên quan đến nhiều lĩnh vực khác như: lưu trữ, sản xuất
Trang 25vào của ngành CNNDS là thông tin và sản phẩm đầu ra cũng là thông tin
Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể và được cung cấp cho những đối tượng cụ thể nhằm phục vụ cho một hay một số hoạt động kinh tế - xã hội nhất định
Chắc chắn rằng, nếu được tô chức tốt, các sản phẩm số sẽ có thị trường
rộng lớn, không phải chỉ ở trong một quốc gia Nhận biết được điều đó, ngày 19/7/2007, Thủ tướng Chính phủ đã ban hành Quyết định số 901/QĐÐ~ TTg về việc *Thành lập Vi
éNam, thuộc Bộ Bưu chính, Viên thông ” Từ đầy, CNNDS ở Việt Nam bước
Công nghệ phần mềm và nội dung số Việt
sang một trang mới Hy vọng, CNNDS sẽ không ngừng lớn mạnh để hỗ trợ,
cung cấp các nguồn tài liệu số cho các Thư viện số và làm cho hoạt động
thông tin khoa học công nghệ sôi động, hấp dẫn hơn
~ Quản lý tài liệu số toàn văn là cơ sở để hình thành thư viện số
Thư viện diện tử, thư viện số, thư viện ảo, là những tên gọi không còn xa lạ đối với những người làm công tác thư viện Việt Nam nhưng vẫn còn tồn tại nhiều cách hiểu, cách định nghĩa khác nhau Có thể coi thư viện số là một kho thông tin dưới dạng số, được cấu trúc sao cho dễ dàng truy cập thông qua các mạng máy tính hay các mạng viễn thông Đó là một hệ thống thông tin tự động hoá mà ở đó, người ta có thé thu thập, xử lý, lưu trừ, tìm kiếm và
phô biến các tài liệu dưới dạng số thông qua các phương tiện công nghệ thông tin và truyền thông,
Hạt nhân của thư viện số là nguồn tải liệu số Trong đó, một bộ phận là
tài liệu số toàn văn từ tài liệu in ấn, phần chủ yếu là các bộ sưu tập số mới
được xây dựng hoặc bổ sung qua nhiều con đường khác nhau như mua, được
biếu tặng, trao đôi Bộ sưu tập số là một tập hợp có tô chức nhiều tài liệu số
Trang 26tài liệu riêng lẻ có sự khác nhau về cách thê hiện, nhưng đều cung cấp một giao diện đồng nhất mà qua đó việc tra cứu, truy cập tài liệu được thực hiện
dễ dàng, thuận tiện Phần mềm quản trị tài liệu số sẽ đem lại cho thư viện tiện
ích nỗi trội mà dịch vụ thư viện truyền thống chưa có như:
- Tạo ra một môi trường bình đẳng cho mọi người được sử dụng trỉ thức nhân loại mà không vướng phải rào cản về không gian, thời gian;
~ Có tính linh hoạt và khả năng đáp ứng nhu cầu sử dụng rất cao nhờ tính chất đa truy cập của nguồn tài liệu số;
~ Tiết kiệm thời gian và kinh phí cho thư viện trong việc xây dựng kho tàng, bảo quản tài liệu, cũng như giúp người dùng tin cắt giảm chỉ phí,
giảm thời gian trong tìm kiếm thơng tin;
lố tồn văn tài liệu và xây dựng bộ sưu tập số là lựa chọn tối ưu
để bảo tồn lâu dài các tài liệu gốc quý hiếm, ngăn chặn những rủi ro, huỷ hoại
tài liệu do thời gian, thiên tai,
Phan cốt lõi của thư viện số là kho tài liệu số với phần mềm quản trị
vốn tài liệu này Vì vậy, việc phát triển kho tài liệu số và tìm kiếm một phần
mềm quan tri tai liệu số là công việc quan trọng hàng đầu trong xây dựng thư viện số
~ Quản trị tài liệu số giúp thư viện đỗi mới và nâng cao chất lượng phục vụ
người dùng tin
Trong thư viện hiện đại, tài liệu số đóng một vai trò cực kỳ quan trọng Theo xu hướng phát triển chung của khoa học và công nghệ, việc xuất bản tai
Trang 27không thê tổ chức lưu trữ và bảo quản được số lượng lớn tài liệu số đang tăng lên hàng ngày, đồng thời đọc giả cũng khó có thể tìm kiếm được tài liệu mình cần trong khối lượng tài liệu số khổng lồ của thư viện Hay nói khác đi, phần mềm quản trị tài liệu số chính là chìa khóa để thư viện cải tiến chất
lượng phục vụ, xây dựng các sản phẩm và dịch vụ thông tỉn có giá trị gia
tăng cao
Các thư viện, cơ quan thông tin nếu không sử dụng phần mềm quan tri tài liệu số sẽ không tô chức, quản lý và khai thác hiệu quả nguồn tài liệu số
của mình Nói cách khác, nguồn tài liệu số dù lớn tới đâu, nội dung phong phú, đa dạng cũng không tới được với người dùng tin nếu không được tổ
chức, quản lý khoa học bằng các phần mềm chuyên dụng Các thư viện, cơ quan thông tin sử dụng phần mềm quan tri tài liệu số đề có thể thu thập, xử lý, lưu trữ, tìm kiếm và phổ biến tài liệu số tới người dùng tin thông qua các phương tiện công nghệ thông tin và truyền thông
Nguồn tài liệu số được quản lý thông qua công tác tạo lập các bộ sưu
tập số, biên mục tải liệu số vào phần mềm Trên cơ sở đó các thư viện, cơ
quan thông tin tô chức phân phối tài liệu số tới người dùng tin Người ding
tin đăng kí sử dụng dịch vụ thư viện số, tra tìm và khai thác tài liệu số qua
module OPAC cia phan mềm Phần mềm quản trị tài liệu số không chỉ giúp các thư viện, cơ quan thông tin tạo lập, quản lý tài liệu số mà nó còn là cầu
nối giữa người dùng tin với kho tài liệu số của các thư viện, cơ quan thông
tin
Trang 28Như vậy có thể nói rằng để tạo lập, quản lý và khai thác tài liệu số không thể không có các phần mềm quản trị tài liệu số Một thư viện số sẽ không th tần tại nếu không có phan mém quán trị chuyên dụng đề thu thập, xử lý, lưu trữ, tìm kiếm và phổ biển tài liệu số tới người dùng tin
1⁄2 Công tác số hóa tài liệu và việc ứng dụng phần mềm quản trị tài
liệu số ở các thư viện công cộng
1.2.1 Công tác số hóa tài liệu trong hệ thống thư viện công cộng
Để đánh giá thực trạng công tác số hóa và xây dựng nguồn lực thông tin
địa phương số, Bộ Văn hóa, Thể thao và Du lịch đã tiến hành một cuộc điều tra
các thư viện công cộng cấp tỉnh trong phạm vi cả nước (năm 2011) Kết quả, có 43 thư viện tỉnh thành phố đã phản hồi Trong số đó có 25 thư viện (chiếm
58,1%) đã triển khai công tác số Việc số hóa tài liệu địa chí đã được tại triển
khai tạo các thư viện tỉnh nhằm mục đích bảo quản và quy tụ các nguồn tài liệu quý về một mi nhằm giúp bạn đọc và các nhà nghiên cứu tiếp cận được thông tin về xuất bản phâm địa phương, nhân vật lịch sử địa phương, sự kiện địa phương, vấn đề dân tộc học và bản sắc văn hóa truyền thống của địa phương một cách đầy đủ, thuận tiện nhất
Việc số hóa tài liệu được thực hiện trong các thư viện Việt Nam từ cuối thập kỷ 90 của Thế kỷ XX Thư viện Khoa học Tổng hợp Thành phố Hồ Chí Minh (TVKHTHTPHCM) là một trong những thư viện công cộng cấp tỉnh tiên phong trong việc triển khai công tác số hóa tài liệu Ngay từ năm 1998
thư viện đã có chương trình số hóa đầu tiên với các sản phẩm đầu tiên là số
hóa khoảng 10 nhan đề sách kho Đông Dương, chương trình nhân kỷ niệm 300 năm Sài Gòn — TP.Hồ Chí Minh Năm 2003, TVKHTHTPHCM thật sự
Trang 29toàn văn Thư viện Quốc gia Việt Nam (TVQGVN) đã bắt đầu triển khai số
hóa từ năm 2003
Nguồn kinh phí thực hiện số hóa có được từ các dự án số hóa do nước
ngoài tài trợ và do ngân sách trung ương và địa phương cấp Năm 2011, TVQGVN da bit dau thực hiện Dự án số hóa tài liệu với tổng kinh phí hơn 20 tỷ đồng Tại TVKHTHTPHCM, Dự án VALEASE do thư viện phối hợp với
Tổng lãnh sự quán Pháp số hóa các tài liệu bằng tiếng Pháp và tiếng Việt nói về 3 nước Đông Dương được tiến hành theo nhiều bước Đây là dự án được
triển khai theo hình thức thuê ngoài (outsourcing) Số lượng tài liệu được số
hóa là sách Đông Dương khoảng 540.000 trang sách, báo tạp chí và công báo Từ năm 2008 Thư viện tỉnh Yên Bái được tiếp nhận Dự án hợp tác văn hoá giữa tỉnh Yên Bái và Hội đồng tỉnh Val-de-Mame (Cộng hoà Pháp) với mục tiêu: Nâng cao năng lực phục vụ cộng đồng, phát triển sự nghiệp văn hoá, nâng cao đời sống văn hoá tỉnh thần cho nhân dân các dân tộc tỉnh Yên Bái
Tiêu Dự án “Phục chế, bảo quản và số hóa tài liệu cỗ lưu giữ tại Thư viện
tỉnh Yên Bái ” được thực hiện và bước đầu triển khai
9 thư viện tỉnh đã thường xuyên được cấp kinh phí cho hoạt động số
bao gồm: TVKHTHTPHCM, Thư viện tỉnh Quảng Ngãi, Hà Tĩnh, Cần Thơ, Gia Lai, Bình Dương, Đắc Lắc, Bình Thuận, Vũng Tàu Tuy nhiên, kinh phí
dành cho hoạt động số còn hạn chế, có tới 83,3% thư viện chỉ được cấp
50.000.000 đồng/năm cho hoạt động này Chỉ có 3 thư viện được cấp trên
100.000.000 đồng cho hoạt động số: TVKHTHTPHCM, Thư viện tỉnh Bà Rịa-Vũng Tàu và Thư viện tỉnh Thanh Hóa
Một trong những hướng ưu tiên mà các thư viện hướng tới là số hóa
các tài liệu quý hiếm và tài liệu địa chí Trong đó, 55,8% thư viện tiến hành số
Trang 30Mặc dù mới được triển khai, nhưng các thư viện đã thực hiện số hóa một số lượng tài liệu đáng kể
Tại TVQGVN, công tác số hóa được bất đầu với đối tượng Luận án
Hiện nay, TVQGVN đã số được 15.571 bản, tương đương với 2.500.000 trang Bên canh đó TVQGVN còn số hóa các tài liệu quý hiếm Bộ Sưu tập Đông Dương Thống kê đã hình thành với 829 tên (130.333 trang); Bộ Sưu tập 'Thăng Long Hà Nội với 850 tên, (407.970 trang)
Tại các thư viện tỉnh, việc số hóa đã đạt được một số kết quả nhất định Tính đến tháng 11/2011, Thư viện KHTH Tp Hồ Chí Minh đã số hóa được
hơn 3.000 tài liệu địa chí với 530.000 trang; Thư viện tỉnh Sơn La đã thực hiện số hóa được 313 tài liệu là sách chữ Thái cổ với 8.610 trang Ngoài số các tài liệu là sách chữ Thái cổ, Thư viện tỉnh Sơn La đã số hóa toàn văn được 269 tài liệu địa chí với 32.610 trang; thư viện tỉnh Khánh Hòa số hóa được hơn 550 tài liệu, Thừa Thiên Huế đã số được khoảng 180.000 trang tài liệu quý hiểm, các viện tỉnh Đồng Nai số hóa được 317 tài liệu địa chí với 24.544 trang; Thư íc phong, luận văn luận án và bài báo thí về địa phương; Thư
viện tỉnh Gia Lai số hóa được 47.200 trang,
Các tài liệu số trong các thư viện đã được đưa ra phục vụ với các mức độ khác nhau Trong đó, phục vụ tại chỗ với mạng nội bộ (LAN) của thư viện
chiếm ưu thế (62,5 %), số thư viện triển khai đưa lên mạng Internet cho bạn
đọc sử dụng còn hạn chế (37%) [2, tr.5]
1.2.2 Tông quan ứng dụng phần mềm quản trị tài liệu số ở các thư viện công
cộng
Trang 31viện điện tử Vì thế bên cạnh tài liệu, sản phẩm thông tin truyền thống, các thư viện tỉnh/thành phố trong cả nước đã có nhiều nỗ lực trong việc sưu tập, biên soạn và phát hành các sản phẩm thông tin như: thư mục toàn văn chuyên
đề, ấn pham tóm tắt, tổng quan cũng như dịch vụ thông tin mới như là phục
vụ theo chế độ hỏi đáp, nói chuyện chuyên đẻ, dịch vụ tra cứu thông tin qua mạng Một trong những hoạt động đề hình thành vốn tài liệu điện tửitài liệu số được các thư viện công cộng quan tâm thực hiện là số các tài liệu quý hiếm Nhiều thư viện đã xây dựng được các bộ sưu tập số lên đến hàng trăm nghìn trang
Tuy nhiên, hầu hết các thư viện đều gặp khó khăn khi tiến hành tổ chức, quản lý và khai thác hiệu quả nguồn lực thông tin quý giá này Ngoài một số phần mềm thương mại như iLIB.Di của công ty CMC, Libol Digital của công ty Tỉnh Vân, Vebrary của công ty Lạc Việt các thư viện công công còn sử dụng phần mềm nguồn mở Greenstone để quản lý tài liệu số của mình và tổ
chức phục vụ bạn đọc tra cứu, khai thác tài liệu số
TAI LIEU SO
STT THU VIEN Nhan 48 | Sé lugng trang PHAN MEM 1 | Bình Dương 853 172.839 | PSC zLIS 6.0 2_ | Cần Thơ, 73 32.026 3 | Gia Lai 7.239 47.200 | iLIB.Di 3.0 4 | Hải Dương 38 6.951 $_ | Hải Phòng 291 15.562 6 [Hoa Binh 97 30.176 7_ | Lạng Sơn 356 10.278
§ | Phú Yên $.397 | trên 300.000 | Greenstone
9 |SơnLa 361 32.610 | Libol Digital 6.0
Trang 32Qua khảo sát tại 10 thư viện tinh có 04 thư viện đã có phần mềm quản trị
tài liệu số, trong đó có 03 thư viện sử dụng phần mềm thương mại là Bình Dương, Gia Lai và Sơn La Thư viện Phú Yên sử dụng phần mềm mã nguồn
mở Greenstone đề quản trị bộ sưu tập số
Sáu thư viện còn lại chưa sử dụng phần mềm quản trị tài liệu số, tài liệu số của các thư viện này chủ yếu được số hóa để bảo quản và "chờ" tìm được
phần mềm thích hợp mới mang ra khai thác Do không có phần mềm các thư viện này chưa thể phục vụ được bạn đọc mà mới chỉ lưu trong đĩa quang, ổ
cứng Thư viện Thừa Thiên - Huế do chưa có phần mềm nên chưa thống kê
được chính xác tên tài liệu và số lượng trang tài liệu đã số hóa
Các phần mềm thương mại đang được sử dụng tại các thư viện công cộng tuy đã đáp ứng được phần nào hoạt động tổ chức, quản lý và khai thác
nguồn lực thông tin số nhưng các phần mềm này có giá thành khá cao (từ khoảng 400 triệu đến trên 1 tỷ đồng) Hơn nữa các phần mềm này vẫn còn nhiều lỗi nảy sinh trong quá trình sử dụng Phần mềm nguồn mở Greenstone,
DSpace, Zope dù được sử dụng miễn phí nhưng cài đặt và sử dụng phức
tạp VỀ giao diện các phần mềm này nhìn chung chưa thân thiện nên ít được
các thư viện công cộng lựa chọn sử dụng
Ứng dụng mã nguồn mở đề xây dựng một phần mềm quản trị thư viện số
nhỏ gọn, dễ sử dụng, dễ quản trị, giao diện thân thiện và gần gũi với người
'Việt cho hệ thống thư viện công cộng là thực sự cần thiết vào thời điểm này
1.2.3 Yêu cầu của một phần mềm quản trị tài liệu số cho hệ thống thư viện
công cộng
1.2.3.1 Nhóm yêu cầu về công nghệ
Một phần mềm quản trị tài liệu số được coi là đáp ứng yêu cầu của thư
Trang 33- Dé dang va thuận tiện trong cải đặt và sử dụng,
~ _ Có thể mở rộng các chức năng theo yêu cầu phát triển trong tương lai,
~_ Có thể quản lý được số lượng tài liệu lớn với nhiều kiểu dữ liệu số khác
nhau, việc tra cứu tìm kiếm thông tin chính xác và nhanh chóng,
từ nhiều may
- _ Việc nhập thông tin vào hệ thống có thể được thực hiệ tính khác nhau, từ nhiều địa điểm khác nhau,
= Phan mềm có thê chạy trên nhiều hệ điều hành như các phiên bản khác
nhau của hệ điều hành Windows cũng như Unix hoặc Linux,
- Phần mềm đảm bảo quản lý an toàn dữ liệu ở nhiều mức khác nhau
Những yêu cầu trên đối với một phần mềm quan tri tài liệu số được thể hiện dưới dạng các yêu cầu kỹ thuật như sau:
a Nguyên tắc thiét ké theo module
Xây dựng theo kiến trúc nhiều lớp, hệ thống gồm nhiều module chức năng và được tích hợp thành một hệ thống thống nhất Phần mềm được thiết kế, xây dựng và vận hành trên nguyên tắc mở, đảm bảo khả năng
mở rộng, nâng cắp, bỗ sung thêm các module chức năng mới mà không
phá vỡ sự ồn định của hệ thống Phần mềm phải đảm bảo được sự kế thừa những thành quả đạt được sau mỗi lần mở rộng, nâng cấp
b Xây dựng theo mô hình khách / chủ
Phần mềm phải đảm bảo được thiết kế và vận hành theo mô hình khách
chủ (clienuserver) để đảm bảo dữ liệu được quản lý tập trung dé dang
cho việc bảo mật, đồng bộ, sao lưu phục hồi Phần mềm được thiết kế
Trang 34cho CSDL của hệ thống tập trung, vận hành, bảo trì nhanh chóng, dễ dàng
Chay trên nền web và hỗ trợ giao thức TCP/IP
Ứng dụng Web có thời gian phát triển nhanh, với giá thành phát triển
và triển khai thấp, tin cậy, có thể truy cập từ bất cứ đâu trên thế giới,
mọi người có thể sử dụng mà không mắt thời gian tìm hiểu nhờ giao diện trực quan Hỗ trợ giao thức TCP/IP để đảm bảo khả năng kết nối, chia sẻ dữ liệu trong mạng nội bộ (LAN), mạng toàn cầu (internet) Sử dụng hệ quản trị CSDL mô hình quan hệ
Mô hình dữ liệu quan hệ được Codd đề xuất năm 1970 và đến nay trở
thành mô hình được sử dụng phổ biến trong các hệ quản trị CSDL Hệ
quản trị CSDL mô hình quan hệ có các ưu điểm: cải thiện tính độc lập
của dữ liệu và chương trình; tối ưu hóa cách truy xuất dữ liệu; tăng tính
bảo mật và toàn vẹn dữ liệu
'Vận hành ổn định trên nhiều hệ điều hành khác nhau
Hệ thống (gồm cả máy chủ và máy trạm) đảm bảo vận hành ổn định trên nhiều hệ thống khác nhau như: Windows, Linux, MacrOS Hệ
thống có khả năng chạy đồng thời trên nhiều HĐH khác nhau và có thể
chuyển đổi hai chiều tir Windows sang Linux, MaerOS và ngược lại Hỗ trợ đa ngôn ngữ (hỗ trợ bảng mã Unicode)
Cả giao diện và bảng mã lưu trữ trong hệ thống đều phải hỗ trợ đa ngôn
ngữ, đảm bảo nhập tin, tìm kiếm tài liệu theo bắt kỳ ngôn ngữ nào (theo
Trang 35g Sấp xếp tiếng Việt
Phần mềm phải có khả năng sắp xếp dữ liệu tiếng Việt theo đúng trật tự
bảng chữ cái và dấu thanh (theo thứ tự dấu: huyền, sắc, hỏi, ngã, nặng) h Xuất bản điện tử Phần mềm có khả năng xuất bản dữ liệu từ các bộ sưu tập số ra đĩa quang, ỗ cứng di động ¡ Hỗ trợ các định dạng tệp dữ liệu số phổ biến số: văn bản, âm Phần mềm phải hỗ trợ tất cả các định dạng file dữ liệt thanh, hình ảnh, video j._ Vận hành ổn định với CSDL lớn
Phần mềm đảm bảo vận hành ôn định, tốc độ truy cập cao với CSDL
lớn (trên 1 triệu biểu ghi)
k An toàn hệ thống và bảo mật dữ liệu
Phần mềm đảm bảo hỗ trợ nhiều mức độ và cơ chế đảm bảo an toàn hệ
thống và bảo mật dữ liệu khác nhau Phân quyền chặt chẽ tới người
dùng là cán bộ thư viện va người dùng là bạn đọc với nhiều mức độ bảo
mật khác nhau Đối với dữ liệu số phần mềm đảm bảo phân quyền đến
từng tệp dữ liệu riêng rẽ
1 Sao lưu phục hồi dữ liệu
Sao lưu / phục hồi dữ liệu dễ dàng, đảm bảo toàn vẹn dữ liệu cho hệ
thống
m Cài đặt, sử dụng dễ dàng
Cán bộ thư viện có khả năng tự cài đặt, cấu hình hệ thống Phần mềm
Trang 361.2.3.2 Nhóm yêu câu về nghiệp vụ thư viện
a DublinCore
Phần mềm hỗ trợ nhập tin theo nhãn trường DublinCore, trao đổi dữ
liệu theo DublinCoreXML
b Hỗ trợ nhiều khung phân loại
Phần mềm phải hỗ trợ các khung phân loại phổ biến trên thế giới và
'Việt Nam
c Kiểm soát trùng biểu ghỉ
Phần mềm phải có khả năng kiểm soát trùng số ĐKCB, trùng biểu ghỉ
và thông báo tới cán bộ biên mục
d Hỗ trợ tìm kiếm đa dạng, chính xác
Tim kiếm theo tắt cả các trường nhập tin, kết hợp với việc sử dụng toán
tử logic (AND, OR, NOT) Tìm kiếm không phân biệt chữ hoa, chữ thường
e Có thể duyệt theo chủ đề
Bạn đọc có thể duyệt dữ liệu theo từng chủ đề, theo từng bộ sưu tập số
1.3 Ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL
1.3.1 Tông quan về PHP va MySQL
1.3.1.1 Ngôn ngữ lập trình PHP
Ban đầu PHP được viết tắt bởi cụm từ Personal Home Page PHP được
Trang 37Tới năm 1997 PHP có bước phát triển vượt bậc, PHP không còn là một dự án cá nhân của Rasmus Lerdorf mà đã trở thành một công nghệ web quan trọng và phổ biến Zaeev Suraski và Andi Gusman đã hoàn thiện việc phân tích cú
pháp cho ngôn ngữ lập trình này, đề rồi đến tháng 6 năm 1998, PHP3 ra đời
(phiên bản này các tệp PHP có phần mở rộng là php3)
Ngay sau khi PHP 3.0 chính thức được công bố, Andi Gutmans và
Zeev Suraski đã bắt đầu bắt tay vào việc viết lại phần lõi của PHP Mục đích
thiết kế là nhằm cải tiến tốc độ xử lý các ứng dụng phức tạp, và cải tiến tính module của co sở mã PHP Tháng 5 năm 2000 PHP4 ra đời, ngoài tốc độ xử
lý được cải thiện rất nhiều, PHP 4.0 đem đến các tính năng chủ yếu khác gồm
có sự hỗ trợ nhiều máy chủ Web hơn, hỗ trợ phiên làm việc HTTP, tạo bộ
đệm thông tin đầu ra, nhiều cách xử lý thông tin người sử dụng nhập vào bảo mật hơn và cung cấp một vài các cấu trúc ngôn ngữ mới Với PHP 4, số nhà
phát triển dùng PHP đã lên đến hàng tram nghìn và hàng triệu site đã công bố cài đặt PHP, chiếm khoảng 20% số tên miền trên mạng Internet
PHPS là phiên bản chính thức được sử dụng phổ biến nhất hiện nay, tuy nhiên người dùng đã có thể download PHP6 (phiên bản dùng thử) tại địa chỉ htip://snaps.php.net
1.3.1.2 Cơ sở dữ liệu MySOL
MySQL là hệ quản trị cơ sở dữ liệu mã nguồn mở phổ biến nhất thế
giới hiện nay, được các nhà phát triển rất ưa chuộng trong quá trình phát triển
ứng dụng MySQL là cơ sở dữ liệu tốc độ cao, ôn định và dễ sử dụng, hoạt
động trên nhiều hệ điều hành khác nhau, MySQL cung cấp một hệ thống lớn
Trang 38toàn cho nên người dùng có thể tai MySQL vé tir trang cha hup://avww.mysql.com My§QL có nhiều phiên bản cho các hệ điều hành khác nhau: Windows, Linux, Mac OS, Unix, FreeBSD, NetBSD, Novell NetWare, SGI Irix, Solaris, SunOS,
1.3.2 Lý do lựa chọn PHP va MySQL xy dựng phần mềm quản trị tài liệu số
1.3.3.1 Lý do chọn PHP
Khi sử dụng PHP, người dùng sẽ có được tốc độ nhanh hơn nhiều so
với các ngôn ngữ kịch bản khác, bởi PHP là phần mềm mã nguồn mở, được
hỗ trợ bởi nhiều lập trình viên giỏi, có số lượng người dùng đơng đảo Ngồi ra PHP chạy được trên nhiều hệ điều hành khác nhau
Rút ngắn thời gian phát triển: PHP cho phép bạn tách phần HTML code
va phin script, do đó có thể độc lập giữa công việc phát triển mã và thiết Điều này vừa giúp lập trình viên dễ dàng hơn vừa có thể làm cho chương
trình mềm dẻo hơn khi cần thay đồi giao diện
PHP là phần mềm mã nguồn mở: không chỉ là phần mềm mã nguồn mở
mà còn thực sự miễn phí (kể cả khi bạn sử dụng cho mục đích thương mại)
Do là phần mềm mã nguồn mở, các lỗi (bug) của PHP được công khai và
nhanh chóng được sửa chữa bởi nhiều chuyên gia trên toàn thế giới
Tốc độ: nhờ vào sức mạnh của Zend Engine, khi so sánh PHP với ASP,
có thê thấy PHP vượt hơn ở một số bài kiểm tra (test), vượt trội ở tốc độ biên
dịch
Tinh khả chuyên: PHP được thiết kế đề chạy trên nhiều nền tảng khác
Trang 39phẩm được phát trién trén nén UNIX, sau đó có thể chuyển sang Windows mà
không gặp phải bắt cứ vấn đề gì)
1.3.3.2 Lý do chọn MySOL
MySQL không chỉ là cơ sở dữ liệu mã nguồn mở phổ biến nhất trên thế
giới, nó còn trở thành cơ sở dữ liệu được chọn cho thế hệ mới của các ứng dung xay dumg trén nén Linux, Apache, MySQL, PHP/Perl/Python MySQL chay trén hon 20 platform bao gém: Linux, Windows, OS/X, HP-UX, AIX, Netware, mang đến cho người dùng tính linh hoạt trong việc sử dụng
Tính linh hoạt: Máy chủ cơ sở dữ liệu MySQL cung cấp đặc tính linh hoạt, có sức chứa để xử lý các ứng dụng được nhúng sâu với dung lượng chỉ
1MB để chạy các kho dữ liệu đồ sộ lên đến hàng terabytes thông tin Sự linh hoạt về platform là một đặc tính lớn của MySQL với tắt cả các phiên bản của
Linux, Unix, và Windows đang được hỗ trợ Và dĩ nhiên, tính chất mã nguồn
mở của MySQL cho phép sự tùy biến hoàn toàn theo ý muốn đề thêm vào các yêu cầu thích hợp cho database server
Tính thực thi cao: kiến trúc storage-engine cho phép các chuyên gia cơ sở dữ liệu cấu hình máy chủ cơ sở dữ liệu MySQL đặc trưng cho các ứng dụng đặc thù Dù ứng dụng là một hệ thống xử lý giao dịch tốc độ cao hay website dung lượng lớn phục vụ hàng triệu yêu cầu mỗi ngày, MySQL có thể
đáp ứng khả năng xử lý những đòi hỏi khắt khe nhất của bắt kì hệ thống nào
Với các tiện ích tải tốc độ cao, đặc biệt bộ nhớ đệm (caches), và các cơ chế xử
lý nâng cao khác, MySQL đưa ra tất cả các vũ khí cần phải có cho các hệ thống,
Trang 40từ cấu hình tái tạo chủ/khách tốc độ cao, đề các nhà phân phối thứ 3 đưa ra
những giải pháp có thể dùng ngay duy nhất cho server cơ sở dữ liệu MySQL
Hỗ trợ giao dịch mạnh: MySQL đưa ra một trong số những engine giao dịch cơ sở dữ liệu mạnh nhất trên thị trường Các đặc trưng bao gồm hỗ trợ
giao dich ACID hoàn thiện ( Atomic - tự động, Consistent — thống nhất,
Isolated — độc lập, Durable - bền vững), khóa mức dòng không hạn chế, khả
năng giao dịch được phân loại, và hỗ trợ giao dịch đa dạng (multi-version) mà người đọc không bao giờ gây trở ngại cho người viết và ngược lại Tỉnh toàn vẹn của dữ liệu cũng phải được bảo đảm trong suốt quá trình server có hiệu
lực, các mức giao dịch độc lập được chuyên môn hóa
Nơi lưu trữ Web và Data đáng tin cậy: MySQL là nơi quản lý, lưu trữ thông tin cho các websites phải trao đổi thường xuyên vì nó có engine xử lý tốc độ cao, khả năng chèn dữ liệu nhanh, hỗ trợ mạnh cho các chức năng chuyên dụng của web như tìm kiếm văn bản nhanh Những tính năng này cũng được áp dụng cho môi trường lưu trữ dữ liệu mà MySQL tăng cường
đến hàng terabyte cho các server đơn
Chế độ bảo mật dữ liệu mạnh: vì bảo mật dữ liệu là công việc số một của các chuyên gia về cơ sở dữ liệu, MySQL đưa ra tính năng bảo mật đặc
biệt chắc chắn dữ liệu sẽ được bảo mật tuyệt đối Trong việc xác nhận truy
ic chăn chỉ có
cập cơ sở dữ liệu, MySQL cung cấp các kĩ thuật mạnh mà c|
người sử dụng đã được xác nhận mới có thể truy nhập được vào server cơ sở dữ liệu, với khả năng này để chặn người dùng ngay từ mức máy khách là điều có thể làm được SSH và SSL cũng được hỗ trợ dé chắc chắn các kết nối được an toàn và bảo mật Cuối cùng, tiện ich sao lưu (backup) và phục hồi dữ liệu