1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn Thạc sĩ Khoa học Thư viện: Ứng dụng PHP/MySQL xây dựng phần mềm quản trị tài liệu số hóa cho hệ thống thư viện công

131 6 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng PHP/MySQL Xây Dựng Phần Mềm Quản Trị Tài Liệu Số Hóa Cho Hệ Thống Thư Viện Công
Tác giả Doãn Anh Đức
Người hướng dẫn TS. Nguyễn Viết Nghĩa
Trường học Trường Đại học Văn hóa Hà Nội
Chuyên ngành Khoa học Thư viện
Thể loại luận văn
Năm xuất bản 2012
Thành phố Hà Nội
Định dạng
Số trang 131
Dung lượng 27,26 MB

Nội dung

Trang 1

DOÃN ANH ĐỨC

ỨNG DỤNG PHP/MySQL XÂY DỰNG PHAN MEM QUAN TRI TAI LIEU SO

HOA CHO HE THONG THU VIEN

CONG

LUAN VAN THAC Si KHOA HQC THU VIEN NGUOI HUONG DAN KHOA HOC: TS NGUYEN VIET NGHIA

Trang 2

Loi cam on

Đề hoàn thành bản luận văn này, tôi đã nhận được sự hướng dẫn và giúp đỡ tận tình của TS Nguyễn Viết Nghĩa Tôi xin bày tỏ lòng biết ơn sâu sắc tới TS Nguyễn Viết Nghĩa về sự giúp đỡ quí báu này

Tôi xin chân thành cảm ơn kỹ sư Tô Trọng Đức, người đã giúp đỡ tơi xây dựng và hồn thiện phan mém DLS

Tôi xin chân thành cảm ơn Ban Giám đốc và tập thể cán bộ,

nhân viên thư viện tỉnh Lạng Sơn đã giúp tôi trong quá trình thử

nghiệm phần mém DLS

Tôi xin chân thành cảm ơn các thấy cô giáo tham gia giảng dạy tại khoa sau đại học, Trường Đại học Văn hóa Hà Nội, các bạn bè đồng nghiệp và người thân - những người đã quan tâm động viên, cổ vũ và giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này

Trang 3

MUC LUC

CAC TU VIET TAT TRONG LUẬN VĂN, 4

DANH MUC BANG BIEU 5

PHAN MO DAU 6

1 Tính cấp thiết của đề tai 6

2 Tình hình nghiên cứu 8

3 Mục tiêu và nhiệm vụ nghiên cứu 10

4 Đối tượng và phạm vi nghiên cứu 10

5 Phương pháp nghiên cứu "

6 Ý nghĩa khoa học và ứng dụng của đề tài "

7 Cấu trúc của luận văn i

Chuong 1: TAI LIEU SO VA PHAN MEM QUAN TRI TAI LIEU SO TRONG HE THONG THU V CÔNG CỘNG LI Tàiliệu số 12

1.1.1 Khái niệm tải liệu số 12

1.1.2 Khái niệm thư viện số 15

1.13 Khái niệm siêu dữ liệu 16

1.1.4 Tầm quan trọng của tài liệu số và việc quản lý tài liệu số 19 1.2 Công tác số hóa tài liệu và việc ứng dụng phần mềm quản trị tài

liệu số ở các thư viện công cộng 26

Trang 4

1.3.2 Lý do lựa chon PHP va MySQL xây dựng phần mềm quản trị tài

liệu số 36

Chương 2: GIẢI PHÁP ỨNG DỤNG PHP/MYSQL XÂY DỰNG PHÀN MEM QUAN TRI TAI LIEU SO AL 2.1 Lựa chọn công nghệ hỗ trợ 4I 21.1 AJAX 4I 2.12 JAVASCRIPTS 4 2.13 CSS 44 2.2 Thiết kế hệ thống, 45

2.2.1 Bai toán quản lý, khai thác tài liệu số ở các thư viện công cộng45

2.2.2 Thiết kế cơ sở dữ liệu 46

2.2.3 Bảo mật và an toàn dữ liệu 52

2.3 _ Thiết kế các module của phần mềm quản lý 54

Trang 5

3.2.2 Đào tạo cán bộ thư viện 84

3.23 Biên mục dữ liệu số 86

3.2.4 Thử nghiệm trong mạng nội bộ (LAN), 89

3.2.5 Thử nghiệm qua Internet 89

3.2.6 Đào tạo người dùng tin 9đ"

3.2.7 Xuất bản thông tin ra CD-ROM, ổ cứng di động 92

3.3 Danh gid két qua thir nghigm 92

3.3.1 Những kết quả đã đạt được 9

3.3.2 Một số tồn tại sau khi thử nghiệm phần mềm DLS 95

3.4 Các kiến nghị và giải pháp hoàn thiên phần mềm 95

Trang 6

TU VIET TAT TRONG LUAN VAN

AJAX Asynchronous JavaScript

ASP Môi trường kịch bản trên máy chủ

(Active Server Pages)

CD-ROM Đĩa quang chỉ đọc

(Compaet Dirk- Read Only Memory) CNNDS Công nghiệp nội dung số

CSDL Cơ sở dữ liệu

Css Cascading Style Sheets

DLS Phần mềm giải pháp thư viện số

(Digital Library Solutions)

GUI Giao diện đồ họa người dùng

(Graphical User Interface)

lib Hệ quản trị thư viện điện tử tích hop

(Intergrated Library Solutions)

LAN Mạng nội bộ

(Local Network Area)

Libol Phần mềm giải pháp Thư viện điện tử

(LIBrary OnLine)

MARC Biên mục máy tính đọc được (Machine Readable Catalog ) MySQL Hệ quản trị cơ sở dữ liệu

(My Structured Query Language)

OPAC Mục lục công cộng truy cập trực tuyến

(Online Public Access Catalog)

PHP Ngôn ngữ lập trình

Trang 7

DANH MUC BANG BIEU

Trang Bảng 1.1: Diéu tra tinh hình số và ứng dụng phần mềm quản trị tài liệu

số tại một số thư viện tỉnh, thành phố 29 Bảng 2.1: Bảng Users 4 Bảng 2.2: Bảng Bo_su tap, 47 Bảng 2.3: Bang Sach 48 Bảng 2.4: Bảng Ban doc 49 Bảng 2.5: Bảng Thong tỉn 50 Bảng 2.6: Bảng File tai lieu sl Bảng 2.7: Bảng Lien he 52

Bảng 2.8: Bảng phân quyền người sử dụng 59 Bảng 2.9: Mô tả cấp độ bảo mật tài liệu số 65

Trang 8

PHAN MO DAI

1 Tính cắp thiết của đề tài

Trong thời đại ngày nay, sự phát triển bùng nỗ của công nghệ thông tin

đã tác động lớn đến cuộc sống cũng như sự phát triển của xã hội Nhận thức rõ tầm quan trọng của của công nghệ thông tin đối với sự phát triển của đất nước Bộ Chính trị đã ban hành chỉ thị số 5§-CT/TƯ về “Đẩy mạnh công

hóa, hiện đại hóa” Chỉ thị

58 khẳng định “Ứng dụng và phát triển công nghệ thông tin là một nhiệm vụ

nghệ thông tin phục vụ sự nghiệp công ngi

ru tiên trong chiến lược phát triển kinh tế - xã hội, là phương tiện chủ lực để đi tắt đón đầu, rút ngắn khoảng cách phát triển so với các nước đi trước °'

Công nghệ thông tin dang thay thế dần các phương tiện thủ công, mọi

loại hình từ quản trị một bộ máy đến cách thức tiếp nhận kiến thức của mỗi cá

nhân cũng đang từng bước được số Trong bối cảnh đó, công tác thông tin - thư viện cũng đã, đang và sẽ tiếp tục có những biến đổi sâu sắc với sự hiện hữu của môi trường số trong hoạt động Xây dựng thư viện số đã trở thành xu

hướng phát triển của hoạt động thông tin - thư viện toàn cầu Thư viện số đã

giúp cho các thư viện triển khai phục vụ vượt ra khỏi khuôn viên của mình,

các giới hạn về hạn chế người sử dụng, hạn chế thời gian phục vụ, hạn chế tài liệu phục vụ đã được vượt qua Bất cứ người dùng tin nào, dù ở bất cứ nơi đâu, tại bất kỳ thời điểm nào đều có thê được phục vụ thông tin nếu truy cập vào một thư viện số Với những đặc điểm đó, thư viện số còn được gọi là thư

viện không nóc, thư viện không tường

Trong bối cảnh hội nhập quốc tế đang diễn ra sôi động, xu hướng liên

Trang 9

thành nên một mạng cung cấp thơng tin tồn cầu Vấn đề đặt ra là, làm sao đẻ cho sự liên kết ấy ngày càng trở nên hữu ích hơn Sự liên kết sẽ không thể đạt hiệu quả như mong muốn, nếu các cơ quan thông tin — thư viện không xây

dựng được các thư viện số, chia sẻ toàn văn của tài liệu, vì chỉ có thư viện số mới giúp cho các cơ quan thông tin — thư viện trao đổi thông tin thuận tiện, nhanh chóng Đó cũng là minh chứng cho sự phát triển về khoa học, công

nghệ của một quốc gia, vùng lãnh thỏ

Xây dựng thư viện số nhằm thoả mãn nhu cầu tìm kiếm, khai thác và sử

dụng thông tin của con người trong kỷ nguyên mới - kỷ nguyên của tri thức, từng bước đưa thư viện Việt Nam hòa nhập với mạng thông tin - thư viện các

nước trong khu vực và thé giới

‘Van đề xây dựng thư viện hiện đại ở Việt Nam đã được Đảng và Nhà

nước quan tâm chỉ đạo Ngày 4 tháng 5 năm 2007, Bộ Văn hóa - Thông tin

(nay là Bộ Văn hóa, Thể thao và Du lịch) đã ban hành quyết định số

10/2007/QĐ-BVHTT phê duyệt “Quy hoạch phát triển ngành thư viện tới năm 2020” trong đó

Việt Nam tới năm 2010 và định hướng phát ti

có nội dung: Ứng dựng khoa học công nghệ cao nhằm tự động hóa, hiện đại

hóa hoạt động của thư viện Phát triển thư viện điện tứ, thư viện kỹ thuật số

Sưu tầm, bảo tôn và phát huy vốn di sản văn hoá trong thư viện theo phương

pháp hiện đại dựa vào công nghệ thông tin phát triển ở mức cao Thư viện công cộng phải là nguồn lực giúp nâng cao dân trí và phổ cập giáo dục của

cộng đồng, là cơ quan giáo dục thường xuyên dành cho mọi người Phần đấu

đến năm 2010, toàn bộ thư viện các tỉnh, hành phố được nói mạng với Thư

Trang 10

Dưới sự chỉ đạo đó hệ thống thư viện công cộng đã tiến hành số hóa tài

liệu, xây dựng thư viện diện tử, thư viện số Tuy nhiên, vấn đề này còn mới

mẻ, do thiếu kinh nghiệm, gặp khó khăn trong công tác lựa chọn phần mềm

quản trị tài liệu số nên vấn đề xây dựng thư viện điện tử, thư viện số mới chỉ

mang tính phong trào chưa đạt hiệu quả như mong muốn Yêu cầu cấp thiết hiện nay là cần nghiên cứu, xây dựng một phần mềm quản trị tài liệu số gọn

nhẹ, giao diện thân thiện, đáp ứng chuẩn nghiệp vụ, phủ hợp với hệ thống thư

viện công cộng Vì vậy tôi chọn đề tài “Ứng dụng PHP/MySOL xây dựng phân mềm quản trị tài liệu số cho hệ thông thư viện công cộng ”

2 Tình hình nghiên cứu

Vấn đề tạo lập nguồn tài liệu số, ứng dụng phần mềm xây dựng thư

viện điện tử đã có một số công trình nghiên cứu được thực hiện trong những

năm gần đây:

s# Cao Minh Kiểm (2000), “Thư viện số - định nghĩa - vấn đề “, Tạp chí

Thông tin & Tư liệu, (3), tr 5-11 Bài báo phân tích những đặc điểm

chủ yếu của thư viện số, xây dựng kho tài liệu số, xây dựng siêu dữ

liệu

+ Nguyễn Minh Hiệp (2006), “Xây dựng thư viện số với hệ thống mã

nguồn mở”, Kỹ yếu hội tháo tổ chức và hoạt động thư viện điện tử, Phú Yên tr 35-43 Bài viết nêu định nghĩa thư viện số, giới thiệu một số phần mềm quản trị tài liệu số tiêu biểu

“+ Nguyễn Hoàng Sơn (2003), Xây dựng mô hình thư viện điện tử ở Việt Nam trong giai đoạn hiện nay, Luận văn thạc sĩ Đề tài đề cập tới các

Trang 11

tử, khảo sát các yếu tố cấu thành thư viện điện tử; đề xuất một số

giải pháp xây dựng mô hình thư viện điện tử ở Việt Nam từ việc

lập dự án đến thực thi dự án

+ Pham Thi Mai (2009), Nghiên cứu phát triển thư viện điện tử trong các trường đại học trên địa bàn Hà Nội hiện nay, Luận văn

thạc sĩ Công trình đề cập tới một số vấn để như các khái niệm

liên quan đến thư viện điện tử, các yếu tố cấu thành thư viện điện

tử, vai trò của thư viện điện tử với phát triển giáo dục đại học ở Việt Nam

Lê Đức Thắng (2010), Phát triển nguôn lực tài liệu số tại Thư viện Quốc gia Việt Nam, Luận văn thạc sĩ Trong công trình của mình, tác giả đề cập tới các khái niệm về tài liệu số, thư viện số; quy trình số hóa tài liệu ở Thư viện Quốc gia Việt Nam, đề xuất

các giải pháp hoàn thiện quy trình số hóa tài liệu

Nhìn chung, các công trình trên mới chỉ đề cập tới một số khía

cạnh của vấn dé xây dựng mô hình thư viện điện tử ở Việt Nam, xây

dựng, phát triển nguồn tài liệu số Trong công trình của tác giả Nguyễn Minh Hiệp có giới thiệu một số phần mềm nguồn mở của nước ngoài, tuy nhiên trong thực tế ứng dụng các phần mềm này vẫn còn nhiều hạn

chế như Việt hóa chưa triệt để, cài đặt, quản trị không thuận tiện, giao

diện thiếu thân thiện Như vậy, có thể nói, cho đến nay chưa có một

công trình nào nghiên cứu một cách toàn diện về việc ứng dụng mã

nguồn mở xây dựng phần mềm quản trị tài liệu số trong hệ thống thư

Trang 12

3 Mục tiêu và nhiệm vụ nghiên cứu Mục tiêu

Ứng dụng ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL

xây dựng phần mềm quản trị tài liệu số cho hệ thống thư viện công cộng

Nhiệm vụ nghiên cứa

s* Xác định các yêu cầu xây dựng phần mềm quản trị tài liệu số s* Thiết kế, xây dựng phần mềm quản trị tài liệu số

* Chạy thử nghiệm phần mềm tại một thư viện công cộng tỉnh, thành

phố

s* Đề xuất giải pháp hoàn thiện phần mềm và đưa vào áp dụng trong thực tiễn

4 Đối tượng và phạm vỉ nghiên cứu

Đối tượng nghiên cứu: phần mềm quản trị tài liệu số trong hệ thống thư

viện công cộng

Pham vi nghién cửa

- Céng tac s6 héa tai ligu va thyc trang img dung phần mềm quản trị tài liệu số tại một số thư viện công cộng cấp tỉnh, thành phố: Bình Dương, Cần

Thơ, Gia Lai, Hải Dương, Hải Phòng, Hòa Bình, Lạng Sơn, Phú Yên, Son La, Thừa Thiên ~ Huế

Trang 13

5 Phương pháp nghiên cứu

- Phương pháp phân tích tổng hợp - Phương pháp chuyên gia

- Phương pháp thực nghiệm ~ Phương pháp nghiên cứu tài liệu

6 Ý nghĩa khoa học và ứng dụng của đề tài

~ Về mặt khoa học: góp phần hoàn thiện lý luận khi tiến hành xây dựng,

quản trị, khai thác nguồn tài liệu số phù hợp với điều kiện của các thư viện

công cộng ở Việt Nam

- Về mặt ứng dụng: đề tài có ý nghĩa thực tiễn bởi kết quả của đề tài có thé được ứng dụng tại các thư viện cấp tỉnh, cấp huyện trong hệ thống thư viện công cộng Ứng dụng PHP/MySQL (mã nguồn mở - miễn phí) để xây

dựng phần mềm giúp các thư viện công cộng tiết kiệm chỉ phí trong quá trình

xây dựng, quản lý và khai thác nguồn tài liệu số

Án trúc của liên văi 7 Cấu trúc của luận văn

Ngoài phần mở đầu, kết luận, tài liệu tham khảo, phụ lục, luận văn

được chia làm ba chương:

Chương 1: Tài liệu số và phần mềm quản trị tài liệu số trong hệ

thống thư viện công cong

Chương 2: Giải pháp ứng dụng PHP/MYSQL xây dựng phần mềm quản trị tài liệu số

Trang 14

Chuong 1: TAI LIEU SO VA PHAN MEM QUAN TRI TAI LIEU SO TRONG HE THONG THU VIEN CONG CONG

1.1.1 Khái niệm tài liệu số

Sự phát triển cực kỳ mau lẹ của công nghệ thông tin và truyền thông

trong những năm gần đây đang tác động mạnh mẽ tới mọi phương diện của

đời sống xã hội, trong đó có lĩnh vực hoạt động thông tin — thư viện Để sử dụng được các phương tiện, kỹ thuật lưu trữ và truyền tải thông tin hiện dai, không thể không có những vật mang tin phủ hợp Do đó, việc nghiên cứu, ứng dụng và hoàn thiện các vật mang tin mới là điều được nhiều nhà khoa học hoạt động trong lĩnh vực thông tin, công nghệ và truyền thông quan tâm Đó

chính là khởi đầu cho sự xuất hiện và phát triển không ngừng của một loại

hình tài liệu mới: Tài liệu só

Cho đến nay, đã có không ít định nghĩa vẻ tài liệu số được dua ra

Điểm chung của các định nghĩa này đều cho rằng: tài liệu số là tài liệu mà thông tin chứa đựng trong đó đã được biểu diễn dưới dạng mã nhị phân, tức là

mã chỉ gồm hai số 0 và 1 Nói cách khác, những thông tin về tài liệu, một

phần hay toàn bộ nội dung của tài liệu đã được chuyển thành các bit thông tin dữ liệu và được lưu trữ, khai thác trên máy vi tính, với sự hỗ trợ của một hay

một vài thiết bị chuyên dụng, phần mềm ứng dụng và hệ thống mạng máy

tính Như vậy, tài liệu được tạo lập trực tiếp từ máy vi tính, được lưu trữ thành các tệp dữ liệu (file), với những định dạng khác nhau như: doc, exe,

jPg, pdf và các tài liệu có nội dung là kết quả của quá trình số các loại

Trang 15

thể coi nguồn tài liệu số là tập hợp có tô chức những bộ sưu tập thông tin số

và thông tin trong tài liệu đã được số

Do bản chất tồn tại và lưu trữ hoàn toàn khác biệt so với loại hình tài liệu truyền thống, nguồn tài liệu số chỉ có thể được truy cập và khai thác trên

máy tính hay hệ thống mạng máy tính Một trong số các phương tiện cầu nối

đưa người dùng tin tới với nguồn tài liệu số chính là hệ thống các mục lục công cộng tra cứu trực tuyến (tiếng Anh là Online Public Access Catalog,

được viết tắt là OPAC) Theo Từ điền Thông tin — Thư viện học trực tuyến -

ODILIS, OPAC là một cơ sở dữ liệu (CSDL) bao gồm các biểu ghi thư mục, mô tả sách hoặc các tài liệu khác được sở hữu bởi một thư viện, trung tâm thông tin, cơ quan lưu trữ hoặc một hệ thống các đơn vị này và người dùng

có thể truy cập qua mạng máy tính đề biết thêm về nguồn tin họ cần Sự truy

cập này ban đầu chỉ hạn chế trong phạm vi các máy tính đặt tai thư viện, trung tâm thông tin, cơ quan lưu trữ Tuy nhiên, ngày nay, nhờ sự tiến bộ không ngừng của công nghệ, người dùng tin có thể thông qua OPAC để tra cứu thông tin ngay trên máy tính tại nhà, tại cơ quan, tại trường học thông qua các kết nối Intemet có dây và không dây Đặc biệt, trong thời gian gần đây,

rất nhiều loại điện thoại di động đời mới có hỗ trợ kết nối Internet được tung

ra thị trường, một trong những ứng dụng của các thiết bị này là tạo điều kiện

đưa người dùng tin đến gần hơn với OPAC, với nguồn tin mà họ đang tim kiếm Chính điều này cũng đang tạo nên một làn sóng mới trong hoạt động

thông tin - thư viện, đó là quảng bá hình ảnh, marketing nguồn tin của mình trên mạng Internet và mạng điện thoại di động

Đối với một tài liệu ở dạng truyền thống: sách, báo, luận văn, việc số

hóa tài

Trang 16

Tài liệu số hóa thư mục là tài liệu chỉ được số phần thư mục Các yếu tố thư mục được đưa vào số bao gồm một số hoặc tất cả các yếu tố sau: Tên

tác giả (có thể có nhiều tên tác giả, tên cơ quan hay tổ chức xuất bản tài liệu), tên người dịch, tên người sưu tầm, tên người hiệu dính ; Tên tài liệu (có thể

bao gồm cả tên tài liệu bằng nhiều thứ tiếng khác nhau nếu tài liệu được xuất

bản đa ngôn ngữ); Nơi xuất bản, Nhà xuất bản, Năm xuất bản; Khổ cỡ của tài liệu; Số trang của tài liệu; Chỉ số ISBN hoặc ISSN Ngoài ra, còn một số

các yếu tổ khác là: Ký hiệu phân loại tài liệu, Ký hiệu xếp giá tài liệu (có thể có cả ký hiệu tên thư viện, trung tâm thông tin, cơ quan lưu trữ tài liệu nếu là mục lục liên hợp); Ký hiệu định chủ đề; Các từ khoá; Bản tóm tắt nội dung tài

liệu

Tài liệu số hóa dữ kiện, dữ liệu là tài liệu ngoài phần số thư mục còn có thêm phần số một số dữ kiện, dữ liệu của tài liệu gốc nhưng khơng phải là

tồn bộ các thông tin chứa đựng trong tài liệu gốc Các dữ kiện, dữ liệu này

có thể là thông tin lịch sử; số liệu thống kê; biểu đồ tăng trưởng; thành phần

cấu tạo; công thức điều chế hoá học; một số nhận định, phân tích và dự báo

được nêu trong tài liệu gốc;

Tài liệu số hóa toàn văn có nội dung là toàn bộ nội dung của tài liệu

gốc đã được số hóa Đây là loại hình tài ố trọn vẹn nhất, có giá trị sử

dụng lớn nhất trong số các loại hình tài liệu số Bởi giá trị của thông tin, nằm

ngay ở chính thông tin đó, chứ không phải được quy định bởi tên tác giả, tên

tài liệu hay một vài dòng xuất hiện trong nguồn tin Nếu có trong tay tài

liệu số thư mục, người dùng tin chỉ biết thông tin về tài liệu (nghĩa là thông

tin về thông tin) Nếu có được tài liệu số dữ kiện, dữ liệu thì người dùng tin

cũng mới chỉ chạm được vào một phần của kho báu thông tin Nghĩa là, để có

được tồn bộ thơng tin mình cần, người dùng tin phải trải qua ít nhất một

Trang 17

điều này, có thể người dùng tin phải tới tận nơi lưu giữ thông tin đề tìm kiếm

tài liệu gốc (nếu tài liệu đó chưa được số toàn văn) hoặc đưa ra yêu cầu được

truy cập tới nguồn toàn văn (nếu người dùng tin chưa được cấp quyền truy cập, hoặc chưa đủ điều kiện đề được truy cập tới các nguồn toàn văn của tài liệu quý, hiếm và chỉ lưu hành nội bộ, hay chưa thực hiện các nghĩa vụ cần

thiết như: trả phí truy cập, đăng ký thông tin người dùng ) Nhưng nếu chỉ

sau một thao tác click chuột, người dùng tin truy cập được đến nguồn tài liệu

số toàn văn - điều đó cũng đồng nghĩa với việc họ được sử dụng toàn bộ

thông tin đó, rất nhanh chóng và thuận tiện mà không cần phải tính đến các

trở lực lớn như: khoảng cách địa lý, giới hạn thời gian hay những ức chế trong

khi chờ đợi để được đến lượt tiếp cận với toàn văn tài liệu Đó là niềm mơ:

ước lớn lao nhất của mọi người dùng tin trên thế giới và cũng là điểm đích mà

mọi thư viện, trung tâm thông tin, cơ quan lưu trữ trên toàn cầu đang nỗ lực

hướng tới

1.1.2 Khái niệm thư viện số

Nhiều định nghĩa đã được công bố trong giới học giả toàn cầu về thư viện nhằm định nghĩa rõ ràng một thư viện số Dưới đây là một số định nghĩa

tiêu biểu về thư viện số:

Hai hoc giả người Nga là Sokolova và Liyabev cho rằng thư viện số là một hệ thống phân tán có khả năng lưu trữ và tận dụng hiệu quả các loại tài liệu điện tử khác nhau, và giúp người dùng có thể truy cập và được chuyển

giao thông tin dễ dàng qua mạng máy tính

Nhiều học giả Trung Quốc lại có cùng quan điềm rằng “Một thư viện

số trên thực tế không phải là một thư viện ở góc độ mở rộng không gian của nó; thay vào đó nó là trung tâm tài nguyên thông tin số chứa đựng tài nguyên

Trang 18

chẳng hạn như văn bản, ký tự, chữ viết, hình ảnh, video và âm thanh, đồng thời cung cấp cho người dùng các dịch vụ thông tin nhanh chóng và thuận

tiện thông qua Internet, nhằm chuyền giao một hệ thống thông tin số mà trong đó việc chia sẻ nguồn tài nguyên luôn sẵn sàng”

Theo định nghĩa của Liên hiệp Thư viện số Hoa Kỳ năm 1999: Thư

viện số là các cơ quan, tô chức có các nguồn lực, kể cả các nguồn nhân lực chuyên hóa, đề lựa chọn, cấu trúc, cung cấp việc truy cập đến, diễn giải, phố

biến, bảo quản sự toàn vẹn, đảm bảo sự ổn định trong thời gian dài của sưu

tập công trình số mà chúng ở dạng sẵn sàng đề sử dụng một cách kinh tế cho một hoặc một số cộng đồng nhát định

Theo tác giả Vũ Văn Sơn: “Thư viện số là hình thức kết hợp giữa thiết

bị tính toán, lưu trữ và truyền thông số với nội dung và phần mềm cần thiết để

tái tạo, thúc đây và mở rộng các dịch vụ của các thư viện truyền thống vốn

dựa trên các biện pháp thu thập, biên mục và phổ biến thông tin trên giấy và các vật liệu khác”

Tóm lại: Thư viện số được hiểu là nơi lưu trữ nguôn thông tin số, đặc

biệt là thông tin toàn văn, đồng thời sử dụng các phương tiện số trong thu

thập, lưu trữ, xử lJ, tìm kiếm và phổ biến thông tin

1.1.3 Khái niệm siêu dữ liệu

Trang 19

những quy tắc biến đổi Siêu dữ liệu bao quát tất cả các phương diện của kho

dữ liệu

Thuật ngữ siêu dữ liệu được định nghĩa là sự mô tả các nguồn thông tin

điện tử nhằm mục đích nhận diện, quản lý, phân loại và tra cứu nguồn thông

tin khi làm việc với tập hợp các nguồn thông tin Siêu dữ liệu là những dữ liệu

mô tả về ngữ cảnh, nội dung, cấu trúc và sự quản lý tài liệu theo dòng chảy

của thời gian

Siêu dữ liệu phải chứa những thông tin:

œ Cấu trúc của dữ liệu

« _ Thuật tốn sử dụng để tổng hợp dữ liệu

© Ánh xạ xác định sự tương ứng dữ liệu từ môi trường tác nghiệp sang kho dữ liệu

Siêu dữ liệu là dữ liệu để mô tả dữ liệu Khi dữ liệu được cung cấp cho người dùng cuối, thông tin siêu dữ liệu sẽ cung cấp những thông tin cho phép họ hiểu rõ hơn bản chất về dữ liệu mà họ đang có Những thông tin này sẽ

giúp cho người dùng có được những quyết định sử dụng đúng đắn và phù hợp

về dữ liệu mà họ có

'Tuỳ thuộc vào từng mục đích sử dụng khác nhau, từng loại dữ liệu khác nhau mà cấu trúc và nội dung dữ liệu metadata có thể có những sự khác biệt

Song, nhìn chung sẽ bao gồm một số loại thông tin cơ bản sau: « Thông tin mô tả về bản thân dữ liệu metadata

«_ Thông tin về dữ liệu mà metadata mơ tả

« Thông tin về cá nhân, tổ chức liên quan đến dữ liệu metadata và dữ liệu Dublin Core Metadata là một trong những sơ đồ yếu tố siêu dữ liệu phổ biến và được nhiều người biết đến Bộ yếu tố này được hình thành lần đầu

Trang 20

Core Metadata Element Initiative) Tap hop yéu t6 siéu dữ liệu này được gọi

là “cốt lõi” (core) vì nó được thiết kế đơn giản và chỉ bao gồm 15 yếu tố mô tả cốt lõi nhất (trong khi Marc21 có hơn 200 trường và rất nhiều trường con)

1 ĐC Creater (Tác giả): Tác giả của tài liệu, bao gồm cả tác giả cá nhân và tác giả tập thé

2 DC Title (Nhan đẻ): Nhan đề của tài liệu

3 DC Subjeet (Chủ đề): Chủ đề tài liệu đề cập dùng để phân loại tài

liệu Có thê thể hiện bằng từ, cụm từ/(Khung chủ đề), hoặc chỉ số

phân loại/ (Khung phân loại)

4 DC Contributor (Cộng tác, đóng góp): Tên những người cùng tham gia cộng tác đóng góp vào nội dung tài liệu, có thể là cá nhân, tổ chức

5 DC Date (Năm xuất bản): Ngày, tháng, năm ban hành tài liệu

6 ĐC Publisher (Nhà xuất bản): Nhà xuất bản, nơi ban hành tài liệu có thể là tên cá nhân, tên cơ quan, tổ chức, dịch vụ

7 DC Description (Trich dan, trích yếu nội dung): Tóm tắt, mô tả nội

dung tài liệu Có thể bao gồm tóm tắt, chú thích, mục lục, đoạn văn bản để làm rõ nội dung

8 DC Type (Kiểu tài liệu): Mô tả bản chất của tài liệu Dùng các thuật ngữ mô tả phạm trù kiểu: trang chủ, bài báo, báo cáo, từ điển

9 ĐC Format (Mô tả vật lý, định dạng): Mô tả sự trình bày vật lý của tài liệu, có thể bao gồm; vật mang tin, kích cỡ độ dài, kiểu dữ liệu (doc, html, jpg, xls, phần mềm )

10 DC Identifiers (Định danh tư liệu): Là một dãy ký tự hoặc số

Trang 21

11 ĐC Source (Nguồn gốc tài liệu): Nguồn gốc mà tư liệu được tạo thành, yếu tố này có thê gồm siêu dữ liệu về nguồn thông tin thứ hai

nhằm khai thác tư liệu hiện hành

12 DC Language (Ngôn ngừ): Ngôn ngữ của nội dung tư liệu, được thành lập theo quy tắc RFC1766

13 DC Relation (Liên kết toàn văn): Một định danh cho nguồn thứ

hai và mối quan hệ của nó với tư liệu hiện hành Yếu tố này thể hiện

sự kết nối giữa các nguồn tư liệu có liên quan

14 ĐC Coverage (Diện bao quát): Các thông tỉn liên quan đến phạm vi, quy mô hoặc mức độ bao quát của tài liệu Phạm vi đó có thể là địa điểm, không gian hoặc thời gian, tọa độ

15 DC Right (Bản quyền): Các thông tin liên quan đến bản quyền của

tài liệu

Tầm quan trọng và ý nghĩa đặc biệt của siêu dữ liệu càng rõ nét khi quản lý tài liệu trong môi trường điện tử Trong môi trường điện tử, tài liệu chính thức luôn luôn kèm theo các siêu dữ liệu Không có siêu dữ liệu không thể xác định một cách chính xác những đặc tính cơ bản của tài liệu điện tử Siêu dữ liệu đảm bảo tính bắt biến, độ tin cậy và chứng cứ pháp lý của tài liệu

điện tử

1.1.4 Tầm quan trọng của tai liệu số và việc quản lý tài liệu số

Ngày nay, nguồn tài liệu số đang giữ vai trò quan trọng, làm thay đổi

Trang 22

- Tài liệu số vừa là hệ quả vừa là cơ sở phát triển ngành xuất bản điện tử:

Tài liệu số ra đời đã góp phần làm thay đổi diện mạo ngành xuất bản

với hàng loạt sản phẩm mới được tung ra thị trường với tên gọi loại hình là ấm

phẩm điện tử hay xuất bản phẩm điện tứ Ý tường đầu tiên về xuất bản điện

tử được ông Vanner Bush đưa ra tại một hội thảo khoa học ở Viện Công nghệ Massachusertte (Mỹ) vào năm 1945 Sau đó ít lâu, đã có một sự bùng nỗ hàng loạt các sản phẩm kỳ thuật số và các lợi thế về kỹ thuật không thể phủ nhận

Năm 1991, cuốn sách điện tử đầu tiên chào đời tại Mỹ Từ năm 1998, sách

điện tử được xuất bản ở dạng đĩa và có thể được tải xuống máy tính cá nhân từ Internet Không còn nghỉ ngờ gì nữa, điều này có ý nghĩa vô cùng quan trọng cả về mặt học thuật cũng như trên phương diện kinh doanh

'Vào năm 1995, F.W Lancaster đã phác thảo một lịch sử ngắn gọn về việc xuất bản các ấn phẩm điện tử như sau: Sử dụng máy tính để tạo ra những

ấn bản như bản in trên giấy thông thường -> Phân phối văn bản bằng hình

thức điện tử (số) nơi mà phiên bản điện tử tương đương chính xác với phiên

bản in ấn -> Xuất bản những ấn bản nhỏ gọn hơn bản in dưới hình thức số

hoá, có thêm những đặc điểm phụ trội để mở rộng khả năng nghiên cứu, điều khiển dữ liệu (qua sự tương xứng hình ảnh) -> Tạo ra những ấn bản hoàn toàn

mới và khai thác thêm nhiều tính năng của các phương tiện kỹ thuật số, như

ứng dụng các kết nối siêu văn bản, tích hợp các chức năng truyền thông

Các loại hình xuất bản phẩm điện tử có trên thị trường hiện nay là sách điện tử (E-Book) và các báo, tạp chí điện tir (E-Journal),

Có thể hiểu một cách đơn giản, sách điện tử là sự trình bày các tệp tin

trên màn hình số, có thể là trên mạng hoặc trên CD ~ ROM hay một thiết bị

Trang 23

hiện nhờ một thiết bị chuyên dụng nào đó (Kindle của Amazon, Geimei,

Floyer ) Từ điển tiếng Anh rút gọn của nhà xuất bản Oxford — The New

Concise Oxford English Dictionary (2001) có đưa ra định nghĩa sách điện tử là: “Một phiên bản điện tử của một quyển sách in có thẻ đọc được trên máy:

tính cá nhân hay một thiết bị cằm tay được thiết kế cho mục đích này"

Cũng giống như nguyên lý ra đời của sách điện tử, các loại báo và tap chí điện tử cũng được ra đời và ngày cảng trở nên phổ biển

Có một số cách thông dụng để khách hàng sử dụng ấn phẩm diện tử lên mạng đọc từ website, dùng tài khoản đăng nhập hệ thống và tai v may tính cá nhân để đọc chúng, đăng nhập tài khoản trên mạng và tải về các máy

trợ giúp cá nhân (personal digital assistan:) hay thiết bị cằm tay (handheld- computer), in ra giây đễ đọc

Sự phát triển của công nghệ thông tin và truyền thông đã thúc đẩy sự

phát triển của ngành xuất bản điện tử Theo số liệu thống kê, năm 2004 chỉ có

36.000 tên tạp chí điện tử, nguồn tin điện tử là 5,4 triệu tên Năm 2009, con số

này là 159.000 tên tạp chí điện tử, nguồn tin điện tử tăng lên tới 42,1 triệu tên (Theo OCLC 2004 Information format: content, not containers)

Sự xuất hiện của các xuất bản phẩm điện tử một lần nữa khẳng định

việc tài liệu số ra đời đã làm thay đồi diện mạo ngành xuất bản toàn cầu

- Tài liệu số là cơ sở của sự hình thành và phát triển ngành công nghiệp

nội dung số

Sự phát triển có tính chất bùng nỗ của các nguồn tài liệu số trong những năm gần đây đã dẫn đến hình thành khái niệm “ndi dung số” và kéo

Trang 24

Nội dung số (tiếng Anh là E-Content hay Digital Content) la thuật ngữ được dùng để chỉ các thông tin hữu ích chứa đựng trong các tài liệu số Các thông tin này có thể tồn tại trên website, hay thông tin chứa trong các tệp dữ liệu ở dạng văn bản, hình ảnh, âm thanh hoặc dạng đa phương tiện, tích hợp văn bản, âm thanh, video Đây là một khái niệm rộng, bao quát nhiều lĩnh

vực và phát triển liên tục, bao gồm phần mềm nội dung, trò chơi điện tử, học tập trực tuyến (E-leaming), xuất bản điện tử, quảng cáo trên Intemet

Các sản phẩm chứa đựng nội dung số, khi tham gia thị trường, sẽ làm hình thành nên ngành công nghiệp nội dung số (CNNDS) Công nghiệp nội

dung sé (tiéng Anh la Digital Content Industry - DCI) là một khái niệm còn

rất mới và trên thế giới vẫn chưa tìm ra được một định nghĩa thống nhất Theo

quan điểm của Bộ Bưu chính- Viễn thông Việt Nam: CNNDS là ngành thiết

kế, sản xuất, xuất bản, lưu trữ, phân phối, phát hành các sản phẩm nội dung số

và dịch vụ liên quan Tập hợp các hoạt động liên quan đến số hố thơng tin ở quy mơ lớn, có sản phẩm hoàn chỉnh và có khả năng đem lại lợi nhuận thì được gọi là ngành CNNDS Các hoạt động trong CNNDS bao gồm: thu thập thông tin; phân tích nội dung để phân loại, lưu trong bộ nhớ máy tính hoặc hiển thị nội dung trên mạng; bao gói thông tin thành các CSDL trên vật mang tin mong muốn: CD - ROM, DVD, thiết bị lưu trữ di động; nhân bản và cung cấp (bán) các sản phẩm thuộc CSDL đó hoặc toàn bộ CSDL

Nhiều người cho rằng, CNNDS là một nhánh của công nghệ thông tin vì nó gắn liền với công nghệ thông tin [7, tr.14] San pham của CNNDS chính

là sản phẩm của quá trình ứng dụng công nghệ thông tin, từ công nghệ phần

mềm, thu thập thông tin, xử lý, lưu trữ thông tin đến cung cấp thông tin

CNNDS không chỉ liên quan đến phần cứng, phần mềm máy tính hay hệ thống mạng mà còn liên quan đến nhiều lĩnh vực khác như: lưu trữ, sản xuất

Trang 25

vào của ngành CNNDS là thông tin và sản phẩm đầu ra cũng là thông tin

Nhưng thông tin đầu ra là CSDL, là thông tin có cấu trúc, có nội dung cụ thể và được cung cấp cho những đối tượng cụ thể nhằm phục vụ cho một hay một số hoạt động kinh tế - xã hội nhất định

Chắc chắn rằng, nếu được tô chức tốt, các sản phẩm số sẽ có thị trường

rộng lớn, không phải chỉ ở trong một quốc gia Nhận biết được điều đó, ngày 19/7/2007, Thủ tướng Chính phủ đã ban hành Quyết định số 901/QĐÐ~ TTg về việc *Thành lập Vi

éNam, thuộc Bộ Bưu chính, Viên thông ” Từ đầy, CNNDS ở Việt Nam bước

Công nghệ phần mềm và nội dung số Việt

sang một trang mới Hy vọng, CNNDS sẽ không ngừng lớn mạnh để hỗ trợ,

cung cấp các nguồn tài liệu số cho các Thư viện số và làm cho hoạt động

thông tin khoa học công nghệ sôi động, hấp dẫn hơn

~ Quản lý tài liệu số toàn văn là cơ sở để hình thành thư viện số

Thư viện diện tử, thư viện số, thư viện ảo, là những tên gọi không còn xa lạ đối với những người làm công tác thư viện Việt Nam nhưng vẫn còn tồn tại nhiều cách hiểu, cách định nghĩa khác nhau Có thể coi thư viện số là một kho thông tin dưới dạng số, được cấu trúc sao cho dễ dàng truy cập thông qua các mạng máy tính hay các mạng viễn thông Đó là một hệ thống thông tin tự động hoá mà ở đó, người ta có thé thu thập, xử lý, lưu trừ, tìm kiếm và

phô biến các tài liệu dưới dạng số thông qua các phương tiện công nghệ thông tin và truyền thông,

Hạt nhân của thư viện số là nguồn tải liệu số Trong đó, một bộ phận là

tài liệu số toàn văn từ tài liệu in ấn, phần chủ yếu là các bộ sưu tập số mới

được xây dựng hoặc bổ sung qua nhiều con đường khác nhau như mua, được

biếu tặng, trao đôi Bộ sưu tập số là một tập hợp có tô chức nhiều tài liệu số

Trang 26

tài liệu riêng lẻ có sự khác nhau về cách thê hiện, nhưng đều cung cấp một giao diện đồng nhất mà qua đó việc tra cứu, truy cập tài liệu được thực hiện

dễ dàng, thuận tiện Phần mềm quản trị tài liệu số sẽ đem lại cho thư viện tiện

ích nỗi trội mà dịch vụ thư viện truyền thống chưa có như:

- Tạo ra một môi trường bình đẳng cho mọi người được sử dụng trỉ thức nhân loại mà không vướng phải rào cản về không gian, thời gian;

~ Có tính linh hoạt và khả năng đáp ứng nhu cầu sử dụng rất cao nhờ tính chất đa truy cập của nguồn tài liệu số;

~ Tiết kiệm thời gian và kinh phí cho thư viện trong việc xây dựng kho tàng, bảo quản tài liệu, cũng như giúp người dùng tin cắt giảm chỉ phí,

giảm thời gian trong tìm kiếm thơng tin;

lố tồn văn tài liệu và xây dựng bộ sưu tập số là lựa chọn tối ưu

để bảo tồn lâu dài các tài liệu gốc quý hiếm, ngăn chặn những rủi ro, huỷ hoại

tài liệu do thời gian, thiên tai,

Phan cốt lõi của thư viện số là kho tài liệu số với phần mềm quản trị

vốn tài liệu này Vì vậy, việc phát triển kho tài liệu số và tìm kiếm một phần

mềm quan tri tai liệu số là công việc quan trọng hàng đầu trong xây dựng thư viện số

~ Quản trị tài liệu số giúp thư viện đỗi mới và nâng cao chất lượng phục vụ

người dùng tin

Trong thư viện hiện đại, tài liệu số đóng một vai trò cực kỳ quan trọng Theo xu hướng phát triển chung của khoa học và công nghệ, việc xuất bản tai

Trang 27

không thê tổ chức lưu trữ và bảo quản được số lượng lớn tài liệu số đang tăng lên hàng ngày, đồng thời đọc giả cũng khó có thể tìm kiếm được tài liệu mình cần trong khối lượng tài liệu số khổng lồ của thư viện Hay nói khác đi, phần mềm quản trị tài liệu số chính là chìa khóa để thư viện cải tiến chất

lượng phục vụ, xây dựng các sản phẩm và dịch vụ thông tỉn có giá trị gia

tăng cao

Các thư viện, cơ quan thông tin nếu không sử dụng phần mềm quan tri tài liệu số sẽ không tô chức, quản lý và khai thác hiệu quả nguồn tài liệu số

của mình Nói cách khác, nguồn tài liệu số dù lớn tới đâu, nội dung phong phú, đa dạng cũng không tới được với người dùng tin nếu không được tổ

chức, quản lý khoa học bằng các phần mềm chuyên dụng Các thư viện, cơ quan thông tin sử dụng phần mềm quan tri tài liệu số đề có thể thu thập, xử lý, lưu trữ, tìm kiếm và phổ biến tài liệu số tới người dùng tin thông qua các phương tiện công nghệ thông tin và truyền thông

Nguồn tài liệu số được quản lý thông qua công tác tạo lập các bộ sưu

tập số, biên mục tải liệu số vào phần mềm Trên cơ sở đó các thư viện, cơ

quan thông tin tô chức phân phối tài liệu số tới người dùng tin Người ding

tin đăng kí sử dụng dịch vụ thư viện số, tra tìm và khai thác tài liệu số qua

module OPAC cia phan mềm Phần mềm quản trị tài liệu số không chỉ giúp các thư viện, cơ quan thông tin tạo lập, quản lý tài liệu số mà nó còn là cầu

nối giữa người dùng tin với kho tài liệu số của các thư viện, cơ quan thông

tin

Trang 28

Như vậy có thể nói rằng để tạo lập, quản lý và khai thác tài liệu số không thể không có các phần mềm quản trị tài liệu số Một thư viện số sẽ không th tần tại nếu không có phan mém quán trị chuyên dụng đề thu thập, xử lý, lưu trữ, tìm kiếm và phổ biển tài liệu số tới người dùng tin

1⁄2 Công tác số hóa tài liệu và việc ứng dụng phần mềm quản trị tài

liệu số ở các thư viện công cộng

1.2.1 Công tác số hóa tài liệu trong hệ thống thư viện công cộng

Để đánh giá thực trạng công tác số hóa và xây dựng nguồn lực thông tin

địa phương số, Bộ Văn hóa, Thể thao và Du lịch đã tiến hành một cuộc điều tra

các thư viện công cộng cấp tỉnh trong phạm vi cả nước (năm 2011) Kết quả, có 43 thư viện tỉnh thành phố đã phản hồi Trong số đó có 25 thư viện (chiếm

58,1%) đã triển khai công tác số Việc số hóa tài liệu địa chí đã được tại triển

khai tạo các thư viện tỉnh nhằm mục đích bảo quản và quy tụ các nguồn tài liệu quý về một mi nhằm giúp bạn đọc và các nhà nghiên cứu tiếp cận được thông tin về xuất bản phâm địa phương, nhân vật lịch sử địa phương, sự kiện địa phương, vấn đề dân tộc học và bản sắc văn hóa truyền thống của địa phương một cách đầy đủ, thuận tiện nhất

Việc số hóa tài liệu được thực hiện trong các thư viện Việt Nam từ cuối thập kỷ 90 của Thế kỷ XX Thư viện Khoa học Tổng hợp Thành phố Hồ Chí Minh (TVKHTHTPHCM) là một trong những thư viện công cộng cấp tỉnh tiên phong trong việc triển khai công tác số hóa tài liệu Ngay từ năm 1998

thư viện đã có chương trình số hóa đầu tiên với các sản phẩm đầu tiên là số

hóa khoảng 10 nhan đề sách kho Đông Dương, chương trình nhân kỷ niệm 300 năm Sài Gòn — TP.Hồ Chí Minh Năm 2003, TVKHTHTPHCM thật sự

Trang 29

toàn văn Thư viện Quốc gia Việt Nam (TVQGVN) đã bắt đầu triển khai số

hóa từ năm 2003

Nguồn kinh phí thực hiện số hóa có được từ các dự án số hóa do nước

ngoài tài trợ và do ngân sách trung ương và địa phương cấp Năm 2011, TVQGVN da bit dau thực hiện Dự án số hóa tài liệu với tổng kinh phí hơn 20 tỷ đồng Tại TVKHTHTPHCM, Dự án VALEASE do thư viện phối hợp với

Tổng lãnh sự quán Pháp số hóa các tài liệu bằng tiếng Pháp và tiếng Việt nói về 3 nước Đông Dương được tiến hành theo nhiều bước Đây là dự án được

triển khai theo hình thức thuê ngoài (outsourcing) Số lượng tài liệu được số

hóa là sách Đông Dương khoảng 540.000 trang sách, báo tạp chí và công báo Từ năm 2008 Thư viện tỉnh Yên Bái được tiếp nhận Dự án hợp tác văn hoá giữa tỉnh Yên Bái và Hội đồng tỉnh Val-de-Mame (Cộng hoà Pháp) với mục tiêu: Nâng cao năng lực phục vụ cộng đồng, phát triển sự nghiệp văn hoá, nâng cao đời sống văn hoá tỉnh thần cho nhân dân các dân tộc tỉnh Yên Bái

Tiêu Dự án “Phục chế, bảo quản và số hóa tài liệu cỗ lưu giữ tại Thư viện

tỉnh Yên Bái ” được thực hiện và bước đầu triển khai

9 thư viện tỉnh đã thường xuyên được cấp kinh phí cho hoạt động số

bao gồm: TVKHTHTPHCM, Thư viện tỉnh Quảng Ngãi, Hà Tĩnh, Cần Thơ, Gia Lai, Bình Dương, Đắc Lắc, Bình Thuận, Vũng Tàu Tuy nhiên, kinh phí

dành cho hoạt động số còn hạn chế, có tới 83,3% thư viện chỉ được cấp

50.000.000 đồng/năm cho hoạt động này Chỉ có 3 thư viện được cấp trên

100.000.000 đồng cho hoạt động số: TVKHTHTPHCM, Thư viện tỉnh Bà Rịa-Vũng Tàu và Thư viện tỉnh Thanh Hóa

Một trong những hướng ưu tiên mà các thư viện hướng tới là số hóa

các tài liệu quý hiếm và tài liệu địa chí Trong đó, 55,8% thư viện tiến hành số

Trang 30

Mặc dù mới được triển khai, nhưng các thư viện đã thực hiện số hóa một số lượng tài liệu đáng kể

Tại TVQGVN, công tác số hóa được bất đầu với đối tượng Luận án

Hiện nay, TVQGVN đã số được 15.571 bản, tương đương với 2.500.000 trang Bên canh đó TVQGVN còn số hóa các tài liệu quý hiếm Bộ Sưu tập Đông Dương Thống kê đã hình thành với 829 tên (130.333 trang); Bộ Sưu tập 'Thăng Long Hà Nội với 850 tên, (407.970 trang)

Tại các thư viện tỉnh, việc số hóa đã đạt được một số kết quả nhất định Tính đến tháng 11/2011, Thư viện KHTH Tp Hồ Chí Minh đã số hóa được

hơn 3.000 tài liệu địa chí với 530.000 trang; Thư viện tỉnh Sơn La đã thực hiện số hóa được 313 tài liệu là sách chữ Thái cổ với 8.610 trang Ngoài số các tài liệu là sách chữ Thái cổ, Thư viện tỉnh Sơn La đã số hóa toàn văn được 269 tài liệu địa chí với 32.610 trang; thư viện tỉnh Khánh Hòa số hóa được hơn 550 tài liệu, Thừa Thiên Huế đã số được khoảng 180.000 trang tài liệu quý hiểm, các viện tỉnh Đồng Nai số hóa được 317 tài liệu địa chí với 24.544 trang; Thư íc phong, luận văn luận án và bài báo thí về địa phương; Thư

viện tỉnh Gia Lai số hóa được 47.200 trang,

Các tài liệu số trong các thư viện đã được đưa ra phục vụ với các mức độ khác nhau Trong đó, phục vụ tại chỗ với mạng nội bộ (LAN) của thư viện

chiếm ưu thế (62,5 %), số thư viện triển khai đưa lên mạng Internet cho bạn

đọc sử dụng còn hạn chế (37%) [2, tr.5]

1.2.2 Tông quan ứng dụng phần mềm quản trị tài liệu số ở các thư viện công

cộng

Trang 31

viện điện tử Vì thế bên cạnh tài liệu, sản phẩm thông tin truyền thống, các thư viện tỉnh/thành phố trong cả nước đã có nhiều nỗ lực trong việc sưu tập, biên soạn và phát hành các sản phẩm thông tin như: thư mục toàn văn chuyên

đề, ấn pham tóm tắt, tổng quan cũng như dịch vụ thông tin mới như là phục

vụ theo chế độ hỏi đáp, nói chuyện chuyên đẻ, dịch vụ tra cứu thông tin qua mạng Một trong những hoạt động đề hình thành vốn tài liệu điện tửitài liệu số được các thư viện công cộng quan tâm thực hiện là số các tài liệu quý hiếm Nhiều thư viện đã xây dựng được các bộ sưu tập số lên đến hàng trăm nghìn trang

Tuy nhiên, hầu hết các thư viện đều gặp khó khăn khi tiến hành tổ chức, quản lý và khai thác hiệu quả nguồn lực thông tin quý giá này Ngoài một số phần mềm thương mại như iLIB.Di của công ty CMC, Libol Digital của công ty Tỉnh Vân, Vebrary của công ty Lạc Việt các thư viện công công còn sử dụng phần mềm nguồn mở Greenstone để quản lý tài liệu số của mình và tổ

chức phục vụ bạn đọc tra cứu, khai thác tài liệu số

TAI LIEU SO

STT THU VIEN Nhan 48 | Sé lugng trang PHAN MEM 1 | Bình Dương 853 172.839 | PSC zLIS 6.0 2_ | Cần Thơ, 73 32.026 3 | Gia Lai 7.239 47.200 | iLIB.Di 3.0 4 | Hải Dương 38 6.951 $_ | Hải Phòng 291 15.562 6 [Hoa Binh 97 30.176 7_ | Lạng Sơn 356 10.278

§ | Phú Yên $.397 | trên 300.000 | Greenstone

9 |SơnLa 361 32.610 | Libol Digital 6.0

Trang 32

Qua khảo sát tại 10 thư viện tinh có 04 thư viện đã có phần mềm quản trị

tài liệu số, trong đó có 03 thư viện sử dụng phần mềm thương mại là Bình Dương, Gia Lai và Sơn La Thư viện Phú Yên sử dụng phần mềm mã nguồn

mở Greenstone đề quản trị bộ sưu tập số

Sáu thư viện còn lại chưa sử dụng phần mềm quản trị tài liệu số, tài liệu số của các thư viện này chủ yếu được số hóa để bảo quản và "chờ" tìm được

phần mềm thích hợp mới mang ra khai thác Do không có phần mềm các thư viện này chưa thể phục vụ được bạn đọc mà mới chỉ lưu trong đĩa quang, ổ

cứng Thư viện Thừa Thiên - Huế do chưa có phần mềm nên chưa thống kê

được chính xác tên tài liệu và số lượng trang tài liệu đã số hóa

Các phần mềm thương mại đang được sử dụng tại các thư viện công cộng tuy đã đáp ứng được phần nào hoạt động tổ chức, quản lý và khai thác

nguồn lực thông tin số nhưng các phần mềm này có giá thành khá cao (từ khoảng 400 triệu đến trên 1 tỷ đồng) Hơn nữa các phần mềm này vẫn còn nhiều lỗi nảy sinh trong quá trình sử dụng Phần mềm nguồn mở Greenstone,

DSpace, Zope dù được sử dụng miễn phí nhưng cài đặt và sử dụng phức

tạp VỀ giao diện các phần mềm này nhìn chung chưa thân thiện nên ít được

các thư viện công cộng lựa chọn sử dụng

Ứng dụng mã nguồn mở đề xây dựng một phần mềm quản trị thư viện số

nhỏ gọn, dễ sử dụng, dễ quản trị, giao diện thân thiện và gần gũi với người

'Việt cho hệ thống thư viện công cộng là thực sự cần thiết vào thời điểm này

1.2.3 Yêu cầu của một phần mềm quản trị tài liệu số cho hệ thống thư viện

công cộng

1.2.3.1 Nhóm yêu cầu về công nghệ

Một phần mềm quản trị tài liệu số được coi là đáp ứng yêu cầu của thư

Trang 33

- Dé dang va thuận tiện trong cải đặt và sử dụng,

~ _ Có thể mở rộng các chức năng theo yêu cầu phát triển trong tương lai,

~_ Có thể quản lý được số lượng tài liệu lớn với nhiều kiểu dữ liệu số khác

nhau, việc tra cứu tìm kiếm thông tin chính xác và nhanh chóng,

từ nhiều may

- _ Việc nhập thông tin vào hệ thống có thể được thực hiệ tính khác nhau, từ nhiều địa điểm khác nhau,

= Phan mềm có thê chạy trên nhiều hệ điều hành như các phiên bản khác

nhau của hệ điều hành Windows cũng như Unix hoặc Linux,

- Phần mềm đảm bảo quản lý an toàn dữ liệu ở nhiều mức khác nhau

Những yêu cầu trên đối với một phần mềm quan tri tài liệu số được thể hiện dưới dạng các yêu cầu kỹ thuật như sau:

a Nguyên tắc thiét ké theo module

Xây dựng theo kiến trúc nhiều lớp, hệ thống gồm nhiều module chức năng và được tích hợp thành một hệ thống thống nhất Phần mềm được thiết kế, xây dựng và vận hành trên nguyên tắc mở, đảm bảo khả năng

mở rộng, nâng cắp, bỗ sung thêm các module chức năng mới mà không

phá vỡ sự ồn định của hệ thống Phần mềm phải đảm bảo được sự kế thừa những thành quả đạt được sau mỗi lần mở rộng, nâng cấp

b Xây dựng theo mô hình khách / chủ

Phần mềm phải đảm bảo được thiết kế và vận hành theo mô hình khách

chủ (clienuserver) để đảm bảo dữ liệu được quản lý tập trung dé dang

cho việc bảo mật, đồng bộ, sao lưu phục hồi Phần mềm được thiết kế

Trang 34

cho CSDL của hệ thống tập trung, vận hành, bảo trì nhanh chóng, dễ dàng

Chay trên nền web và hỗ trợ giao thức TCP/IP

Ứng dụng Web có thời gian phát triển nhanh, với giá thành phát triển

và triển khai thấp, tin cậy, có thể truy cập từ bất cứ đâu trên thế giới,

mọi người có thể sử dụng mà không mắt thời gian tìm hiểu nhờ giao diện trực quan Hỗ trợ giao thức TCP/IP để đảm bảo khả năng kết nối, chia sẻ dữ liệu trong mạng nội bộ (LAN), mạng toàn cầu (internet) Sử dụng hệ quản trị CSDL mô hình quan hệ

Mô hình dữ liệu quan hệ được Codd đề xuất năm 1970 và đến nay trở

thành mô hình được sử dụng phổ biến trong các hệ quản trị CSDL Hệ

quản trị CSDL mô hình quan hệ có các ưu điểm: cải thiện tính độc lập

của dữ liệu và chương trình; tối ưu hóa cách truy xuất dữ liệu; tăng tính

bảo mật và toàn vẹn dữ liệu

'Vận hành ổn định trên nhiều hệ điều hành khác nhau

Hệ thống (gồm cả máy chủ và máy trạm) đảm bảo vận hành ổn định trên nhiều hệ thống khác nhau như: Windows, Linux, MacrOS Hệ

thống có khả năng chạy đồng thời trên nhiều HĐH khác nhau và có thể

chuyển đổi hai chiều tir Windows sang Linux, MaerOS và ngược lại Hỗ trợ đa ngôn ngữ (hỗ trợ bảng mã Unicode)

Cả giao diện và bảng mã lưu trữ trong hệ thống đều phải hỗ trợ đa ngôn

ngữ, đảm bảo nhập tin, tìm kiếm tài liệu theo bắt kỳ ngôn ngữ nào (theo

Trang 35

g Sấp xếp tiếng Việt

Phần mềm phải có khả năng sắp xếp dữ liệu tiếng Việt theo đúng trật tự

bảng chữ cái và dấu thanh (theo thứ tự dấu: huyền, sắc, hỏi, ngã, nặng) h Xuất bản điện tử Phần mềm có khả năng xuất bản dữ liệu từ các bộ sưu tập số ra đĩa quang, ỗ cứng di động ¡ Hỗ trợ các định dạng tệp dữ liệu số phổ biến số: văn bản, âm Phần mềm phải hỗ trợ tất cả các định dạng file dữ liệt thanh, hình ảnh, video j._ Vận hành ổn định với CSDL lớn

Phần mềm đảm bảo vận hành ôn định, tốc độ truy cập cao với CSDL

lớn (trên 1 triệu biểu ghi)

k An toàn hệ thống và bảo mật dữ liệu

Phần mềm đảm bảo hỗ trợ nhiều mức độ và cơ chế đảm bảo an toàn hệ

thống và bảo mật dữ liệu khác nhau Phân quyền chặt chẽ tới người

dùng là cán bộ thư viện va người dùng là bạn đọc với nhiều mức độ bảo

mật khác nhau Đối với dữ liệu số phần mềm đảm bảo phân quyền đến

từng tệp dữ liệu riêng rẽ

1 Sao lưu phục hồi dữ liệu

Sao lưu / phục hồi dữ liệu dễ dàng, đảm bảo toàn vẹn dữ liệu cho hệ

thống

m Cài đặt, sử dụng dễ dàng

Cán bộ thư viện có khả năng tự cài đặt, cấu hình hệ thống Phần mềm

Trang 36

1.2.3.2 Nhóm yêu câu về nghiệp vụ thư viện

a DublinCore

Phần mềm hỗ trợ nhập tin theo nhãn trường DublinCore, trao đổi dữ

liệu theo DublinCoreXML

b Hỗ trợ nhiều khung phân loại

Phần mềm phải hỗ trợ các khung phân loại phổ biến trên thế giới và

'Việt Nam

c Kiểm soát trùng biểu ghỉ

Phần mềm phải có khả năng kiểm soát trùng số ĐKCB, trùng biểu ghỉ

và thông báo tới cán bộ biên mục

d Hỗ trợ tìm kiếm đa dạng, chính xác

Tim kiếm theo tắt cả các trường nhập tin, kết hợp với việc sử dụng toán

tử logic (AND, OR, NOT) Tìm kiếm không phân biệt chữ hoa, chữ thường

e Có thể duyệt theo chủ đề

Bạn đọc có thể duyệt dữ liệu theo từng chủ đề, theo từng bộ sưu tập số

1.3 Ngôn ngữ lập trình PHP và hệ quản trị cơ sở dữ liệu MySQL

1.3.1 Tông quan về PHP va MySQL

1.3.1.1 Ngôn ngữ lập trình PHP

Ban đầu PHP được viết tắt bởi cụm từ Personal Home Page PHP được

Trang 37

Tới năm 1997 PHP có bước phát triển vượt bậc, PHP không còn là một dự án cá nhân của Rasmus Lerdorf mà đã trở thành một công nghệ web quan trọng và phổ biến Zaeev Suraski và Andi Gusman đã hoàn thiện việc phân tích cú

pháp cho ngôn ngữ lập trình này, đề rồi đến tháng 6 năm 1998, PHP3 ra đời

(phiên bản này các tệp PHP có phần mở rộng là php3)

Ngay sau khi PHP 3.0 chính thức được công bố, Andi Gutmans và

Zeev Suraski đã bắt đầu bắt tay vào việc viết lại phần lõi của PHP Mục đích

thiết kế là nhằm cải tiến tốc độ xử lý các ứng dụng phức tạp, và cải tiến tính module của co sở mã PHP Tháng 5 năm 2000 PHP4 ra đời, ngoài tốc độ xử

lý được cải thiện rất nhiều, PHP 4.0 đem đến các tính năng chủ yếu khác gồm

có sự hỗ trợ nhiều máy chủ Web hơn, hỗ trợ phiên làm việc HTTP, tạo bộ

đệm thông tin đầu ra, nhiều cách xử lý thông tin người sử dụng nhập vào bảo mật hơn và cung cấp một vài các cấu trúc ngôn ngữ mới Với PHP 4, số nhà

phát triển dùng PHP đã lên đến hàng tram nghìn và hàng triệu site đã công bố cài đặt PHP, chiếm khoảng 20% số tên miền trên mạng Internet

PHPS là phiên bản chính thức được sử dụng phổ biến nhất hiện nay, tuy nhiên người dùng đã có thể download PHP6 (phiên bản dùng thử) tại địa chỉ htip://snaps.php.net

1.3.1.2 Cơ sở dữ liệu MySOL

MySQL là hệ quản trị cơ sở dữ liệu mã nguồn mở phổ biến nhất thế

giới hiện nay, được các nhà phát triển rất ưa chuộng trong quá trình phát triển

ứng dụng MySQL là cơ sở dữ liệu tốc độ cao, ôn định và dễ sử dụng, hoạt

động trên nhiều hệ điều hành khác nhau, MySQL cung cấp một hệ thống lớn

Trang 38

toàn cho nên người dùng có thể tai MySQL vé tir trang cha hup://avww.mysql.com My§QL có nhiều phiên bản cho các hệ điều hành khác nhau: Windows, Linux, Mac OS, Unix, FreeBSD, NetBSD, Novell NetWare, SGI Irix, Solaris, SunOS,

1.3.2 Lý do lựa chọn PHP va MySQL xy dựng phần mềm quản trị tài liệu số

1.3.3.1 Lý do chọn PHP

Khi sử dụng PHP, người dùng sẽ có được tốc độ nhanh hơn nhiều so

với các ngôn ngữ kịch bản khác, bởi PHP là phần mềm mã nguồn mở, được

hỗ trợ bởi nhiều lập trình viên giỏi, có số lượng người dùng đơng đảo Ngồi ra PHP chạy được trên nhiều hệ điều hành khác nhau

Rút ngắn thời gian phát triển: PHP cho phép bạn tách phần HTML code

va phin script, do đó có thể độc lập giữa công việc phát triển mã và thiết Điều này vừa giúp lập trình viên dễ dàng hơn vừa có thể làm cho chương

trình mềm dẻo hơn khi cần thay đồi giao diện

PHP là phần mềm mã nguồn mở: không chỉ là phần mềm mã nguồn mở

mà còn thực sự miễn phí (kể cả khi bạn sử dụng cho mục đích thương mại)

Do là phần mềm mã nguồn mở, các lỗi (bug) của PHP được công khai và

nhanh chóng được sửa chữa bởi nhiều chuyên gia trên toàn thế giới

Tốc độ: nhờ vào sức mạnh của Zend Engine, khi so sánh PHP với ASP,

có thê thấy PHP vượt hơn ở một số bài kiểm tra (test), vượt trội ở tốc độ biên

dịch

Tinh khả chuyên: PHP được thiết kế đề chạy trên nhiều nền tảng khác

Trang 39

phẩm được phát trién trén nén UNIX, sau đó có thể chuyển sang Windows mà

không gặp phải bắt cứ vấn đề gì)

1.3.3.2 Lý do chọn MySOL

MySQL không chỉ là cơ sở dữ liệu mã nguồn mở phổ biến nhất trên thế

giới, nó còn trở thành cơ sở dữ liệu được chọn cho thế hệ mới của các ứng dung xay dumg trén nén Linux, Apache, MySQL, PHP/Perl/Python MySQL chay trén hon 20 platform bao gém: Linux, Windows, OS/X, HP-UX, AIX, Netware, mang đến cho người dùng tính linh hoạt trong việc sử dụng

Tính linh hoạt: Máy chủ cơ sở dữ liệu MySQL cung cấp đặc tính linh hoạt, có sức chứa để xử lý các ứng dụng được nhúng sâu với dung lượng chỉ

1MB để chạy các kho dữ liệu đồ sộ lên đến hàng terabytes thông tin Sự linh hoạt về platform là một đặc tính lớn của MySQL với tắt cả các phiên bản của

Linux, Unix, và Windows đang được hỗ trợ Và dĩ nhiên, tính chất mã nguồn

mở của MySQL cho phép sự tùy biến hoàn toàn theo ý muốn đề thêm vào các yêu cầu thích hợp cho database server

Tính thực thi cao: kiến trúc storage-engine cho phép các chuyên gia cơ sở dữ liệu cấu hình máy chủ cơ sở dữ liệu MySQL đặc trưng cho các ứng dụng đặc thù Dù ứng dụng là một hệ thống xử lý giao dịch tốc độ cao hay website dung lượng lớn phục vụ hàng triệu yêu cầu mỗi ngày, MySQL có thể

đáp ứng khả năng xử lý những đòi hỏi khắt khe nhất của bắt kì hệ thống nào

Với các tiện ích tải tốc độ cao, đặc biệt bộ nhớ đệm (caches), và các cơ chế xử

lý nâng cao khác, MySQL đưa ra tất cả các vũ khí cần phải có cho các hệ thống,

Trang 40

từ cấu hình tái tạo chủ/khách tốc độ cao, đề các nhà phân phối thứ 3 đưa ra

những giải pháp có thể dùng ngay duy nhất cho server cơ sở dữ liệu MySQL

Hỗ trợ giao dịch mạnh: MySQL đưa ra một trong số những engine giao dịch cơ sở dữ liệu mạnh nhất trên thị trường Các đặc trưng bao gồm hỗ trợ

giao dich ACID hoàn thiện ( Atomic - tự động, Consistent — thống nhất,

Isolated — độc lập, Durable - bền vững), khóa mức dòng không hạn chế, khả

năng giao dịch được phân loại, và hỗ trợ giao dịch đa dạng (multi-version) mà người đọc không bao giờ gây trở ngại cho người viết và ngược lại Tỉnh toàn vẹn của dữ liệu cũng phải được bảo đảm trong suốt quá trình server có hiệu

lực, các mức giao dịch độc lập được chuyên môn hóa

Nơi lưu trữ Web và Data đáng tin cậy: MySQL là nơi quản lý, lưu trữ thông tin cho các websites phải trao đổi thường xuyên vì nó có engine xử lý tốc độ cao, khả năng chèn dữ liệu nhanh, hỗ trợ mạnh cho các chức năng chuyên dụng của web như tìm kiếm văn bản nhanh Những tính năng này cũng được áp dụng cho môi trường lưu trữ dữ liệu mà MySQL tăng cường

đến hàng terabyte cho các server đơn

Chế độ bảo mật dữ liệu mạnh: vì bảo mật dữ liệu là công việc số một của các chuyên gia về cơ sở dữ liệu, MySQL đưa ra tính năng bảo mật đặc

biệt chắc chắn dữ liệu sẽ được bảo mật tuyệt đối Trong việc xác nhận truy

ic chăn chỉ có

cập cơ sở dữ liệu, MySQL cung cấp các kĩ thuật mạnh mà c|

người sử dụng đã được xác nhận mới có thể truy nhập được vào server cơ sở dữ liệu, với khả năng này để chặn người dùng ngay từ mức máy khách là điều có thể làm được SSH và SSL cũng được hỗ trợ dé chắc chắn các kết nối được an toàn và bảo mật Cuối cùng, tiện ich sao lưu (backup) và phục hồi dữ liệu

Ngày đăng: 13/01/2024, 23:28