Chức năng thông tin: Thư viện với tư cách là cơ quan cung cấp thông tin thực hiện chức năng thông tin bằng cách: - Phục vụ thông tin – thư mục theo phương thức cổ truyền cũng như hiện đạ
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI & NHÂN VĂN
KHOA THÔNG TIN – THƯ VIỆN
Hà Nội - 05/2011
Trang 2LỜI NÓI ĐẦU 4
1 Tính cấp thiết của đề tài 5
2 Mục đích nghiên cứu 6
3 Đối tƣợng nghiên cứu 6
4 Phạm vi nghiên cứu 7
CHƯƠNG I THƯ VIỆN SỐ VÀ NHỮNG VẤN ĐỀ VỀ THƯ VIỆN SỐ7 1.1 Thƣ viện và các mô hình thƣ viện 7
1.1.1 Khái niệm thƣ viện 7
1.1.2 Chức năng của thƣ viện 8
1.1.3 Các mô hình thƣ viện ngày nay 9
1.2 Công nghệ thƣ viện số và các vấn đề liên quan 12
1.2.1 Đặc điểm của thƣ viện số 12
1.2.2 Lợi ích của thƣ viện số 13
1.2.3 Kiến trúc và Kiến trúc thông tin của thƣ viện số 14
1.2.4 Nền tảng thƣ viện số 18
1.2.5 Các dịch vụ Thƣ viện số 27
1.2.6 Web Services 29
1.2.7 Bài toán tích hợp thƣ viện số 30
CHƯƠNG II: PHẦN MỀM THƯ VIỆN SỐ 32
2.1 Các yêu cầu về quản lý thƣ viện số 32
2.1.1 Yêu cầu chung 32
2.1.2 Yêu cầu về công nghệ nền tảng 33
2.1.3 Yêu cầu về chuẩn thƣ viện 35
2.1.4 Yêu cầu về chuẩn nghiệp vụ thƣ viện 35
2.2 Các phần mềm thƣ viện số 39
2.2.1 Giới thiệu chung 39
2.2.2 Phần mềm Greenstone 40
2.2.3 Phần mềm Dspace 41
2.2.4 Phần mềm Feroda 43
Trang 32.2.5 So sánh các phần mềm và phản hồi của người dùng 44
2.3 Đặc điểm của Dspace 47
2.3.1 Mô hình đối tượng trong Dspace 47
2.3.2 Kiến trúc của Dspace 48
2.3.3 Tiến trình của Dspace 48
2.3.4 Dspace Workflow 49
2.3.5 Quản lí người dùng trong DSpace 51
2.3.6 Quản lí tài liệu trong DSpace 52
2.3.7 Manakin cho Dspace 52
CHƯƠNG III: ỨNG DỤNG XÂY DỰNG THƯ VIỆN SỐ Ở THƯ VIỆN ĐẠI HỌC BÁCH KHOA HÀ NỘI 55
3.1 Vài nét về thư viện Tạ Quang Bửu 55
3.1.1 Lịch sử hình thành và phát triển 55
3.1.2 Chư ́ c năng, nhiê ̣m vu ̣ của Thư viê ̣n Ta ̣ Quang Bửu 57
3.1.3 Khảo sát trực trạng thư viện Tạ Quang Bửu 60
3.2 Mục tiêu xây dựng thư viện số ở thư viện Tạ Quang Bửu 62
3.3 Tiến hành xây dựng thư viện số ở thư viện Tạ Quang Bửu 63
KẾT LUẬN 65
DANH MỤC HÌNH VẼ 66
DANH MỤC TÀI LIỆU THAM KHẢO 71
Trang 4LỜI NÓI ĐẦU
Thư viện là kho tri thức của xã hội; có người còn cho rằng thư viện là đền đài của văn hoá và sự uyên thâm Được hình thành trong thời kỳ nông nghiệp thống trị trong tư duy của nhân loại, thư viện đã trải nghiệm qua một cuộc hồi sinh với việc phát minh ngành in trong thời kỳ Phục hưng, và thực sự bắt đầu khởi sắc khi cuộc cách mạng công nghiệp bùng phát với hàng loạt những phát minh cơ giới hoá quy trình in ấn
Lịch sử thư viện đã trãi qua hơn 25 thế kỷ Hình ảnh thư viện của thời xa xưa được hình dung như là một cơ sở vững chắc trong đó chứa hàng ngàn phiến
Trang 5đá khổng lồ được khắc chữ - thường được gọi là "rừng bia" Qua nhiều năm cùng với sự tiến hoá của nhân loại, con người càng tiến bộ trong nhận thức và thư viện ngày càng được phát triển Giai đoạn Quản lý tư liệu đã trải qua một thời gian dài theo sự phát triển đó Cho đến một lúc, cũng xuất phát từ ý định ban đầu là làm tốt công việc lưu trữ và bảo quản, thư viện đã chú trọng đến việc xem người
sử dụng là trung tâm, với sự nhấn mạnh đến việc trao đổi thông tin Điều này cũng đồng thời để đáp ứng yêu cầu thông tin ngày càng gia tăng Giai đoạn Quản
lý thông tin được xem như bắt đầu Và chúng ta sẽ nhận thức được rằng để xây dựng thư viện số là ta đã bắt đầu bước qua một giai đoạn phát triển mới của thư viện: Giai đoạn Quản lý tri thức
Cùng với sự phát triển của mạng lưới truyền thông và công nghệ thông tin (CNTT), hiện nay trên thế giới nhiều thư viện số (TVS) đã ra đời và ngày càng phát triển mạnh mẽ Sự ra đời của TVS là một tất yếu của cuộc cách mạng khoa học kỹ thuật trong giai đoạn bùng nổ thông tin hiện nay
1 Tính cấp thiết của đề tài
Thư viện số đã hình thành và phát triển hơn mười năm nay trên thế giới
Đó là một hình thức phục vụ tài liệu điện tử và liên thông trên phạm vi toàn cầu mang đến hiệu quả cao nhất trong việc đáp ứng nhu cầu thông tin cho người sử dụng khắp nơi trên thế giới Tại hội nghị quốc tế lần thứ năm về Thư viện số Châu Á (ICADL 2002) tại Singapore từ 11-14/12/2002 cho thấy rằng thư viện số Châu Á đã đạt đến một mức độ phát triển cao trong đó có nhiều nước trong khu vực Đông Nam Á
Hiện nay các thư viện trên thế giới và trong khu vực đã đạt đến một mức
độ hiện đại cao về hạ tầng cơ sở và công nghệ để phát triển và khai thác thư viện
số Giá trị thư viện ngày nay là chỗ thư viện sử dụng công nghệ như thế nào để
Trang 6đáp ứng mọi nhu cầu của độc giả từ mọi nguồn thông tin khắp nơi trên thế giới thông qua thư viện số
Thư viện Việt Nam có đủ khả năng về hiện đại hóa hạ tầng cơ sở nhưng hiện nay do thiếu trình độ quản lý, thiếu nhận thức và thông tin về hiện đại hóa, lúng túng và không biết sử dụng công nghệ nên khắp nơi đang lãng phí thời gian
và ngân sách từ nhiều nguồn kể cả nguồn vay nước ngoài trong hoạt động thư viện một cách nghiêm trọng Trong khi hoàn toàn có thể đi tắt đón đầu, sử dụng công nghệ mới để hội nhập với hệ thống thư viện trên thế giới Trong đó việc ứng dụng phần mềm các phần mềm thư viện số để xây dựng thư viện số ở các thư viện nước ta hiện nay là một điển hình Xây dựng thành công thư viện số mang ý nghĩa đặc biệt như một bước ngoặt trên con đường hiện đại hóa ngành thông tin thư viện – con đường của sự phối hợp giữa công nghệ thông tin và thư viện Từ đấy, mọi nghiên cứu khoa học thông tin thư viện chính là nghiên cứu công nghệ thông tin
Xuất phát từ thực tế trên, em đã đi đến lựa chọn tìm hiểu và nghiên cứu đề tài: “Tìm hiểu phần mềm thư viện số và ứng dụng xây dựng thư viện số ở Thư viện Tạ Quang Bửu”, nhằm lựa chọn những phần mềm thư viện số ưu việt, và hình mẫu ứng dụng xây dựng thư viện số ở thư viện Tạ Quang Bửu – một trong những thư viện Đại học đi đầu trong ứng dụng CNTT, để từ có đó được những định hướng tốt nhất trong việc xây dựng thư viện số ở nước ta
2 Mục đích nghiên cứu
Mục đích nghiên cứu của khóa luận là nhằm nghiên cứu các phần mềm thư viện số đang được sử dụng rộng rãi hiện nay, có nhiều ưu điểm và phù hợp với đặc điểm của các thư viện nước ta Bên cạnh đó, khóa luận đi vào tìm hiểu việc ứng dụng xậy dựng thư viện số ở Thư viện Tạ Quang Bửu để có được cái nhìn khái quát hơn trong việc việc định hướng xây dựng thư viện số ở nước ta
3 Đối tượng nghiên cứu
Trang 7Nghiên cứu các phần mềm thư viện số và việc ứng dụng xây dựng thư viện số ở thư viện Tạ Quang Bửu
4 Phạm vi nghiên cứu
Nghiên cứu các phần mềm thư viện số đang được ứng dụng rộng rãi và xây dựng thư viện số tại Thư viện Tạ Quang Bửu trong thời gian hiện nay
CHƯƠNG I THƯ VIỆN SỐ VÀ NHỮNG VẤN ĐỀ VỀ THƯ VIỆN SỐ
1.1 Thư viện và các mô hình thư viện
1.1.1 Khái niệm thư viện
Thuật ngữ “thư viện” xuất phát từ chũ Hy Lạp bibliotheca “Biblio” nghĩa
là sách, “theca” là nơi bảo quản Hiểu theo nghĩa đen, thư viện là nơi bảo quản sách, nơi tàng trữ sách báo Ngày nay, thư viện được định nghĩa như sau:
“TV là cơ quan TT, văn hoá giáo dục có VTL nhân bản được tổ chức và đưa ra cho các pháp nhân, cá nhân người sử dụng có thời hạn” (Liên Bang Nga)
“TV- một sưu tập những TL đã được tổ chức để đáp ứng nhu cầu của một nhóm người mà TV có bổn phận phục vụ, để cho họ có thể sử dụng cơ sở của
TV, truy dụng thư tịch cũng như trau dồi kiến thức của họ” (Các nhà Thư viện học Mỹ)
“TV là một bộ sưu tập sách nhằm mục đích để đọc, để nghiên cứu hoặc tra cứu” (Bách khoa toàn thư Anh)
“TV không phục thuộc vào tên gọi, là bất cứ bộ sưu tập có tổ chức nào của sách, ấn phẩm định kỳ hoặc các TL khác nhau, kể cả đồ họa, nghe nhìn và nhân
Trang 8viên phục vụ có trách nhiệm tổ chức cho bạn đọc sử dụng các TL đó nhằm mục đích TT, NCKH, GD hoặc giải trí” (Tuyên ngôn 1994 của UNESCO về thư viện công cộng)
Như vậy trên thế giới tồn tại rất nhiều quan điểm khác nhau về thư viện Tuy nhiên trong các định nghĩa trên, định nghĩa của UNESCO được các nhà thư viện học trên thế giới đánh giá là định nghĩa đầy đủ nhất về thư viện vì định nghĩa này nêu lên được những thành phần cấu tạo nên thư viện và các chức năng nhiệm vụ chủ yếu của nó
Thư viện được cấu thành từ 4 yếu tố: vốn tài liệu, cán bộ thư viện, người
sử dụng, cơ sở vật chất kỹ thuật Các yếu tố này có mối quan hệ qua lại, tác động chặt chẽ với nhau
1.1.2 Chức năng của thư viện
Thư viện có vai trò quan trọng trong công tác phục vụ nhu cầu đọc, tìm hiểu thông tin, nâng cao tri thức cho con người Thư viện có một số chức năng chính như sau:
Chức năng văn hóa:
Thư viện thu thập, tàng trữ, bảo quản và truyền bá di sản văn hóa của nhân loại cũng như của đất nước được lưu giữ trong các tài liệu Thư viện là trung tâm sinh hoạt văn hóa, trung tâm mở mang dân trí, tuyên truyền, phổ biến kiến thức
về các loại hình nghệ thuật và lôi cuốn quảng đại quần chúng tham gia và hoạt động sáng tạo
Chức năng giáo dục:
Ngay từ thời cổ đại, thư viện đã là một tổ chức giáo dục quan trọng Chức năng giáo dục của thư viện được các thư viện công cộng thực hiện từ thế kỷ XVI, thể hiện ở các điểm chính sau:
- Tham gia vào việc xóa mù chữ cho nhân dân
Trang 9- Nâng cao trình độ dân trí, chuyên môn cho các tầng lớp dân cư trong vùng
Cho đến nay, các thư viện hiện đại vẫn thực hiện chức năng giáo dục của mình
Chức năng thông tin:
Thư viện với tư cách là cơ quan cung cấp thông tin thực hiện chức năng thông tin bằng cách:
- Phục vụ thông tin – thư mục theo phương thức cổ truyền cũng như hiện đại ngay tại thư viện: hệ thống mục lục, thư mục, cơ sở dữ liệu, phổ biến thông tin chọn lọc, bản tin điện tử…
- Tiếp cận qua mạng để với tới nguồn lực của các thư viện khác và đảm bảo sự tiếp cận đó tới các nguồn thông tin điện tử cho bạn đọc không có điều kiện nhận được ngay từ nhà hoặc nơi làm việc của họ
Chức năng giải trí:
Ngoài các kiến thức chuyên ngành, thư viện còn tham gia vào việc tổ chức
sử dụng thời gian nhàn rỗi cho nhân dân bằng cách cung cấp sách báo và các phương tiện nghe – nhìn khác để đáp ứng nhu cầu giải trí, góp phần giảm bớt mệt nhọc trong quá trình học tập và làm việc
1.1.3 Các mô hình thư viện ngày nay
Cùng với sự phát triển của CNTT và khoa học công nghệ, thư viện không đơn thuần là nơi lưu giữ sách, báo, tạp chí, nơi yêu tĩnh cho độc giả đến nghiên cứu, học tập mà thư viện còn trở thành một trung tâm thông tin được ứng dụng công nghệ cao Từ đó, nhiều mô hình thư viện hiện đại cũng ra đời
Theo Barker (1997), có 4 dạng thư viện khả dĩ:
- Thư viện đa phương tiện;
- Thư viện điện tử;
- Thư viện số;
Trang 10- Thư viện ảo
1.1.3.1 Thư viện đa phương tiện
Là thư viện sử dụng hỗn hợp sách báo và nhiều phương tiện lưu trữ thông tin và tri thức khác nhau như băng đĩa video, vi phim, CD - ROM, phần mềm máy tính, vv Quy trình và quá trình tổ chức và quản lí TVĐPT giống như thư viện truyền thống: việc tìm tài liệu cũng bằng tay, sử dụng bộ máy tra cứu bằng phiếu hoặc vi phim, vi phiếu Cán bộ thư viện vẫn đóng vai trò quan trọng trong TVĐPT, mặc dù sử dụng máy tính nhưng chưa thể tự động hoá hoàn toàn các thao tác Tại Việt Nam, một số cơ quan thông tin tư liệu và thư viện lớn đã và đang tổ chức một số phòng đọc đa phương tiện phục vụ người sử dụng
1.1.3.2 Thư viện điện tử
Là thư viện mà các quá trình cơ bản về nghiệp vụ dựa trên cơ sở máy tính
và các phương tiện hỗ trợ khác Dấu hiệu đặc trưng của TVĐT là sử dụng phổ biến các phương tiện điện tử trong lưu giữ, tìm kiếm và cung cấp thông tin Tuy nhiên, trong TVĐT, sách truyền thống vẫn tiếp tục tồn tại cùng với các ấn phẩm điện tử nên vẫn cần sự trợ giúp của cán bộ thư viện trong mọi hoạt động chuyên môn
Đặc điểm của thư viện điện tử:
- Thư viện phải có vốn tài liệu điện tử (là những tư liệu được lưu giữ dưới dạng
số sao cho có thể truy nhập được bằng các thiết bị xử lý dữ liệu)
- Phải được tin học hóa, phải có một hệ quản trị thư viện điện tử tích hợp, phải nối mạng
- Phải cung cấp và tạo điều kiện cho người sử dụng các dịch vụ điện tử (timg tin trong các cơ sở dữ liệu, yêu cầu và gia hạn mượn qua mạng )
Tóm tại, TVĐT phải sử dụng các phương tiện điện tử trong việc thu thập, xử lý, tìm kiếm và phổ biến thông tin
Trang 111.1.3.3 Thư viện số
Nhiều định nghĩa đã được công bố trong giới học giả toàn cầu về thư viện nhằm định nghĩa rõ ràng một thư viện số Dưới đây là một số định nghĩa tiêu biểu về thư viện số:
Một số thành viên Hiệp hội Thư Viện Số Hoa kỳ (Digital Library Federation) đã đưa ra một định nghĩa, “Thư viện số là các tổ chức cung cấp tài nguyên, gồm các nhân viên chuyên biệt giúp lựa chọn, tổ chức, cung cấp khả năng truy cập thông minh, chỉ dẫn, phân phối, bảo quản tính toàn vẹn và sự thống nhất của các bộ sưu tập số theo thời gian để đảm bảo làm sao chúng luôn sẵn có để truy xuất một cách dễ dàng và kinh tế nhất đối với một cộng đồng người dùng hoặc một nhóm cộng đồng người dùng” (Raitt, 1999)
Hai học giả người Nga là Sokolova và Liyabev cho rằng thư viện số là một hệ thống phân tán có khả năng lưu trữ và tận dụng hiệu quả các loại tài liệu điện tử khác nhau, mà giúp người dùng có thể truy cập và được chuyển giao thông tin dễ dàng qua mạng máy tính (Xiao, 2003)
Nhiều học giả Trung Quốc lại có cùng quan điểm rằng “Một thư viện số trên thực tế không phải là một thư viện ở góc độ mở rộng không gian của nó; thay vào đó nó là trung tâm tài nguyên thông tin số chứa đựng tài nguyên thông tin đa phương tiện Một thư viện số tồn tại bằng việc số hóa thông tin, chẳng hạn như văn bản, ký tự, chữ viết, hình ảnh, video và âm thanh, đồng thời cung cấp cho người dùng các dịch vụ thông tin nhanh chóng và thuận tiện thông qua Internet, nhằm chuyển giao một hệ thống thông tin số mà trong đó việc chia sẻ nguồn tài nguyên luôn sẵn sàng” (Wang, 2003)
Trang 12Như vậy thư viện số được hiểu là: “một thư viện điện tử cao cấp, trong đó toàn bộ các tài liệu của thư viện đó được số hoá và được quản lý bằng một phần mềm chuyên nghiệp có tổ chức để người dùng tin dễ dàng truy cập, tìm kiếm và xem được nội dung toàn văn của chúng từ xa thông qua hệ thống mạng thông tin
và các phương tiện truyền thông”
1.1.3.4 Thư viện ảo
Một loại thư viện số khác cung cấp một cổng thông tin nhằm vào thông tin điện tử ở nơi khác ngoài thư viện Loại này đôi khi được gọi là thư viện ảo để nhấn mạnh rằng đây là thư viện mà bản thân không chứa nội dung Những quản thủ thư viện đã dùng thuật ngữ này cách đây hơn mười năm để chỉ một loại thư viện chuyên cung cấp việc truy cập thông tin điện tử thông qua những chỉ điểm – pointers
Thư viện ảo được xác định theo kho tin của nó Thư viện không có kho riêng, mà phụ thuộc vào kho của các thư viện khác Thư viện ảo còn gọi là thư viện không tường
Thư viện ảo cũng được định nghĩa theo dịch vụ của nó Thư viện ảo không phải quản trị kho tin, mà tiến hành lựa chọn, thu thập, tổ chức thông tin cho yêu cầu của người dùng riêng biệt Thư viện là một trung tâm tra cứu tới các tài liệu hướng dẫn, bảng tra, tài liệu tóm tắt và các công cụ khác để nâng cao việc truy cập các nguồn tin
1.2 Công nghệ thư viện số và các vấn đề liên quan
1.2.1 Đặc điểm của thư viện số
Mặc dù có sự khác nhau về lý giải trong nhiều định nghĩa về thư viện số, nhưng những đĩnh nghĩa này lại tương tự nhau về mặt bản chất cốt yếu Vì vậy,
từ những định nghĩa trên chúng ta có thể rút ra những đặc điểm khác biệt của thư viện số bao gồm:
Trang 13- Khả năng lưu trữ khối lượng lớn tài nguyên thông tin khác nhau;
- Khả năng lưu trữ và chuyển giao tài nguyên thông tin bằng nhiều phương tiện khác nhau;
- Khả năng chuyển giao tài nguyên thông tin qua mạng;
- Khả năng quản lý tài nguyên thông tin phân tán;
- Khả năng chia sẻ thông tin ở cấp độ chuyên biệt cao;
- Có công nghệ tìm kiếm và truy xuất thông minh;
- Cung cấp dịch vụ thông tin không giới hạn thời gian và không gian
1.2.2 Lợi ích của thư viện số
- Mang lại thông tin cho NDT: TVS có thể sử dụng ở khắp mọi nơi, NDT có thể truy cập và tìm kiếm thông tin mọi lúc, mọi nơi theo cơ chế quản trị quyền truy cập
- Tăng cường khả năng tìm kiếm thông tin: Thông qua các tiện ích phức tạp và
đa dạng, đặc biệt là các dịch vụ tìm kiếm CSDL và các trang Web, máy tìm…
- Tăng cường việc chia sẻ thông tin: Các tổ chức, công ty, trường đại học, viện nghiên cứu đã và đang sử dụng và chia sẻ các nguồn tài nguyên thông tin trên Internet và TVS
- Giúp NDT truy cập thông tin kịp thời: Khoảng cách giữa việc sáng tạo thông tin và truy cập tới thông tin này là rất lớn trong thư viện truyền thống TVS giảm thiểu tối đa khoảng cách này bằng cách xuất bản số và nhanh chóng tích hợp bổ sung thông tin vào các bộ sưu tập và dịch vụ của TVS Thông qua các tiện ích tìm kiếm cũng giúp NDT cập nhật thông tin nhanh chóng với khoảng thời gian nhanh nhất
Trang 14- Giúp tăng cường việc sử dụng thông tin: TVS phá vỡ hàng rào thời gian, không gian, ngôn ngữ và văn hóa Thông tin được tạo ra từ nhiều nơi trên thế giới, nhiều nền văn hóa và các ngôn ngữ khác nhau đều có thể được NDT truy cập dễ dàng Thông tin được đóng gói, chế biến để phục vụ mọi đối tượng
- Tăng cường khả năng cộng tác: Chu trình giao lưu, sử dụng và truyền bá thông tin của các học giả và nhà nghiên cứu được tăng cường
- Giảm khoảng cách số: Ngày nay, CNTT và truyền thông, đặc biệt là Internet đã làm giảm khoảng cách giữa mọi người trên thế giới nhưng giữa các quốc gia vẫn còn :khoảng cách số”, đó là khoảng cách về hạ tầng công nghệ, các tiện ích và các tài nguyên thông tin…Đó cũng là khoảng cách giữa các cá nhân, tổ chức ở các mức độ kinh tế - xã hội khác nhau,…(cơ hội tiếp cận CNTT & Internet, khả năng sử dụng trong các hoạt động khác nhau)
1.2.3 Kiến trúc và Kiến trúc thông tin của thư viện số
1.2.3.1 Kiến trúc của thư viện số
Một thư viện số thường là một tập tích hợp các dịch vụ khác nhau như thu thập, phân loại, biên mục, lưu trữ, tìm kiếm, bảo vệ và duy trì thông tin, hệ thống này tạo thành một tổ chức chặt chẽ, thuận tiện, cho việc truy cập và xử lý một số lượng lớn tài nguyên số Các thư viện số là các việc thực thi kiến trúc của hạ tầng mạng, hệ thống máy tính, các phần mềm, phần cứng nhất định để tăng cường tổ chức, thu thập, bảo trì và tận dụng thông tin
Thư viện số là một hệ thống phức tạp Một thư viện số có thể là một hệ thống có kiến trúc đa tầng với nhiều chức năng khác nhau và các thư viện số có khác nhau thường có mô hình và kiến trúc khác nhau Tuy nhiên, kiến trúc chung
Trang 15cho một thư viện thường gồm 4 thành phần cơ bản: giao diện người dùng, kho thông tin, hệ thống định danh và hệ thống tìm kiếm
Giao diện người dùng (User Interface):
Thường có 2 giao diện người dùng:
- Giao diện dành cho người dùng tin thư viện
- Giao diện cho cán bộ thư viện và người quản trị hệ thống
Giao diện người dùng tin có hai phần: một là trình duyệt Internet tiêu chuẩn cho người sử dụng tương tác thực với máy tính Trình duyệt này nối với dịch vụ máy khách, đóng vai trò trung gian giữa trình duyệt và các thành phần khác của hệ thống Dịch vụ máy khách cho phép người dùng xác định vị trí cũng như nội dung tìm kiếm, chúng diễn giải thông tin được cấu trúc từ những đối tượng số Chúng thương lượng các điều khoản và điều kiện, quản lý các điều kiện giữa các đối tượng số, ghi nhớ lại tình trạng của quá trình giao tiếp của các
hệ thống khác nhau
Kho thông tin:
Các kho thông tin lưu trữ và quản lý các đối tượng số và các loại thông tin khác Một thư viện số quy mô lớn có rất nhiều kho thông tin với nhiều loại hình, bao gồm các kho thông tin hiện có và các cơ sở dữ liệu hồi cố, tương tác với kho này phải thông qua giao thức truy cập kho Giao thức này nhận diện quyền và sự cho phép một khách hàng có thể truy cập vào kho, hỗ trợ trên quy mô lớn sự phân phối thông tin và tao ra một kiến trúc mờ đối với các giao diện đã được xác định rõ ràng
Hệ thống định danh:
Trang 16Đây là những yếu tố định danh có mục đích tổng quát được dùng để xác định các nguồn tin trên Internet trong một thời gian dài và để quản lý các tài liệu
có trong kho hay trong cơ sở dữ liệu Hệ thống định danh là một hệ thống máy tính nhằm cung cấp dịch vụ chỉ dẫn phân tán cho các định danh cho các nguồn tin trên Internet Khi tương tác với kho thông tin, hệ thống định danh tiếp nhận thông tin định danh của đối tượng số và gửi nó về kho thông tin nơi mà đối tượng số được lưu trữ
Hệ thống tìm kiếm:
Hệ thống tìm kiếm phải thiết kế để có những chỉ mục (Index) và mục lục (Catalog) để phát hiện ra thông tin cần tìm trước khi truy xuất nó từ kho thông tin Các Index này phải được quản lý độc lập và có rất nhiều giao thức
1.2.3.2 Kiến trúc thông tin của thư viện số
Trong thư viện số, thông tin được lưu trữ dưới dạng những đơn vị thông tin số cơ bản như bản đồ số hóa, một đoạn văn bản, một trang web hay một bức ảnh quét … Các tài liệu số thường liên hệ với các tài liệu khác theo quan hệ bộ phận – toàn thể hay theo quan hệ trật tự Chẳng hạn, một văn bản được số hóa có thể bao gồm các trang, chương, bảng mục lục, ví dụ minh họa, … Trong hệ thống mạng toàn cầu (www), một văn bản tương tự có thể bao gồm nhiều trang văn bản với hình đi kèm và đường dẫn tới các thông tin khác Theo phương thức này, tài liệu được chia thành những tập hợp Đó có thể là những tập hợp thông tin theo nghĩa đen, những nhóm thông tin do các nhà xuất bản cung cấp hay có thể là những trang tin được người chủ trang web đưa lên
Những thông tin cùng loại được lưu dưới nhiều dạng khác nhau Đôi lúc những định dạng này hoàn toàn tương thích và có thể chuyển đổi dễ dàng từ
Trang 17dạng này sang dạng khác, nhưng cũng có khi một loại thông tin lại được chứa trong những định dạng khác hẳn nhau
Do tính năng dễ thay đổi nên các sản phẩm số thường xuyên phải thay phiên bản (chúng ta có thể thấy rõ điều này qua các trang web của một số tổ chức - họ thay đổi trang chủ của mình nhiều lần trong một tháng) Khi một tài liệu được chuyển đổi sang dạng số thì các định dạng của nó cũng được chuyển đổi nhiều lần Ví dụ như một bức ảnh quét có thể có 3 phiên bản: bản lưu trữ có
độ phân giải cao, một phiên bản chất lượng trung bình, và một hình ảnh dạng phác thảo (thumbnail)
Mỗi một yếu tố của thông tin số có chức năng và quyền truy cập khác nhau, phụ thuộc vào kích cỡ tài liệu và đặc điểm của hệ thống máy tính và mạng
Kiến trúc thông tin được mô tả ở đây cung cấp cách tiếp cận chung để tổ chức thông tin trong thư viện số theo cách hiệu quả, giúp cho các chương trình máy tính có thể hiểu được cấu trúc của tài liệu và tiến hành các tương tác theo mong muốn của người sử dụng
* Các nguyên tắc cơ bản:
Kiến trúc thông tin được tổ chức theo các nguyên tắc cơ bản sau:
Người sử dụng và các chương trình ứng dụng của họ cần phải linh hoạt
Do người sử dụng có thể khai thác thông tin theo những cách thức khác nhau nên thông tin cần được tổ chức linh hoạt, không lệ thuộc quá nhiều vào cách thức truy cập, trình độ chuyên môn hay trình tự truy cập của họ
Bộ sưu tập tài liệu cần được quản lý theo cách đơn giản Cũng giống như các thư viện khác, một số cán bộ làm việc trong thư viện số mặc dù có chuyên môn tương đối thấp vẫn phải quản lý một bộ sưu tập tài liệu rất lớn Do vậy,
Trang 18thông tin cần phải được kiến trúc theo cách thức đơn giản, cho phép các cán bộ thư viện tập trung vào những lĩnh vực họ cần phụ trách chứ không ôm đồm quá nhiều việc cùng lúc
Kiến trúc thông tin phải phản ánh được cơ cấu kinh tế xã hội và pháp lý của sự phát triển hạ tầng thông tin Cụ thể những đặc tính đó là: có giá trị, phụ thuộc vào thời gian và các điều kiện khách quan, được truyền đạt thông qua các
hệ thống mạng không bảo mật của các quốc gia
* Loại dữ liệu, siêu dữ liệu cấu trúc và siêu đối tượng
Thông tin được cấu trúc dựa trên ba khái niệm cơ bản: Loại dữ liệu, siêu dữ liệu
có cấu trúc và siêu đối tượng
- Loại dữ liệu mô tả những đặc tính của thông tin như loại định dạng hay
phương thức xử lý thông tin
- Siêu dữ liệu có cấu trúc là loại siêu dữ liệu mô tả phiên bản, các mối quan
hệ và các đặc tính khác của tài liệu số
- Siêu đối tượng là đối tượng cho phép tham chiếu đến một tập hợp các đối
tượng số Theo cách hiểu đơn giản thì siêu đối tượng là danh mục liệt kê các nhóm đối tượng khác Chẳng hạn như trong một tuyển tập thơ, mỗi một bài thơ
là một đối tượng số và tuyển tập thơ đó được gọi là một siêu đối tượng Cũng có lúc một siêu đối tượng chính là đối tượng số liệt kê các phiên bản đã được chuyển đổi của cùng một dữ kiện cụ thể
1.2.4 Nền tảng thư viện số
1.2.4.1 Metadata
Trang 19Siêu dữ liệu (metadata) dùng để mô tả tài nguyên thông tin Thuật ngữ
“meta” xuất xứ là một từ Hy Lạp đùng để chỉ một cái gì đó có bản chất cơ bản hơn hoặc cao hơn Vì vậy metadata là dữ liệu về dữ liệu
Theo tiến sĩ Warwick Cathro (Thư viện Quốc gia Úc) thì “siêu dữ liệu là những thành phần mô tả tài nguyên thông tin hoặc hỗ trợ thông tin truy cập đến tài nguyên thông tin” Cụ thể trong tài liệu thì siêu dữ liệu được xác định là “dữ liệu mô tả các thuộc tính của đối tượng thông tin và trao cho các thuộc tính này ý nghĩa, khung cảnh và tổ chức Siêu dữ liệu còn có thể được định nghĩa là dữ liệu
có cấu trúc về dữ liệu”
Theo Gail Hodge siêu dữ liệu là “thông tin có cấu trúc mà nó mô tả, giải thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử dụng và quản lý hơn Siêu dữ liệu được hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin”Nói tóm lại thì siêu dữ liệu là thông tin mô tả tài nguyên thông tin
Mục đích đầu tiên và yêu cầu cốt lỗi nhất của siêu dữ liệu (metadata) là góp phần mô tả và tìm lại các tài liệu điện tử trên mạng Internet Sự phát triển mạnh mẽ của Internet đã tạo ra sự bùng nổ của các loại dữ liệu đa dạng ở dạng
số, văn bản, âm thanh, hình ảnh, tài liệu đa phương tiện Những tài liệu này có thể truy cập được trên mạng Internet song việc tìm kiếm chúng một cách hiệu quả và khoa học như với các hệ thống thông tin trực tuyến là hết sức khó khăn
Để góp phần tăng cường chất lượng tìm kiếm các tài liệu số trên mạng Internet, người ta đã đưa ra giải pháp sử dụng siêu dữ liệu
Thực ra trong hoạt động thông tin – thư viện truyền thống, từ lâu đã có những khái niệm liên quan đến siêu dữ liệu Các bản thư mục chứa các dữ liệu
mô tả đối tượng như cho sách , cho tạp chí thì chúng cũng được coi như là một dạng siêu dữ liệu Với việc tự động hóa công tác biên mục, phiếu thư mục được thay thế bằng biểu ghi thư mục Như vậy thành phần siêu dữ liệu còn có thể
Trang 20được trình bày trong biểu ghi, vì vậy biểu ghi này được coi là biểu ghi siêu dữ liệu (metadata record) của đối tượng được cơ sở dữ liệu quản lý Với tài nguyên truyền thống trên giấy, thông tin mô tả được bố trí nằm ngoài đối tượng mà nó
mô tả (Ví dụ, trên phiếu thư mục của mục lục thư viện, trong biểu ghi của CSDL) Nhờ những yếu tố mô tả như vậy, người ta có thể xác định và tìm kiếm lại được tài liệu một cách chính xác theo một vài yếu tố
Ngày nay, nguồn tài liệu điện tử phát triển nhanh chóng và sự phân tán trên mạng nhiều đến mức không thể xử lý được một cách thủ công như đã và đang áp dụng đối với tài liệu xuất bản trên giấy Để xử lý được hết tài liệu điện
tử phân tán, người ta phải áp dụng các phương pháp tự động – sử dụng các chương trình đặc biệt (được gọi theo nhiều cách khác nhau như: robots, crawlers, spiders, ) Do tài liệu điện tử được tạo ra, thông thường không tuân thủ những quy định xuất bản truyền thống, không có những quy tắc nhất định giúp cho phép nhận dạng tự động được các yếu tố mô tả thông thường như tác giả, địa chỉ
về xuất bản, thông tin về khối lượng nên cần thiết phải có những quy định thống nhất để các chương trình tự động nhận dạng và xử lý chúng theo các yêu cầu nghiệp vụ Những quy định như vậy được gọi là những quy định về siêu dữ liệu Có thể thấy hiện nay, do nhiều chương trình máy tính chỉ định chỉ số dựa vào một số thành phần hạn chế như nhan đề hoặc toàn văn nên không hỗ trợ những tìm kiếm đặc thù (ví dụ theo tác giả, theo chủ đề, theo lĩnh vực ) Vì thế
để tạo điều kiện cho các chương trình có thể đinh chỉ số tự động theo một số yếu
tố xác định, người ta phải đưa thêm vào tài liệu điện tử những thuộc tính bổ sung
để tăng cường mô tả tài nguyên thông tin Các công cụ định chỉ số tự động sẽ được lập trình để nhận dạng các thuộc tính này và định chỉ số chúng, từ đó hỗ trợ tìm kiếm những thuộc tính đặc thù
Như vậy một bản ghi metadata bao gồm một tập hợp những thuộc tính hoặc tập hợp những phần tử cần thiết để mô tả các tài nguyên thông tin theo yêu
Trang 21cầu nghiệp vụ Thông thường trong hoạt động nghiệp vụ thông tin – thư viện bao gồm các yếu tố như: Nhan đề tài liệu, tác giả, thông tin về xuất bản, nơi/vị trí lưu giữ, kiểu/dạng tài liệu
Mối liên hệ giữa siêu dữ liệu và tài nguyên thông tin mà nó mô tả có thể được thể hiện ở một trong hai cách sau:
+ Các phần tử metadata được chứa trong một biểu ghi tách biệt bên ngoài đối tượng mô tả
+ Các phần tử metadata có thể được nhúng (gắn) vào bên trong tài nguyên
mà nó mô tả
Trước đây với tài liệu truyền thống, các mô tả dữ liệu nằm ngoài đối tượng
mô tả (được đưa vào phiếu thư viện hoặc biểu ghi CSDL), như vậy siêu dữ liệu được lưu trữ một cách tách biệt bên ngoài đối tương mô tả
Với tài liệu điện tử, siêu dữ liệu của chúng được nhúng (gắn) trong bản thân tài nguyên hoặc liên kết với tài nguyên mà nó mô tả như trong trường hợp
các thẻ meta của tài liệu HTML hoặc các tiêu đề TEI (Text Encoding Initiative)
Trong thực tế có nhiều chuẩn mô tả biên mục mang tính chất metadata khá thông dụng đang được áp dụng như: MARC21/UNIMARC, ISO-2709, Dublin Core Metadata các dữ liệu metadata này thường được gắn vào phần đầu cho mỗi tài liệu điện tử được đưa vào máy chủ hoặc trên mạng internet nhằm hỗ trợ các công cụ tìm kiếm lọc ra các thông tin metadata để tổ chức thành các kho dữ liệu mà không cần dùng đến hệ quản trị cơ sở dữ liệu truyền thống Thực tế thì ngay bản thân ngôn ngữ XML tự nó đã hỗ trợ việc hình thành một cơ sở dữ liệu toàn văn, phi cấu trúc và rất thuận lợi cho việc tìm kiếm và trao đổi thông tin
Các loại metadata chính:
Trang 22Metadata mô tả: (Descriptive metadata): Mô tả nguồn tài nguyên cho các mục
đích khám phá và định nghĩa Dạng thức này có thể mô tả và xác định tài nguyên
ở các mức khác nhau như:
- Ở mức cực bộ, cho phép tìm và tìm lại đối tượng
- Ở cấp mạng Web, cho phép phát hiện tài nguyên
- Các định danh tài nguyên (URL, URN, PURL, )
- Các thuộc tính vật lý: vật mang, kích cỡ, điều kiện truy cập, )
- Các thuộc tính thư mục; nhan đề, tác giả, ngôn ngữ, từ khóa
- MARC
- Dublin Core
Metadata cấu trúc (Structural metadata): xác định cách các đối tượng kết hợp
với nhau như thế nào, như cách thức các trang được sắp xếp theo các chương Hỗ trợ tin và trình bày tài nguyên điện tử Cung cấp thông tin về cấu trúc bên trong của tài nguyên như định trang, chương, mục, Mô tả quan hệ giữa các tài liệu: ảnh B được nhúng vào tài liệu A, liên kết các tập
Metadata quản trị (Administrative metadata): Quản lý thông tin về nguồn tài
nguyên, như các thông tin đó được tạo ra khi nào, như thế nào, các dạng file, thông tin kỹ thuật và cho biết ai có quyền truy cập
Metadata có khả năng mô tả dữ liệu của các nguồn tài nguyên ở các mức khác nhau Nó có thể mô tả một bộ sưu tập, một nguồn tài nguyên đơn lẻ hoặc một phần của một tài nguyên lớn Chỉ khi người biên mục tạo ra các quyết định
về một bản ghi biên mục được tạo ra cho cả tập tài nguyên hay cho mỗi tài nguyên đặc trưng cho cả tập hợp người tạo metadat mới được tạo các quyết định tương tự như vậy
Trang 23Các ứng dụng của metadata:
Khai phá tài nguyên:
Metadata cung cấp các chức năng trong khai phá tài nguyên hiệu quả như việc biên mục (catologing) bằng cách:
- Cho phép các nuồn tài nguyên có thể được tìm kiếm thông qua các điều kiện liên quan;
- Xác định các nguồn tài nguyên
- Đưa ra các nguồn tài nguyên tương tự nhau
- Phân loại các nguồn tài nguyên không tương xứng
- Trả về vị trí thông tin
Tổ chức các tài nguyên điện tử:
Khi các nguồn tài nguyên điện tử dựa trên web phát triển một cách nhanh chóng, các website tích hợp và các cổng thông tin cần tổ chức thông tin các nguồn tài nguyên dựa trên chủ đề và đối tượng người dùng một cách hiệu quả Các cổng thông tin này có thể được xây dựng như hệ thống các trang tĩnh Tuy nhiên sẽ hiệu quả hơn và tăng cường tính phổ dụng hơn là xây dựng các trang web động bằng cách metadata được lưu trong SCDL Các công cụ phần mềm khác nhau có thể tự động trích chọn và định dạng lại thông tin cho các ứng dụng web
Xử lý tương tác:
Việc mô tả tài nguyên bằng metadata cho phép con người và máy tính có thế hiểu được về tài nguyên đó, thông qua đó có thể trao đổi tương tác với nhau Tương tác là khả năng các hệ thống với các nền phần mềm và phần cứng cấu
Trang 24trúc dữ liệu và các giao diện khác nhau có thể chuyển đổi dữ liệu cho nhau một cách tối ưu nhất mà không mất thông tin Việc sử dụng các lược đồ metadata được định nghĩa, các giao thức chuyển đổi chia sẻ và các mối liên hệ giữa các lược đồ làm cho việc tìm kiếm các nguồn tài nguyên qua mạng thông suốt, liền mạch hơn Có 2 hướng để xử lý kết hợp và tìm kiếm xuyên suốt hệ thống và thu hoạch metadata Giao thức Z29.50 là giao thức phổ dụng cho việc tìm kiếm xuyên suốt hệ thống Các bộ thực thi Z39.50 không chia se metadata nhưng ánh
xạ khả năng tìm kiếm của nó tới tập các thuộc tính tìm kiếm thông thường Sáng kiến lưu trữ mở đưa ra một hướng trái ngược là cho phép tất cả nhà cung cấp dữ liệu dịch metadata nguyên gốc của họ sang một tập các thành phần cốt lõi chung
và phát tán chúng cho các bộ thu hoạch Sau đó, một nhà cung cấp dịch vụ tìm kiếm gom nhóm metadata trong một số chỉ số trung tâm thích hợp để cho phép tìm kiếm thông qua các kho lưu trữ mà không cần quan tâm đến các định dạng metadata được sử dụng trên các kho lưu trữ đó
Định nghĩa số:
Hầu hết các lược đồ metadata bao gồm nhiều yếu tố mô tả như là các nhân
tố tiêu chuẩn để xác định duy nhất đối tượng hoặc công việc mà metadata mô tả Việc xác định một đối tượng có thể thông qua tên file, URL, PURL, DOI Các
bộ xác định liên tục được ưa chuộng hơn vì vị trí các đối tượng thường xuyên được thay đổi, việc tạo ra tiêu chuẩn URL không hợp lệ Ngoài các yếu tố thực
sự xác định cho đối tượng ra, metadata được đóng vai trò như một tập dữ liệu định nghĩa để phân biệt đối tượng này với đối tượng kia trong các mục đích khác nhau
Lưu trữ và bảo trì:
Hầu hết các tác động metadata hiện thời là xoay quanh việc khai phá tài nguyên được tạo ra Tuy nhiên định dạng của các tài nguyên số thượng bị thay
Trang 25đổi theo thời gian Thông tin số có thể bị thay đổi, chỉnh sửa, chuyển từ định dạng này sang định dạng khác Nó cũng có thể trở nên vô dụng như khi các công nghệ phương tiện lưu trữ, phần cứng, phần mềm thay đổi Vì vậy việc đánh giá phần cứng, phần mềm, chuyển đổi định dạng là các chiến lược nhằm khắc phục các thay đổi đó Metadata là nhân tố quan trọng đảm bảo sự tồn tại và tiếp tục có khả năng truy cập trong tương lai của tài nguyên Việc lưu trữ và bảo trì nhằm lưu các vết đối tượng số (nó từ đâu đến, nó được thay đổi theo thời gian như thế nào), để chi tiết hóa các đặc điểm vật lý và để mô tả các hoạt động của nó với mục đích đánh giá vai trò của nó trong công nghệ tương lai
1.2.4.2 XML
XML (eXtensible Markup Language): là ngôn ngữ tạo cấu trúc dữ liệu văn bản được phát triển từ đầu năm 1996 dựa theo và tận dụng những điểm mạnh của chuẩn SGML (Standard Generalized Markup Language: được coi như
là siêu ngôn ngữ có khả năng sinh ngôn ngữ khác), cùng những kinh nghiệm có được từ ngôn ngữ HTML (HyperText Markup Language) SGML phát triển cho việc định cấu trúc và nội dung tài liệu điện tử do tổ chức ISO (International Organization for Standardization) chuẩn hóa năm 1986
SGML là do IBM đưa ra nhưng được phát triển bởi W3C (World Wide Web Consortium: tổ chức độc lập định ra tiêu chuẩn cho định dạng Web, máy chủ và ngôn ngữ), nhưng đặc tả XML lại do Netscape, Microsoft và các thành viên dự án Text Encoding Intiative (TEI) xây dựng Tổ chức W3C XML Special Interest Group có đại diện từ hơn 100 công ty cùng nhiều chuyên gia được mời khác W3C chính thức thông qua chuẩn XML vào tháng 2/1998
XML là một hệ thống có luật dùng cho việc thiết kế các khổ mẫu (format) cho văn bản giúp tạo cấu trúc cho dữ liệu Trong thực tế XML không phải là một
Trang 26ngôn ngữ lập trình, XML giúp máy tính dễ dàng tạo dữ liệu, đọc dữ liệu, trao đổi
dữ liệu và làm cho cấu trúc dữ liệu trở nên rõ ràng và dễ hiểu hơn, ngoài ra XML còn có thể mở rộng, có nền tảng hoàn toàn độc lập và hỗ trợ tính quốc tế hóa, nội địa hóa XML hỗ trợ hoàn toàn unicode
XML được xem như là ngôn ngữ mạnh hơn HTML do nó mang lại thông tin đầy đủ về dữ liệu XML cung cấp “siêu dữ liệu” metadata hay còn được gọi
là “dữ liệu về dữ liệu” (data about data) XML cho phép các nhà phát triển và quản trị công nghệ thông tin mô tả thông tin có liên quan tới các nguồn thông tin khác Đây là phương pháp khai thác thông tin lý tưởng trong môi trường trao đổi thông tin từ các máy chủ ứng dụng cũng như từ các ứng dụng với nhau Cấu trúc chặt chẽ của XML (nội dung được đặt giữa các thẻ metadata) cho phép các ứng dụng dễ dàng tìm kiếm và sử dụng nội dung đã tạo Môi trường tài liệu XML trở thành một kho dữ liệu hỏi-đáp (query data repository) tương tự như cơ sở dữ liệu Ngôn ngữ XML là giải pháp tích hợp cho vấn đề trao đổi dữ liệu tự động giữa các kho thông tin trên mạng Internet
Một biểu ghi XML đơn giản có dạng như sau:
<?xml version= "1.0"?> encoding="utf-8" standalone="yes"?>
<!DOCTYPE book SYSTEM="book.dtd">
Trang 27<namxuatban>2006</namxuatban>
</book>
Hiện nay các thư viện và trung tâm thông tin lớn trên thế giới đang có xu hướng sử dụng chuẩn XML thay thế cho chuẩn Marc 21 đã không còn phù hợp cho công tác biên mục và trao đổi dữ liệu như (Thư viện Y học Quốc gia Mỹ, các thư viện của Pháp, Anh, Nhật Bản )
1.2.4.3 Lược đồ XML
Lược đồ XML là một tập hợp những luật được định nghĩa lại để mô tả nội dung dữ liệu của một tài liệu XML Nó tương tự như định nghĩa cấu trúc bảng trong CSDL quan hệ Trong lược đồ XML, chúng ta định nghĩa một tài liệu XML, một phần tử của nó, những kiểu dữ liệu của phần tử và những thuộc tính liên quan và quan trọng là mối quan hệ “cha-con” giữa các phần tử
XML và lược đồ XML rất quan trọng trong việc mô tả thông tin, đặc biệt trong vô số các đặc tính của Internet, web services, và các công nghệ dựa trên nền tảng web khác XML hỗ trợ đắc lực cho việc trao đổi dữ liệu, tương tác hoạt động, cung cấp phương thức truyền dữ liệu từ dạng mô tả này sang dạng mô tả khác Việc tạo ra tài liệu XML thì các tài liệu đó hầu hết có khả năng đọc được trên bất kỳ hệ thống nào
1.2.5 Các dịch vụ Thư viện số
Đặc tính quan trọng nhất của thư viện số là lưu trữ các tài liệu số Thư viện số cung cấp các dịch vụ nhằm hiển thị, khôi phục và đưa dữ liệu được lưu trữ ra các ứng dụng thực tế Các dịch vụ thông tin cơ bản nhất của Thư viện số là tìm kiếm và duyệt thông tin Các dịch vụ này đều có các đặc tính khác nhau và
đa dạng từ các chức năng đơn giản nhất đến các chức năng phức tạp Các dịch vụ
Trang 28khác thường hướng vào chức năng tương tác người dùng và các chức năng phụ như hản hồi, giới thiệu thông tin dựa trên các nội dung hiển thị Cũng vậy, các dịch vụ ghi chú cũng khá phổ biến, thông báo cho người dùng các thông tin mới nhất liên quan đến nội dung hay chủ đề người dùng lựa chọn cũng như cho phép người dùng “lưu” lại thông tin ưa thích nhất Thư viện số là tổng hợp các thành phần tạo nên hệ thống hoàn chỉnh bao gồm rất nhiều các dịch vụ khác nhau có khả năng tương tác với nhau
Nhìn tổng thể, một thư viện số đơn giản là một hệ thống trực tuyến cung cấp khả năng truy cập tới các dịch vụ và nội dung da dạng Nội dung có thể bao gồm bất kỳ các loại tài liệu điện tử như các dạng media điện tử khác nhau (images, video, etc….), các dạng CSDL có bản quyền của các bài báo, tiêu đề, bản tóm tắt và các mô tả về các bộ sưu tập vật lý Các dịch vụ thư viện số cũng rất đa dạng, nhưng điển hình vẫn phục vụ như vài trò của phát triển các bộ sưu tập truyền thống và truy cập các dịch vụ có trong các thư viện mang tính chất vật lý: lựa chọn, chuyên môn hóa và quản lý
Trong một thư viện số, việc lựa chọn bộ sưu tập có nghĩa là tìm kiếm, mô
tả, lưu trữ và truyền các tài nguyên điện tử Metadata không dùng để mô tả các thuộc tính kỹ thuật và sở hữu trí tuệ của các đối tượng tài nguyên Việc lưu trữ khôn chỉ được phân bổ cho một đơn vị mà còn có thể được phân phát trên toàn thế giới thông qua hiệp hội các thành viên hoặc qua sự hợp tác với các đối tác từ
xa Nhiều đối tượng số có thể được truyền trực tiếp trên Web, hoặc một số tái nguyên khi muốn hiển thị thì phải có các ứng dụng đặc biệt
Việc chuyên môn hóa là động cơ tạo ra tính đa dạng trong truy cập dịch vụ thông qua việc tìm kiếm, hiển thị và phát hiện tài nguyên Các đối tượng số cần được tổ chức, đánh chỉ mục cho các mục đích khác nhau Cấu trúc cho việc tổ chức và đánh chỉ mục các đối tượng số bo gồm catalog của các bộ sưu tập, trợ giúp tìm kiếm và cơ sở dữ liệu, với các bộ sưu tập ảo có thể xây dựng từ nhiều
Trang 29nguồn tài nguyên Ví dụ, một người trợ giảng muốn kết hợp cá tham chiếu của các đối tượng trong catalog thư viện các bài báo điện tử, và các vật lưu trữ điện
tử trong các trang bài giảng trực tuyến Cơ chế tìm và truy cập các đối tượng này
bị phụ thuộc vào các ngữ cảnh trực tuyến khác nhau Ngoài ra, bạn đọc có khả năng thực hiện việc đồng bộ hóa các nội dung trực tuyến thông qua việc truy cập nội dung và dịch vụ thư viện số qua các cổng thông tin cá nhân
Các dịch vụ chính trong thư viện thường tương tác với các dịch vụ thư viện số khác nhau nhiều hơn là tương tác trực tiếp với bạn đọc Các dịch vụ này thường xuyên phải được tái tạo lại ho mỗi môi trường mới và hệ thống thư viện
số mới Cách phát triển và duy trì các dịch vụ này như thế nào để cho thành công lâu dài của dự án thư việ số, đặc biệt khi nguồn tài nguyên kỹ thuật bị giới hạn
Ví dụ, một dịch vụ định danh có thể cung cấp công nghệ và cơ chế độc lập về vị trí cho việc xác định và lấy về các đối tượng số; nếu không có công nghệ đó thì việc truy cập các dịch vụ phải được điều chỉnh khi các tài nguyên di chuyển hoặc được chuyển tới một hệ nền khác Việc điều khiển truy cập đưa ra một thách thức đối với các thư viện số có các tài nguyên điện tử đa dạng từ các nguồn khác nhau Các cơ chế khác nhau (như proxy, tên truy cập và mật khẩu, chức thực hoặc các hình thức biên nhận khác) phải được thực hiện để công nhận truy cập tùy thuộc vào bạn đọc là ai, ở đâu và vừa truy cập cái gì
1.2.6 Web Services
Cùng với sự phát triển của Internet và các tổ chức kinh doanh trong lĩnh vực công nghệ thông tin và truyền thông, dịch vụ web trở thành một chuẩn trong truyền thông dựa trên nền tảng web Web services được xây dựng dựa trên XML – Nhân tố chính trong mô tả thông tin Các dịch vụ web từ đơn giản, mở rộng đến tiên tiến được phát triển cho phép nhiều hệ thống và các website trở nên mở hơn và có khả năng tương tác với các ứng dụng với đối tác thứ 3 Trong các dịch
vụ web, một phần nhỏ thông tin được mã hóa theo các cách thức xác định, đặc
Trang 30biệt, được truyền qua web như một dạng thông tin chuyển đổi Với phương thứ như vậy, các máy tính sẽ gửi các dữ liệu và các máy tính khá sẽ lắng nghe các yêu cầu và cung cấp các thông tin có ý nghĩa Các phương thức thông thường của web service là giao thức truy cập đối tượng đơn giản – SOAP (Simple Object Access Protocol) và các dịch vụ truyền trạng thái mô tả - and REST (Representational State Transfer services) Mặc dù các nền tảng dịch vụ web hướng nghiên cứu phổ biến nhất là Apache Axis, các dịch vụ này cũng được chạy trên Apache Tomcat Java servlet container Với các đặc tính của thư viện
số, các dịch vụ web đóng vai trò quan trọng trong việc truyền thông của các hệ thống thư viện số phân tán và có nhiều thành phần
1.2.7 Bài toán tích hợp thư viện số
Công nghệ cung cấp các dịch vụ thư viện số tiếp tục phát triển và thay đổi nhanh chóng cùng với việc phát triển các sản phẩm thương mại mở rộng các loại hình quản lý nội dung và truy cập dịch vụ của các nhà nghiên cứu, các nhà cung cấp Khi công nghệ thay đổi và phát triển, tâm fnhinf của ccs tổ chức và yêu cầu cho một thư viện số cũng phát triển cho phù hợp Phần mềm hỗ trợ các dịch vụ này cũng phức tạp và linh hoạt hơn Cách thức để các thư viện trung bình thuộc các trường đại học, với nguồn tài nguyên kỹ thuật hạn chế, sẽ quản lý sự phát triển và lớn mạnh của các yêu cầu về các sản phẩm thư viện số như thế nào? Có một nhân tố làm hạn chế khả năng của các đơn vị khi xây dựng một thư viện số
là giá thành và các yếu tố quan trọng liên quan đến việc thực hiện (như việc số hóa và bản quyền) để tạo ra nội dung Tuy nhiên nhân tố quan trọng cần lưu tâm
ở đây là sự phát triển và bảo trì phần mềm hỗ trợ chuyển tải các dịch vụ và nội dung của thư viện số
Các thư viện lớn thuộc các trường dại học có khả năng tự viết phần mềm cho riêng họ Nhiều trương không có nhân lực dể xây dựng một giải pháp toàn dieenj và giải pháp thương mại hóa toàn diện vì thường là quá đắt Hơn nữa, do
Trang 31các dịch vụ và nội dung là rất đa dạng và phong phú nên không có một sản phẩm đơn thuần nào có thể đáp ứng được hết tất cả các yêu cầu dù chỉ là các chức năng
cơ bản của một thư viện số
Trong thực tiễn, các hệ thống thư viện số thế giới thực là các bộ sưu tập với ác dịch vụ đi kèm với nhau thể hiện khả năng tích hợp ít hay nhiều khi truy cập thông qua trang web của thư viện Các hệ thống khác nhau để xây dựng thư viện số bao gồm các sản phẩm thương mại, các thành phần được xây dựng với các công cụ chuyên biệt hóa, các ứng dụng nội bộ và một số khác được phát tán thông qua internet và được cung cấp bởi phần lớn các nguồn độc lập Việc xây dựng một thư viện số có tính toàn diện trở thành một công việc tích hợp các hệ thống phức tạp
Nếu thực hiện trong một cách thức đặc biệt, thì việc giải quyết mỗi bài toán tích hợp riêng lẻ và khả năng tìm kiếm tài nguyên là ngoài khả năng của nhiền đơn vị Đa giao tiế với các thành phần trong thư viện số sẽ tạo nên một ứng dụng phân tán yếu và khó để bảo trì Các dịch vụ quản lý chính giống như việc định danh và điều khiển truy cập có thể làm đơn giản hóa khả năng tích hợp bằng cách làm giảm và tiêu chuẩn hóa các giao tiếp giữa các thành phần, nhưng
tự chúng khó có thể xây dựng khả năng linh hoạt và tương thích tối đa
Trang 32CHƯƠNG II: PHẦN MỀM THƯ VIỆN SỐ
2.1 Các yêu cầu về quản lý thư viện số
2.1.1 Yêu cầu chung
8 Phân hệ Xuất/Nhập dữ liệu
9 Phân hệ Mƣợn liên thƣ viện
10 Phân hệ Tìm kiếm toàn văn (Fulltext Search Engine)
11 Phân hệ Quản trị nội dung Tích hợp
Trang 33 Tính tích hợp
Các phân hệ của Bộ Phần mềm phải được tích hợp trong một hệ thống với
cơ sở dữ liệu chung, với giao diện nhất quán và đặc biệt là có các mối liên kết theo chu trình phản ánh đúng logic của những chu trình diễn ra trong thực tế hoạt động của thư viện
Tính mở và tuỳ biến
Bộ Phần mềm Quản lý Thư viện và Quản trị Nội dung số tích hợp phải là một giải pháp mở cho phép thay đổi dễ dàng các tính năng có sẵn và bổ sung các tính năng mới vào chương trình Khả năng tuỳ biến cao cũng giúp thư viện ít phải lệ thuộc vào nhà phát triển trong một số nghiệp vụ đặc thù như tạo sản phẩm thư mục, định khung biên mục, tạo các báo cáo, khuôn dạng văn bản,
Dữ liệu số
Bộ Phần mềm Quản lý Thư viện và Quản trị Nội dung số tích hợp phải là một giải pháp tích hợp cho việc xây dựng và phát triển thư viện số, trong đó tư liệu không chỉ là các ấn phẩm hoặc các vật phẩm nằm trên các vật mang tin riêng biệt mà là một kho dữ liệu đa phương tiện bao gồm văn bản, hình ảnh, đồ hoạ,
âm thanh, video, tệp máy tính có thể được lưu trữ và khai thác trực tuyến qua mạng máy tính
2.1.2 Yêu cầu về công nghệ nền tảng
Hệ quản trị CSDL
Phần mềm phải hoạt động được trên cả hai hệ quản trị CSDL Oracle 8/9i
và MS SQL Server, là một phiên bản duy nhất với mọi tính năng tương đương cho cả hai hệ quản trị cơ sở dữ liệu này
CSDL lớn
Quản lý được cơ sở dữ liệu lớn (hơn 1 triệu bản ghi) với tốc độ tra cứu nhanh
Hệ điều hành
Trang 34Chạy trên các hệ điều hành khác nhau: Windows NT, Windows 2000 cho máy chủ nghiệp vụ; Windows NT, Windows 2000, Unix cho máy chủ CSDL; mọi hệ điều hành hỗ trợ Web cho các trạm làm việc
Hỗ trợ đa ngữ và đa mã tiếng Việt
Quản lý dữ liệu đa ngữ bằng mã UNICODE và cung cấp giao diện làm việc theo nhiều bảng mã tiếng Việt (Unicode, ABC, VNI, ),và ngôn ngữ khác nhau (Anh, Pháp, Nga)
100% giao diện trên Web
Toàn bộ giao diện của tất cả các phân hệ phần mềm được xây dựng trên Web, sẵn sàng cho kết nối diện rộng với Internet, tuân thủ chặt chẽ các chuẩn của giao thức TCP/IP
Bảo mật
- Mã hoá: Tuân thủ chặt chẽ các yêu cầu về bảo mật, với khả năng hoạt động trên giao thức mã hoá đường truyền SSL (Secure Socket Layer), sử dụng các thuật toán mã hoá mạnh
- Xác thực: Sử dụng khả năng xác thực máy chủ và máy trạm (client & server certificate), cho phép quản lý các hoạt động của người dùng trong hệ thống từ nhiều mức: trạm làm việc, người sử dụng, tính năng được sử dụng
Tra cứu toàn văn
Tích hợp với mọi dạng dữ liệu số hóa với khả năng đánh chỉ mục và tìm kiếm toàn văn tiếng Việt mạnh
Trang 352.1.3 Yêu cầu về chuẩn thư viện
Hỗ trợ các chuẩn biên mục ISBD, AACR-2, TCVN 4743/89
Khung phân loại
Hỗ trợ các khung phân loại: BBK, UDC, DDC, LC, khung đề mục quốc gia, subject headings
Chuẩn OCLC
Hỗ trợ chuẩn OCLC 4 figure cutter table,OCLC sanborn 4 figurecutter table, chuẩn cutter của TVQG cho nhan đề/tác giả tiếng Việt
Chuẩn ISO 10161
Chuẩn ISO 10161 cho nghiệp vụ mượn liên thư viện
2.1.4 Yêu cầu về chuẩn nghiệp vụ thư viện
2.1.4.1 Yêu cầu chung
Tuỳ biến theo template
Khả năng tuỳ biến mềm dẻo trong việc tạo các sản phẩm thư mục theo định dạng HTML/XML qua các template (mẫu) do người dùng tự xây dựng
Tuỳ biến khung biên mục
Khả năng tuỳ biến mềm dẻo trong việc mở rộng khung biên mục
Mã vạch
Trang 36Áp dụng mã vạch trong các khâu in thẻ, in nhãn, đăng ký cá biệt cho ấn phẩm, trong hoạt động mượn - trả và quản lý kho
Xuất/Nhập dữ liệu
Khả năng xuất/nhập dữ liệu với các phần mềm thư viện khác và với CDS/ISIS
Lưu thông đa điểm
Khả năng quản lý lưu thông tài liệu theo nhiều điểm cho mượn
2.1.4.2 Yêu cầu về các chuẩn nghiệp vụ
Khung biên mục MARC 21 và MARC 21 VN
Hỗ trợ đầy đủ khung biên mục chuẩn quốc tế phổ dụng nhất là MARC 21
và phiên bản tiếng Việt của khung biên mục này là MARC 21 VN Phần mềm cần đảm bảo:
- Hỗ trợ các mọi trường chuẩn (các trường con và indicators) của khung MARC
21
- Hỗ trợ trường 856 cho liên kết dữ liệu đa phương tiện (multimedia)
- Tự động hợp lệ bản ghi theo chuẩn MARC 21
- Hỗ trợ khả năng bổ sung thêm các trường sử dụng cục bộ (mức quốc gia hoặc từng thư viện cụ thể)
- Hỗ trợ quá trình biên mục các trường dữ liệu mã có độ dài cố định (Fixed Length Data) 00X trong chuẩn MARC 21
- Hỗ trợ quá trình xác định Leader của biểu ghi theo khung MARC 21
- Hỗ trợ khung biên mục dữ liệu căn cứ (Authority Data) theo chuẩn MARC 21