2.3.1 Phần mềm xây dựng bộ sưu tập Greenstone
Greenstone là một trong những hệ thống phần mềm nguồn mở thư viện số nổi tiếng và phổ biến nhất hiện nay. Được phát triển bởi Dự án thư viện số New
Zealand của trường đại học Waikato, New Zealand và được UNESCO phân phối, Greenstone là một phần mềm đa ngôn ngữ được dịch sang gần 50 thứ tiếng, bản tiếng Việt do Công ty IES của Phần Lan ở Việt Nam phối hợp với Thư viện Đại học Khoa học Tự nhiên TP. HCM biên dịch. Phần mềm nguồn mở thư viện số Greenstone và tài liệu hướng dẫn bằng tiếng Việt có thể tải xuống thông qua trang webGreenstoneWiKi
(http://greenstone.sourceforge.net/wiki/inde x.php/GreenstoneWiki).
Greenstone được dựng để thu gom và biên mục tài liệu theo Dublin Core, đồng thời tổ chức thành bộ sưu tập và xuất ra đĩa CD hay Internet. Greenstone được lưu hành với giấy phép GPL, được dựng rộng rãi khắp nơi trên thế giới như là một “mốt – fashion”. Ở Việt Nam nhiều thư viện đã sử dụng Greenstone để xây dựng nhiều bộ sưu tập có giá trị cao, đáng kể nhất là Thư viện ĐH Khoa học Tự nhiên và Thư viện ĐH Ngân hàng TP. Hồ Chí Minh.
2.3.2 Phần mềm gặt hái metadata: dlbox
dlbox hay “Digital Libraries-in-a-Box” được phân phối bởi Phòng thí nghiệm Thư
viện số thuộc trường đại học Virginia Tech, Hoa Kỳ. Phần mềm này được dựng để hỗ trợ việc tích hợp những thành phần mô tả dữ liệu biên mục. Đây là một ứng dụng việc mở rộng giao thức OAI (Open Archives Initative) cho việc gặt hỏi metadata (XOAIPMH). Những thành phần có thể được tải xuống và được xây dựng bởi những công cụ Pert và Java. Nếu chúng ta đã xây dựng cấu trúc cho một bộ sưu tập kỹ thuật số rồi trong một cơ sở dữ liệu quan hệ, thì những thành phần này có thể bổ sung thêm chức năng cho cấu trúc hiện hữu. Gặt hái metadata là
để tạo nên những bộ sưu tập mới dựa vào tài nguyên bên ngoài
Vào Tháng Sáu 2001, OCLC công bố rằng SiteSearch, một bộ gồm những công cụ
truy hồi và quản lý thông tin, sẽ không còn là một sản phẩm thương mại nữa. Với việc phát hành phiên bản 4.0.2a vào 5/2002, SiteSearch được sản xuất và cấp phép với danh nghĩa Giấy phép nguồn mở OCLC và là một trong ít ví dụ trong thế giới thư viện, một sản phẩm thương mại trở thành nguồn mở. SiteSearch có một tầng Z39.50 mạnh và có thể cung cấp một giao diện đối với những bộ sưu tập địa phương hay từ xa. Nhiều máy chuyển đổi và những công cụ khác có thể được dựng để chuyển tải nội dung vào trong SiteSearch, và nó có thể chỉ mục trực tiếp những khổ mẫu MARC, XML, và SGML.
2.3.4 Phần mềm chuyển đối MARCDublin Core và Dublin Core-MARC:MarcEdit MarcEdit
MarcEdit được xây dựng bởi Terry Reese, ĐH Oregon, Hoa Kỳ. Phần mềm được thiết kế nhằm hỗ trợ các dạng khác nhau của MARC như MARC 21, UNIMARC, vv… đồng thời cung cấp các chức năng chuyển đổi từ MARC sang Text, Text sang MARC; MARC sang MARC-XML; MARC sang Dublin Core và ngược lại. MarcEdit được thiết kế dựa trên Window COM.Cho phép tận dụng các tiện ích của Windows Scripting Host.
MarcEdit là một chương trình lý tưởng cho bất kỳ dự án liên quan đến MARC – từ bảo trì dữ liệu đến tạo biểu ghi cơ sở.
2.3.5 Biên mục Phần mềm thư viện số DSpace (DSpace Cataloguing)
DSPACE là một bộ phần mềm hỗ trợ giải pháp xây dựng và phân phối các bộ sưu tập số hóa trên Internet. Nó cung cấp một phương thức mới trong việc tổ chức và xuất bản thông tin trên Internet. DSpace do HP và The MIT Libraries phát triển vào năm 2002, hiện nay có hơn 200 trường đại học và các tổ chức văn hoá sử dụng phần mềm số DSpace để quản lý và chia sẻ nguồn tài nguyên: Sách, Tạp chí, Luận văn và các sưu tập Hình ảnh, Âm thanh và Phim. Đây là một phần
mềm mã nguồn mở cho phép các thư viện, các cơ quan nghiên cứu phát triển và mở rộng, tại địa chỉ http://dspace.or
CHƯƠNG 3: XÂY DỰNG BỘ SƯU TẬP THƯ VIỆN SỐ VỚI GREENSTON
3.1. Giới thiệu về Greenston
Greenstone là một bộ phần mềm dựng để xây dựng và phân phối các bộ sưu tập thư viện số. Nó cung cấp một phương pháp mới để tổ chức và xuất bản thông
tin trên Internet hoặc trên CD-ROM. Greenstone là sản phẩm của dự án New
Zealand Digital Library của trường đại học University of Waikat , được phát
triển và phân phối với sự tham gia của UNESCO và Human Info NG. Đây là
phần mềm mã nguồn mở được cung cấp trên
http://greenstone.or theo thoả thuận của dăng kí GNU General Public License.
Mục tiêu của phần mềm là cung cấp cho người sử dụng, đặc biệt là các trường đại học, các thư viện hoặc trong các trụ sở công cộng xây dựng các thư viện số riêng của họ. Các thư viện số làm thay đổi nhanh chóng cách thức thông tin được thu thập và phổ biến trong các thành viên của UNESCO và các trụ sở giáo dục, khoa học và văn hóa trên toàn thế giới, đặc biệt là ở các quốc gia đang phát triển. Chúng tôi hy vọng rằng phần mềm thư viện số này sẽ gia tăng hiệu quả trong việc chia sẻ thông tin và công bố rộng rãi chúng.
Greenstone chạy trên Windows, Unix và Mac OS X. Việc phân phối bao gồm các bản cài đặt cho tất cả các phiên bản của Windows, Linux và Mac OS X. Nó cũng cung cấp toàn bộ source code của hệ thống để người sử dụng có thể biên dịch lại bằng Microsoft C++ hoặc gcc. Phần mềm đi kèm với Greenstone cũng đều miễn phí, ví dụ như Apache Webserver và PERL. Giao diện người sử dụng dựng một Web browser điển hình là Netscape Navigator hoặc Internet Explorer.
Greenstone được thiết kế để dễ mở rộng và chỉnh sửa. Các định dạng mới của một tài liệu và metadata được cung cấp bằng cách viết “plugins” (trong Perl). Tương tự, việc duyệt cấu trúc của metadata có thể thực hiện bằng cách viết “classifiers”. Giao diện người sử dụng có thể được thay thế bằng cách viết các “macros”. Giao thức Corba cho phép các chương trình thông minh (ví dụ trong Java) sử dụng tất cả các tiện ích đi kèm với bộ sưu tập. Cuối cùng, source code bằng C++ và Perl được cung cấp miễn phí và cho phép sửa đổi.
Giao diện Greenstone đầy đủ và mọi tài liệu đều đã có sẵn trong các thứ tiếng Anh,Pháp,TBN,Nga và Cadắc.Greenstone cũng có những dao diện trong nhiều ngôn ngữ khác.
Phần mềm Greenstone là một kết hợp hiệu quả giữa nhiều người. Rodger McNab và Stefan Boddie là những kiến trúc sư và người thực hiện chính. Những người cộng tác thực hiện bao gồm: David Bainbridge, George Buchanan, Michael Dewsnip, Katherine Don, Hong Chen, Elke Duncker, Carl Gutwin, Geoff Holmes, John McPherson, Craig Nevill-Manning, Dynal Patel, Gordon Paynter, Bernhard Pfahringer, Todd Reed, Bill Rogers, John Thompson, and Stuart Yeates. Một số thành viên khác của dự án New Zealand Digital Library đã cung cấp lời khuyên và ý tưởng trong thiết kế của hệ thống: Mark Apperley, Sally Jo Cunningham, Matt Jones, Steve Jones, Te Taka Keegan, Michel Loots, Malika Mahoui, Gary Marsden, Dave Nichols and Lloyd Smith…
Phần mềm này được phát triển và phân phối dưới sự hợp tác hiệu quả giữa ba bên vào tháng 8 năm 2000.
Dự án thư viện số tại đại học Waikato
Phần mềm Greenstone được mở rộng từ dự án này và ý tưởng ban đầu của dự án được phát triển bởi Communication Sub-Commission của New Zealand National Commission cho UNESCO như là một phần đúng ghóp của New Zealand cho các chương trình của UNESCO.
Địa chỉ trang web của New Zealand Digital Library (http://nzdl.org) chứa nhiều bộ sưu tập mẫu, tất cả chúng được tạo với phần mềm Greenstone, cái mà được công bố rộng rãi cho bạn nghiên cứu. Tất cả các bộ sưu tập mẫu được minh hoạ bằng nhiều ví dụ khác nhau về tìm kiếm và hiển thị các tùy chọn và bao gồm nhiều bộ sưu tập bằng tiếng Arabic, Chinese, French, Maori và Spanish cũng như tiếng English. Cũng có cả các bộ sưu tập về âm nhạc.
Thư viện giáo dục, khoa học và văn hóa của UNESCO
Mục tiêu chính của UNESCO là quảng bá các thông tin về giáo dục, khoa học và văn hoá trên toàn thế giới, đặc biệt đối các quốc gia đang phát triển. Việc sử dụng rộng rãi các phương tiện thông tin liên lạc được xem như một công cụ quan trọng trong việc thực thi mục tiêu này
Thư viện thông tin con người của tổ chức phi chính phủ
Đây là dự án hợp tác với các cơ quan UN & NGOs. Nó đã xây dựng được tiếng vang trên khắp thế giới trong việc số hoá và phổ biến các tài liệu liên quan đến sự phát triển của nhân loại.
Đặc điểm của Greenstone
Truy cập rộng rãi. Bộ sưu tập được truy cập qua một trình duyệt web chuẩn.
Đa hệ. Bộ sưu tập có thể chạy trên Window và Unix.
Hướng metadata. Chỉ mục lướt tìm được tạo nên từ metadata. Metadata có thể kết hợp với mỗi tài liệu hoặc một phần tài liệu.
Đa ngôn ngữ. Unicode được dựng để hỗ trợ việc chuyển đổi ngôn ngữ. Chỉ mục riêng biệt có thể tạo ra cho những ngôn ngữ khác nhau.
Thang độ (scale) lớn. Những bộ sưu tập chứa hàng triệu tài liệu, nhiều gigabytes có thể được tạo ra. Truy tìm toàn văn nhanh chóng. Có thể nén để giảm kích thước văn bản.
Tương thích Z39.50. Giao thức Z39.50 hỗ trợ việc truy cập máy chủ bên ngoài cũng như giới thiệu bộ sưu tập Greenstone cho người sử dụng bên ngoài.
Truy tìm linh hoạt. Người sử dụng có thể truy tìm toàn văn tài liệu với những dẫn mục thích hợp.
Lướt tìm linh hoạt. Người sử dụng có thể lướt tìm danh mục tác giả, danh mục nhan đề, danh mục đề mục, danh mục từ khó, danh mục ngày tháng, những cấu trúc phân cấp, vv…
Đa phương tiện. Bộ sưu tập có thể chứa hình ảnh, âm nhạc, đoạn băng ghi âm và hình.
Xuất ra CD-ROM. Bộ sưu tập có thể xuất ra một CD-ROM tự khởi động.
Greenstone là phần mềm nguồn mở nên dễ dàng chỉnh sửa.
3.2 Cách cài đặt Greenstone:3.2.1 Trên Window 3.2.1 Trên Window
Trước khi cài đặt Greenstone người sử dụng phải cài đặt hai phần mềm yêu cầu : ImageMagick và Java. ImageMagick là phần mềm hỗ trợ hiển thị đồ họa yêu cầu
trong GreenStone, có thể tải ImageMagick tại www.imagemagick.or
hoặc magemagic .sourceforge.ne . Java là thành phần không thể thiếu khi cài đặt GreenStone, yêu cầu tối thiểu là j2re-1.4.x phải được cài
Khi cài đặt thành công các phần mềm yêu cầu ở trên, có thể thực hiện cài phần mềm GreenStone. Khi quá trình cài đặt thành công sẽ có hai ứng dụng được nằm trên máy tính đó là ứng dụng tạo bộ sưu tập và ứng dụng xuất bản bộ sưu tập trên web
Hình10
: Hai thành phần ứng dụng của GreenSto 3.2.2 Trên Linux
- Login với user root để cài đặt.
- Mount CD vào một thư mục trên hệ điều hành (ví dụ /home/cdrom)
- Chuyển đến thư mục chứa tập tin Install_Linux.sh ghõ lệnh sau để cài đặt:
./Install_Linux.sh
- Nếu tập tin Install_Linux.sh không chạy được, copy tập tin gsdl-2.62- unix.tar.gz trong thư mục greenstone trên CD vào thư mục /var/www. Sau đó
chuyển vào thư mục /var/www và thực hiện lệnh giải nén: tar -xzvf gsdl-2.62-
unix.tar.gz
- Phần mềm Greenstone sau khi cài đặt nằm trong thư mục /var/www/gsdl và đã
được đóng gói sẵn giao diện tiếng Việt cùng các bộ sưu tập mẫu.
- Mở tập tin httpd.conf trong thư mục /etc/httpd/conf thêm các dòng sau vào phần
Alias và ScriptAlias. Tham khảo tập tin http.conf.sample cho phần cấu hình
Alias và ScriptAlias, tập tin mẫu này chỉ ra vị trí cần thêm những dòng phía dưới.
<Directory “/var/www/gsdl”>
Options Indexes MultiViews FollowSymLinks AllowOverride None
Order allow,deny Allow from all </Directory>
ScriptAlias /gsdl-bin/ “/var/www/gsdl/cgi-bin/” <Directory “/var/www/gsdl/cgi-bin”>
AllowOverride None Options None
Order allow,deny Allow from all </Directory>
- Khởi động lại Apache webserver bằng lệnh sau: service httpd restart
- Mở trình duyệt(IE, Mozilla) ghõ dòng sau trên thanh Address để chạy chương trình: http://localhost/gsdl-bin/librar
3.3 Sử dụng phần mềm thư viện số Greenstone để tạo một bộ sưu tậ3.3.1 Bộ sưu tập thông ti 3.3.1 Bộ sưu tập thông ti
o
Một bộ sưu tập thông tin bao gồm nhiều tài liệu dưới nhiều dạng thức khác nhau: văn bản, hình ảnh, âm thanh, hình ảnh động.
o
Tài liệu là đơn vị căn bản từ đó sưu tập thông tin được xây dựng. Một bộ sưu tập có thể chứa nhiều loại tài liệu khác nhau
Ví dụ một bộ sưu tập về đề tài "Phố cổ Hội An" sẽ bao gồm những tài liệu dạng văn bản về lịch sử, văn hoá, phong tục, vv…; tài liệu dạng hình ảnh về những di tích, trang phục, các bản thiết kế, vv…; tài liệu dạng âm thanh về những bài hát, dân ca, vv…; tài liệu dạng phim về những lễ hội, sinh hoạt cộng đồng, vv…
o Một bộ sưu tập chứa nhiều tài liệu với dạng thức khác nhau, tuy
nhiên cung cấp một giao diện đồng nhất qua đó tất cả các tài liệu có thể được truy cập, mặc dù cách mà tài liệu đó hiển thị sẽ tuỳ thuộc vào phương tiện và dạng thức của tài liệu đó.
o Một bộ sưu tập như thế trước khi trình bày phải qua một quá trình
hình thành để tạo nên những cấu trúc hỗ trợ cho việc truy tìm và lướt tìm được dùng cho việc truy cập sưu tập.
o Khi xây dựng xong, bộ sưu tập có thể được xuất bản trên Internet
hoặc xuất ra CD-ROM một cách hoàn toàn tự động.
o Một khi sưu tầm thêm tài liệu mới, ta có thể dễ dàng bổ sung thêm
vào bộ sưu tâp bằng cách tái xây dựng.
o Một thư viện nói chung bao gồm nhiều bộ sưu tập khác nhau, mỗi
sưu tập tổ chức mỗi khác, tuy nhiên hoàn toàn giống nhau về phương cách hiển thị.
o Những bộ sưu tập như thế có thể được tạo nên bằng một Phần mềm
nguồn mở đa ngôn ngữ thư viện số Greenstone (Greenstone digital library multilingual open source software) .
Quá trình xây dựng bộ sưu tập thông tin được thực hiện theo các bước cơ bản sau:
Hình 11 : Quá trình xây dựng bộ sưu p
3.3.2 Nguyên tắc chọn tài liệu để số
á
Có sáu nguyên tắc được xác định nhằm chọn tài liệu để số hóa hướng đến việc phát triển sưu tập thư viện
ố:
Tính hữu ụng : Hữu dụng là lý do cơ bản trước tất cả mọi quyết định phát triển sưu tập. Tài liệu có tần suất sử dụng cao (như giáo trình, tài liệu tham khảo mà các giáo viên thường yêu cầu tất cả sinh viên tìm đ
);
Nhu cầu nộ bộ : Sưu tập nội bộ được xây dựng để phục vụ nhu cầu nội bộ và chi phí cho tài nguyên nội bộ phải được thuyết minh vì lợi ích nội bộ - chẳng hạn như đối với thư viện đại học, yêu cầu học tập, giảng dạy, và nghiên cứu là ưu t
n;
Tài liệumới : Mặc dù sưu tập cũ mang tính lịch sử là cần thiết cho nghiên cứu, nhưng tài liệu mới vẫn ưu tiên
ơn
Tài liệu liên quan đến bảngốc : Những tài liệu mà người muốn tìm hiểu không thể tiếp cận được bản gốc (ví dụ các văn bản viết tay - "manuscript" của các nhà thơ, nhà văn, các nhà chính trị, hoặc các bản tuyên ngôn có chữ ký cuả các lãnh tụ như bản tuyên ngôn độc lập của Hoa Kỳ hiện có tại Thư viện Quốc hội Hoa Kỳ, vv…). Trên thực tế, còn có rất nhiều thể loại viết tay trên những chất liệu
khác nhau. Việc số hoá các bản viết tay đó tạo điều kiện tiếp cận thuận lợi hơn cho các nhà nghiên
ứu;
Tài liệu quýhiếm : Tài liệu quớ hiếm, lâu năm, độc giả không thể trực tiếp sử