Phần mềm thư viện số Greenstone và vấn đề ứng dụng trong thực tiễn với các nội dung: ưu điểm của Greenstone; các tính năng của Greenstone; xây dựng bộ sưu tập số dựa trên phần mềm Greenstone; tìm kiếm thông tin dựa trên phần mềm Greenstone...
PHầN MềM THƯ VIệN Số GREENSTONE Và VấN Đề ứNG DụNG TRONG THựC TIễN Nguyễn Thị Loan(*) uá trình ứng dụng công nghệ thông tin hoạt động thông tin - th viện đà có bớc phát triển mạnh mẽ từ năm 1980 Mở đầu trình việc xây dựng phát triển phần mềm quản lý tài liệu th viện Năm 1986 UNESCO đà tạo lập phần mềm quản trị sở liệu (CSDL) CDS/ISIS (Computerized Documentation System/Intergrated Set of Information System) ®Ĩ cung cấp cho nớc phát triển, cã ViƯt Nam Q Cïng víi sù ph¸t triĨn cđa công nghệ thông tin truyền thông, vào khoảng năm 1990 nay, hoạt động thông tin - th viện đà có bớc phát triển rõ rệt Đồng thời, vấn đề phát triển phần mềm đợc sử dụng lĩnh vực đợc trọng nớc ta, điều đợc phản ánh rõ nét, mà biểu xuất phần mềm th viện số, bao gồm phần mềm thơng mại (Libol Công ty Tinh Vân, Ilib Công ty CMC, Vebrary Công ty Lạc Việt, ) phần mềm nguồn mở (Greenstone, Zope, Drupal, ) Các phần mềm đà giúp việc chuyển đổi tõ th− viƯn trun thèng sang th− viƯn sè, cịng nh giải toán hoạt động thông tin - th viện (không quản lý tài liệu, mà quản lý việc luân chuyển tài liệu, việc khai thác thông tin ) trở nên thuận tiện Tuy nhiên, phần mềm lại có đặc trng tiện ích khác Bài viết tập trung vào nét khái quát phần mềm Th viện số Greenstone (Greenstone Digital Library) khả ứng dụng phần mềm thực tiễn hoạt động thông tin th viện Việt Nam.(*) Greenstone sản phẩm Dự án th viện số New Zealand trờng đại học Waikato với hợp tác UNESCO Human Info NGO Greenstone phần mềm mà nguồn mở dùng để xây dựng su tập sè Theo David Wheeler, “PhÇn mỊm m· ngn më sÏ cho phÐp ng−êi dïng sư dơng theo bÊt kú mơc đích nào; đợc phép nghiên cứu sửa đổi, đợc phép chép tái phát hành phần mềm gốc phần mềm đà sửa đổi mà trả tiền cho ngời lập trình trớc Greenstone phần mềm đa ngôn ngữ Hiện nay, Greenstone đợc dịch sang 60 ngôn ngữ (3) Trong ngôn ngữ nòng cốt là: Anh, Pháp, Tây Ban Nha Nga ViƯt Nam, nÕu mn sư (*) Viện Th«ng tin Khoa häc x· héi Th«ng tin Khoa häc x· héi, sè 5.2009 48 dụng phiên tiếng Việt quan thông tin-th viện phải trả phí cho ngời biên soạn phiên tiếng Việt Ngoài ra, Greenstone cung cấp phơng thức để tổ chức xuất thông tin dới dạng số, kể Internet nh đợc bao gói CD- ROM Một số −u ®iĨm cđa Greenstone - Truy cËp réng r·i Bé su tập đợc truy cập qua trình duyệt Web chuẩn - Đa hệ (có thể sử dụng nhiều hệ điều hành) Bộ su tập chạy Windows, Unix/ Linux Mac OS-X - Hớng siêu liệu Các số lớt tìm đợc tạo nên từ siêu liệu Các siêu liệu kết hợp với tài liệu phần tài liệu - Đa ngôn ngữ Unicode đợc dùng để hỗ trợ việc chuyển đổi ngôn ngữ Chỉ mục riêng biệt tạo cho ngôn ngữ khác - Thang độ (Scale) lớn Những su tập chứa hàng triệu tài liệu, nhiều Gigabytes đợc tạo Tìm kiếm toàn văn nhanh chóng Có thể nén để giảm kích thớc văn số đợc gắn kèm - Tơng thích Z39.50 Giao thức Z39.50 hỗ trợ việc truy cập máy chủ bên cịng nh− giíi thiƯu bé s−u tËp Greenstone cho ng−êi sử dụng bên - Tìm kiếm linh hoạt Ngời dùng tìm toàn văn tài liệu với số liên kết thích hợp - Lớt tìm linh hoạt Ngoài khả tìm kiếm theo thuộc tính đà định, ngời dùng lớt tìm theo quy định việc thiết kế nh: danh mục tác giả, chủ đề, từ khoá, năm xuất tài liệu, - Đa phơng tiện Bên cạnh thông tin dạng văn bản, su tập chứa hình ảnh, âm thanh, băng ghi âm, ghi hình - Xuất CD-ROM Bé s−u tËp cã thÓ xuÊt CD-ROM mét cách tự động - Greenstone phần mềm mà nguồn mở, ngời sử dụng dễ dàng chỉnh sửa phù hợp với công việc - Một u điểm bật phần mềm mà nguồn mở nói chung Greenstone nói riêng trả tiền quyền Đặc biệt, sản phẩm phần mềm nguồn mở đợc thay đổi theo nhu cầu ngời dùng có tính tơng thích cao Các tính Greenstone - Có thể sử dụng để xây dựng su tập tài liệu số từ Internet CSDL trực tuyến dạng đa phơng tiện: su tập thông tin dạng âm thanh, tranh ảnh, hình ảnh động, hoạt hình, đồ hoạ, toàn văn Lúc này, thông tin đà tồn dới dạng số - không cần thiết phải tiến hành việc số hoá - Có thể sử dụng để xây dựng su tập chuyên ngành cách số hoá tài liệu có th viện: sách, tạp chí, luận văn, báo cáo khoa học, đề tài nghiên cứu khoa học, giảng, giáo trình, với su tập toàn văn Nhng b su tập số đợc xây dựng sở nguồn tài liệu dạng truyền thống (in giấy) - vậy, cần tiến hành số hoá tài liệu - Có thể sử dụng để xây dựng CSDL th mục theo chuẩn Dublin Core(*) (*) Dublin Core chuẩn chủ yếu dùng cho việc mô tả tài liệu dạng số th mục nguồn thông tin Internet Phần mềm th viện số Greenstone hay MARC 21 Ngoài ra, phần mềm Greenstone có khả hỗ trợ xây dựng su tập, biên mục theo Dublin Core MARC 21 Greenstone công cụ Librarian Interface - Greenstone tích hợp vào phần mềm quản lý th viện có sẵn - Greenstone đợc phát triển thành phần mềm quản lý th viện hoàn chỉnh theo yêu cầu th viện - tức đợc thiết kế để thực chức khác nhau, giải toán th viện Với tính nêu trên, Greenstone đà đợc sử dụng để tạo lập xuất su tập Web nhiều tổ chức nớc giới Việt Nam, số nơi đà sử dụng Greenstone để xây dựng su tập số Đầu năm 2004, Th viện Đại học Khoa học Tự nhiên - Đại häc Qc gia Tp Hå ChÝ Minh ®· sư dơng Greenstone xây dựng th viện số với hỗ trợ phiên tiếng Việt Integrated e-Solution, ITD Việt Nam (Ies) Tháng 6/2004, Th viện trờng Đại học Ngân hàng Tp Hồ Chí Minh đà sử dụng Greenstone Tháng 10/2004, Trung tâm Thông tin - T liệu Đại học Đà Nẵng sử dụng Greenstone để tạo lập bé s−u tËp sè HiƯn nay, c¸c th− viƯn tr−êng đại học, trung tâm thông tin đà bắt đầu nghiên cứu sử dụng Greenstone nh: Trung tâm Th«ng tin KH&CN Qc gia, ViƯn Th«ng tin Khoa học xà hi, Th viện trờng Đại học Hà Nội, So sánh tính CDS/ISIS Greenstone bảng (trang bên) theo số tiêu chí cụ thể cho thấy rõ u điểm Greenstone so víi CDS/ISIS Vµ nh− vËy, so víi CDS/ISIS, 49 Greenstone công cụ hữu ích th viện số Ngoài ra, Greenstone phần mềm đợc chuẩn hoá cao, điều giúp tiếp cận với chuẩn th viện quốc tế, từ nâng cao khả hợp tác hội nhập với th viện nớc quốc tế Xây dựng su tập số dựa phần mềm Greenstone Xây dựng su tập số nội dung thu hút quan tâm th viện giới nh Việt Nam Đối với tệp tài liệu đợc lu giữ máy tính điện tử việc su tầm, tổ chức xử lý liệu đơn giản Song, nguồn thông tin truyền thống (dạng in giấy) việc số hóa phức tạp tốn kém, thực tế, khó có đủ khả để số hóa tất tài liệu có th viện Vì vậy, cần phải xác định mức độ cần thiết độ u tiên su tập để tiến hành việc xây dựng su tập số: tài liệu quý hiếm, có nhất; tài liệu viết tay dễ h hỏng, rách nát; tài liệu có tần suất sử dụng cao; tài liệu lu hành phục vụ nhu cầu nội bộ, Ngoài ra, số hoá tài liệu công việc tạo cho tài liệu gốc khả phổ biến mới, tất ảnh hởng đến vấn đề quyền hay quyền sở hữu trí tuệ tài liệu đợc số hoá Đó thực tế mà trình xây dựng su tập số cần phải tính đến, đặc biệt số hoá tài liệu cha đợc xuất bản, nh: luận án khoa học, báo cáo kết nghiên cứu, t liệu dịch cha xuất Đây vấn đề phức tạp đòi hỏi phải đợc giải cách có hệ thống từ khía cạnh sách cụ thể, viết không đề cập phân tích vấn đề Thông tin Khoa học xà hội, số 5.2009 50 STT Tiêu chí CDS/ISIS Greenstone Hỗ trợ tiếng Việt - Hỗ trợ ASCII 16 bit (TCVN 5712 1999) - Cần phát triển bổ sung chức cho phép hiển thị công cụ tiếng Việt - Để truy cập Internet cần có máy chủ Webisis, máy chủ Proxy đặc biệt để thực chuyển ®ỉi tõ m· ASCII sang Unicode (TCVN 6909 -2001) vµ ngợc lại CDS/ISIS tự thân tính cài đặt chạy Internet mà cần phải có công cụ đặc biệt (Webisis) Hỗ trợ xuất CSDL Web Quản lý - Số lợng tối đa biểu ghi CSDL CSDL lµ 16 triƯu (d−íi 500 MB) - Mét biĨu ghi CDS/ISIS cã tèi ®a 200 tr−êng, trờng chứa tối đa 32.000 ký tự - Không có sẵn khả quản lý toàn văn - Hỗ trợ Unicode (TCVN 6909 - 2001) - Có sẵn giao diện tiếng Việt - Không cần chuyển đổi mà ký tự, Greenstone mặc định sử dụng Unicode - Dữ liệu bên Greenstone lu trữ theo UFT-8 Có thể cài đặt chạy Internet Tạo cấu trúc CSDL Ngời dùng phải tạo Bảng định nghĩa trờng (FDT) để định nghĩa cấu trúc (các yếu tố mô t¶ cđa biĨu ghi th− mơc) - Cho phÐp sư dụng toán tử nh: toán tử Bool, tìm lân cận, chặt cụt - Hai hình thức tìm kiếm: Tìm nâng cao tìm đơn giản có hớng dẫn - Đối với Webisis cần tạo mẫu tìm kiếm, điều không đơn giản ngời lập trình viên Tìm kiếm thông tin Hiển thị xem CSDL hình - Ngời dùng xem lần lợt biểu ghi xem biểu ghi - Không có chức duyệt (xem) theo hệ thống thứ bậc theo chủ đề Lu in ấn kết tìm kiÕm - In trùc tiÕp bÊt kú m¸y in nµo cã cµi Windows - Cã thĨ in trùc tiếp chế độ xem chuyển kết sang Word để in - Không giới hạn số lợng ký tự biểu ghi - Có khả quản lý toàn văn, tạo mục toàn văn Do tiến hành tìm kiếm toàn văn - Có sẵn số siêu liệu để ngời dùng lùa chän (vÝ dơ: Dublin Core víi 15 u tè mô tả) - Khả tìm kiếm mạnh, sử dụng toán tử Bool ký hiệu chặt cụt - Hai hình thức tìm kiếm tìm đơn giản tìm theo mẫu - Dễ dàng tạo mẫu tìm kiếm sử dụng công cụ sẵn có - Greenstone sử dụng trình duyệt Web (Ví dụ: Internet Explorer, Netscape) để duyệt bé s−u tËp - Cho phÐp duyÖt bé s−u tËp theo cách khác (Sắp xếp theo danh sách, theo chủ đề, theo thời gian,) Sử dụng tính lu in ấn kết mặc định trình duyệt Internet Phần mềm th viện số Greenstone Để tiến hành xây dựng su tập số với Greenstone cần thực bớc sau: Xác định chđ ®Ị néi dung cđa bé s−u tËp Chđ ®Ị đợc phản ánh cách hàm súc qua tên su tập, đợc dùng để phân biệt su tập khác Xác định nguồn tài liệu cần đợc bao quát để đa vào su tập Nguồn tài liệu cụ thể gồm: tài liệu in giấy vật mang tin khác, tệp liệu đợc lu trữ máy tính điện tử, tài liệu đợc lấy từ Web hay PDF Xác định cấu hình su tập Đây công việc đóng vai trò đặc biệt quan trọng định su tập có hoạt động đợc hay không Trong tập tin cấu hình, tài liệu đợc tự động chuyển sang định dạng XML(*), đồng thời Plugin(**) thích hợp đợc chọn trình tạo lập CSDL Sau số tìm kiếm cấu trúc trình duyệt tài liệu đợc quy định tập tin cấu hình đợc tạo Đến đây, trình xây dựng su tập số hoàn thành tiến hành tìm kiếm thông tin theo dấu hiệu khác đợc quy định cấu hình su tập Tuy nhiên, để xây dựng su tập số vấn đề tạo siêu liệu công việc cần thiết Đối với Greenstone, việc xác định siêu liệu đợc thực theo chuẩn Dublin Core Chuẩn Dublin Core bao gồm 15 yếu tố mô tả: Nhan đề, Đề mục, Mô tả, Loại (*) XML định dạng tệp liệu tổng hợp chứa đựng nhiều tính năng, cho phép thu nhỏ kích thớc tệp liệu, phục hồi tệp liệu đà bị hỏng, đồng thời tăng cờng độ an toàn (**) Plugin công cụ dùng để mở rộng chức WordPress 51 hình, Nguồn gốc, Liên kết, Nơi chứa, Tác giả, Tác giả phụ, Thông tin xuất bản, Bản quyền, Ngày tháng, Mô tả vật lý, Địa danh, Ngôn ngữ Dublin Core có u điểm là: Đơn giản tạo lập bảo trì (đợc thiết kế nhằm phục vụ ngời không chuyên), dễ sử dụng, rẻ mang lại hiệu cao; Ngữ nghĩa thông dụng (khắc phục khó khăn việc hiển thị thuật ngữ, ví dụ: yếu tố - Creator - đợc gán cho ngời tạo lập tài liệu nh: tác giả tài liệu, nhà soạn nhạc, đạo diễn,) ; Khả mở rộng đa ngôn ngữ Chuẩn Dublin Core giúp ta xác định siêu liệu theo cách: Thứ nhất: Xây dựng thủ công công cụ Organizer; Thứ hai: Xây dựng bán tự động công cụ Librarian Interface; Thứ ba: Xây dựng tự động công cụ Greenstone Collector Cách thứ đòi hỏi ngời xây dựng phải có khả lập trình tốt Cách thứ ba thờng áp dụng với tài liệu đơn giản kết tạo su tập với giao diện định trớc Cách thứ hai cách làm phù hợp với khả cđa chóng ta Bëi v× giao diƯn Librarian Interface trình bày 15 yếu tố Dublin Core giúp cho việc tạo lập điểm truy cập theo nhan đề, tác giả, từ khóa, chủ đề Tìm kiếm thông tin số dựa phần mềm Greenstone Greenstone có giao diện đơn giản thân thiện với màu xanh đặc trng; ngôn ngữ giao tiếp mặc định tiếng Anh Ngời dùng chuyển đổi giao diện sang ngôn ngữ cần cách: Từ cửa sổ Greenstone nhấn chuột trái vào biểu tợng thuộc tính lựa chọn ngôn ngữ 52 Enter Ngời dùng đợc hớng dẫn chi tiết nhấn vào biểu tợng giúp đỡ Từ cửa sổ tìm kiếm ca Greenstone, tiến hành tìm kiếm thông tin theo c¸c c¸ch kh¸c nh−: NhËp tõ kho¸ vào hộp tìm kiếm hoc tìm theo kiểu duyệt lớt Tùy thuộc vào cấu trúc CSDL ngời tạo lập thiết kế, ngời dựng tiến hành tìm kiếm theo dấu hiệu khác nh: nhan đề, tác giả, từ khóa, tên tác giả, chủ đề, Sau tìm kiếm, kết đợc hiển thị dới dạng th mục Để đọc đợc toàn văn, ngời dùng tin kích vào biểu tợng file đính kèm để kết nối tới toàn văn dới dạng PDF hay HTML Ngày nay, vấn đề xây dựng th viện ®iƯn tư/th− viƯn sè ®ang diƠn rÊt m¹nh mÏ Các thành tựu khoa học, công nghệ đại không ngừng nâng cao khả trình lu trữ, tổ chức truy cập thông tin Xu hội nhập đà tạo hội, đồng thời đặt không thách thức cho ngành thông tin - th viện Chính xu nhu cầu thông tin xà hội nói chung đòi hỏi cần phải có đổi hoạt động th viện Việc xây dựng su tập số th viện động thái tích cực nhằm bảo quản lâu dài nguồn tài liệu, đáp ứng cách hiệu nhu cầu tin ngời dùng tin Để thực mục tiêu viƯc sư dơng phÇn mỊm th− viƯn sè Greenstone sÏ giải pháp thiết thực góp phần phát triển hoạt động thông tin th viện theo hớng đại hoá TàI LIệU THAM KHảO Allison Zhang and Don Gourley A Digital Collections Management Th«ng tin Khoa häc x· héi, sè 5.2009 System Based On Open Source Software Washington Research Library Consortium Poster/Demo Presentation at JCDL 2003 (28/5/2003) About http://greenstone.org Greenstone Greenstone language support http://greenstone.sourceforge.net/wi ki/index.php/Greenstone_language_ support Ian H Witten, David Baibridge, Stefan J Boddie Greenstone Open SourceDigital Library Software DLib Magazine, October 2001, Volume 7, Number 10 www.dlib.org Diane Hillmann Using Dublincore http://uk.dublincore.org/documents /usageguide/#whatis Cao Minh Kiểm, Đào Mạnh Thắng Lựa chọn phần mềm khổ mẫu liệu số phục vụ nông thôn miền núi (Kỷ yếu Hội nghị th viện số châu lần thứ 10) H., 2007, tr 106-118 Kỷ yếu Hội thảo khoa học: Tăng cờng công tác tiêu chuẩn hoá hoạt động thông tin - t liệu H.: Trung tâm Thông tin KH&CN quốc gia, 2006 Kỷ yếu Hội thảo khoa học: Tiếp cận xây dựng th viện số Việt Nam Hiện trạng vấn đề H.: Trung tâm Thông tin KH&CN Quốc Gia, 2007, 171 tr Ngun Minh HiƯp Sư dơng phÇn mềm nguồn mở th viện số Greenstone để xây dựng kho tài nguyên học tập (Kỷ yếu Hội thảo Xây dựng phát triển nguồn học liệu để phục vụ đào tạo nghiên cứu, tr.93-103) 10 Sử dụng Greenstone để xây dựng Bộ su tập th viện số Bản tin Th− viƯn - C«ng nghƯ th«ng tin, sè 1/2006, tr 22-33 ... Interface - Greenstone cã thể tích hợp vào phần mềm quản lý th viện có sẵn - Greenstone đợc phát triển thành phần mềm quản lý th viện hoàn chỉnh theo yêu cầu th viện - tức đợc thiết kế để thực chức... th viện số Ngoài ra, Greenstone phần mềm đợc chuẩn hoá cao, điều giúp tiếp cận với chuẩn th viện quốc tế, từ nâng cao khả hợp tác hội nhập với th viện nớc quốc tế Xây dựng su tập số dựa phần mềm. .. hiệu nhu cầu tin ngời dùng tin Để thực mục tiêu việc sử dụng phần mềm th viện số Greenstone giải pháp thiết thực góp phần phát triển hoạt động thông tin th viện theo hớng đại hoá TàI LIệU THAM