9. Bố cục của Luận văn:
3.2.3. Ứng dụng phần mềm mã nguồn mở Dspace để quản lý CSDL
Hiện nay trên thế giới có rất nhiều phần mềm mã nguồn mở với nhiều mục đích sử dụng khác nhau, và có thể định nghĩa phần mềm mã nguồn mở ngắn gọn nhƣ sau: Mã nguồn mở là thuật ngữ chỉ các sản phẩm phần mềm công khai mã nguồn (source code). Ngƣời dùng không phải trả một khoản chi phí nào, hơn nữa họ có quyền xem, sửa đổi, cải tiến, nâng cấp theo một số nguyên tắc chung qui định trong giấy phép phần mềm nguồn mở (general public licence).
Một số lý do chính nên sử dụng phần mềm mã nguồn mở để xây dựng CSDL:
Là phần mềm đƣợc sử dụng rộng rải trên thế giới
Là phần mềm đƣợc xây dựng theo chuẩn quốc tế nhƣng lại đƣợc miễn phí.
Ngƣời sử dụng có thể cấu hình hoặc cập nhật để phù hợp với nhu cầu của đơn vị.
Có thể quản lý và lƣu trữ tốt nội dung tài liệu.
Dể dàng tổ chức và xuất bản thông tin trên Internet hoặc trên CD-ROM Hiện nay, trong lĩnh vực quản lý thông tin tƣ liệu toàn văn có rất nhiều phần mềm mã nguồn mở đƣợc xây dựng bởi các tổ chức danh tiến trên thế giới nhƣ phần mềm DSpace của Học viện Công nghệ Massachuset, hoặc
Eprints của đại học Southampton - Anh, Open Journal System, Green Stone là sản phẩm của chƣơng trình New Zealand Digital Library trƣờng đại học Waikato.
Trong những năm gần đây, một số trƣờng Đại học ở Việt Nam cũng dần có xu hƣớng sử dụng phần mềm mả nguồn mở để quản lý thông tin toàn văn. Trong giới hạn của luận văn tác giả xin chọn phần mềm mã nguồn mở
Dspace để làm giải pháp chính cho việc quản lý nguồn thông tin Khoa học và công nghệ của mình.
Tác giả xin chọn phần mềm này vì các lý do sau:
Xét về phạm vi sử dụng: DSpace là sản phẩm công nghệ của Học viện Công nghệ Massachuset và là phần mềm đƣợc sử dụng rộng rãi trên khắp thế giới với hơn 800 tổ chức cài đặt và vận hành.
Xét về gốc độ kinh tế và chất lƣợng dịch vụ: Khi sử dụng Dspace không cần phải trả bất kỳ khoản chi phí nào, và có thể download, cài đặt dể dàng tại website. Kèm theo đó là dịch vụ tƣ vấn, hỗ trợ, tài liệu hƣớng dẫn đƣợc cung cấp và cập nhật miễn phí tại website http://www.dspace.org.
Đứng về quy mô phát triển của ĐHQG-HCM ngoài những loại hình thông tin là bản in, là file mềm, … trong thời gian tới có thể pháp triển thêm nhƣ các chƣơng trình ứng dụng, tài liệu đa phƣơng tiện, phần mềm, quy trình công nghệ,…. Tất cả những tài liệu này đều có thể tổ chức đƣợc trong Dspace.
Đứng về gốc độ công nghệ:
Dspace đƣợc cập nhật thƣờng xuyên bởi các nhà thƣ viện học và các chuyên gia CNTT trên khắp thế giới tại website chính thức của Dspace.
Ngƣời sử dụng có thể cấu hình lại giao diện và thay đổi ngôn ngữ cho phù hợp với nhu cầu của đơn vị (có tài liệu hƣớng dẫn đƣợc xuất bản tại website).
Đứng về gốc độ thƣ viện:
Dspace sử dụng chuẩn biên mục tài liệu theo MARC.
Các tiêu chí kỹ thuật khuyến cáo khi sử dụng phần mềm Dspace:
Không có một tiêu chí cụ thể cho việc cài đặt Dspace vì Dspace rất dể cài đặt có thể cài đặt và vận hành trên máy tính có cấu hình bình thƣờng. Dspace có thể chạy đƣợc trên hầu hết các hệ điều hành nhƣ UNIX/Linux hoặc trên Microsoft Windows. Việc sử dụng Dspace để tạo lập thành CSDL phải chú ý dự trù đến các trƣờng hợp, số lƣợng tài liệu, thời gian phát triển của CSDL, tốc độ phát triển của CSDL, đối tƣợng phục vụ, phạm vi phục vụ, chính sách phục vụ. Tổng hợp tất cả các yếu tố trên sẽ giúp chúng ta có một sự phân tích tổng thể và ra một quyết định lựa chọn phần cứng nào phù hợp với nhu cầu của cơ quan, tránh lãng phí đồng thời sử dụng hết công năng của CSDL.
Với hiện trạng của ĐHQG-HCM cấu hình đề xuất tham khảo: Server đề xuất:
Hầu hết các Sever của ĐHQG-HCM đều chạy trên hệ điều hành Linux/unix vì vậy việc cài đặt và vận hành Dspace trên cùng một hệ điều hành là rất thuận tiện.
Cấu hình 1: HP Server rx2600, với cấu hình 02 bộ xử lý 64- bit Intel Itanium 900MHz, 2GB RAM, không gian lƣu trữ trong 26 GB. Bộ lƣu trữ ngoài HP StorageWorks Modular SAN Array 1000 (msa1000) với bộ điều khiển đơn. Các lựa chọn thêm bao gồm bộ điều khiển thứ 2 và 2 không gian đĩa thêm, có thể điều khiển lên tới 42 Ultra2, Ultra 3, hay Ultra320 SCSI. Tổng dung lƣợng có thể đạt 06 terabytes.
Chi phí đầu tƣ khoản 40.000 USD trở lên.
Cấu hình 2: SunFire 280R Server, hai bộ vi xử lý 900MHz UltraSPARC-III Cu, 8MB E-cache, bộ nhớ 2GB, hai ổ đĩa trong FCAL 36GB 10,000rpm, DVD, 436-GB, hoặc 12 x 26.4 Gbyte 10K RPM, Sun StorEdge A1000 có thể gắn trên khung giá với 1 HW RAID controller, 24MB std cache.
Cấu hình 3: Dell PowerEdge 2650 với bộ xử lý kép Xeon 2.4GHz, 2GB RAM, ổ đĩa 2x73GB scsi. Một Apple XServe 2.5TB. Ổ đĩa băng từ DLT để sao lƣu DB/jsps.
Chi phí đầu tƣ khoản 10.000 USD
Hiển nhiên, chi phí đầu tƣ sẽ phụ thuộc vào nguồn tài chính hoạch định hệ thống
Cách sử dụng Dspace
Một số tính năng đặc biệt và mềm dẻo giúp thuận tiện trong việc quản lý và vận hành.
Chính sách phân quyền:
Đối với Dspace thì việc phân quyền rất mềm dẻo, có thể phân quyền theo IP sử dụng, có thể phân quyền theo đối tƣợng sử dụng, có thể phân quyền theo từng CSDL riêng biệt và cũng có thể phân quyền theo cấp quản lý. Nói chung Dspace cung cấp cho ngƣời dùng thuận tiện trong phân quyền để việc quản lý, cập nhập dữ liệu, truy xuất dữ liệu, tra cứu dữ liệu đƣợc thực thi một cách mềm dẻo và thuận tiện nhất. Công cụ đã sẵn sàng vấn đề là thƣ viện, trung tâm thông tin phải khảo sát và lập kế hoạch và đề ra chính sách quản trị ngƣời dùng nhƣ thế nào để vận hành nó.
Vấn đề liên kết chia sẽ dữ liệu cộng đồng: Dspace cho phép ngƣời quản trị có thể sát thực, liên kết, chia sẽ dữ liệu thông qua cổng truy cập Z3959 Server. Thông qua đây việc liên thông, chia sẽ dữ liệu giữa các đơn vị cũng dễ dàng, thuận tiện.
Về biên mục dữ liệu: Dspace xây dựng trên cơ sở các chuẩn biên mục thƣ viện hiện hành trên toàn thế giới nhƣ chuẩn MARC
Thay đổi giao diện: Về giao diện Dspace cho phép ngƣời sử dụng có thể tự thay đổi, cập nhật hoặc thiết kế lại một giao diện khác phù hợp với nhu cầu của đơn vị hoặc cơ quan công tác. Một số ví dụ về sự thay đổi giao diện: Giao diện chung của Dspace
Hình: 3.1. Giao diện chung ban đầu
Hình:3.2 Giao diện sau khi biên tập lại
Hình 3.3: Tạm bố trí quy hoạch trong Dspace
Phân quyền cho các trung tâm, phòng khoa học và công nghệ:
Hệ thống thƣ viện trong ĐHQG-HCM nhìn chung hoạt động khá tốt, tuy nhiên nhƣ trình bày trong hiện trạng sợi dây nối mối liên hệ giữa thƣ viện với các phòng khoa học công nghệ trong việc chia sẽ và phục vụ thông tin KH&CN chƣa đƣợc chặt chẽ do thiếu vấn đề nền tảng. Trƣớc mắt và theo nghiên cứu của tác giả nên gắng kết mối quan hệ này bằng cách sử dụng chung phần mềm quản lý thông tin điều này sẽ giúp cơ quan thông tin cập nhật những thông tin hiệu quả và kịp thời còn đối với các phòng khoa học thì sẽ giảm gánh nặng về quản lý thủ công bằng Excel và tra cứu thông tin cũng thuận lợi. Cụ thể theo đề xuất nguyên tắc quản lý thông tin qua phần mềm này là:
Cán bộ làm công tác quản lý KH&CN và cán bộ quản lý kết quả nghiên cứu cùng sử dụng chung một phần mềm, nhƣng sự phân quyền, phân cấp vào trong dữ liệu lại khác nhau, tuỳ vào chức năng nhiệm vụ của từng bộ phận sẽ đƣợc cấp quyền cập nhật hoặc truy xuất dữ liệu đến mức độ nào
Nguyên tắc thực hiện:
Bộ phận quản lý KH&CN và thƣ viện cần phối hợp để xây dựng CSDL KH&CN
Hình 3.4: Cấp quyền truy cập vào CSDL Thông tin KH&CN
Giai đoạn từ lúc duyệt đề đến lúc nghiệm thu đề tài và vai trò của cán bộ làm công tác quản lý nghiên cứu KH&CN đối với việc quản lý thông tin KH&CN: Sau khi đề tài vừa đƣợc duyệt và trƣớc khi tiến hành cấp kinh phí
Thƣ viện Trung Tâm Phòng KH&CN ĐH Quốc tế Ban KH&CN Phòng KH&CN ĐH KHXH&NV Phòng KH&CN ĐH KHTN Phòng KH&CN ĐH Bách khoa DSPACE RESOURCE
để triển khai cán bộ KH&CN cần tập hợp hồ sơ nhập dữ liệu biên mục vào phần mềm Dspace và chọn hiện trạng của đề tài/dự án đang nghiên cứu, và dự kiến thời gian triển khai là năm nào. Sau khi biên mục xong toàn thể ngƣời sử dụng đều biết thông tin. Với việc cập nhật thông tin nhƣ vậy sẽ giúp ngƣời nghiên cứu/ ngƣời sử dụng/ học viên tìm đƣợc thông tin, đồng thời giúp họ thuận tiện trong việc chọn lựa đề tài vì biết đƣợc đề tài nào đang tiến hành trong ĐHQG-HCM và thời gian hoàn tất, và nhƣ thế có thể giúp học viên có cái nhìn tổng quát và chuyển hƣớng nghiên cứu nếu cần
Giai đoạn từ sau khi nghiệm thu đề tài đến lúc đƣa đề tài ra phục vụ và vai trò của cán bộ thƣ viện.
Sau khi đề tài/ công trình, dự án đã chính thức nghiệm thu, cán bộ quản lý KH&CN chuyển giao kết quả này cho cán bộ thƣ viện. Bằng phƣơng pháp nghiệp vụ của mình cán bộ thƣ viện sẽ cập nhật thêm thông tin thƣ mục, chỉnh sửa tập tin và tổ chức thông tin lên Dspace.
Quản trị Dspace
Phân quyền truy cập
Mỗi cán bộ tham gia cập nhật/biên mục vào Dspace đều đƣợc cấp một Username và một Password. Song song với mỗi Username là mực độ quyền hạn đƣợc sử dụng các tính năng của Dspace và tác giả đề xuất phân quyền nhƣ sau
Cán bộ làm công tác quản lý KH&CN:
Về mặt biên mục thông tin: chỉ đƣợc cập nhật thông tin thƣ mục về nghiên cứu KH&CN của đơn vị mình.
Về mặt truy xuất dữ liệu: cũng chỉ đƣợc truy xuất những thông tin về KH&CN của đơn vị mình.
Báo cáo thống kê: cũng chị đƣợc lấy số liệu thống kê và những tài liệu KH&CN của đơn vị mình và các đơn vị khác cùng hệ thống.
Phân quyền cho tình trạng tài liệu: Cán bộ quản lý KH&CN đƣợc phép phân quyền cho ngƣời tra cứu đƣợc phép xem thông tin tóm tắt hoặc thƣ mục
Đối với cán bộ làm công tác thƣ viện:
Về mặt biên mục thông tin: đƣợc phép biên mục dạng thƣ mục cũng nhƣ toàn văn đến tất cả các lĩnh vực thông tin mà Dspace quản lý.
Truy xuất dữ liệu: đƣợc phép truy xuất tất cả những thông tin dạng thƣ mục và toàn văn đến tất cả các lĩnh vực thông tin mà Dspace quản lý kể cả thông tin KH&CN.
Báo cáo thống kê: đƣợc phép lấy tất cả những thông tin dạng thƣ mục và toàn văn đến tất cả các lĩnh vực thông tin mà Dspace quản lý kể cả thông tin KH&CN.
Cán bộ quản trị Dspace: tuỳ theo chức năng nhiệm vụ của từng bộ phận và từng thành viên tham gia vào Dspace mà phân quyền cho từng nhóm ngƣời tham gia thao tác trong Dspace. Kết thúc hoặc khoá Username nếu đối tƣợng sử dụng vi phạm chính sách phân quyền và quy định đề ra.
Ngƣời sử dụng/ ngƣời dùng tin: Đây là đối tƣợng thụ hƣởng sản phẩm thông tin đƣợc biên tập trên Dspace đồng thời họ cũng có thể đăng ký tham gia là thành viên của Dspace để tra cứu thông tin, yêu cầu hệ thống thông báo gửi tài liệu mới theo chủ đề, sử dụng toàn văn,… Tất cả các tính năng này đều thực hiện đƣợc thông qua phần mềm quản trị ngƣời dùng tin trên Dspace
Phục vụ thông tin KH&CN
Có 2 cấp phục vụ thông tin cho ngƣời dùng tin đối với sản phẩm thông tin này:
o Thông tin thƣ mục về tài liệu KH&CN của ĐHQG-HCM cụ thể tên đề tài/luận văn/dự án, nơi lƣu trữ, thời gian hoàn tất, hoặc tóm tắt đề tài … nói chung là tình trạng tài liệu đƣợc phục vụ
rộng rãi trong và ngoài ĐHQG-HCM có thể xuất bản toàn bộ trên website cho mọi đối tƣợng ngƣời dùng.
o Thông tin toàn văn về tài liệu KH&CN của ĐHQG-HCM chỉ phục vụ cho các thành viên trong ĐHQG- HCM, phƣơng thức phục vụ phân quyền sử dụng toàn văn theo IP (trong hệ thống mạng nội bộ của ĐHQG-HCM mới có thể truy cập đƣợc toàn văn), hoặc theo User và Password ngƣời quản trị cấp.
Xây dựng CSDL: 2 giai đoạn xây dựng CSDL nhƣ sau:
Giai đoạn 1: Số hoá và biên mục những tài liệu cũ sẵn có
Phòng/ ban KH&CN thống kê chính xác lại toàn bộ tài liệu KH&CN của từng trƣờng thành viên và của ĐHQG-HCM
Phân loại những tài liệu “mật”, tài liệu không công bố (nếu có).
Chuyển giao cho thƣ viện để thƣ viện thực hiện số hoá và xây dựng thành CSDL hoàn chỉnh về tài liệu KH&CN.
Quy trình biên mục
Bước 1: Nếu tài liệu là bản in và không có CD hoặc file mềm đính kèm phải tiến hành Scan tài liệu và chỉnh sửa lại. Nếu tài liệu có CD hoặc file mềm đính kèm chỉ cần chỉnh sửa hình thức lại.
Bước 2: Sau khi chỉnh sửa xong cần đặt tên file và tổ chức lƣu trữ file theo một quy định thống nhất.
Ví dụ đặt tên file là: XX_YY_ZZ_000001 Trong đó XX: ký hiệu tên CSDL
YY: ký hiệu bộ sƣu tập con ZZ: Ký hiệu ngành/lĩnh vực
Bước 3: Biên mục thông tin vào phần mềm Mã nguồn mở theo chuẩn quy định.
Bước 4: Kiểm tra tổng thể và xuất bản thông tin phục vụ cho ngƣời dùng tin.
Hoàn tất giai đoạn 1 ta đã có một CSDL hoàn chỉnh về thông tin KH&CN kế đến chuyển sang giai đoạn 2 để cập nhật thông tin thƣờng xuyên và định kỳ
Giai đoạn 2: cập nhật những tài liệu mới định kỳ.
Bước 1: Sau khi hội đồng đã duyệt danh sách đề tài nghiên cứu khoa học của trƣờng, Phòng/ Ban KH&CN cập nhật thông tin vào Dspace nhƣ nhan đề, tác giả hoặc nhóm tác giả thực hiện, thời gia dự kiến hoàn tất. Thao tác này giúp ngƣời nghiên cứu biết những thông tin, công trình, vấn đề nghiên cứu đang đƣợc thực hiện tại ĐHQG-HCM
Bước 2: Sau khi đề tài đã đƣợc nghiệm thu, cán bộ làm công tác KH&CN chuyển bản in hoặc CD cho thƣ viện, Thƣ viện chỉnh sửa và biên mục vào dữ liệu để phục vụ cho ngƣời sử dụng (giống từ bƣớc 1 đến bƣớc 4 của giai đoạn 1). Bƣớc này sẽ cho thông tin hoàn chỉnh về bức tranh thông tin
Thông tin bản in Thông tin dạng file Scan và chỉnh sửa Chỉnh sửa, định dạng Đặt tên và tổ chức lưu trữ file theo quy định
thống nhất Biên mục vào Dspace Kiểm tra Xuất bản Phục vụ
và cũng là thông báo cuối cùng báo cáo vấn đề nghiên cứu đã đƣợc hoàn tất và đang sẵn sàng phục vụ ngƣời dùng
Phát triển dịch vụ cung cấp thông tin khoa học và công nghệ.
Dựa trên cơ cấu tổ chức của thƣ viện tiến hành cơ cấu lại bộ phận cung cấp thông tin khoa học và công nghệ.
Thông tin KH&CN phải đƣợc xem là bộ phận của thông tin khoa học, ngƣời/bộ phận làm công tác cung cấp thông tin khoa học cũng nên đảm nhiệm thêm công tác cung cấp thông tin KH&CN. Thƣ viện/ Trung tâm thông tin