Ngoài ra giới thiệu về công cụ tìm kiếm, phát hiện và chuyển giao tài nguyên thông tin tập trung hiện nay của Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội TT-TV, ĐHQGHN hiện đ
Trang 1KHÁM PHÁ VÀ KHAI THÁC NGUỒN TÀI NGUYÊN THÔNG TIN TRUY CẬP MỞ TẠI TRUNG TÂM THÔNG TIN – THƯ VIỆN,
ĐẠI HỌC QUỐC GIA HÀ NỘI
Nguyễn Hoàng Sơn*, Lê Bá Lâm** 1
TÓM TẮT
Bài viết đưa ra khái niệm về truy cập mở; những lợi ích mà truy cập mở mang lại cho các đối tượng bạn đọc khác nhau như các tổ chức, cộng đồng, các cá nhân, Ngoài ra giới thiệu về công cụ tìm kiếm, phát hiện và chuyển giao tài nguyên thông tin tập trung hiện nay của Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội (TT-TV, ĐHQGHN) hiện đang được sử dụng ở rất nhiều thư viện đại học lớn trên thế giới với những tính năng tìm kiếm thông tin mạnh mẽ, trong
đó có việc tìm kiếm đến phần lớn nguồn tài nguyên học liệu mở trên toàn cầu
Từ khóa: Truy cập mở; Học liệu mở; Lợi ích truy cập mở; Tìm kiếm
tập trung; Tìm kiếm một lần; Open Access; Primo Central; Metalib; Sfx.
* 1 TS., Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
** ThS., Phó Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Nội
Trang 21 GIỚI THIỆU VỀ TRUY CẬP MỞ
1.1 Truy cập mở là gì?
Truy cập mở là truy cập miễn phí tới các công trình nghiên cứu
và các dữ liệu trên Internet mà không có bất cứ một yêu cầu nào về tài chính, pháp lý và các rào cản kỹ thuật hay công nghệ Việc cho phép người dùng tự do truy cập giúp cho tác giả phổ biến rộng rãi, nhanh chóng, kiểm soát được việc đạo văn và tăng số trích dẫn công trình khoa học của mình Các tài liệu truy cập mở thường tập trung vào các bài báo, báo cáo hội thảo, luận văn, luận án và bài viết có phản biện [1] Truy cập mở được xem như là một phương tiện để thúc đẩy phát minh khoa học bằng cách cung cấp truy cập miễn phí và không hạn chế
về kiến thức khoa học thông qua Internet Một vai trò quan trọng của truy cập mở nữa đó là việc bảo tồn lâu dài các bài báo khoa học và các công trình nghiên cứu Cho phép truy cập mở còn là khuyến khích sự đổi mới, phát triển kinh tế - xã hội, và dòng chảy của tri thức trên toàn thế giới Như vậy, truy cập mở có thể được định nghĩa như là một công
cụ cuối cùng là sử dụng cho phúc lợi công cộng để kích thích sự phát triển của khoa học toàn cầu, cũng như duy trì chất lượng của các thành tựu khoa học trong cùng thời điểm
Một ấn phẩm được gọi là truy cập mở khi đáp ứng một trong hai điều kiện sau:
- Tác giả giữ bản quyền cho phép tất cả người dùng sử dụng miễn phí, không thu hồi lại, vĩnh viễn quyền tiếp cận, đồng thời cho phép sao chép, sử dụng, phân phối, truyền tải và hiển thị các công việc công khai, được phân phối các sản phẩm phái sinh nhưng ghi công tác giả
- Một bản đầy đủ của công trình nghiên cứu và tất cả các tài liệu liên quan, tốt nhất là một bản điện tử có định dạng chuẩn và chắc chắn
là lần đầu tiên xuất bản cho một tổ chức, cơ quan chính phủ có thể lưu trữ và tổ chức cho khai thác, truy cập mở và phân phối không hạn chế
Trang 31.2 Lợi ích của truy cập mở
Truy cập mở có rất nhiều lợi ích cho cộng đồng, tổ chức và cá nhân [2]
Đối với các nhà nghiên cứu:
- Tăng số lượng người biết đến bài biết và các tài liệu liên quan;
- Tăng khả năng nhận biết, hiển thị và ảnh hưởng của công trình;
- Tăng cường nghiên cứu liên ngành;
- Tăng tốc độ nghiên cứu, khám phá và đổi mới;
Đối với các tổ chức giáo dục:
- Đóng góp, thúc đẩy các nghiên cứu trình độ cao;
- Giúp cho các đơn vị nhỏ có cơ hội truy cập bình đẳng;
- Tăng khả năng cạnh tranh trong nghiên cứu học thuật;
- Hỗ trợ tích cực cho sinh viên và học viên;
- Làm phong phú về số lượng và tăng cường chất lượng bài viết;
- Là một kênh hỗ trợ, giáo dục người học;
Đối với các doanh nghiệp:
- Được truy cập vào các kết quả nghiên cứu để thúc đẩy sản xuất, đổi mới;
- Kích thích ý tưởng mới, dịch vụ mới, sản phẩm mới;
- Tạo các cơ hội việc làm cho người lao động;
Đối với cộng đồng:
- Nâng cao hiểu biết về khoa học phục vụ sức khỏe, môi trường, năng lượng,
Trang 4- Đẩy mạnh phong trào tự học, tự nâng cao trình độ;
Đối với các nhà tài trợ nghiên cứu:
- Thúc đẩy lợi ích trong đầu tư;
- Tạo danh mục để quản lý đầu tư nghiên cứu;
- Tránh tài trợ cho các nghiên cứu trùng lặp;
- Tạo ra sự minh bạch trong đầu tư;
- Tăng sự cạnh tranh trong các kết quả nghiên cứu
2 KHÁM PHÁ, GIỚI THIỆU TÀI NGUYÊN TRUY CẬP MỞ TẠI TRUNG TÂM THÔNG TIN - THƯ VIỆN, ĐẠI HỌC QUỐC GIA HÀ NỘI
2.1 Phát hiện tài nguyên học tập và nghiên cứu truy cập mở thông
and Delivery) [3]
Cổng tích hợp và chuyển giao kiến thức của Trung tâm Thông tin - Thư viện, ĐHQGHN phát triển dựa trên bộ giải pháp URD2 bao gồm các ứng dụng thu hoạch với các công nghệ khai mỏ và chuyển giao dữ liệu hay tài nguyên thông tin định hướng học tập và nghiên cứu với giao diện tích hợp thống nhất Primo, hệ thống quản lý và tìm kiếm CSDL trực tuyến truy cập từ xa MetaLib và hệ thống xử lý nối kết mở SFX cùng với các dịch vụ dữ liệu DaaS (Data-as-a-Service) là CSDL Primo Central
và Scholarly Bx Recommender được xử lý trong môi trường điện toán đám mây nhằm cung cấp một hạ tầng tìm kiếm thống nhất và di chuyển giữa các tài nguyên điện tử nối kết mạng Để đảm bảo khả năng hệ thống chỉ khai thác những nguồn học liệu và dữ liệu nghiên cứu mở cùng với tài nguyên cấp phép, trước tiên phân tích về quy mô và dạng tài nguyên chứa đựng trong CSDL chỉ mục Primo Central được Ex Libris phát triển
và cập nhật thường xuyên nhằm lựa chọn các nguồn tài nguyên điện tử
Trang 5nối kết mạng sẵn có trên thế giới và khu vực dành cho học tập và nghiên cứu để tích hợp vào cổng kiến thức URD2, sau đó giới thiệu trải nghiệm làm thế nào hệ thống URD2 có thể trình bày những tài nguyên truy cập
mở hữu ích bên cạnh những tài nguyên cần phải cấp phép giúp thư viện khai thác học liệu và quản lý dữ liệu nối kết điện tử tốt nhất và bạn đọc
có thể khai thác tối đa tài nguyên thông tin khi truy cập dịch vụ này của thư viện ở phần “Truy cập học liệu mở: khai thác sức mạnh của dữ liệu nối kết từ cổng tích hợp thư viện URD2”
Hiện CSDL Primo Central, một dịch vụ dữ liệu điện toán đám mây tích hợp với cổng tích hợp kiến thức URD2 đang chứa đựng tài liệu trên 1900 bộ sưu tập tham khảo dưới dạng điện tử với trên 1 tỷ biểu ghi thư mục chỉ mục nhiều loại hình tài liệu học tập, nghiên cứu trong hầu hết lĩnh vực học tập và nghiên cứu khoa học như tạp chí khoa học chuyên ngành, bài báo nghiên cứu, sách điện tử, bình xét khoa học, tài liệu pháp luật, báo cáo kỹ thuật, kỷ yếu hội nghị khoa học, bộ dữ liệu nghiên cứu, luận văn cũng như nhiều dạng tài liệu học tập khác từ hàng trăm nhà xuất bản dữ liệu nghiên cứu quốc tế gốc như Elsevier, Springer, Taylor and Francis, John Wiley and Sons,… và khu vực ví dụ như KoreaMed, JSTAGE, nhà xuất bản cấp hai, nhà tích hợp nội dung như Proquest, Ebsco và kho số thư viện từ nhiều trường đại học uy tín trên thế giới, ví dụ như Đại học Harvard, Đại học Iowa, Đại học Cornell, Đại học Liege, Đại học Khoa học Công nghệ Hongkong Tài nguyên học liệu truy cập mở được chỉ mục trong Primo Central hiện có các dạng xuất bản như sau:
✓ Tạp chí khoa học xuất bản truy cập mở hoàn toàn (Scholarly Open Access Publishing), ví dụ như Hindawi Journals
✓ Bài báo nghiên cứu xuất bản truy cập mở trong tạp chí cấp phép (hybrid journals), ví dụ như Springer Open Access Journals, Wiley Open Access, Oxford Journals Open Access, IOPscience Open Access Journals…
Trang 6✓ Tài liệu nghiên cứu và luận văn lưu trong kho số (IR-Digital Repository) của các trường đại học và viện nghiên cứu trên thế giới, ví
dụ ORBi của Đại học Liege ở Bỉ và DASH (Digial Access to Scholar-ship at Harvard) của Đại học Harvard, kho số chuyên ngành arXiv của Đại học Cornell
✓ Báo cáo kỹ thuật và tài liệu nghiên cứu từ các trung tâm nghiên cứu chuyên ngành, ví dụ NASA Technical Reports Servers (NTRS), DTIC Technical Reports xuất bản những nghiên cứu được hỗ trợ bởi
Bộ Quốc phòng Mỹ, SciTech Connect Bộ Năng lượng Mỹ
HỌC LIỆU CHỈ MỤC TRONG CSDL PRIMO CENTRAL
Phong trào truy cập mở đã và đang có được động lực với số lượng tăng lên nhanh chóng các tổ chức giáo dục và cấp quỹ đầu tư nghiên cứu đưa ra quy định bắt buộc phải xuất bản truy cập mở đối với những
dữ liệu nghiên cứu được tài trợ kinh phí Kết quả là số lượng học liệu sẵn có truy cập miễn phí ngày càng sẵn có, từ các kho số của các trường đại học, viện nghiên cứu tới những tạp chí khoa học truyền thống và mới xuất bản Các thư viện trên thế giới đang đóng một vai trò kép trong việc hỗ trợ phong trào này: thứ nhất, họ có thể cung cấp các dịch
Tạp chí điện tử nghiên cứu Bài trích
PRIMO CENTRAL
Bộ dữ liệu
nghiên cứu
Kỷ yếu Hội nghị
khoa học
Báo cáo
kỹ thuật
Tài liệu pháp luật/pháp lý
Bình xét khoa học Sách điện tử
Trang 7vụ hỗ trợ nhà nghiên cứu ký gửi dữ liệu nghiên cứu vào trong các kho
số thư viện của họ, bao gồm hỗ trợ khả năng phát hiện sự sẵn có tài nguyên rộng rãi thông qua hệ thống cổng kiến thức và phát hiện tích hợp của thư viện Thứ hai, các thư viện tổ chức và cho phép bạn đọc
có thể phát hiện học liệu mở thông qua các chỉ mục tập trung, nhờ vậy
mở rộng truy cập bộ sưu tập của họ bao gồm nhiều học liệu không cần thiết phải được cấp phép
2.2 Truy cập học liệu mở: khai thác sức mạnh của dữ liệu nối kết
từ cổng kiến thức thư viện URD 2
Theo định nghĩa một dự án nghiên cứu về dữ liệu nối kết (http:// linkeddata.org/), dữ liệu nối kết (Linked Data) hay nối kết mở (LOD – Linking Open Data) là sử dụng Web để tổ chức kết nối dữ liệu liên quan đến nhau mà trước đó nó không có sự liên kết nào, hoặc sử dụng công nghệ Web để làm giảm đi rào cản kết dữ liệu hiện đang được kết nối sử dụng những phương pháp khác Từ điển cộng đồng Wikipedia đã định nghĩa dữ liệu nối kết một cách cụ thể hơn, nó được sử dụng như là một thuật ngữ để mô tả một cách thực hành tốt nhất để trình bày, chia sẻ và kết nối các phần tử dữ liệu, thông tin và kiến thức trên môi trường Web ngữ nghĩa (Sematic Web) sử dụng các công nghệ Web như giao thức chuyển văn bản HTTP (Hypertext Transer Protocol), định vị vị trí tài nguyên đồng nhất URIs (Uniform Resource Identifier) và khổ mẫu mô tả tài nguyên nối kết mạng RDF (Resource Description Framework) Trong môi trường thư viện số hay điện tử ngày nay, dữ liệu nối kết mạng được sử dụng kết hợp với những bộ từ vựng kiểm soát, tiêu chuẩn phân loại thông tin khoa học của ngành thư viện khiến cho dữ liệu nối kết trở nên có ý nghĩa hơn bao giờ hết đối với bạn đọc Do vậy, việc triển khai các hệ thống kiếm soát và quản lý dữ liệu nối kết mạng, đặc biệt những dữ liệu nối kết các nguồn học liệu hay tài nguyên thông tin nghiên cứu rộng khắp, có ý nghĩa qua trọng đối với thư viện hiện
Trang 8đại ngày nay trong việc duy trì sự ổn định của nối kết và xây dựng các dịch vụ tra cứu tập trung và kết hợp giữa mục lục nội sinh và nguồn tài nguyên thông tin ngoại sinh, đồng thời tạo ra khả năng nối kết tham khảo chéo giữa nhiều nguồn tài nguyên thông tin học tập khác nhau Hơn thế nữa, bằng việc sử dụng các công nghệ nối kết OpenURL hiện
có để mã hóa theo ngữ cảnh siêu dữ liệu hay thư mục thư viện trở thành các nối kết hữu ích cho bạn đọc cùng khả năng xử lý thêm vào các dữ liệu trích dẫn tham khảo vào mục tra cứu của thư viện từ các CSDL trích dẫn như Scopus hay ISI Scitation Indexes hay dữ liệu đo lường từ cộng đồng người đọc Altmetrics để đánh giá một tài liệu trước khi đọc đang là xu hướng cần thiết cho một thư viện đại học và nghiên cứu
HÌNH MINH HỌA VỀ DỮ LIỆU NỐI KẾT TRÊN WEB
2.3 Ví dụ về truy cập học liệu mở trên cổng tích hợp kiến thức URD 2
Do hệ thống cổng tích hợp kiến thức URD2 được trang bị một
hệ thống xử lý nối kết mã hóa siêu dữ liệu biểu ghi thư mục theo ngữ cảnh SFX cùng các CSDL mô tả tài nguyên KnowledgeBase, với khả
Trang 9năng quản lý kích hoạt tài nguyên điện tử phù hợp, hệ thống cổng kiến thức giúp bạn đọc khai thác hiệu quả các nguồn học liệu mở bên cạnh những nguồn học liệu cần phải cấp phép
Ví dụ 1: Truy cập mở tạp chí của Nhà xuất bản Đại học Oxford
Hình 02: Truy cập mở từ tạp chí Nature
Ví dụ 2: Truy cập mở từ tạp chí Nature
Hình 03: Truy cập mở từ tạp chí Nature
Nối kết truy cập mở
Nối kết cấp phép
và phải trả tiền
Nối kết truy cập mở Nối kết cấp phép
và trả phí
Trang 10Ví dụ 3: Truy cập mở từ kho số Đại học Liege, Bỉ (University of Liege).
Ví dụ tìm một từ khóa “Inhibition of dd-peptidases” hệ thống cổng kiến thức tìm kiếm và nhóm cả biểu ghi từ các CSDL nguồn khác nhau trình bày cho bạn đọc những nối kết toàn văn khác nhau cho cùng một bài báo từ tạp chí “Chemistry” của nhà xuất bản ACS (American Chemical Society)
Hình 04: Hệ thống URD 2 trình bày một nối kết tới tạp chí “Chemistry” được xuất bản điện tử bởi Nhà xuất bản ACS mà thư viện phải trả phí
để truy cập toàn văn
Hình 05: Hệ thống URD 2 đồng thời cũng trình bày một nối kết tới toàn văn cho cùng bài báo đó được truy cập mở thông qua kho số của Đại học Liege ở Bỉ
vì bài báo đó được hệ thống phát hiện có cùng một siêu dữ liệu
và tác giả là nhà nghiên cứu tại Đại học Liege phải nộp vào kho số thư viện
theo chính sách của trường.
Trang 113 GIỚI THIỆU MỘT SỐ CSDL TRUY CẬP MỞ ĐƯỢC BẠN ĐỌC SỬ DỤNG NHIỀU TẠI ĐHQGHN
3.1 Cơ sở dữ liệu SSRN (Social Science Research Network) [4]
SSRN là tên viết tắt của Mạng lưới Nghiên cứu Khoa học xã hội – trang web thúc đẩy việc phổ biến các nghiên cứu học thuật trong lĩnh vực khoa học xã hội và nhân văn, được thành lập năm 1994 bởi nhà kinh tế học tài chính Michael Jensen và Wayne Marr Tháng 1/2013, trang web xếp hạng các kho tài liệu nội sinh đã đánh giá SSRN là kho tài liệu nội sinh cho phép truy cập mở đáng tin cậy hàng đầu thế giới Thư viện số SSRN bao gồm 2 phần:
(1) Phần Cơ sở dữ liệu tóm tắt gồm các bản tóm tắt của hơn 557.500 các bản báo cáo khoa học và các báo cáo liên quan,
(2) Bộ sưu tập báo cáo điện tử gồm hơn 460.300 các văn bản toàn văn có thể download dưới định dạng PDF
Các lĩnh vực và bài báo có trong SSRN: Nhân loại học và Khảo cổ học (15.020 bản báo cáo); Khoa học nhận thức (9.667 bản báo cáo); Nhân văn (34.687 bản báo cáo); Bảo hiểm xã hội (6,176 bản báo cáo);
Kế toán (23.062 bản báo cáo); Kinh tế học (327.662 bản báo cáo); Kinh
tế học tài chính (122.208 bản báo cáo); Doanh nghiệp và chính sách (27.887 bản báo cáo); Hệ thống thông tin và Kinh doanh số (19.294 bản báo cáo); Luật (180.850 bản báo cáo); Khoa học chính trị (91.330 bản báo cáo); …
Trong lĩnh vực kinh tế học và luật kinh tế, hầu như tất cả các báo cáo khoa học hiện nay đều được xuất bản trước tiên trên SSRN dưới dạng bản in sơ bộ trước khi được chính thức đăng trên các tạp chí khoa học Ngay cả khi các báo cáo đã được xuất bản này bị giới hạn truy cập thì bản in sơ bộ vẫn được mở truy cập trên SSRN
Trang 12Trên SSRN, các tác giả có thể đăng tải tài liệu dạng PDF trực tiếp lên trang web Các tài liệu này sau đó cho phép tải xuống miễn phí trên toàn thế giới Bên cạnh đó, các nhà xuất bản và các tổ chức cũng có thể đăng tải các báo cáo khoa học có tính phí
Trang web này đánh giá và xếp hạng độ phổ biến của các tác giả và các báo cáo của họ theo số lượt tải xuống của tài liệu
Với SSRN, các nhà nghiên cứu về khoa học xã hội dễ dàng có được tài liệu tham khảo và chia sẻ công trình khoa học của mình ra toàn thế giới Trong kỷ nguyên thông tin hiện nay, nhu cầu thông tin của người dùng ngày càng cao đòi hỏi các thư viện không chỉ chú trọng việc nâng cao chất lượng phục vụ mà công tác bổ sung tài liệu, làm giàu kho tài nguyên cũng ngày càng được đặt ở vị trí then chốt Trước việc các ấn phẩm liên tục tăng giá cộng với ngân sách vốn dĩ hạn hẹp của thư viện thì sử dụng các trang web truy cập mở là một giải pháp rất khả thi Với ba ưu thế nổi trội là xóa bỏ rào cản về giá cả; xóa bỏ những hạn chế truy cập và tăng mức
độ ảnh hưởng – truy cập mở thực sự là một sáng kiến ưu việt trong thời đại số, đảm bảo sự tiếp cận công bằng các cơ hội thông tin và học tập cho mọi người dân, đồng thời nhấn mạnh vai trò sống còn của các thư viện và chuyên gia thông tin trong việc khai thác các khả năng vô hạn mà công nghệ hiện nay cung cấp để truy cập thông tin và cung cấp dịch vụ
3.2 Cơ sở dữ liệu OAJSE (Open Access Journals Search Engine) [5]
Dịch vụ truy cập mở CSDL OAJSE giới thiệu danh mục các tạp chí truy cập mở trên toàn cầu theo các chủ đề, môn loại khoa học cho phép tìm kiếm và khai thác miễn phí toàn văn các bài báo khoa học có kiểm soát chất lượng chặt chẽ theo đúng quy trình xuất bản Danh mục hiện có 4775 tạp chí và đều có thể tìm kiếm ở mức độ bài viết Đây là kết quả của một
dự án được phát triển từ năm 2008 có tên là “Liên kết thư viện của các tạp chí truy cập mở ” do tiến sỹ Badan Barman quản lý và xây dựng Từ năm
2011 được tài trợ bởi Đại học Mở, Bang Krishna Kanta Handiqui Ấn Độ