Chuẩn trao đổi dữ liệu

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu một số mô hình và giao thức thư viện điện tử (Trang 26 - 37)

Nội dung cần thống nhất liên thông

 Thống nhất về quy tắc mô tả tài liệu: sử dụng MARC21  Thống nhất về định dạng chủ đề và phân loại tài liệu  Thống nhất về định chủ đề và phân loại tài liệu.

 Thống nhất trong việc sử dụng phần mềm và các chuẩn công nghệ thông tin.

Nội dung trao đổi

 Trao đổi bản ghi biên mục  Thông qua tệp: ISO2709  MARC

 Thông qua Z39.50  Trao đổi tài liệu  Tài liệu số

Các yếu tố và vấn đề liên quan đến liên thông chia sẻ nguồn lực thông tin  Hạ tầng công nghệ thông tin

 Phần mềm

 Tuân theo các chuẩn trong thƣ viện và các chuẩn công nghệ thông tin  Yếu tố con ngƣời: các nhà lãnh đạo, quản lý và các cán bộ thực thi

Có thể dẫn chứng ra mô hình liên thông Thƣ viện quốc gia và các tỉnh thành đã triển khai trong nhiều năm qua.

Mục đích trao đổi thông tin

 Nhập dữ liệu từ thƣ viện Tỉnh/Thành phố lên thƣ viện Quốc gia.

 Thƣ viện Tỉnh/Thành phố truy cập, khai thác thông tin thƣ mục của Thƣ viện Quốc gia.

 Đảm bảo tính thống nhất và phát triển hệ thống.  Trao đổi liên thƣ viện.

Thực hiện quá trình trao đổi thông tin:

 Các thƣ viện tỉnh xuất các bản ghi thƣ mục cần chuyển lên Thƣ viện quốc gia ra tệp ISO 2790, hoặc dƣới dạng XML, hoặc dƣới dạng xuất nhập của Ilib.

 Thƣ viện tỉnh gửi tệp này lên cho Thƣ viện quốc gia thông qua mạng WAN.

 Thƣ viện Quốc gia kiểm tra lại tệp đã nhận và nhập chúng vào Cơ sở dữ liệu thông qua Module Nhập/Xuất dữ liệu.

 Các thƣ viện truy cập vào Web của Thƣ viện Quốc gia để khai thác thông tin thƣ mục tại Thƣ viện Quốc gia trên các giao diện thân thiện với ngƣời dùng tin.

 Các thƣ viện tỉnh cũng có thể thực hiện tra cứu trên cơ sở dữ liệu của các cơ quan thông tin – thƣ viện khác (trong nƣớc hoặc quốc tế) thông qua giao thức Z39.50 tại chính thƣ viện mình hoặc nối vào trang Web của Thƣ viện Quốc gia và quốc tế khác (Ví dụ nhƣ: tra cứu tại các cơ quan thông tin – thƣ viện các trƣờng đại học trong nƣớc hay tra cứu vào thƣ viện Quốc hội Mỹ,…) nhằm làm phong phú nguồn dữ liệu cho thƣ viện mình, phục vụ ngƣời dùng tin ngày một tốt hơn.

 Các thƣ viện tỉnh có thể sao các bản ghi từ cơ sơ dữ liệu của Thƣ viện Quốc gia bằng cách sử dụng Module Nhập/Xuất dữ liệu.

2.3 Chuẩn tra cứu liên thƣ viện Z39.50

Z39.50 là một chuẩn tìm kiếm và khai thác thông tin giữa các cơ quan thông tin – thƣ viện.

Ban đầu Z39.50 là một chuẩn quốc gia của Mỹ về khai thác thông tin. Tuy nhiên hiện nay, Z39.50 đƣợc cả thế giới công nhận nhƣ là một chuẩn chung về khai thác thông tin thay cho chuẩn tìm kiếm và khai thác thông tin. Là một chuẩn ứng dụng mạng, vì vậy Z39.50 là một chuẩn mở nên nó cho phép trao đổi thông tin giữa các hệ thống chạy trên phần mềm và các phần cứng khác.

Z39.50 đƣợc phát triển nhằm khắc phục những vấn đề liên quan đến việc tìm kiếm trong cơ sở dữ liệu ví dụ nhƣ phải biết hệ thống menu, ngôn ngữ tìm tin,…của mỗi hệ thống khác nhau. Z39.50 làm cho đơn giản hoá quá trình tìm kiếm bằng việc sử dụng giao diện tìm kiếm quen thuộc của hệ thống đó để tìm kiếm vốn tài liệu ở chính cơ quan thông tin – thƣ viện đó cũng nhƣ ở các cơ quan thông tin – thƣ viện mà ứng dụng chuẩn này.

Các chức năng tra cứu

Z39.50 server: cung cấp cho các thƣ viện khách Z39.50 khả năng tra cứu cơ sở dữ liệu của cơ quan thông tin – thƣ viện.

Z39.50 client: cung cấp cho cơ quan thông tin – thƣ viện khả năng tra cứu cơ sở dữ liệu của các cơ quan thông tin – thƣ viện khác qua Z39.50.

Z39.50 Getway: làm đầu mối gửi các yêu cầu tra cứu tới các máy chủ Z39.50. Ngƣời dùng tin không cần kết nối Internet trực tiếp, mà vẫn tra cứu đƣợc các máy chủ Internet.

Tra cứu và nhập dữ liệu biên mục qua Z39.50

Để tra cứu đƣợc dữ liệu thông qua Z39.50, cần biết ba yếu tố sau: Tên máy chủ

Cổng truy cập Tên cơ sở dữ liệu

Sử dụng các chƣơng trình xuất nhập dữ liệu để lấy dữ liệu từ Internet thông qua giao thức Z39.50. Cán bộ làm công tác biên mục có thể sử dụng chuẩn này để tra cứu trực tiếp vào các cơ sở dữ liệu trực tiếp trên mạng để tải về các bản ghi thƣ mục đã đƣợc xử lý để tái sử dụng lại. Công việc duy nhất còn lại là bổ sung thêm chỉ số xếp giá hoặc đăng ký cá biệt cho bản ghi thƣ mục này. Tại Việt Nam, cán bộ biên mục khi xử lý tài liệu có thể tải bản ghi thƣ mục tại hai địa chỉ sau: nếu là tài liệu nƣớc ngoài thì có thể tải dữ liệu thƣ mục từ Thƣ viện Quốc hội Mỹ, nếu là tài liệu tiếng Việt thì có thể tải dữ liệu thƣ mục từ Thƣ viện Quốc gia Việt Nam.

Tên thƣ viện Tên máy chủ Cổng CSDL

Đại học Quốc gia Australia Library.anu.edu.au 210 INNOPAC Amsterdam Public Library 194.171.56.160 8000 Catalogue OBA Thƣ viện Quốc hội Mỹ Z3950.loc.gov 7090 Voyager

Viện công nghệ Massachusetts Library.mit.edu 210 ADVANCE Thƣ viện Quốc gia Australia ilms.nla.gov.au 210 NLA

Thƣ viện New Zealand saturn.natlib.govt.nz 210 Pinz

Đại học Oxford libray.ox.ac.uk 210 ADVANCE

Thƣ viện Quốc gia Việt Nam www.nlv.gov.vn 210 Default

Bảng 1: Một số địa chỉ Z39.50 trên Internet

2.3.1 Khái niệm về Z39.50

Z39.50 là gì: Z39.50 là một giao thức tiêu chuẩn quốc tế đƣợc sử dụng bởi hệ thống máy tính kết nối mạng để lấy thông tin. Z39.50 cho phép ngƣời tìm tin tìm kiếm nhiều hệ thống khác nhau trên mạng hoặc Internet thông qua việc sử dụng một giao diện ngƣời dùng duy nhất. Nhiều nhà cung cấp phần mềm và hệ thống đem đến cho ngƣời dùng khả năng truy cập thông tin từ một sự đa dạng các hệ thống cá biệt, khác nhau từ phần cứng, phần mềm, giao diện, đến các câu lệnh tìm kiếm cơ sở dữ liệu. Thách thức lớn với ngƣời dùng là Internet cung cấp

khả năng truy cập tới một khối lƣợng khổng lồ các cơ sở dữ liệu đang phát triển hàng ngày. Thách thức đối với ngƣời tìm kiếm là làm sao để tìm thấy thông tin cần thiết giữa mảng thông tin rộng lớn một cách ít đau khổ nhất. Mục tiêu của chuẩn Z39.50 là giảm sự phức tạp và khó khăn của việc tìm kiếm và lấy thông tin.

Z39.50 làm cho việc sử dụng các nguồn tài nguyên thông tin giàu có trên Internet đƣợc dễ dàng hơn. Khi sử dụng một hệ thống hỗ trợ Z39.50, một ngƣời dùng trong một hệ thống có thể tìm kiếm thông tin điện tử trong hệ thống khác mà không cần phải biết cách làm việc của hệ thống đó.

Z39.50 hoạt động như thế nào: Z39.50 hoạt động trong môi trƣờng khách /

chủ, nó đóng vai trò nhƣ một ngôn ngữ chung mà tất cả các hệ thống hỗ trợ Z39.50 đều có thể hiểu đƣợc. Nó nhƣ là một quốc tế ngữ _ Esperanto và làm cầu nối "nhiều ngôn ngữ và tiếng địa phƣơng" mà hệ thống thông tin khác nhau “nói”. Để thực hiện giao tiếp và tƣơng tác với Z39.50, cả máy khách và máy chủ phải sử dụng ngôn ngữ Z39.50. Hầu hết các triển khai Z39.50 sử dụng chuẩn TCP / IP giao thức truyền thông Internet để kết nối các hệ thống và phần mềm tƣơng thích Z39.50 để dịch giữa chúng phục vụ việc tìm kiếm và thu thập thông tin. Đối với ngƣời sử dụng, các công việc này đƣợc thực hiện sau hậu trƣờng; họ chỉ đơn thuần nhìn thấy giao diện tìm kiếm và hiển thị kết quả thông thƣờng. Để đạt đƣợc khả năng tƣơng tác này, Z39.50 tiêu chuẩn hóa các thông điệp mà máy khách và các máy chủ sử dụng cho truyền thông, bất kể những gì bên dƣới nhƣ phần mềm, hệ thống, hay nền tảng đƣợc sử dụng.

Z39.50 hỗ trợ các hệ thống mở, có nghĩa là nó độc lập với chủ sở hữu hay các nhà cung cấp. Một hệ thống khách thực thi giao thức Z39.50 cho phép giao tiếp với nhiều máy chủ khác nhau, các hệ thống máy chủ hỗ trợ giao thức này thì cho phép tìm kiếm từ các hệ thống khách đƣợc phát triển bởi các nhà cung cấp khác nhau. Không cần phải biết hệ thống máy chủ hoạt động thế nào, ngƣời dùng thực hiện các tìm kiếm thông qua giao diện Z39.50 trên máy khách. Z39.50 chi phối việc các máy khách “dịch” yêu cầu tìm kiếm sang một định dạng chuẩn để gửi đến máy chủ. Sau khi nhận đƣợc yêu cầu tìm kiếm, máy chủ sử dụng quy tắc Z39.50 để “dịch” yêu cầu tìm kiếm vào một định dạng đƣợc công nhận bởi các cơ sở dữ liệu cục bộ, thực hiện tìm kiếm, và trả về kết quả cho máy khách của ngƣời dùng. Phần mềm giao diện ngƣời dùng của máy khách xử lý kết quả trả về qua Z39.50, với mục tiêu hiển thị càng gần với cách các bản ghi đƣợc trình diễn trong hệ thống cục bộ của ngƣời dùng càng tốt.

2.3.2 Giải pháp và lợi ích của Z39.50

Z39.50 ban đầu đƣợc thiết kế để trợ giúp tìm kiếm với cơ sở dữ liệu rất lớn nhƣ các mục lục của OCLC và Thƣ viện Quốc Hội Mỹ. Ngày nay Z39.50 đƣợc sử dụng cho một phạm vi rộng lớn các chức năng của thƣ viện bao gồm tìm kiếm cơ sở dữ liệu, từ biên mục tới mƣợn liên thƣ viện tới tham chiếu. Với sự phát triển nhanh chóng của Internet, tiêu chuẩn Z39.50 đã trở nên đƣợc chấp nhận rộng rãi nhƣ là một giải pháp cho các thách thức trong việc thu thập thông tin đa phƣơng tiện bao gồm cả văn bản, hình ảnh, và tài liệu số hóa. Z39.50 đƣợc sử

dụng để truy cập tới các nguồn thông tin đa dạng ví dụ nhƣ dữ liệu bảo tàng, thông tin chính phủ, và các dữ liệu không gian địa lý. Nó cũng có thể đƣợc sử dụng để tìm kiếm cơ sở dữ liệu trực tuyến và CD-ROM mà các nhà cung cấp phát triển theo nhiều các đề án thiết kế đa dạng. Không cần phải tìm hiểu từng hệ thống, ngƣời dùng có thể tìm kiếm các cơ sở dữ liệu đó với một máy khách Z39.50 duy nhất, mặc dù mỗi hệ thống sử dụng một cấu hình phần cứng và phần mềm khác nhau, lƣu trữ các loại dữ liệu khác nhau, và có logic khác nhau trong việc tìm kiếm cục bộ.

Truy cập liền mạch

Khả năng truy cập liền mạch tới nhiều các cở sở dữ liệu đa dạng thông qua một giao diện là lợi ích to lớn nhất của Z39.50.

Thêm khả năng hoạt động theo tiêu chuẩn Z39.50 vào một hệ thống thông tin cho phép hệ thống thông tin duy trì tính duy nhất của họ trong khi cung cấp một giao diện thống nhất cho ngƣời tìm thông tin.

Các thƣ viện có thể thông qua một giao diện duy nhất đã đƣợc tiêu chuẩn hóa cho phép độc giả của họ truy cập tới mục lục của thƣ viện, các CDROM đã mua, các cơ sở dữ liệu đã đặt trực tuyến và các nguồn tài nguyên Internet.

Dữ liệu từ nhiều nguồn khác nhau có thể đƣợc trích ra một định dạng phổ biến để sử dụng ngoại tuyến hoặc nhập vào một cơ sở dữ liệu cục bộ.

Chia sẻ tài nguyên

Z39.50 thúc đẩy việc chia sẻ tài nguyên trên quy mô rộng. Trong cộng đồng thƣ viện, ví dụ, Z39.50 hỗ trợ:

Tìm kiếm diện rộng tới các mục lục thƣ viện nằm trên Internet ở bất cứ nơi nào trên thế giới.

Mƣợn liên thƣ viện với cách tiếp cận theo chuẩn Z39.50 để truyền tải thông tin về vốn tƣ liệu, và đặt mƣợn, chuyển giao tài liệu trực tuyến.

Một số lƣợng đáng kể các mục lục thƣ viện đã sẵn sàng cho tìm kiếm Z39.50 thông qua liên kết từ trang web của Thƣ viện Quốc Hội Mỹ, và ngày càng có thêm theo thời gian. Vì ngày càng nhiều các tổ chức thiết lập truy cập mạng tới các bộ sƣu tập số hóa điện tử, chia sẻ các nguồn tài nguyên đang xác lập một ý nghĩa mới trên cơ sở là tài liệu và sách vật lý dành cho mƣợn liên thƣ viện.

Tăng năng suất

Bởi vì các giao diện tìm kiếm của các hệ thống khác nhau là trong suốt, ngƣời dùng không còn cần phải làm chủ việc làm thế nào để sử dụng mỗi cơ sở dữ liệu, tránh một đƣờng cong học tập có khả năng dốc. Thời gian đào tạo đội ngũ nhân viên có thể đƣợc giảm cho các chức năng cần đến việc tìm kiếm cơ sở dữ liệu, ví dụ nhƣ biên mục, bổ sung, và mƣợn liên thƣ viện. Khả năng truy cập dễ dàng hơn tới các nguồn tài nguyên điện tử làm giảm tổng thời gian ngƣời dùng chi phí cho việc tìm kiếm thông tin liên quan.

2.3.3 Tóm lƣợc lịch sử phát triển của Z39.50

Z39.50 phát triển vƣợt ra khỏi Dự án Hệ Thống Liên Kết - Linked Systems Project (LSP), một sáng kiến trong những năm 1980 để chuẩn hóa tìm kiếm của các cơ sở dữ liệu thƣ mục chính của OCLC, Thƣ viện Quốc Hội Mỹ, Mạng Thƣ

Viện Washington - Washington (Western) Library Network (WLN), và các Thƣ viện Thông tin Nghiên cứu của Nhóm Thƣ viện Nghiên cứu - Research Libraries Group (RLG).

Làm việc song song với các sáng kiến LSP là nỗ lực tiêu chuẩn hóa trên một giao thức truy vấn thông tin cho các ứng dụng thƣ viện dƣới sự bảo trợ của NISO. Các giao thức đƣợc phát triển từ LSP chuyển đến NISO và đƣợc tiếp tục phát triển thành Z39.50 tiêu chuẩn thu hồi thông tin, đã đƣợc phê duyệt nhƣ là một tiêu chuẩn NISO năm 1988.

Thƣ viện Quốc Hội Mỹ (LC)đã đƣợc chỉ định chính thức là Cơ quan Bảo trì và đăng ký quyền đối với tiêu chuẩn Z39.50. Nhƣ vậy, LC cung cấp thông tin liên quan đến sự phát triển và bảo trì Z39.50 các phiên bản hiện tại và tƣơng lai, cũng nhƣ về việc thực hiện và sử dụng giao thức Z39.50.

Một nhóm đƣợc gọi là Nhóm thực hiện Z39.50 (Z39.50 Implementors’ Group - ZIG) đảm nhận một vai trò chính trong sự phát triển liên tục. Kết hợp với Cơ quan Bảo trì Z39.50, ZIG đã phát triển phiên bản 2 và 3 của giao thức Z39.50 (1992 và 1995 tƣơng ứng). NISO sử dụng sự đồng thuận bình thƣờng của nó và thủ tục biểu quyết để phê duyệt các phiên bản nhƣ là Tiêu chuẩn quốc gia.

Chỉ trong hơn một thập kỷ, Z39.50 đã phát triển qua ba phiên bản, với mỗi phiên bản thêm chức năng tốt hơn và tinh tế hơn.

- Phiên bản 1 đƣợc xác định các dịch vụ cốt lõi của Z39.50.

- Phiên bản 2 chính thức hoá cấu trúc của thông tin trao đổi dựa trên các tiêu chuẩn ISO về ngôn ngữ mô tả dữ liệu và các quy tắc mã hóa đƣợc biết đến nhƣ ASN.1 BER. Với sự đồng thuận về Z39.50 phiên bản 2, các nhà cung cấp đã bắt đầu tạo ra các ứng dụng nhanh chóng và là đà phát triển cho việc phát triển các chức năng tuân thủ Z39.50.

- Phiên bản 3, phiên bản hiện tại của tiêu chuẩn, xây dựng bao gồm phiên bản 2. Phiên bản 3 là cực kỳ tốt trong việc hỗ trợ cho các ứng dụng đơn giản đến phức tạp.

- Phiên bản hiện tại của tiêu chuẩn Z39.50 chính thức đƣợc biết đến nhƣ ANSI / NISO Z39.50-1995, định nghĩa dịch vụ và đặc tả giao thức cho các ứng dụng thu hồi thông tin - Information Retrieval Application. Tổ chức tiêu chuẩn quốc tế ISO đã phê duyệt hai tiêu chuẩn thu hồi thông tin trong năm 1993 (ISO 10162 và ISO 10163-1). Năm 1998, ISO đã thông qua giao thức Z39.50 và ban hành thông tin và tài liệu tiêu chuẩn ISO 23950 – Information retrieval (Z39.50), thu hồi hai tiêu chuẩn trƣớc đó.

Z39.50 toàn cầu

Z39.50 đƣợc công nhận trên toàn thế giới nhƣ là tiêu chuẩn quốc tế để tìm kiếm và thu hồi thông tin trên mạng. Sự hội tụ của Z39.50 và ISO 23.950 đã dẫn đến

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Nghiên cứu một số mô hình và giao thức thư viện điện tử (Trang 26 - 37)

Tải bản đầy đủ (PDF)

(63 trang)