Quản l‎ý tài nguyên thông tin thuận tiện với Cơ sở dữ liệu KnowledgeBase

Một phần của tài liệu Những quan điểm của quá trình áp dụng cổng tìm kiếm siêu dữ liệu metalib tại trung tâm thông tin tƣ liệu viện khoa học và công nghệ việt nam (Trang 55 - 64)

8. Bố cục của khóa luận

2.2.5 Quản l‎ý tài nguyên thông tin thuận tiện với Cơ sở dữ liệu KnowledgeBase

KnowledgeBase

2.2.5.1 Cập nhật thông tin nhanh chóng trong Cơ sở dữ liệu KnowledgeBase

Hình 15: Các KnowledgeBase trong Metalib

Trong sơ đồ trên có thể nhận thấy tích hợp trong Metalib có 1 Central KnowledgeBase ( CKB) . Central KnowledgeBase là cơ sở dữ liệu của hệ thống

Inactive

IRD Record

Configuration Record (METALIB Institution)

VAST KnowledgeBase (VAST Institution) Central KnowledgeBase (METALIB Institution) IRD Record Active

Khoá luận tốt nghiệp

chứa thông tin mô tả về các tài nguyên. MetaLib Central KnowledgeBase và một hoặc nhiều Local KnowledgeBase. Central KnowledgeBase thuộc vào METALIB Institution, là đơn vị quản trị mặc định của Metalib, thông tin trong CKB không đƣợc thay đổi bởi Thủ thƣ mà sẽ đƣợc Exlibris cập nhật (sẽ đƣợc đề cập trong phần CKB Update).

Mỗi Local KnowledgeBase thuộc 1 đơn vị quản trị, là 1 bản sao của Central KnowledgeBase nhƣng có thể đƣợc cán bộ Trung tâm thay đổi thông tin cho phù hợp với nhu cầu riêng của Viện Khoa học và Công nghệ ( VAST Institution). Thông qua License của công ty ExLibris cấp cho Trung tâm 1 đơn vị quản trị là VAST Institution, đơn vị quản trị này có 1 Local KnowledgeBase sẽ đƣợc gọi là VAST KnowledgeBase .

Nguồn tài nguyên đƣợc thêm mới thƣờng xuyên, tiện lợi và không mất nhiều thời gian nhờ việc cập nhật thông tin đƣợc lƣu trữ trong KnowledgeBase , đó là thông tin mô tả và thông tin chức năng

Thông tin mô tả

Từ góc độ của thông tin mô tả, KnowledgeBase là một bộ sƣu tập siêu dữ liệu về tài nguyên. Mỗi tài nguyên đƣợc biên mục trong KnowledgeBase, là kết quả của sự hợp tác giữa Ex Libris, một đại diện của ở phía ngƣời sử dụng tài nguyên, và cũng là các thành viên của tổ chức thƣ viện, mỗi một thành viên nhƣ vậy có quyền giám sát và thêm vào những mục tiêu mới.

Thông tin mô tả ( ví dụ : tên, nhà xuất bản, bản, loại..) cho phép một nhà nghiên cứu xác định đƣợc những tài nguyên phù hợp với chủ đề cụ thể nào đó. Các thủ thƣ sử dụng thông tin mô tả nhƣ là một công cụ để trình bày bộ sƣu tập của thƣ viện theo một cách thức toàn diện nhất. Ngoài việc cung cấp cho ngƣời dùng dữ liệu giàu thông tin, trung thực, thủ thƣ còn có thể phân loại tài nguyên và gán những từ khóa tới tài nguyên đó. Ngoài ra, thủ thƣ còn có thể xây dựng

Khoá luận tốt nghiệp

cầu hình chuyển giao tài nguyên đến ngƣời dùng dựa trên cơ sở phân nhóm ngƣời dùng .

MetaLib sử dụng siêu dữ liệu của tài nguyên để cho phép ngƣời dùng xác

định vị trí tài nguyên mà họ quan tâm. Ví dụ, một danh mục tài nguyên mặc định đƣợc biên tập bởi thủ thƣ hình thành lên một cơ sở danh mục tài nguyên cá nhân của một cán bộ nghiên cứu nào đó. Cán bộ nghiên cứu này sau đó có thể sửa đổi danh mục này và thêm vào những tài nguyên khác mà họ quan tâm. Khi tìm kiếm thông tin, ngƣời dùng có thể lựa chọn tài nguyên từ một danh mục cá nhân hóa của mình hoặc sử dụng chức năng “Resource Locator” trong MetaLib để xác định vị trí tài nguyên cho một câu hỏi truy vấn cụ thể. Ngoài ra, cũng có thể lựa chọn chế độ làm việc với những tài nguyên đƣợc thƣ viện xây dựng sẵn.

Hầu hết thông tin mô tả đều sẵn có đối với ngƣời dùng một cách rõ ràng hoặc là ẩn chứa bên trong. Bất cứ lúc nào, một ngƣời dùng cũng có thể truy vấn thông tin về một tài nguyên. Khi tìm kiếm một tài nguyên cụ thể, ngƣời dùng mong muốn thấy tài nguyên hiển thị theo sự phân loại và tận dụng đƣợc thông tin đã lƣu trữ trƣớc đó. Ngƣời dùng chỉ thấy đƣợc tài nguyên mà một thƣ viện cài đặt trƣớc theo những quy luật trao quyền ngƣời dùng để cho phép họ có thể xem đƣợc.

Khoá luận tốt nghiệp Hình 16 : Cập nhật thông tin mô tả

Thông tin chức năng

Thông tin chức năng trong KnowlegeBase cho mỗi tài nguyên bao gồm cách thức hiển thị và cách thức truy vấn thông tin .

Thông tin về cài đặt các quy luật để biên dịch và truyền tải một câu hỏi truy vấn. Thông tin này đƣợc cung cấp trên 3 cấp độ: Phƣơng pháp truyển tải (ví dụ: tƣơng tác máy chủ tới máy chủ, hoặc HTTP); khổ mẫu mà câu hỏi truy vấn đó đƣợc truyền tải (ví dụ : nó có thể đƣợc gửi nhƣ câu hỏi truy vấn Z39.50 hoặc nhƣ một yêu cầu HTTP, hoặc đƣợc mã hóa trên đƣờng dẫn URL hoặc gửi trong một tài liệu XML); xây dựng lại chính câu hỏi truy vấn đó. Việc xây dựng lại câu hỏi truy vấn liên quan đến khả năng thích nghi một cú pháp truy vấn, khả năng ánh xạ các chỉ mục tìm kiếm, và khả năng chuyển đổi ký tự.

Thông tin cài đặt các quy luật cho biên dịch kết quả có đƣợc từ một tài nguyên. Thông tin này giống nhƣ thông tin của câu hỏi truy vấn và bao gồm quy luật cho phép biên dịch các biểu ghi có sự khác nhau về cấu trúc vật lý và cấu trúc logic, khổ mẫu biên mục (nhƣ MARC và MAB), và các bộ ký tự. Một khi các biểu ghi đƣợc biên dịch và chuyển đổi sang một khổ mẫu nội bộ thống nhất, thì các công cụ đƣợc lập trình tự động có thể hiện thị kết quả tới ngƣời dùng theo cùng một cách, so sánh các biểu ghi từ những tài nguyên khác biệt nhau, cung cấp dịch vụ

Khoá luận tốt nghiệp

Phù hợp cho từng loại biểu ghi cụ thể và nhiều dịch vụ khác.

Hình 17 :Cập nhật thông tin chức năng

Cập nhật KnowledgeBase

Cập nhật tài nguyên trong KnowledgeBase nhằm mục đích thêm mới nguồn tài nguyên trong CSDL, do nguồn tài nguyên đang tồn tại trong CSDL của Trung tâm đang bị thay đổi. thông tin thay đổi đƣợc tạo ra bởi Exlibris và đƣợc cán bộ của Trung tâm cập nhật thƣờng xuyên vào hệ thống

Các bƣớc cập nhật bao gồm :

Bƣớc 1: Thủ thƣ cập nhâ ̣t KnowledgeBase từ giao diện quản trị hoặc có thể đặt lịch để tự động cập nhật hàng tháng.

Bƣớc 2: Xem lại các tài nguyên đã thêm và đã thay đổi

Bƣớc 3: Thƣ̣c hiê ̣n thay đổi bằng tay đối với các tài nguyên đƣợc thay đổi

Bƣớc 4: Kiểm tra trong giao diện ngƣời dùng nhằm chắc chắn giao diện tài nguyên đã thay đổi trong giao diện ngƣời dùng hoạt động tốt.

Trƣớc hết cán bộ Trung tâm cần Đăng ký với MetaLib-Discuss Listserv để nhận email thông báo về các bản cập nhật Thông báo đƣợc gửi đi thƣờng tƣ̀ ngày 25 đến cuối tháng theo địa chỉ:

http://www.lsoft.com/scripts/wl.exe?SL1=METALIB-DISCUSS L&H=LISTSERV.ND.EDU

Khoá luận tốt nghiệp

Kích hoạt nếu thấy cần thiết (Đánh giá tài nguyên mục tiêu trƣớc khi kích hoạt – Free Search, OA hay Licensed)

Nếu kích hoạt thì cần cập nhật biểu ghi thông tin mô tả (Thêm thông tin mô tả, thông tin xác thực, phân quyền truy cập, phân nhóm tài nguyên)

o Đối với tài nguyên đƣợc thay đổi:

Chỉ thực hiện đối với tài nguyên đã đƣợc kích hoạt và cần thiết phải sửa đổi. Nhƣ̃ng phần cần sƣ̉a đổi: Thay đổi hostname: port

2.2.5.2 Hiển thị thống nhất các biểu ghi đã truy xuất khi đƣợc biên dịch phù hợp trong Cơ sở dữ liệu KnowledgeBase

KnowledgeBase chứa đựng một bộ quy luật đƣợc chƣơng trình xử lý liên tục theo chuỗi nhằm hoàn thành ngay một nhiệm vụ vừa đƣợc đƣa ra bởi ngƣời dùng; ví dụ, chuyển đi một câu hỏi truy vấn và xử lý kết quả trả về. Nhiều bảng chuyển đổi giúp chƣơng trình biên dịch các quy luật của mỗi loại tài nguyên cụ thể và hành động theo những quy luật này cho cả xử lý câu hỏi truy vấn và dữ liệu truy xuất về.

Quy luật áp dụng cho các câu hỏi truy vấn thực hiện những quy luật suy luận sử dụng một bộ chuyển đổi để chuyển câu hỏi truy vấn của ngƣời dùng vào một khổ mẫu phù hợp với đặc tính kỹ thuật của một đầu tìm kiếm tài nguyên. Ví dụ, . Một tài nguyên mục tiêu cụ thể nào đó yêu cầu tên tác giả trong câu hỏi truy vấn phải theo mẫu sau :

< LAST NAME > - < FIRST NAME > ?

Nếu một ngƣời dùng nhập vào một tên nhƣ là “ Hoàng, Minh” (trong cú

pháp tìm kiếm MetaLib) tên này phải đƣợc chuyển đổi sang “ HOÀNG - M ? ” Trong KnowlegdeBase, những chuyển đổi sau đây đƣợc xử lý liên tục theo chuỗi, đƣợc gán cho mỗi tài nguyên cụ thể :

(1) Thay đổi chuỗi ký tự từ chữ thƣờng sang chữ hoa (2) Loại bỏ dấu phẩy

Khoá luận tốt nghiệp

(3) Thay thế những ký tự cuối cùng và để lại ký tự đầu tiên

(4) Thay thế khoảng trống giữa hai chữ bằng một dấu gạch ngang (5) Đánh một dấu hỏi vào cuối từ

Bằng việc thực hiện một quy luật sẵn có nhƣ vậy, MetaLib thể hiện logic một quy trình chuyển đổi và làm cho quy trình này dễ dàng hơn đối với cán bộ Trung tâm để có thể theo dõi và điều chỉnh khi cần thiết – không giống nhƣ thói quen lập trình mà ngƣời ta thƣờng tạo ra một hộp đen (Black box) trong hệ thống. Với Metalib, một cán bộ không có kiến thức lập trình có thể dễ dàng cài đặt quy luật áp dụng cho mỗi tài nguyên cụ thể; chƣơng trình sau đó sẽ kích hoạt quy luật để tạo một câu hỏi truy vấn và theo dõi từng bƣớc theo đúng với tài nguyên mục tiêu ở xa. Giai đoạn tiếp theo MetaLib giúp xác định chỉ những kết quả mong muốn và nhân tố quyết định những quy luật nào sẽ đƣợc áp dụng.

Xử lý kết quả phức tạp hơn chuyển đi một câu hỏi truy vấn. Một khi các biểu ghi đƣợc truy xuất, khổ mẫu của chúng cần thiết đƣợc chuyển đổi vào một khổ mẫu chung. Sự chuyển đổi tất cả các kết quả vào một khổ mẫu thống nhất đem lại một số lợi ích:

 Một hiển thị thống nhất các biểu ghi mà chúng thƣờng khác biệt do sự ảnh hƣởng bởi giao diện gốc của tài nguyên mục tiêu

 Khả năng so sánh các biểu ghi, cho phép sắp xếp theo sự phù hợp cũng nhƣ kết hợp lại và loại bỏ trùng lặp trong danh mục kết quả cho dù biểu ghi trong các danh mục đó bắt nguồn từ các tài nguyên khác biệt nhau.

 Xây dựng một đƣờng dẫn OpenURL cho phép phát sinh các nối kết phù hợp ngữ cảnh (context-sensitive linking) tới các dịch vụ khác.

Tiếp đó, xử lý kết quả đòi hỏi một bộ quy luật cần đƣợc tuân thủ, các quy luật cho phép phần mềm ánh xạ trƣờng dữ liệu chính xác, chuyển đổi các bộ ký tự, phân tích cú pháp trƣờng dữ liệu để xuất ra siêu dữ liệu phù hợp cho việc sinh ra một đƣờng dẫn OpenURL, và nhiều yêu cầu khác nữa

Khoá luận tốt nghiệp

Giả sử, một trƣờng dữ liệu dƣới đây:

< Journal abbreviated name > < month > / < month > < year >, Vol.< volume > Issue < issue >, p < page >

Ví dụ :Macrobiotics Today May/June2002, Vol. 42 Issue 3, p25 Health June2002, Vol.16 Issue 5, p120

Cán bộ Trung tâm kích hoạt các quy luật để trích xuất thông tin cần thiết gồm: (1) Tên tạp chí ở trong vị trí đầu tiên và kết thúc trƣớc tên của một tháng

(2) Tên của một tháng đƣợc tiếp theo bởi năm nếu không có dấu “/”. Một năm có bốn chữ số.

(3) Sau chuỗi ký tự “Vol.” là số quyển, và tiếp đó là một khoảng trống

(4) Sau chuỗi ký tự “issue” là số xuất bản định kỳ, và tiếp sau đó là một khoảng trống

(5) Sau chuỗi ký tự “p” tiếp sau là số trang bắt đầu.

Cấu trúc KnowledgeBase và các chức năng chứa đựng trong nó đã cho phép Trung tâm cài đặt các cổng tài nguyên nhanh chóng, đồng thời tận dụng đƣợc KnowledgeBase trung tâm nhƣ là cơ sở tƣơng tác với các tài nguyên mục tiêu, và đƣa vào đó ngữ cảnh đặc thù và yêu cầu quản trị riêng của Trung tâm . Hơn thế nữa, chính KnowledgeBase bao gồm một tài nguyên giá trị có tính tiềm năng mà các chƣơng trình máy tính có thể truy cập trong một ngữ cảnh không sử dụng MetaLib để trích xuất thông tin chứa đựng trong đó.

2.2.6 Tùy biến và cá biệt hóa danh mục tài nguyên thông tin

Cổng thƣ viện phải cho phép tùy biến theo nhu cầu, cho phép tùy biến các danh mục tài nguyên theo từng nhóm ngƣời sử dụng, đƣợc định nghĩa theo tính chất của bộ phận, chức năng công việc hoặc các lĩnh vực quan tâm. Ngƣời sử

Khoá luận tốt nghiệp

dụng cũng cần cá biết hóa các vùng làm việc trong cổng thƣ viện, nó có thể chứa các lịch sử tìm kiếm, danh mục các nguồn tài nguyên yêu thích, tham chiếu đến các tài liệu hữu ích từng đƣợc thu thập và sử dụng. Các dịch vụ cá biệt hóa đặc trƣng bao hàm khả năng thực hiện tìm kiếm tự động trên các qui định cơ bản, với kết quả tìm kiếm đƣợc cung cấp bằng email, nhƣ vậy ngƣời sử dụng có thể thiết lập và quản lý các dịch vụ kiến thức riêng biệt của mình.

Tiêu chí đánh giá phần mềm này đƣợc thể hiện rõ nhất thông qua chức năng tạo lập khu vực nghiên cứu riêng của phần mềm Metalib mà tại Trung tâm đang áp dụng tính năng này khá hiệu quả. Khu vực nghiên cứu riêng ( My reseach) đây chính là không gian riêng dành cho ngƣời dùng khi đăng nhập vào hệ thống, là nơi mà ngƣời sử dụng đƣợc phép lƣu giữ những biểu ghi đã tìm thấy trong mỗi lần truy cập CSDL, tạp chí và bài báo, thông qua đó giúp ngƣời dùng tin lƣu giữ những thông tin trong những lẫn tìm kiếm trƣớc nhƣ : Xây dựng chủ đề tìm kiếm CSDL riêng; Xây dựng chủ đề tìm kiếm riêng; Lƣu thuật ngữ tìm kiếm; Lƣu từ khóa tìm kiếm; kích hoạt thông báo kết quả tìm kiếm mới tự động cho ngƣời dùng cá nhân . Khi một tìm kiếm đƣợc thực hiện ngƣời sử dụng có thể truy cập vào Menu Tìm kiếm trƣớc để kiểm tra lại thông tin đã tìm kiếm trƣớc. Ngoài ra với chức năng này của phần mềm ngƣời sử dụng có thể điển từ khoá cần tìm các lần tiếp theo, ghi lại địa chỉ Email của mình và nếu có tài liệu mới sẽ gửi vào địa chỉ Email cá nhân.

Ví dụ : Lựa chọn tìm kiếm tìm kiếm nhiều CSDL theo chủ đề nghiên cứu ( Vật l‎‎y và Thiên văn học ) với từ khoá tìm kiếm là “ Solar eclipse”, sau đó tích vào nút để xem thông tin về CSDL cần lựa chọn, tích vào dấu + để lựa chọn những CSDL phù hợp với yêu cầu tin. Nhƣ vậy, chúng ta đã lƣa chọn những tài liệu cần thiết sau khi tiến hành tìm kiếm trong CSDL của phần mềm. Vào tính

Khoá luận tốt nghiệp

năng tạo lập khu vực nghiên cứu riêng và mở CSDL của mình vừa lƣu trong quá trình tìm kiếm trƣớc ,nhấp chuột vào nút để tạo bộ sƣu tập của chủ đề nghiên cứu, ghi tên và miêu tả về bộ sƣu tập vừa tìm kiếm và cuối cùng chuyển các CSDL đã lƣa chọn vào tên bộ sƣu tập vừa tạo.

Hình 18 : Giao diện tạo lập khu vực nghiên cứu riêng

Nhƣ vậy, trong khu vực nghiên cứu riêng đã hiển thị những biểu ghi trong những lần tìm kiếm trƣớc và có 3 cách hiển thị : Xem dạng bảng; Xem dạng tóm tắt và xem dạng chi tiết.

Một phần của tài liệu Những quan điểm của quá trình áp dụng cổng tìm kiếm siêu dữ liệu metalib tại trung tâm thông tin tƣ liệu viện khoa học và công nghệ việt nam (Trang 55 - 64)

Tải bản đầy đủ (PDF)

(88 trang)