8. Dự kiến kết quả nghiên cứu
2.1 Ứng dụng CNHĐ trong các khâu xử lý nghiệp vụ
2.1.3 Xây dựng các sản phẩm thông tin – thư viện
Sản phẩm TT-TV là kết quả của quá trình xử lý TT, do cá nhân/tập thể thực hiện nhằm thỏa mãn nhu cầu của NDT. Quá trình lao động để tạo ta sản phẩm là
quá trình xử lý TT bao gồm: biên mục, phân loại, định từ khóa, tóm tắt, chú giải,
biên soạn tổng quan,… cũng như các q trình phân tích, tổng hợp TT [42].
Ngày nay, với sự tác động của CNHĐ sản phẩm TT-TV trở nên đa dạng về loại hình, tính tiện nghi, tiện lợi được mở rộng và nâng cao về chất lượng từ đó tạo
điều kiện cho NDT khai thác và sử dụng một cách hiệu quả.
phẩm thư mục, CSDL thư mục, CSDL tồn văn, cổng thơng tin TV (library portal), bản tin truyền thống, bản tin điện tử,... và đa số các sản phẩm này đã ứng dụng
CNHĐ để xây dựng.
¾ Cơ sở dữ liệu:
Với sự phát triển mạnh mẽ của CNTT và truyền thông các hệ quản trị CSDL ngày nay có khả năng lưu trữ khối lượng dữ liệu với dung lượng lớn. Bên cạnh đó các chuẩn trong thiết kế CSDL, phương thức quản trị và khai thác theo hướng người dùng cũng đang được quan tâm phát triển nên khá thuận lợi cho người sử dụng.
Chính vì vậy, ngay từ ngày đầu trang bị phần mềm quản lý TV với phần mềm Iporlib do công ty IeS cung cấp TTTT-TV trường ĐHNH Tp.HCM đã lựa chọn hệ quản trị CSDL Oracle10g để xây dựng và quản trị toàn bộ CSDL của mình. Khi thay đổi phần mềm mới thì PSCzLis sử dụng hệ quản trị CSDL cho 3 yêu cầu khác nhau: XML để lưu biểu ghi MARCXML với tốc độ truy vấn <100ms cho CSDL có thể lên tới trên 20 triệu biểu ghi, sử dụng MS SQL Server để lưu trữ các TT quản lý như nhà cung cấp, chi tiết hóa đơn, số cá biệt, hồ sơ độc giả, lịch sử mượn trả,... và Lucene Search Engine (Lucene là phần mềm mã nguồn mở, dùng để phân tích, đánh chỉ mục và tìm kiếm TT với hiệu suất cao bằng Java) để lưu dữ liệu chỉ mục của tài liệu điện tử.
CSDL thư mục chứa các TT giúp bạn đọc thơng qua nó để tra cứu đến tài liệu gốc. “CSDL thư mục trở thành một cơng cụ lưu trữ và tìm kiếm TT tự động hóa khơng thể thiếu được trong các cơ quan TT-TV hiện nay” [35]. Việc ứng dụng phần mềm quản lý TV với hệ quản trị CSDL My SQL Server là nền tảng đến nay TTTT- TV trường ĐHNH Tp.HCM đã xây dựng được một CSDL thư mục khá đầy đủ về
các loại tài liệu có trong TV với khoảng 22.356 biểu ghi..
Xây dựng CSDL toàn văn luận văn thạc sỹ, luận án tiến sỹ, cơng trình nghiên cứu khoa học trên nền tảng phần mềm Greenstone theo chuẩn dữ liệu Dublin code với 15 trường cơ bản (Chúng tơi sẽ trình bày sâu hơn về Greenstone ở phần sau). Xây dựng CSDL tồn văn tạp chí chun ngành với hơn 10.000 biểu ghi.
¾ Cổng thơng tin: Địa chỉ http://library.buh.edu.vn
Cổng thông tin (Portal) là một công cụ hay dịch vụ, tập hợp tất cả các TT lại với nhau, liên kết chúng lại sau để cung cấp cho một số lượng lớn người khai thác, truy cập và hình thành một cộng đồng người sử dụng. Trong thực tế, Portal có thể
đơn giản được coi như là một phần mềm hệ thống nền với cơng nghệ Web, cung
cấp một điểm tích hợp truy cập duy nhất tới tất cả các TT, ứng dụng và dịch vụ cho mọi đối tượng người sử dụng.
Từ năm 2004 cổng thơng tin chính thức của TTTT-TV trường ĐHNH
Tp.HCM đã được xây dựng để giới thiệu, phổ biến TT tới NDT. Đến nay, TV đã có một cổng thơng tin dựa trên sản phẩm PSC Portal do Cty Kim tự tháp cung cấp.
Cấu trúc cổng thông tin TV bao gồm: Các dịch vụ công cộng và nhiều dịch vụ khác khi người sử dụng đăng nhập, cho phép quản lý đăng tải TT giới thiệu về cơ sở vật chất trang thiết bị TV, các quy trình hoạt động, trang tin tức hoạt động,
thông báo, TT hướng dẫn, TT liên hệ.
Trang TT giới thiệu sách mới tích hợp mã QR (Quick Response - Đáp ứng
nhanh). Mã QR là một mã ma trận cho phép mã hóa và giải mã với phần mềm ứng dụng kèm theo ở tốc độ cao được phát triển bởi công ty Denso Wave (Nhật Bản)
vào năm 1994. Các mã QR được sử dụng phổ biến khá thông dụng ở Nhật Bản, ban
đầu mã QR được dùng để theo dõi các bộ phận trong sản xuất xe hơi, hiện nay nó được dùng trong quản lý kiểm kê ở nhiều ngành khác nhau. Phần mềm đọc mã QR đã được phát triển phiên bản cài đặt trong điện thoại di dộng có gắn camera. Điều
này đưa đến các ứng dụng mới và đa dạng đối với người sử dụng, giúp việc nhập dữ liệu vào điện thoại di động một cách nhanh chóng. Ở Việt Nam điện thoại di động
đang trở nên phổ biến, mã QR có thể chứa tới 4.000 ký tự cùng lúc chữ và số. Vì
vậy, trang thông báo sách mới trên cổng thông tin đã ứng dụng để mã hóa nội dung biểu ghi thư mục của tài liệu giúp NDT có thể ghi nhận trực tiếp vào điện thoại di
động nhằm tạo lập một danh mục cho cá nhân. (Xem Phụ lục 3: Ứng dụng QR)
thác nguồn lực TT của TV, phân hệ quản trị TV có thể theo dõi và xem báo cáo thống kê một số hoạt động nghiệp vụ TV, phân hệ dành riêng cho NDT, cung cấp các đường liên kết để truy cập vào các CSDL trực tuyến do TV xây dựng bằng phần mềm TVS Greenstone hoặc CSDL thương mại và các bộ sưu tập chuyên biệt.
Mỗi độc giả đăng nhập vào cổng thông tin TTTT-TV trường ĐHNH
Tp.HCM, ngồi việc tìm hiểu các TT về TV, sử dụng dịch vụ giao tiếp trực tuyến (chat reference), các dịch vụ yêu cầu bổ sung tài liệu, hỏi đáp qua web,... cổng
thơng tin cịn cung cấp các dịch vụ TT liên quan tới giao dịch mượn trả tài liệu giữa NDT với TV, gia hạn và nhận thông báo quá hạn thông qua trang cá nhân hoặc dịch vụ email.
Với mục tiêu xây dựng cổng thông tin là trung tâm hệ thống TT-TV thực hiện chức năng thống nhất các nguồn tài nguyên TT trên hệ thống và tổ chức cung cấp TT tới người sử dụng đảm bảo người sử dụng có thể truy nhập và khai thác TT mọi lúc, mọi nơi với hiệu quả cao nhất. Nhưng đến nay, các tính năng của cổng
thơng tin cần được hồn thiện để có thể đáp ứng được những yêu cầu đặt ra trong
thời đại phát triển mạnh mẽ của TVĐT, TVS.
¾ Ấn phẩm thư mục chuyên ngành, chuyên đề:
Để xây dựng và xuất bản ấn phẩm TT thư mục chuyên ngành, chuyên đề tại
TTTT-TV trường ĐHNH Tp.HCM, sử dụng tính năng truy vấn SQL cho môn học, cho sưu tập chuyên đề trên hệ thống phần mềm quản lý TV PSCzLis. Nhu cầu tìm tài liệu theo mơn học của đại đa số nhóm đối tượng sinh viên là rất lớn, tính năng
này để giới thiệu tài liệu có liên quan tới các mơn học trong chương trình đào tạo
của nhà trường. Trên cơ sở nhận định mỗi môn học, chuyên ngành, chuyên đề đều phản ảnh một hoặc một vài lĩnh vực nhất định, điều này liên quan mật thiết đến ký
hiệu phân loại trong hoạt động TT-TV mà phần mềm quản lý TV PSCzLis đã cung cấp tính năng truy vấn theo các câu lệnh SQL để cho xuất ra các thư mục trên web. Thực hiện trực tiếp trên CSDL đang hoạt động trên phần mềm quản lý TV hiện thời. Chỉ thực hiện truy vấn lần đầu, sau đó danh mục tài liệu tăng dần theo cấu trúc truy
vấn cho mỗi tên môn học/chuyên đề. Mặc dù vậy chất lượng của câu truy vấn phụ thuộc vào sự am hiểu của cán bộ TV về phân loại, định chủ đề và phương pháp truy vấn SQL. Nếu truy vấn khơng chính xác và đầy đủ thì dễ dẫn tới xuất hiện các tài liệu khác lĩnh vực hoặc tài liệu khơng mong muốn có trong mơn học, chuyên đề, chuyên ngành mà TV xây dựng. (Xem Phụ lục 4: Truy vấn theo môn học)
Xong trên thực tế thì tính năng này chưa được khai thác hiệu quả do sự liên kết giữa phần mềm quản lý TV và phần mềm đào tạo tín chỉ của nhà trường chưa được thực hiện. Dữ liệu các môn học, ngành học chưa được chia sẽ, liên kết giữa
hai phần mềm nên tên môn học, ngành học chưa thật sự chính xác từ đó dẫn tới các truy vấn đưa ra kết quả khơng chính xác và phù hợp.
Trong thời gian qua TTTT-TV trường ĐHNH Tp.HCM đã có nhiều cố gắng trong việc xây dựng các sản phẩm TT-TV phục vụ nhu cầu của NDT. Tuy nhiên, sản phẩm của Trung tâm cịn ít về số lượng, chưa đa dạng và chất lượng cũng còn nhiều hạn chế cần được quan tâm đầu tư nhiều hơn nữa.
¾ Xây dựng các bộ sưu tập số
Bộ sưu tập số là một tập hợp có tổ chức nhiều tài liệu đã được số hố dưới
nhiều hình thức khác nhau (văn bản, hình ảnh, audio, video…) về một hoặc một số chủ đề. Để xây dựng bộ sưu tập số hoá người ta phải thực hiện thu thập nguồn tài liệu được lưu trữ dưới dạng số hoặc tài liệu bản in đã được số hoá chuyển dạng tài liệu hoặc TT số hóa đã được chuyển đổi bởi các thiết bị TT và các phần mềm tin
học, sau đó lưu trữ chúng trong các thư mục thích hợp trước khi xây dựng bằng các phần mềm máy tính.
Tài liệu số là đơn vị căn bản từ đó các bộ sưu tập số được xây dựng, một bộ sưu tập số có thể chứa nhiều loại tài liệu khác nhau, với dạng thức trình bày khác nhau, nhưng nó cần cung cấp một giao diện đồng nhất mà qua đó các tài liệu có thể truy cập, tìm kiếm và sử dụng dễ dàng. Tài liệu số có thể thực hiện bổ sung từ các nguồn khác nhau như nguồn mua, nguồn trao đổi, nhận tặng, nguồn tải từ mạng toàn cầu (internet) hoặc nguồn tự số hóa.
Một TVS có thể xây dựng nhiều bộ sưu tập số theo các chủ đề khác nhau, mỗi sưu tập được tổ chức khác nhau phù hợp với những đặc tính của mỗi loại tài
liệu, có thể do tập thể hoặc cá nhân tự xây dựng hoặc trao đổi, mua bán, có thể nằm trong lưu trữ của TV nhưng cũng có thể nằm ngồi TV thơng qua một kênh cung cấp từ phía đối tác. Ngoài ra để xây dựng những bộ sưu tập số, TV có thể thực hiện việc tự tạo lập siêu dữ liệu (metadata) hoặc gặt hái metadata. Tạo lập metadata là chủ động biên mục tài liệu sưu tầm được để xây dựng những bộ sưu tập số với đầy
đủ nội dung được lưu trữ trên server của TV mình; trong khi gặt hái metadata được
dùng để xây dựng những bộ sưu tập số chỉ bao gồm metadata, tuy nhiên qua từng siêu dữ liệu thư tịch trong bộ sưu tập ta có thể truy cập đến nội dung của tài liệu ở khắp nơi – Đây là hình thức Thư viện ảo [25, tr.18].
Những bộ sưu tập như thế có thể được xây dựng bằng một hoặc một số phần mềm (Phần mềm quản lý TV tích hợp phân hệ xây dựng và quản lý tài liệu số, phần mềm Greenstone, Dspace, Dlib,...), tuy nhiên yêu cầu về sự giống nhau về phương cách hiển thị và một giao diện đồng nhất qua đó các tài liệu có thể truy cập, tìm
kiếm và sử dụng dễ dàng.
Phần mềm TVS được ứng dụng để xây dựng bộ sưu tập số cần những cấu
trúc hỗ trợ cho việc truy tìm, lướt tìm và truy cập nguồn tài liệu số. Khi xây dựng xong, bộ sưu tập số có thể được xuất bản trên Internet hoặc xuất ra CD-ROM một cách hoàn toàn tự động, khi sưu tầm thêm tài liệu mới có thể dễ dàng bổ sung thêm vào bộ sưu tâp bằng cách tái xây dựng.
Hiện nay, TTTT-TV trường ĐHNH Tp.HCM bổ sung tài liệu số thông qua
nguồn mua với 140 luận án tiến sĩ bằng tiếng anh, 261 cơng trình nghiên cứu khoa học trong nước đã được cơng bố dưới dạng file .pdf, ngồi ra TV cịn mua quyền truy cập CSDL điện tử ProQuest và Willson từ năm 2010 đến nay. Nguồn trao đổi, nhận tặng các luận văn, luận án, cơng trình nghiên cứu khoa học với TV Trường
Đại học Kinh tế Tp.HCM. Nhận file luận văn, luận án từ các học viên sau đại học
lĩnh vực kinh tế – tài chính – ngân hàng: Luận án, luận văn, cơng trình NCKH đã
được bảo vệ thành cơng; Các bài báo, tạp chí; Kỷ yếu hội thảo, tài liệu hội nghị;...
Tiêu chí lựa chọn tài liệu số hóa được sắp xếp theo thứ tự ưu tiên: Tình trạng bản quyền của tài liệu bảo đảm không vi phạm bản quyền khi thực hiện số hóa, nhu cầu của NDT, nội dung tài liệu, mức độ ưu tiên thực hiện, điều kiện bảo quản tài liệu;…
Đối với nguồn tài liệu số thu thập từ nguồn mua, trao đổi lưu trữ dưới dạng
file, TTTT-TV trường ĐHNH Tp.HCM sử dụng các phần mềm ứng dụng để xử lý
file như kiểm tra định dạng, dung lượng, bảo mật, chất lượng,…và chuyển dạng về các định dạng phù hợp, dung lượng đảm bảo lưu trữ, khơng cịn chế độ bảo mật
bằng mật khẩu, chất lượng tốt đảm bảo khả năng phân phối và sử dụng.
Đối với việc xây dựng bộ sưu tập số từ nguồn tự số hóa TTTT-TV trường ĐHNH Tp.HCM sử dụng các máy quét ảnh Canon 5010c, HP5590, máy tính và các
phần mềm hỗ trợ để chuyển dạng tài liệu sang file hình ảnh .pdf (một chuẩn được sử dụng rộng rãi trong số hoá tài liệu bằng phương pháp quét ảnh) với tốc độ quét khá chậm sau đó các file tài liệu được sử dụng phần mềm Adobe Acrobat 7.0
Professional thực hiện hiệu chỉnh hình ảnh cho file: xóa vết đen, chính lề trang,… để chuẩn bị cho các giai đoạn tiếp theo là nhận dạng quang học tài liệu.
Toàn bộ tài liệu số hiện chưa được nhận dạng quang học, đang được lưu trữ trên 2 máy chủ (server) 1 đặt tại TV, 1 đặt tại Công ty Truyền tải số liệu 2 (VDC2).
Để xây dựng các bộ sưu tập số hiện nay TV sử dụng song song 2 phần mềm:
Phần mềm quản lý TV PSCzLis ứng dụng để xây dựng bộ sưu tập số báo –
tạp chí chuyên ngành kinh tế - tài chính – ngân hàng. Biên mục đầy đủ TT thư mục của tài liệu số hóa theo chuẩn MARC 21 và tạo đường liên kết tới tài liệu số để cho người sử dụng có thể khai thác thơng qua cổng thơng tin TV với tính năng đăng
nhập trên trang cá nhân.
Phần mềm nguồn mở TVS Greenstone ứng dụng để xây dựng các bộ sưu tập luận văn, luận án, công trình nghiên cứu khoa học, hình ảnh hoạt động của trường
và nhu cầu của NDT. Biên mục tài liệu số theo chuẩn Dublin Core sử dụng dự trên 15 trường cơ bản của Greenstone.
Trong thời gia từ năm 2008 đến nay công tác xây dựng và phát triển các bộ sưu tập số đã được quan tâm đầu tư nhiều hơn, xong do những hạn chế nhất định cả về kinh phí, nhân lực, quy trình, hạ tầng công nghệ và cả việc ứng dụng hiệu quả các công nghệ đang được ứng dụng trong các khâu quy trình xây dựng bộ sưu tập số nên số lượng, chất lượng cũng còn nhiều hạn chế.