Chất lượng TNS phụ thuộc vào nhiều yếu tố và quá trình, trong đó chủ yểu phụ thuộc vào quá trình lựa chọn nguồn nguyên liệu đầu vào, kỹ thuật tạo lập TLS và công tác xử lý dữ liệu số. Sau đây là một số giải pháp nẳng cao chất lưọTig nguồn TNSNS tại Trung tâm:
3.3.1. Tối mi hoá công tác sổ hoá tài liệu truyền tbống
Trong quá trình số hoá tài liệu, dù sử đụng loại máy scan nào, người xử lý cũng Ichông ừánh khỏi một số lỗi nhất định như đã trình bày trong mục 2.2.2. Trong
phần này, tác giả sẽ tập trung vào tìm hiểu cách khắc phục những lỗi trên để đảm bảo chất iượtig cho TLS (áp dụng đối với máy APT BookScan 120Q và các phần mềm kèm theo)
- Tài ỉiệu bị thiểufìle ảnh Nguyên nhân:
+ Trang tài liệu bị dính vào nhau + Độ hút quá mạnh của cánh tay lật trang + Do độ thổi quá mạnh của ống thổi Khắc phục:
+ Kiểm tra tài liệu ttirớc khi thực hiện sổ hoá (các góc quăn có thể là nguyên nhân khiến các trang tài liệu đính vào nhau)
+ Điều chỉnh độ hút của cánh tay lật trang - Trang ảnh bị cut-off vào text
Nguyên nhân:
+ BỊ cắt vào text trong quá trình loại bỏ kẹp hoặc crop + Do khuông lề quá rộng
Khắc phục:
+ Chia nhỏ theo các lô nếu tài iiệu quá dày ( mỗi lô khoảng 300 trang) + Xử lý khuông lề cho các trang ở giữa lô
- Anh bị mờ Nguyên nhân:
+ Tài liệu gốc bị mờ
+ Thiết đặt các thông số camera không phù hợp
+ Tài liệu có ảnh màu, trong đó có nhiều màu nhạt gần với màu nền trắng của trang tài liệu
Khắc phục:
+ Điều chỉnh lại các thông số cho camera
+ Sử dụng các chức năng ừong Book Scan Editor (BSE) để điều chỉnh - Nền ảnh bị tối
Nguyên nhân:
+ Trang tài liệu quét có nền tối
+ Thiết đặt các thông số cho camera chưa phù hợp Khăc phục:
+ Đặt lại các thông số cho camera + Đặt lại chế độ mở ống kính
+ Sử dụng các chức năng trong BSE để điều chỉnh (tăng độ sáng) -Anh bị nghiêng
Nguyên nhân:
+ Trang tài liệu bị in nghiêng hoặc vị trí đặt không thẳng Khẳc phục:
+ Đặt lại tài vị trí liệu cần quét cho thẳng
+ Sử dụng chức năng Manual deskewing trong chưoíng trình BSE để chỉnh lại - Đen ỉề
Nguyên nhân:
+ Khuông lề quá rộng Khắc phục:
+ Khuông lại trang tài liệu (sử dụng chức năng crop ữong chương trình BSE hoặc Acrobat proíessional)
+ Sử dụng chức năng “Erase” hoặc “Black border cleanup” trong chương trình BSE để xoá viền đen. Trong Acrobat proíessional có thể sử dụng chức năng crop
“odd pages only” hoặc “even pages only”
- Sìze ảnh không đồng nhất giữa các trang Nguyên nhân:
+ Quá trình crop các trang chẵn và lẻ không thống nhất + Tài íiệu scan là tài liệu phô tô hai trang trên một mặt giấy Khãc phục:
+ Thực hiện crop lại
+ Nên quét cả trang trắng để đảm bảo số trang chẵn và lẻ không bị lệch nhau 3.3.2. Hoàn thiện công tác biên mục
Công tác biên mục đóng vai trò quan trọng trong quá trình xây dựng các BSTS, nó quyết định đến sự thống nhất dữ liệu trong toàn hệ thống, giúp cho quá trìnlì quản lý, khai thác được thuận lợi và nhanh chóng. Công tác biên mục liên
quan đến nhiều công cụ và thao tác nghiệp vụ khác nhau, trong đó việc ứng dụng các chuẩn dữ liệu và sử dụng các công cụ biên mục đóng vai trò quan trọng nhất.
Liên quan đến việc đảm bảo chất lượng trong công tác biên mục chúng ta thấy cỏ một số vấn đề chính nổi lên như sau;
Thứ nhất: vẩn đề áp dụng các chuẩn, khổ mẫu và công cụ biên mục - Chuẩn mô tả dữ ỉiệu thư mục:
Hiện nay Trung tâm đang sử dụng khổ mẫu Marc21 cho công tác biên mục, trong khi đó khổ mẫu này lại chịu ảnh hưởng nhiều của quy tắc mô tả AACR2. Do vậy, Trung tâm cần sớm triển khai áp dụng quy tắc này vào công tác biên mục.
Để áp dụng AACR2 vào xử lý tài liệu tại Trung tâm, trước hết cần có một tải liệu AACR2 rút gọn bởi vì hiện nay tuy đã có bản dịch đầy đủ về AACR2, nhưng tài liệu này quá công kềnh. Bản dịch đầy đủ này dày khoảng hcm một nghìn ữang, trong đó từ chương 2 đến chương 13 là những chương mô tả các dạng tài liệu đặc thừ nên thường được chỉ đẫn xem chương 1 (Quy tắc mô tả tổng quát). Trong khi đó lại thiếu nhiều chỉ dẫn cần thiết cho biên mục tài liệu Việt Nam. Bởi vậy, cần có một tài liệu mang tính rút gọn về AACR2, trong đó chỉ nên đưa Chương l (Quy tắc mô tả tổng quát) và một số chương có dạng tài liệu phổ biến như sách, tạp chí, bài trích và nguồn tin điện tử để thuận lợi cho việc ưa cúai hàng ngày của các cán bộ biên mục. Điều quan trọng nhất là phải đưa vào quy tắc này những vấn đề cụ thể của Việt Nam theo quy định của AACR2.
- Áp dụng kho mẫu:
+ Đối với dữ liêu thư muc:
Khổ mẫu dữ liệu thư mục đóng vai trò quan trọng trong xây dựng các CSDL thư mục. Tiêu chuẩn hoá khổ mẫu thư mục là cơ sở thiết yếu trong trao đổi thông tin. Do phát triển tự phát, thiếu sự kết hợp và sự chưa nhận thức được đầy đủ vai trò của chuẩn khổ mẫu dữ liệu nên xuất hiện tình ừạng không thống nhất khổ mẫu dữ liệu, gây khó khăn trong việc trao đổi dữ liệu. Một nghiên cứu do Trung tâm Thông tin Tư liệu KHCN Quốc gia tiến hành đã cho thấy, chỉ riêng trong các CSDL trên mạng VISTA ở Trung tâm cũng đã có đến 12 loại khổ mẫu đữ liệu thư mục khác nhau [2]. Qua tìm hiểu thấy có hai khổ mẫu được phổ biến rộng rãi nhất ở Việt Nam; khổ mẫu dữ liệu thư mục do Trung tâm Thông tin Tư liệu KH&CN Quốc gia
biên soạn [3] được phổ biến rộng rãi trong hệ thống thông tin KHCN quốc gia và khổ mẫu CSDL Sách do Thu viện Quốc gia biên soạn lại phổ biến rộng rãi ữong hệ thống thư viện công cộng. Tuy nhiên, cả hai khổ mẫu trên đều không tuân thủ khổ mẫu chuẩn quốc tế nào (như MARC, UNIMARC, CCF,...)-
MARC 21 là một khổ mẫu tích họp có thể dùng chung cho các loại hình tài liệu thư viện không phải thiết kế các mẫu nhập tin khác nhau, mà chỉ cần ứiêm bớt các trường dữ liệu đặc thù cho phù hợp; Khả năng chia sẻ và sử dụng các biểu ghi thư mục giữa các thư viện với nhau được đễ đảng không chỉ giữa các thư viện trong nước mà cả với thư viện nước ngoài. Tài liệu khổ mẫu MARC21 rút gọn xuất bản năm 2005 có bổ sung một sổ công cụ hồ trợ thổng nhất cho người biên mục; danh mục mã ngôn ngữ theo tiêu chuẩn ISO 639-2; mã nước theo tiêu chuẩn ISO 3166;
từ và cụm từ viết tắt dùng ừong biên mục; nguồn hệ thống phân loại, thuật ngữ.
Việc áp dụng khổ mẫu Marc21 vào xây dựng CSDL là rất hữu ích và cần thiết.
Đẻ giảm bớt những khó khăn như đã nêu tại mục 2.2.3, Trung tâm cần biên soạn một tài liệu hướng dẫn rút gọn trong phạm vi sử dụng của minh để cán bộ xử lý áp dụng một cách dễ dàng hcm. Bên cạnh đó, việc tăng cường các khoá tập huấn về MARC21 cho cán bộ, đặc biệt là những cán bộ mới cQng cần được quan tâm hofn nữa.
+ Đối vái toàn bô hê thống
Cùng với việc áp dụng MARC21 cho dữ iiệu thư mục, một số chuẩn dùng cho mô tả, trao đổi dữ liệu, siêu dữ liệu phổ biến cũng cần được triển khai nghiên cứu và áp dụng thống nhất. Dưới đây là một số chuẩn được khuyến nghị dùng chung cho các Cữ quan TT-TV ở Việt Nam [2]:
STT Dịch vụ, ứng dụng ChuẩD Ghi chú
Dùng trong trao đổi dữ liệu:
1 Định dạng mô tả trang PDF Dùng để cung cấp tài liệu số hoá
2 Dữ liệu có câu trúc Dùng cho tài liệu điện tử
SGML Chuấn quốc tế ISO 8879. Sử dụng MARC-DTD do Thư viện Quốc hội Mỹ xây dựng
HTML Hypertexr Mark-up Language XML Extensible Mark-up Language Kliô mâu phân phôi tài
liệu
4. Bộ Mã ký tự TCVN 6909-
2002
UNICODE, ISO 10646 Dùng trong siêu dữ liệu và biên mục
1 Siêu dữ liệu Dublin Core Tiêu chuânNISO Z39.85-200Ì Biên mục mảy đọc được MARC21
ISO 2709
Dùng cho dữ liệu thư mục
Dùng trong các dịch vụ ứng dụng 1 Máy chủ ứng dụng tìm
tin và yêu cầu tin
Z39.50 áp dụng cho các máy chủ thông tin thư mục, là chuẩn ISO 23950.
- Sử dụng khung phân loại:
Việc sử dụng khung phân loại trong công tác xử lý tài liệu được Trung tâm áp dụng khá sớm. Trước khi biên soạn và đưa vào sử dụng Khung phân loại BBK (năm 1975), Trung tâm (khi đó là Thư viện Khoa học Kỹ thuật Trung ương) đã sử dụng hai khung phân loại đó là Khung phân loại Trung tiểu hình và Khung phân loại ƯDC. Hiện nay, bên cạnh Khung phân loại BBK, Khung Đê mục Quốc gia Trung tâm còn sử dụng thêm Khung phân loại dành cho các sản phẩm công nghiệp (đối các CSDL về thị trường công nghệ).
Đối với Khung phân loại đành cho dữ liệu thư mục, mặc dù theo xu hướng hiện nay cũng như theo khuyến nghị của Vụ Thư viện thì Khung phân loại DDC đang được nhiều cơ quan TT-TV triển khai áp dụng cùng vớỉ MARC21 và AACR2.
Tuy nhiên theo quan điểm của những người trực tiếp làm công tác phân ioại tài liệu tại Trung tâm cũng như quá trình tìm hiểu, so sánh khung phân loại DDC với BBK chúng tôi nhận thấy:
Việc sử dụng khung phân loại BBK cho các tài liệu khoa học kỹ thuật vẫn có nhiều ưu điểm hơn so với DDC bởi lẽ trong khung phân loại BBK, các mục đành
cho khoa học kỹ thuật được trình bày tương đối khoa học và chi tiết. Trong khi đó khung phân loại DDC các mục này được trình bày rất đơn giản và chung chung.
Đối với các CSDL thị trường công nghệ hiện đang áp dụng hai công cụ phân loại là Khung Đề mục Quốc gia và Khung phân loại đành cho các sản phẩm công nghiệp. Theo kiến nghị của những cán bộ trực tiếp xây dựng CSDL này thì chỉ nên sử dụng một trong hai công cụ trên cho công tác phân loại tài liệu.
Tuy nhiên, việc sử dụng đồng thời 3 công cụ phân loại đã tạo nên sự thiếu thống nhất trong toàn hệ ứiống. Do vậy, trong thời gian tới Trung tâm cần thống nhất lại việc áp dụng khung phân loại chung cho toàn hệ thống.
- Sử dụng Bộ từ khoả cỏ kiểm soát trong quá trình xử lý từ khoá
Hiện nay, đa số các cơ quan thông tin - thư viện đều lựa chọn phương pháp đánh từ khoả tự do bởi hai nguyên nhân là do không có bộ từ khoá có kiểm soát và để cho nhanh chóng, thuận tiện trong quá trình xử lý tài liệu. Điều này làm mất đi tính nhất quán của dữ liệu bởi vì từ khoá tự do bị ảnh hưởng lớn bời yếu tố chủ quan của người xử lý. Trong cùng một chủ đề sẽ có nhiều từ Iđioá khác nhau do sự thiếu thống nhất ữong quá ưình sử dụng ngôn ngữ ở các địa phương,..,Với hệ thống chỉ dẫn và bảng tra chéo, bộ Từ khóa có kiểm soát đã tạo ra được sự thổng nhất về thuật ngữ trong toàn bộ hệ thống CSDL của Trung tâm.
Để khắc phục những tồn tại như đã nêu tại mục 2.2.3 và đảm bảo tính thống nhất của hệ thống từ khoá ưong các CSDL thư mục cũng như toàn văn, Trung tâm cần tiếp tục áp dụng đầy đủ và có kiểm duyệt bộ Từ khoá có kiểm soát vào quá ưình xử lý từ khoá. Bên cạnh đó cũng cần đối chiếu các thuật ngữ mới với các từ điển chuyên ngành và cập nhật vào Bộ Từ khoá có kiểm soát. Trước mắt, khi chưa tái bản có ứiể cập nhật trực tiếp bằng cách viết tay trực tiếp vào bản in của Bộ Từ khoá.
Thứ hai: Công iảc kiểm duyệt Vớ hiệu đính
Một trong những đặc trưng của các CSDL thư mục tại Trung tâm là có thời gian xây dựng khá dài, trải qua nhiều thế hệ cán bộ xử lý, qua nhiều tiêu chuẩn và phần mềm khác nhau nên sự thiếu đồng bộ về dữ liệu hoặc một sổ biểu ghi không đảm bảo chất lượng là khó tránh khỏi. Trong số đó có những sự khác biệt có ứiể chấp nhận và cả những sự khác biệt, sai sót cần được chỉnh sửa lại cho thống nhất.
Thi dụ:
+ Các biểu ghi hồi cố cho kho sách thường có các ký hiệu không kèm theo năm hoặc không có trường Chỉ sổ Cutter. Đây là sụ khác biệt cỏ thể chấp nhận vì những ký hiệu này được lập từ nhiều năm trước, khi đó chưa quy định việc đánh ký hiệu kèm theo năm, trong khi khối lượng kho tài liệu tài liệu dạng này rất lớn nên Trung tâm đã quyết định không bồ sung thêm năm lập ký hiệu đăng ký cá biệt kèm theo. Đối với trường Chỉ sổ Cutter, do sử đụng phần mềm CDS/ĨSIS để nhập liệu và sau đó chuyển dữ liệu sang phần mềm Libol nên xuất hiện một số lồi trong quá trình chuyển đổi. Do vậy, Trung tâm cũng quyết định bỏ qua trường này khi xử lý tài liệu hồi cố cho CSDL Sách.
Hay:
+ Những tài liệu có cùng một chủ đề lại được phân ioại khác nhau (như trường hợp các tài liệu về lĩnh vực thống kê đang được xếp ở hai mục của Khung phân loại BBK là ô 6 và Q 051). Hiện tượng này là do sự thiếu thống nhất về quan điểm trong khâu phân loại giữa những người làm công tác xử lý. Trong trường hợp này, càn sớm có sự thống nhất và hiệu đính lại để đảm bảo tính thống nhất trong toàn bộ CSDL.
Hoặc:
+ Trường hợp thiếu thống nhất ưong mô tả trường Cơ quan chủ ừì đề tài và trưòrng Tóm tắt cùa CSDL KQNC như đã nêu tại mục 2.2.3.
Thực tế hiện nay cho thấy, đội ngũ cán bộ xỏ lý dữ liệu thư mục của Trung tâm đang được trẻ hoá vì vậy rất cần được đào tạo một cách hệ thống, toàn diện và lâu dài. Hơn nữa công tác xử lý tài liệu liên quan đến nhiều kiến thức chuyên môn, đặc biệt là kinh nghiệm nên những cán bộ trẻ thường gặp phải không ít khó khăn khi bắt đầu tham gia công việc này. Nhằm đảm bảo cho những cán bộ mới có điều kiện nâng cao kỹ năng nghiệp vụ, trước mắt cần tạo cơ hội cho họ vừa học vừa làm trên cơ sờ áp dụng lý thuyết và thực tiễn. Vì vậy, trong một vài năm trở lại đây bộ phận xử lý CSDL Sách đã phân công những cán bộ có chuyên môn giỏi và kinh nghiệm chịu trách nhiệm hiệu đính biểu ghi và truyền đạt lại kiến thức chuyên môn cũng như kinh nghiệm cho những cán bộ mới. Những lỗi xuất hiện trong quá trình xử lý sẽ được những cán bộ mới tổng hợp và ghi chép lại để làm cơ sở cho những lần xử lý tiếp íheo. Tuy nhiên, giải pháp này chỉ mang tính tạm thời vì trong thực tế,
những lỗi sảy ra ở từiig cán bộ xử lý khác nhau thường không giống nhau nên một người không thể tìm hiểu hết những lỗi mà những người khác thường mắc phải.
Giải pháp cho vấn đề này là Trung tâm cần có một nhóm cán bộ chuyên môn có nghiệp vụ và kinh nghiệm đảm nhiệm nhiệm vụ biên soạn tài liệu hướng dẫn. Tài liệu này cần được xây dựng ngắn gọn, dễ hiểu và đặc biệt là phải dựa trên thực tế để làm căn cứ chung cho những người tham gia xử lý có thể tham khảo và áp dụng.
Thử ba: Phái triển nhân lực cho công tác xử lỷ dữ liệu thư mục
Hiện nay, đội ngũ cán bộ làm công tác xử lý dữ ỉiệu thư mục của Trung tâm ngày một giảm đi không chỉ về số lượng mà cả chất lượng.
Thi dụ:
Bộ phận xử lý sách tại Phòng Phát trển nguồn tin hiện nay được phân công gồm 03 người, trong khi đó bộ phận đảm nhiệm khâu này trước đây ỉuôn được duy trì từ 5 đến 7 người cũng với một khối lượng sách tương đương. Điều này cho thấy sự phân phối nhân lực cho bộ phận này là chưa hợp lý.
Mặt khác, những cán bộ cỏ kinh nghiệm xử lý tài liệu lâu năm đang dần dần giảm đi do đến tuổi nghi hưu trong khi đó, đa số đội ngũ cán bộ trẻ không được đào tạo chính quy nên sẽ mất rất nhiều thời gian để làm quen với công việc. Do đặc điểm của khâu xử ỉý là đòi hỏi rất cao về nghiệp vụ, có những cản bộ phụ trách những chuyên ngành nhất định và khả năng ngoại ngữ tôt nên hầu như rất khó để xây dựng được một đội ngũ cán bộ xử lý có khả năng đáp ứng tốt yêu cầu của khâu này.
Để khắc phục hiện tượng ừên, Trung tâm cần có kế hoạch lâu dài cho việc phát triển đội ngũ cán bộ tham gia xử lý đó là:
+ Tăng cường thêm nhân lực cho khâu xử lý dữ liệu thư mục (trước hết là khâu xử lý sách, số lượng cán bộ xử lý cần ít nhất là 4 người mới có thể đảm bào được tiến độ công việc)
-I- Sớm xây dựng tài liệu hướng dẫn cụ thể cho công tác xử lý (về quy tắc mô tà, nhập liệu đối với tìrng dạng tài liệu cụ thể)
+ Sớm ừiển khai áp dụng các chuẩn cho một kế hoạch lâu dài
+ Thường xuyên mở các lớp tập huấn cho cản bộ xử lý (đặc biệt là các lớp tập huấn về MARC21, sử dụng khung phân loại, định từ khoá,...)