Chương 2: THỰC TRẠNG CÔNG TÁC XỬ LÝ TÀI LIỆU TẠI THƯ VIỆN CÁC TRƯỜNG ĐẠI HỌC Ở HÀ NỘI
2.2. Xử lý nội dung tài liệu
2.2.2. Quy trình xử lý
Sau khi tài liệu đã được xử lý hình thức thì được tiến hành xử lý nội dung. Hiện nay, các bước để phân loại tài liệu: xác định chủ đề mà nội dung tài liệu phản ánh, hầu hết các thư viện đều tham khảo trên hệ thống xử lý nội dung tài liệu của Thư viện Quốc Gia Việt Nam, thư viện khác và Thư viện Quốc Hội Mỹ (tài liệu tiếng Anh) để rút ngắn thời gian xử lý nội dung tài liệu.
Nếu chưa xác định được KHPL thì đọc phụ đề, mục lục, chính văn, tra trong khung phân loại chính và các bảng phụ, gắn cho tài liệu một KHPL. Sau đấy tiến hành định từ khóa tài liệu/định chủ đề, làm tóm tắt hay làm chú giải cho tài liệu căn cứ vào nội dung tài liệu, bước cao hơn nữa là làm tổng luận,.. Tùy vào nhu cầu thực thế của NDT tại mỗi thư viện, mà tiến hành làm các sản phẩm thông tin khác nhằm thỏa mãn tối đa nhu cầu tin của NDT và hợp tác, chia sẻ nguồn lực thông tin thư viện trong nước và quốc tế. Tuy nhiên, nhiều cán bộ xử lý hay làm sai quy trình, bỏ qua các bước, không tuân thủ các bước, không kiểm soát tính nhất quán, bỏ qua khâu kiểm tra lại kiến thức mà sử dụng trí nhớ của cá nhân, nên đa số là định từ khóa tự do, định KHPL không chuẩn xác, văn phong tóm tắt mắc lỗi nhiều dẫn đến chất lượng XLND tài liệu không cao.
48 2.2.2.1. Phân loại tài liệu
Theo tác giả khảo sát, thì hầu hết các thư viện đều tuân thủ các bước tiến hành trong quá trình phân loại tài liệu, có đầy đủ phương tiện, công cụ hỗ trợ phân loại tài liệu, phần lớn nhân sự tiến hành phân loại tài liệu đều tuân thủ các quy định về phân loại tài liệu như:
Bước 1: phân tích chủ đề (nội dung tài liệu), xác định các đặc trưng của nội dung, tuân thủ các nguyên tắc của hệ thống phân loại (nguyên tắc phân loại chung, nguyên tắc phân loại riêng cho các dạng tài liệu khác nhau, yêu cầu đối với cán bộ phân loại tài liệu),
Bước 2: Dịch tài liệu ra ngôn ngữ phân loại và định ký hiệu phân loại, thực hiện đầy đủ các bước để quy kết tài liệu vào đầu mục (khoa học) lớn nhất, tìm vị trí chính xác nhất nếu không có cấp cao hơn gần nhất, gán ký hiệu phân loại chính và trợ ký hiệu phân loại (nếu cần thiết).
Từ kết quả tổng hợp 279 phiếu điều tra người dùng tin và khảo sát 30 nhân lực xử lý trực tiếp tài liệu và 60 tài liệu tác giả có được số liệu sau:
Biểu đồ 2.1: Chất lƣợng phân loại tài liệu
49
Khảo sát NDT đánh giá (Biểu đồ 2.1) chất lượng của công tác phân loại có 10,8 % đánh giá rất tốt, 83,9 % đánh giá tốt, đầy đủ hay chấp nhận được, còn lại 5,4 % cho rằng chưa tốt, hạn chế hoặc chưa đầy đủ KHPL, con số này dù khiêm tốn nhưng cũng cho ta thấy dù tuân thủ tất cả các quy định, quy tắc để PLTL nhưng vẫn còn sai, chưa chính xác, nghĩa là số tài liệu này mất giá trị, hoặc NDT cần mà không có khả năng được tiếp cận, lý do hạn chế về trình độ, chủ quan, lỗi kết hợp,..
Tác giả căn cứ vào việc khảo sát PLTL của 30 nhân lực phân loại tài liệu, trực tiếp trên danh mục 60 tài liệu được nhập luôn vào cơ sở dữ liệu hoặc viết trên phiếu tiền máy tại thư viện các trường đại học tại Hà Nội. Các cán bộ PLTL làm việc độc lập, đã viết trên phiếu tiền máy hoặc nhập vào khổ mẫu biên mục trên máy, có công cụ hỗ trợ xử lý cơ bản là khung phân loại, bảng chỉ mục, các bảng phụ, từ điển Tiếng Việt, từ điển chuyên ngành,..
Dựa trên các quy tắc phân loại tài liệu trên, khảo sát 30/30 cán bộ cho biết họ đều tuân thủ quy trình phân loại tài liệu. Kết quả phỏng vấn cho thấy có 3/30 (10 %) cán bộ XLTL cho rằng không quan tâm đến lĩnh vực nghiên cứu của tác giả vì rất nhiều tác giả viết nhiều lĩnh vực khác nhau hoặc gần nhau nên tài liệu cần xử lý chỉ cần dựa vào các vùng mô tả và chính văn là đủ. Có 2/30 (7%) cho rằng không cần dựa vào phụ đề tài liệu. Có 10/30 (33 %) cán bộ XLTL nói cần dựa vào tất cả các yếu tố trong vùng mô tả để định ký hiệu PLTL: Nhan đề, phụ đề, mục lục, lời nói đầu, chính văn, lĩnh vực nghiên cứu của tác giả. Có 15/30 (50 %) cho rằng tùy từng tài liệu khác nhau mà mức độ tìm thông tin trên các vùng mô tả cũng khác nhau chứ không nhất thiết phải đọc hết tất cả thông tin ở các vùng mô tả.
Từ kết quả trên tác giả rút ra, 17 % nhân lực PLTL vi phạm quy tắc phân loại, 50 % tùy tài liệu, 33 % tuân thủ đủ các bước.
50
Bảng 2.3: Lỗi định ký hiệu phân loại 60 tài liệu
TT ĐTNC PDND PDĐL PDTG PDNC KH đã định KH chính xác
1 Lưu trữ Lịch sử Việt Nam 1958-2010 025.095 025. 09597
2 Web động Thiết kế Giáo trình 005.4 006.7
3 Giao tiếp Quy tắc 153.6 302.2
4 Thơ Văn học hiện đại Việt Nam 895.922 895.922 1
5 Tiểu thuyết lịch sử Văn học trung đại Việt Nam Đàm đạo 895.922 895.922 306
6 Bút ký Văn học hiện đại Việt Nam 895.922 895.922 803
7 Tiểu thuyết Văn học hiện đại Việt Nam 895.922 895.922 3
8 Người Dao Trang phục truyền thống Việt Nam 391.597 391.089 597
9 Lễ tục Gia đình Phú Yên 390.095 390.095 9755
10 Văn hóa Quảng Nam 390.095 390.095 9752
11 Văn hóa
Huyện Anh
Sơn 390.095 390.0959742
12 Gỗ, đá, Nghề thủ công, Dân tộc thiểu số
Cao Bằng
674.0095 674.0095971
13 Tiểu thuyết Văn học Trung đại Trung Quốc 895.1 895.13
14 Tác giả, tác phẩm Nghiên cứu Văn học Nhật Bản Tổng quan 895 895.68
15 Truyện ngắn Văn học hiện đại Mỹ 818 813
16 Tiểu thuyết Văn học hiện đại Mỹ 810 813
17 Hồi ký Văn học hiện đại Mỹ 810.092 818.092
18 Thần thoại
Hy Lạp -
La Mã
Từ điển
413.949 5 803
51
19 Văn học Việt Nam Từ điển 413.800 803
20 Nghiên cứu văn học Phương pháp luận 001.4895 807
21 Diễn văn Thế giới 158 808.5
22 Án dân sự Pháp luật Việt Nam 340 347.597
23 Tam nông Trung Quốc 388.151 338.151
24 Ca dao Thi pháp Việt Nam 398.90957 398.809 597
25 Học tập, Làm việc Phương pháp 371.01 371.3
26 Giáo dục học Từ điển 413.3703 370.3
27 Viện kiểm sát Luật tổ chức 342 347.597
28 Trợ giúp pháp lý Pháp Luật 374 347.597
29 Thủy động lực học Cơ học chất lỏng 420 532
30 Hệ thống nước tuần hoàn Tuabin cao áp 607 621.406
31 Rừng Pháp Luật 333.75 333.75 7
32 Tiếng Việt Từ điển 495.922 495.922 03
33 Chuyện lạ Văn học hiện đại Thế giới 390.095 390.095 975 2
34 Tri thức phổ thông
Bách khoa
tri thức 030 030
35 Đơn vị hành chính Việt Nam Từ điển 060.597 060.59703
36 Văn hóa Ẩm thực Hình ảnh Thế giới 641 641
37 Văn phòng Quản trị học Giáo trình 025.1 651.3
38 Quản trị kinh doanh Lý thuyết Giáo trình 658.8 658.8
39 Dự án Quản lý 658.4 658.4
52
40 Đồ uống Công thức pha chế Cocktail 641.8 641.8
41 Bí ẩn Lịch sử 5000 Thế giới 001.94 001.94
42 Hạch toán kế toán Lý thuyết Giáo trình 657 657
43 Văn phòng Quản trị học 651.3 658.068
44 Hội đồng nhân dân Điểm mới quy chế Việt Nam 2005 348.597 348.597
45 Bí ẩn Quân sự Thế giới 355 355
46 Nước tự nhiên Khai thác tài nguyên Giáo trình 333.91 333.91
47 Giáo dục Tương lai Hoa kỳ 370.973 370.973
48 Học tập Phương pháp 371.15 371.15
49 Thương mại quốc tế Kinh doanh, tự vệ WTO 382 382
50 Trường học, xử thế Nghệ thuật 371.3 371.3
51 Tội phạm ma túy Trách nhiệm hình sự Việt Nam 351.5 351.597
52 Quốc phòng an ninh Luật, văn bản hướng dẫn 355.597 355.597
53 Điện tử Kỹ thuật Bài tập 621.381 076 621.381 076
54 Vẽ sơn dầu Kỹ thuật 750 751.4
55 Sinh học, thực vật Công nghệ Giáo trình 660.6 660.6
56 May Công nghệ Giáo trình 646.4 646.4
57 Động vật, thực vật Công nghệ chuyển gen 660.6 660.6
58 Nuôi trồng thủy sản Quản lý môi trường Việt Nam 363.7 363.7
59 Luật Sở hữu trí tuệ Pháp luật Việt Nam 347.597 347.597
60 Luật công chứng Pháp luật Việt Nam 347 347.597
53
Từ kết quả phân loại tài liệu của 60 tài liệu (Bảng 2.3) đã định KHPL theo DDC 14 có 09/60 tài liệu sai hoàn toàn (chiếm tỉ lệ 15 %) ở các số thứ tự sau: 2,3,18,19,20, 21,26,29,37 định ký hiệu sai hoàn toàn do xác định sai ĐTNC, PDND, không quy tài liệu về nội dung phản ánh. CBXL trả lời, lý do chung (mới áp dụng khung phân loại, chưa nắm vững quy tắc phân loại, không đọc kỹ hướng dẫn sử dụng khung phân loại, nhiều CBXL bỏ qua bảng chỉ mục quen hệ, chưa đọc kỹ nội dung cuốn sách, một số CBXL tăng cường khi tài liệu về nhiều). Ngoài ra còn đọc nhưng dễ nhầm lẫn như đối với tài liệu 2,3,18,19,20, 21, 26, 37 CBXL không có kinh nghiệm, không làm thường xuyên.
Tài liệu 02, xác định đối tượng nghiên cứu “Lập trình” nên đưa ký hiệu về 005.4 (Lập trình, chương trình hệ thống). Cán bộ XLTL xác định thuộc tin học lập trình mà không xác định cụ thể là thiết kế trang web chỉ dẫn rõ trong bảng chỉ mục quan hệ trang 1019 Q2.
Tài liệu 03, xác định ĐTNC là “Giao tiếp” nên đưa về ký hiệu 153.6
“Truyền thông (Giao tiếp)” cá nhân giao tiếp cá nhân, dễ gây hiểu nhầm nếu không tìm đến bảng chỉ mục (giao tiếp: 302.2 trang 896 Q2 xem thêm truyền thông chỉ rõ: 302.2 trang 1044, 1045 Q2 xem chỉ dẫn B1-01 trang 135 Q1.
Tài liệu 18, xác định ĐTNC là (ngôn ngữ) nên định KHPL là 413.949 5, từ điển trang 492 Q1, chỉ mục trang 1049 + B2- 9, + B2- 495 Hy Lạp trang 144,155 Q1 và chỉ mục trang Hy Lạp 9495 trang 914 Q2, trong khi ký hiệu chính xác của tài liệu là 803, khía cạnh nền văn học 8 trang 792 Q2 + 03 trợ ký hiệu từ điển từ B1.
Tài liệu 19 xác định sai ĐTNC là (từ điển văn học) KHPL là 413.800, tương tự tài liệu số 20 cần tuân thủ nội dung tài liệu phản ánh về lĩnh vực nào thì định KHPL ưu tiên lĩnh vực đó.
Tài liệu số 20 định KHPL 001.4895 xác định ĐTNC là (phương pháp luận về văn học Châu Á là 001.4 trang 210 Q1) và phương pháp khoa
54
học trong bảng chỉ mục trang 984 Q2 + nền văn học Đông Nam Á 895 trang 753 Q2.
Tài liệu 21 KHPL là 413.370 3 (từ điển giáo dục), kết hợp hai chủ đề cùng một bảng chính mà không đưa về chủ đề chính là (giáo dục) là 370.3 nên dẫn đến sai.
Tài liệu 29, CBXL định KHPL 420 tiếng Anh và ngôn ngữ Anh cổ, hiểu sai quy tắc PLTL, nghĩ rằng tài liệu thể hiện bằng tiếng Anh nên đưa về.
CBXL đã bỏ qua bước xác định nội dung tài liệu, trong bảng chỉ mục (thủy động lực học) phản ánh 532 trang 1023 Q2 và cơ học chất lưu, cơ học chất lỏng trang 519 Q2.
Tài liệu 37, xác định ĐTNC là “quản lý tài liệu” nên định KHPL 025.1.
Tài liệu 12 xác định 025.1 Quản trị, nhầm cho quản trị văn phòng, quản lý văn phòng trang 231 Q1 mà bỏ qua bảng chỉ mục trang 988 Q2 tài liệu dùng tham khảo giảng dạy về văn phòng. Trên thực tế nội dung cuốn giáo trình xoay quanh vấn đề hoạt động của nhân viên văn phòng, quản lý sổ sách, các văn bản đến văn bản đi,... nên cũng không được đưa vào mục quản trị 658 kết hợp với B1- 068 dễ gây nhầm lẫn đối với người xử lý không đọc chính văn.
Kết quả chính xác là chỉ số 651.3 trang 651 Q2.
Các tài liệu định KHPL sai ở mức 1 (ba chữ số đầu) trong đề mục chính 10/60 (chiếm gần 17 %) gồm các số 15,16,17,22,23,27,28,30,43,54, tác giả phỏng vấn cán bộ xử lý tài liệu được biết do chưa có nhiều kinh nghiệm định KHPL nên dẫn đến sai sót, chưa nắm rõ cách kết hợp, do không làm thường xuyên, do một số trường có vốn tài liệu ít nên không định KHPL chi tiết như KHPL đầy đủ theo quy định vì việc định KHPL chỉ phục vụ cho tổ chức kho nên các trường tùy vào vốn tài liệu của mình để quyết định chi tiết hay không. Ngoài ra, với suy nghĩ KHPL chỉ để tổ chức kho thôi nên nhầm thì sửa lại nếu lỗi nhận ra.
55
Tài liệu số 23 nhập máy nhầm số 3 thành số 8 (338.151 -> 388.151) đa số tài liệu định KHPL xong không hiệu đính lại mà nhập vào CSDL, phích mục lục luôn, vì bạn đọc không quan tâm KHPL khi tìm tài liệu trên CSDL, chỉ khi phục vụ phát hiện sai sót các thư viện mới hiệu đính biểu ghi.
Ngoài ra, tài liệu số 15 là Truyện ngắn Emst Hemingway nhiều trường định 818, người xử lý cho biết đọc mãi không có thông tin về địa lý, nhờ nghiên cứu tác giả nên xác định được thuộc nước Mỹ nhưng định KHPL 810, lập luận rằng tài liệu là truyện ngắn không phải tiểu thuyết, nhưng KHPL chính xác là 813 nhờ kinh nghiệm PLTL, vì 810 từ 3 lĩnh vực trở lên mới khái quát thành chủ đề chung, hai chủ đề thì định vào chủ đề đầu tiên và trong B3- 3 trang 187 Q1 xếp vào đây tiểu thuyết ngắn.
Các tài liệu định KHPL sai mức 2,3 có 19/60 tài liệu (chiếm gần 32 %) gồm các số: 1,4,5,6,7,8,9,10,11,12,31,32,33,35,43,51,60 lý do lỗi kết hợp bảng phụ và mức độ đầy đủ của KHPL. Một số thư viện thấy KHPL dài quá mà vốn tài liệu ít nên quy ước dừng định KHPL đến mức chi tiết nên thiếu, một số nghĩ đã hết ký hiệu, vì chưa có kinh nghiệm PLTL, chưa tìm hiểu kỹ khung phân loại, mới ứng dụng...Một số thì muốn lấy KHPL đồng nghĩa với ký hiệu xếp giá theo nội dung nên giản lược chỉ một vài đề mục chính, phát hiện sai sót trong quá trình phục vụ sẽ được tập hợp và sửa khi có điều kiện.
Ngoài ra, dựa vào đánh giá kết quả phân loại tài liệu thư viện của Đại học Sư Phạm Hà Nội năm 2013, 80 % PLTL chính xác còn lại 11 % chưa chính xác 3% lỗi kết hợp, 6 % sai [4]. Đánh giá kết quả PLTL thư viện theo LC của Thư viện Tạ Quang Bửu 2009 thì 91,9 % chính xác, 4,2 % sai cấp độ 1, 0,9 % PL sai ở cấp độ 3, 3 % PL sai ở cấp độ 4 [13].
Ngoài ra, tác giả còn so sánh sơ bộ dữ liệu khảo sát của thư viện ĐH Mở Hà Nội, ĐH Hà Nội, ĐH Ngoại thương, ĐH Nội vụ có chất lượng xử lý tài liệu tương đồng nhau, ĐH Điện Lực có chất lượng kém nhất trong tất cả các trường được khảo sát.
56
2.2.2.2. Định từ khóa, định chủ đề tài liệu
Nếu KHPL là quan trọng nhất trong việc tổ chức kho sách theo nội dung, thì từ khóa đặc biệt quan trọng trong việc giúp NDT tra tìm được nguồn tài liệu, để thỏa mãn nhu cầu tin của họ.
- Chất lượng kết quả định từ khóa
Khảo sát các thư viện cho thấy, 100 % đều tuân thủ ba nước về định từ khóa: Bước 1 là phân tích chủ đề để xác định các đặc trưng chính của tài liệu,..Bước 2 là dịch các đặc trưng chính đó sang ngôn ngữ từ khóa (xử lý từ vựng). Bước 3 là trình bày từ khóa được chọn lên phiếu tiền máy hoặc nhập vào worksheet (bản điện tử) theo Marc 21.
Hiện nay, tại thư viện nói chung, các thư viện trường đại học tại Hà Nội nói riêng, đều tiến hành theo quy trình định từ khóa tự do và ghi vào trường 653. Mỗi một tài liệu gồm một hoặc nhiều từ khóa và nó được trình bày trong biểu ghi thư mục, vì ngôn ngữ từ khóa có giá trị tìm tin ngang nhau, từ khóa chính ghi ở trường 653, sau đó đến từ khóa địa lý, từ khóa nhân vật.
Đây là cơ sở tạo lập bảng tra tra cứu phụ trợ đối với các SP & DVTT thư mục thư viện.
Nếu trình bày riêng thì trường 610 từ khóa nhân vật, 651 trường từ khóa địa lý, 653 là từ khóa chính. Tùy vào quy định riêng của mỗi thư viện mà cách trình bày cũng khác nhau, chưa có sự thống nhất. Bản thân các từ khóa được trình bày trong phần mềm của các CSDL thư mục cũng không được tạo lập để phân biệt từ khóa chính phụ, vì vậy đòi hỏi từ khâu XLTL đến tạo lập phần mềm cũng phải có sự thống nhất để có được hiệu quả tìm tin chính xác nhất.
Thực tế, hiện nay vẫn chưa có một công cụ kiểm soát từ khóa được biên soạn đầy đủ, cập nhật thường xuyên để dùng cho các thư viện, nên chất lượng định từ khóa ảnh hưởng rất lớn đến hiệu quả phục vụ thông tin. Việc
57
định từ khóa chủ yếu là dựa vào kinh nghiệm của người xử lý, gây nhiễu tin, mất tin, không tìm được tài liệu do từ khóa sai, không chính xác, không phản ánh được nội dung tài liệu.
Từ kết quả tổng hợp 279 phiếu điều tra người dùng tin và khảo sát 30 nhân lực xử lý trực tiếp tài liệu và 60 tài liệu, tác giả có được số liệu sau:
Biểu đồ 2.2: Chất lƣợng định từ khóa tài liệu
Khảo sát người dùng tin đánh giá chất lượng của công tác phân loại (Biểu đồ 2.2) có 10.8 % đánh giá rất tốt, 82.8 % đánh giá tốt, còn lại 6.5 % cho rằng chưa tốt. Con số này cho ta thấy dù XLTL tuân thủ tất cả các quy định, quy tắc để định từ khóa nhưng vẫn còn sai. Nghĩa là số tài liệu này mất giá trị, hoặc NDT cần mà không có khả năng được tiếp cận. Nguyên nhân, người XLTL hạn chế về trình độ, chủ quan, xác định từ,...
Tác giả căn cứ vào việc khảo sát PLTL của 30 nhân lực định từ khóa tài liệu, trực tiếp trên danh mục 60 tài liệu được nhập luôn vào cơ sở dữ liệu hoặc viết trên phiếu tiền máy tại thư viện các trường đại học tại Hà Nội. Các cán bộ PLTL làm việc độc lập, đã viết trên phiếu tiền máy hoặc nhập vào khổ mẫu biên mục trên máy,.. Từ kết quả định từ khóa của 60 tài liệu (Bảng 2.4) đã định từ khóa tự do: