Đánh giá chất lượng định từ khóa

Một phần của tài liệu (LUẬN văn THẠC sĩ) xử lý nội dung tài liệu tại trung tâm thông tin thư viện đại học luật hà nội (Trang 54 - 59)

2.3 Định từ khóa

2.3.3 Đánh giá chất lượng định từ khóa

Để đánh giá chất lượng từ khóa, luận văn lựa chọn ngẫu nhiên 20 biểu ghi trong CSDL và đánh giá dựa trên 2 tiêu chí: độ chính xác và độ đầy đủ.

Độ chính xác

Độ chính xác của từng biểu ghi được xác định bằng tỷ số giữa số lượng các từ khóa được lựa chọn phản ánh đúng đối tượng, phương diện và phương pháp nghiên cứu với tổng số từ khóa được lựa chọn trong biểu ghi. Cơng thức tính hệ số chính xác đã được trình bày ở phần 1.1.4.1 của Chương 1.

Ví dụ

Biểu ghi HLU140023845 có 4 từ khóa: Luật Ngân hàng, Luật Tài chính, Luật Kinh tế, Cho thuê, trong đó có 3 từ khóa phản ánh khơng chính

xác nội dung tài liệu. Độ chính xác của biểu ghi là 1/4.

Biểu ghi HLU150027513 có 2 từ khóa: Trung Quốc, Văn hóa phản ánh chính xác nội dung tài liệu. Độ chính xác của biểu ghi là 2/2.

Độ chính xác trung bình của các biểu ghi được khảo sát chưa cao, chiếm khoảng 76.92%.

Độ đầy đủ

Độ đầy đủ của từng biểu ghi được xác định bằng tỷ số giữa số lượng các đối tượng nghiên cứu được mô tả và tổng số đối tượng được đề cập trong nội dung tài liệu. Cơng thức tính hệ số đầy đủ được trình bày ở phần 1.1.4.1 của Chương 1.

Ví dụ biểu ghi HLU150027805 có 5 từ khóa được mơ tả. Tuy nhiên, biểu ghi này cịn thiếu 2 từ khóa nên độ đầy đủ của biểu ghi là 5/7.

Chất lượng phản ánh nội dung tài liệu được thể hiện ở bảng sau:

Chỉ tiêu khảo sát Mã biểu ghi Độ chính xác Độ đầy đủ Ncx/Ncm Tỷ lệ Nđt/Mđt Tỷ lệ HLU150027805 5/6 83.3 5/7 71.4 HLU150025370 6/7 85.7 6/7 85.7 HLU150027809 4/8 50 4/8 50 HLU150027811 5/6 83.3 6/6 100 HLU150027908 3/3 100 3/3 100 HLU150027911 3/5 60 3/4 75 HLU150027513 2/2 100 2/3 66.7 HLU150027532 4/4 100 3/5 60 HLU150027575 5/5 100 4/5 80 HLU150027781 3/4 75 3/4 75 HLU150027796 3/3 100 3/3 100 HLU 140021112 4/5 80 5/6 83.3 HLU 140023840 4/5 80 4/4 100 HLU 140023841 4/5 80 4/4 100 HLU140023843 3/4 75 3/4 75 HLU140023845 1/4 25 1/3 33 HLU140024180 4/4 100 4/4 100 HLU150025039 3/4 75 3/3 100 HLU150025115 2/3 63.3 3/3 100 HLU150025104 4/4 100 4/4 100

Bảng 2.3 Kết quả khảo sát, đánh giá chất lượng từ khóa

Số lượng từ khóa trong kết quả là : 91 Số lượng đặc trưng được lựa chọn là : 71 Tổng số đặc trưng của 20 tài liệu là : 90 Như vậy hệ số chính xác là: Kcx =Ncx/Ncm x100% = 70/91 x 100%= 76.92% Hệ số đầy đủ là: Kđđ = Nđt/Mđt x 100% = 71/90 x 100% = 78.9%

Ngoài việc đi sâu phân tích và đánh giá kết quả định từ khóa của 20 tài liệu, tác giả cịn trích lọc tồn bộ các từ khóa được lưu trữ trong CSDL thơng qua tính năng từ điển từ khóa của phần mềm Libol 6.0. Qua khảo sát tập hợp các từ khóa này, tác giả nhận thấy một số hạn chế, tồn tại trong cơng tác định từ khóa của Trung tâm như sau:

- Hình thức của các từ khóa cịn chưa có sự thống nhất trong cách trình bày, cụ thể như sau:

+ Khơng thống nhất trong cách viết chữ “i” và “y”

Chữ “i” Chữ “y”

Chữ ký điện tử (1 từ) Chữ kí điện tử (2 từ) Hiệu lực pháp lí (3 từ) Hiệu lực pháp lý (5 từ) Công ti (8 từ) Công ty (331 từ)

Văn bản qui phạm pháp luật (9 từ) Văn bản quy phạm pháp luật (213 từ) Hoa Kỳ (142 từ) Hoa Kì (2 từ)

…………….. ………………

+ Khơng thống nhất trong cách trình bày tên địa danh, tên nước, tên nhân vật là người nước ngồi. Ví dụ:

Từ khóa Số lƣợng Campuchia 28 Cam pu chia 1 Canađa 3 Canada 37 Goóc ba chốp 1 Gcbachơp 1 Goócbachốp 3 V.I.Lê Nin 7 V.I.Lênin 2 V.Lênin 1

- Sử dụng từ nối, dấu phẩy (,) khi định từ khóa. Ví dụ: Luật Hơn nhân và gia đình

Tổ chức và kiểm soát quyền lực nhà nước Tạm giam, tạm giữ người chưa thành niên…

- Các từ khóa cịn vi phạm các u cầu về tính ngắn gọn, súc tích. Ví dụ: + Các vụ án kinh doanh

+ Bảo vệ quyền lợi người phụ nữ

+ Một số công ước quốc tế về nhân quyền + Hợp nhất văn bản quy phạm pháp luật

- Một số từ khóa khơng chính xác: Kỹ năng học tập hợp tác, Nghề nghiệp bị cáo, Bộ trưởng ban hành văn bản, Thất nghiệp nông thôn…

Từ kết quả trên cho thấy, khâu định từ khóa của Trung tâm cịn nhiều hạn chế: tỷ lệ từ khóa phản ánh chính xác nội dung tài liệu cịn chưa cao, cách thức trình bày từ khóa chưa thống nhất, một số từ khóa cịn dài và khơng thơng

dụng. Nguyên nhân của những hạn chế này chính là hệ quả của việc định từ khóa tự do. Phương thức này muốn đạt chất lượng cao phụ thuộc rất nhiều vào kỹ năng của cán bộ làm từ khóa, đặc biệt là kỹ năng xử lý từ vựng.

2.4 Tóm tắt

Tóm tắt nội dung tài liệu là trình bày bằng văn bản một cách đầy đủ, chính xác và ngắn gọn nội dung của tài liệu gốc mà khơng kèm theo bất kỳ lời bình luận nào từ phía người làm tóm tắt. Kết quả của quá trình này tạo ra tài liệu cấp 2 – bài tóm tắt.

Người ta có thể phân loại bài tóm tắt theo nhiều tiêu chí khác nhau, theo hình thức bài tóm tắt hoặc theo mức độ mơ tả nội dung tài liệu gốc. Phân loại theo mức độ mơ tả nội dung tài liệu gốc gồm có ba loại: tóm tắt chỉ dẫn, tóm tắt thơng tin và tóm tắt hỗn hợp.

Thư viện trường Đại học Luật Hà Nội sử dụng hình thức làm tóm tắt chỉ dẫn. Đây là loại tóm tắt trình bày đầy đủ các chủ đề nội dung mà tài liệu đề cập đến song không quan tâm đến kết quả nghiên cứu hoặc kết luận cụ thể có trong tài liệu. Bài tóm tắt chủ yếu mơ tả lại cấu trúc nội dung của tài liệu, những chủ đề chính mà tài liệu nghiên cứu, khía cạnh tiếp cận đối với chủ đề nội dung. Một bài tóm tắt có độ dài từ 50 đến 150 từ. Bài tóm tắt chỉ dẫn có đặc điểm:

Ngắn gọn, giúp người dùng tin nắm bắt nhanh, tổng quát nội dung tài liệu. Dễ làm vì khơng cần triển chi tiết và rộng nội dung của tài liệu như tóm tắt thơng tin.

Khối lượng bài tóm tắt nhỏ.

Tuy nhiên bài tóm tắt chỉ dẫn có nhược điểm là khơng đáp ứng được yêu cầu của người dùng tin khi muốn tìm hiểu sâu hơn về nội dung tài liệu.

Bài tóm tắt có tác dụng trợ giúp người dùng tin cũng như cán bộ thư viện trên các phương diện sau:

- Chọn lọc tài liệu: Bằng việc thông báo cho người dùng tin những đặc điểm và nội dung tài liệu gốc, bài tóm tắt giúp họ loại bỏ những tài liệu khơng phù hợp với nhu cầu tin của mình mà khơng cần đọc tài liệu gốc.

- Vượt qua rào cản ngơn ngữ: Tài liệu có thể được thể hiện bằng nhiều ngôn ngữ khác nhau và không phải người dùng tin nào cũng thành thạo tất cả ngơn ngữ đó. Bài tóm tắt bằng tiếng Việt sẽ giúp người dùng tin không phải mất nhiều thời gian, công sức để hiểu đầy đủ và chính xác nội dung của tài liệu gốc mà không phụ thuộc vào kiến thức của họ về ngơn ngữ của tài liệu gốc.

- Tóm tắt tài liệu giúp cán bộ thư viện có thể nắm bắt được nội dung kho tài liệu, chủ động giải đáp yêu cầu tin của bạn đọc. Ngồi ra, làm tóm tắt cịn giúp cán bộ hồn thiện và phát triển kỹ năng viết văn bản, kỹ năng phân tích và tổng hợp nội dung của tài liệu.

Hiện nay, với số lượng cán bộ làm công tác xử lý tài liệu ít và trình độ ngoại ngữ cịn hạn chế, do đó thư viện chỉ tiến hành làm tóm tắt cho các loại giáo trình, sách tham khảo, chuyên khảo, luận án, luận văn, đề tài khoa học, bài trích tạp chí bằng tiếng Việt. Các tác phẩm văn học và tài liệu ngoại văn chưa được biên soạn bài tóm tắt.

Cũng giống như hai phương thức trên, trước khi tiến hành tóm tắt nội dung tài liệu, các cán bộ thư viện sẽ tìm kiếm các tài liệu cần được xử lý trên cơ sở dữ liệu của một số thư viện đặc biệt là Thư viện Quốc gia Việt Nam. Nếu tìm được các tài liệu tương ứng sẽ sao chép bản tóm tắt của các tài liệu đó về CSDL của thư viện. Với cách thức này sẽ giúp tiết kiệm rất nhiều thời gian cho cán bộ xử lý. Các tài liệu khơng tìm thấy trên cơ sở dữ liệu của Thư viện Quốc gia thì sẽ tiến hành theo quy trình làm tóm tắt thơng thường.

Một phần của tài liệu (LUẬN văn THẠC sĩ) xử lý nội dung tài liệu tại trung tâm thông tin thư viện đại học luật hà nội (Trang 54 - 59)

Tải bản đầy đủ (PDF)

(101 trang)