Để phân loại tài liệu và định từ khóa, định chủ đề (sau đây gọi là định chỉ mục) đạt chất lượng tốt, đảm bảo tính khoa học thì cần phải đảm bảo các tính chất sau:
- Tính chính xác: đó là mức độ tương ứng giữa lượng khái niệm của đặc trưng tài liệu với lượng khái niệm đặc trưng được chọn để mô tả. Trong trường hợp mức độ chính xác cao nhất không được đảm bảo, nên mở rộng khái niệm ở mức cao hơn gần nhất. Mức độ chính xác của việc định chỉ mục được xác định bởi:
+ Nhiệm vụ của hệ thống cụ thể, phục vụ cho diện người dùng nào, đề tài gì được ưu tiên (Những vấn đề thuộc nhiệm vụ của hệ thống được ưu tiên ở độ chính xác cao, những vấn đề ngoại vi liên quan sử dụng mức độ chính xác hạn chế).
+ Khả năng của các phương tiện được sử dụng trong hệ thống (Khả năng ngữ nghĩa của các phương tiện ngôn ngữ tư liệu, khả năng của phần mềm, các quy định và quy trình định chỉ mục).
+ Trình độ của người định chỉ mục.
- Tính khách quan: Nhằm mục đích quản trị nguồn tin, các đặc trưng nội dung thông tin trong tài liệu gốc phải được trình bày theo đúng với tư tưởng của nó, không được biến đổi theo ý kiến chủ quan của người phân tích, không có bất kỳ sắc thái đánh giá nào đối với tài liệu gốc.
20
- Tính đơn nghĩa: Mỗi chỉ mục phải đảm bảo tính đơn nghĩa, mỗi nội dung khoa học ứng với một tập hợp chỉ mục và chỉ một mà thôi. Kết quả xử lý cùng một tài liệu bới nhiều người khác nhau phải giống nhau.
- Tính đầy đủ: Được hiểu là sự bao hàm đầy đủ các đặc trưng quan trọng nhất của tài liệu, với độ sâu tương ứng với quy định chung của hệ thống.
Để đánh giá chất lượng của công tác phân loại tài liệu, định từ khóa và định chủ đề người ta sử dụng hai hệ số đánh giá cơ bản sau:
- Hệ số chính xác thông qua mô tả:
Kcxmt = Ncxmt/Ncmmt x 100%, trong đó: Kcxmt - Hệ số chính xác
Ncxmt - Số lượng chỉ mục mô tả chính xác Ncmmt - Tổng số chỉ mục trong kết quả - Hệ số đầy đủ thông qua mô tả:
Kđđmt = Nđtmt /Mđtmt x 100%, trong đó: Kđđmt - Hệ số đầy đủ thông qua mô tả Nđtmt - Số lượng đặc trưng được mô tả Mđtmt - Tổng số các đặc trưng nội dung
Ngoài ra, ta còn có thể đánh giá hiệu quả công tác này thông qua tìm tin. - Hệ số chính xác thông qua tìm tin
Kcxtt = Ncxtt/ Nr x 100%
Kcxtt - Hệ số chính xác thông qua tìm tin
Ncxtt - Số lượng các biểu ghi tìm ra đáp ứng yêu cầu tìm Nr - Tổng số các biểu ghi tìm ra
21
Kđđtt = Ŋcx/Ncx x100% trong đó Kđđtt - Hệ số đầy đủ thông qua tìm tin
Ŋcx - Số lượng các biểu ghi tìm ra đáp ứng yêu cầu tin
Ncx - Tổng số các biểu ghi đáp ứng yêu cầu tin trong CSDL. [39, tr.11]