Phương pháp đánh giá chất lượng dữ liệu trực tiếp được chia ra hai loại sau đây:
- Phương pháp đánh giá trong: là phương pháp đánh giá chỉ sử dụng dữ liệu trong nội bộ tập dữ liệu cần đánh giá;
- Phương pháp đánh giá ngoài: là phương pháp đánh giá có sử dụng các dữ liệu khác ngoài tập dữ liệu cần đánh giá.
Phương pháp đánh giá chất lượng dữ liệu gián tiếp là phương pháp đánh giá chất lượng tập dữ liệu cần đánh giá dựa trên kinh nghiệm của người tiến hành kiểm tra chất lượng dữ liệu và các thông tin ngoài phạm vi tập dữ liệu có ảnh hưởng đến chất lượng dữ liệu.
1.2. Phương pháp đánh giá chất lượng dữ liệu trực tiếp
Phương pháp đánh giá chất lượng dữ liệu trực tiếp được thực hiện bằng cách kiểm tra tự động, kiểm tra thủ công hoặc kết hợp kiểm tra tự động và kiểm tra thủ công. Kiểm tra tự động là sử dụng công cụ phần mềm; kiểm tra thủ công do cán bộ kiểm tra chất lượng thực hiện.
a) Mức độ kiểm tra gồm:
- Kiểm tra toàn bộ: kiểm tra tất cả các phần tử có trong tập dữ liệu theo các bước sau:
+ Xác định nội dung kiểm tra: xác định đơn vị dữ liệu nhỏ nhất (đối tượng, thuộc tính, quan hệ của đối tượng) cần kiểm tra.
+ Kiểm tra nội dung theo từng tiêu chí chất lượng.
- Kiểm tra theo phương pháp lấy mẫu: kiểm tra các mẫu được trích ra từ tập dữ liệu theo các bước sau:
+ Xác định phương pháp lấy mẫu. + Xác định nội dung kiểm tra
+ Chia tập dữ liệu ra thành các lô có cùng tính chất.
+ Chia lô thành các đơn vị mẫu; một đơn vị mẫu là khu vực được kiểm tra chất lượng. + Xác định mức độ kiểm tra cho từng mẫu theo tỉ lệ hoặc số lượng mục thông tin. + Kiểm tra từng đơn vị mẫu.
Việc lấy mẫu phải đảm bảo tính ngẫu nhiên và độ tin cậy của kết quả đánh giá chất lượng.