Kiểm tra logic và các đặc trưng mẫu

Một phần của tài liệu ĐÁNH GIÁ các yếu tố ẢNH HƯỞNG đến sự CĂNG THẲNG TRONG CÔNG VIỆC đối với CÔNG CHỨC THUẾ tại THÀNH PHỐ hồ CHÍ MINH (Trang 43 - 44)

a. Tạo các biến kiểm tra logic

Thông thường các quan hệ logic được đặt ngay trong thiết kế nhập dữ liệu. Tuy nhiên, cần kiểm tra logic với tất cả các khả năng có thể để tránh sai sót và ảnh hưởng đến kết quả phân tích sau này. Một hệthống các biến kiểm tra phải được thiết kế ngay từ đầu để phát hiện các sai sót dạng này. Hết sức tránh tình trạng khi xử lý gặp một kết quả không giải thích được mới phát hiện ra số liệu lỗi logic, hậu quả là có thể phải làm lại mọi tính toán, phân tích từ đầu.

b. Sử dụng thống kê mô tả, các biểu đồ phát hiện các giá trị ngoại lai và dữ liệu lỗi

Các mô tả thống kê nhờ các đặc trưng và các biểu đồ của các biến là công cụ hữu ích hơn cả để phát hiện các giá trị (thông tin) cá biệt- ngoại lai. Các giá trị nhỏ nhất, lớn nhất sẽ cho biết vùng dữ liệu quan sát được của mỗi biến. Đây chính là thông tin quan trọng xác định một biến nào đó có trường hợp ngoại lai không. Cũng cần chú ý là giá trị ngoại lai không nhất thiết là thông tin sai, nhưng cần loại các giá trị này trong một số tính toán vì chúng có thể làm sai lệch đặc trưng chung của tổng thể nghiên cứu.

Lỗi dữ liệu có thể xuất hiện có tính hệ thống, có thể phát hiện các lỗi này qua các biểu đồ quan hệ, qua mối quan hệ giữa các biến có quy luật, v.v… Khi một biểu đồ quan hệ của hai biến X và Y không phản ánh đúng quan hệ thực tế chúng ta có thể cần nhiều hơn các phân tích để xác định đó là trường hợp cá biệt hay do lỗi của dữ liệu (do

30

cách hiểu các câu hỏi không thống nhất hoặc hiểu sai nội dung câu hỏi trong các cuộc khảo sát).

c. Xử lý số liệu thiếu

Cần phân biệt rõ số liệu thiếu và giá trị 0 của số liệu (nhất là các biến định lượng). Trong rất nhiều trường hợp một quan sát tại một biến nào đó không có dữ liệu thì dữ liệu này có thể thay bằng 0 trong một số tính toán. Trong những trường hợp khác giá trị thiếu không thể thay bằng 0 vì chắc chắn đó là giá trị tồn tại, khác 0 mà không thu thập được. Để bù giá trị thiếu loại này có thể dùng một số cách thông thường sau đây:

- Sử dụng giá trị trung tâm chung: Trong trường hợp tổng thể thuần nhất theo chỉ tiêu X, giá trị thiếu của X có thể lấp đầy bởi một trong các giá trị trung tâm của biến này (trung bình, trung vị hay mốt).

- Sử dụng giá trị trung tâm nhóm: Nếu tổng thể chỉ được coi là thuần nhất về X với một số điều kiện nào đó. Chúng ta có thể sử dụng trung bình nhóm lấp đầy giá trị thiếu nhờ việc chia nhóm theo các điều kiện sao cho trong mỗi nhóm tính thuần nhất có thể được chấp nhận.

- Sử dụng trung bình (hay trung vị) địa phương: Trong một số trường hợp người ta sử dụng trung bình của các quan sát liền kề lấp đầy giá trị thiếu.

- Ngoài ra có thể sử dụng các phép nội suy theo các quan hệ của các biến để tìm giá trị thay cho giá trị thiếu. Trong hầu hết các phân tích thống kê, các phần mềm chuyên nghiệp đều cho phép lựa chọn cách bù giá trị thiếu tạm thời trong tính toán. Việc lựa chọn cách thức bù giá trị thiếu cần hết sức thận trọng.

Một phần của tài liệu ĐÁNH GIÁ các yếu tố ẢNH HƯỞNG đến sự CĂNG THẲNG TRONG CÔNG VIỆC đối với CÔNG CHỨC THUẾ tại THÀNH PHỐ hồ CHÍ MINH (Trang 43 - 44)