2.3.1. Phƣơng pháp luận
Phương pháp của chúng tôi tập trung vào phân tích tổng thể các dữ liệu điều tra trong khoa học nhân văn. Phương pháp này xuất phát từ thực tế là các biến độc lập (các câu trả lời định lượng hoặc định tính cho bản hỏi của cuộc điều tra) thường không có đủ phẩm chất cần thiết để được đưa trực tiếp vào mô hình thống kê. Các tập dữ liệu có thể có sai số, sai sót hay bỏ sót. Câu hỏi không phải lúc nào cũng dễ hiểu, người được phỏng vấn không phải lúc nào cũng biết đưa ra câu trả lời cần thiết, tinh thần cuộc điều tra, bản chất của việc đặt câu hỏi không phải lúc nào cũng được lĩnh hội. Sau khi được mã hóa dưới dạng số, một biến độc lập không còn chứa các yếu tố cho phép phê duyệt liến đó. Tuy nhiên, một số biến liên quan đến cùng một chủ đề có thể phê duyệt lẫn nhau thông qua phân tích đa biến. Chúng tôi muốn đề xuất các phương pháp áp dụng kỹ thuật phân tích dữ liệu (phân tích khảo sát đa chiều) để phê duyệt và đánh giá thông tin cơ sở. Hai bước đầu tiên trong xử lý số liệu điều tra theo phương pháp này gồm: Làm sạch số liệu và mô tả sơ bộ (sắp xếp
dữ liệu, lược đồ, tính số liệu thống kê ban đầu, trung bình, độ lệch chuẩn, giá trị cực trị, ngũ phân vị, bảng phân tổ chéo) ; xem xét tính gắn kết tổng thể, hiển thị dữ liệu, cơ cấu số liệu, phân loại theo phương pháp khảo sát.Phương pháp này gồm hai nhóm lớn sau: phương pháp nhân tố (phân tích theo thành phần chính, phân tích tương quan đơn giản và phức tạp) và phương pháp phân loại tự động. Chúng tôi muốn nhấn mạnh trước hết đến bước thứ hai có tên gọi “xem xét tính gắn kết tổng thể”. Đây là ứng dụng mới trước đây không có trong các phần mềm tin học truyền thống. Trong khi đó đây là bước quan trọng giúp đánh giá chất lượng thông tin, xác định mối quan hệ tương tác giữa tất cả hay từng phần đặc điểm của tổng thể nghiên cứu. Bước này cho phép đánh giá tính gắn kết tổng thể của tập dữ liệu, xây dựng các chỉ số tổng hợp và đưa ra các bước tiếp theo trong quá trình xử lý số liệu điều tra.Thống kê khảo sát: phân tích nhân tố và phân loại.