- Các nhóm phụ được chọn lựa theo các tiêu chí liên quan đến các biến số nghiên
Chương 7 Nhập và xử lý dữ liệu Mục tiêu giảng dạy
Mục tiêu giảng dạy
Nhằm hướng dẫn sinh viên cách:
1. Cách nhập liệu, xử lý và phân tích dữ liệu.
2. Các kỹ thuật phân tích dữ liệu mang tính khám phá (exploratory data analysis) cung cấp một sự thấu hiểu và chẩn đoán dữ liệu bằng cách nhấn mạnh việc trình bày trực quan các dữ liệu.
3. Cách sử dụng bảng chéo (cross-tabulation) để trắc nghiệm mối quan hệ giữa các biến phân loại (categorical variables), có vai trò như là một khung phân tích cho các trắc nghiệm thống kê sau này, và làm cho các phân tích dựa trên bảng số
liệu sử dụng một hoặc nhiều biến khống chế (control variables) trở thành một công cụ thể hiện dữ liệu có hiệu quả.
4. Cách sử dụng các thống kê phân tích trắc nghiệm giả thiết.
1. PHÂN TÍCH KHÁM PHÁ DỮ LIỆU
Khi dùng phân tích khám phá dữ liệu - exploratory data analysis (EDA) ta có khả
năng linh động đáp ứng lại các khuôn mẫu khác nhau của bước phân tích dữ liệu sơ
khởi. Cách thức phân tích này cho phép xem xét và đánh giá lại kế hoạch phân tích dữ
liệu. Tính mềm dẻo là một thuộc tính quan trọng của cách tiếp cận này.
Phân tích xác nhận dữ liệu (Confirmatory data analysis) là một quá trình phân tích theo hướng suy luận từ kết quả phân tích thống kê dựa trên trắc nghiệm ý nghĩa và độ
Hình 5.1 Các bước khám phá, trắc nghiệm và phân tích trong quá trình nghiên cứu 2. NHẬP SỐ LIỆU 2.1 Cách bố trí dữ liệu trên máy tính a) Mục tiêu: • Nhằm tạo điều kiện thuận tiện cho việc nhập liệu • Nhằm tạo sự thuận lợi cho việc chỉnh sửa dữ liệu b) Thực hiện:
• Nguyên tắc chung: đặt tên biến ngắn gọn, nên viết tắt (nên sử dụng tiếng Việt không dấu hoặc sử dụng tiếng Anh). Tên biến nên được đặt theo quy luật và trình tự của bảng câu hỏi hay nội dung khảo sát.
Lập đề cương NC Thu thập và chuẩn bị dữ liệu Phân tích và diễn giải dữ liệu Phân tích mô tả các biến số Lập bảng chéo cho các biến số Trình bày dữ liệu (histogram, boxplots, Pareto, stem-and-
leaf, AID, etc.)
Phân tích dữ liệu
Báo cáo nghiên cứu Ra quyết định Kế hoạch phân tích sơ khởi Xác định lại giả thiết Thể hiện trực quan dữ liệu Trắc nghiệm giả thiết
• Nếu lưu trữ bằng phần mềm Excel: ưu điểm là dễ thao tác và chỉnh sửa, nhược điểm là không gian lưu trữ hạn chế, công cụ thống kê và kinh tế
lượng phát triển chưa đầy đủ cho nhu cầu phân tích.
• Nếu lưu trữ bằng phần mềm SPSS: ưu điểm là không gian lưu trữ gần như
không hạn chế, công cụ thống kê và kinh tế lượng phát triển khá đầy đủ cho nhu cầu phân tích. Nhưng nhược điểm là đòi hỏi việc khai báo dữ liệu mất nhiều thời gian hơn.
2.2 Cách nhập liệu
a) Đối với dữ liệu định lượng: nhập đúng giá trị trong bảng phỏng vấn, nên thao tác bằng các phím tại ô số trên bàn phím.
b) Đối với dữ liệu định tính • Câu trả lời đóng:
o Trường hợp câu hỏi có 1 câu trả lời hoặc chọn 1 trong 2 (ví dụ: có hoặc không, nam hay nữ): sử dụng giá trị 0 và 1 để lưu thông tin. Ví dụ: có là 1 , không là 0, nam là 1 , nữ là 0 hoặc ngược lại.
o Trường hợp có từ 3 lựa chọn trở lên nhưng chỉ có 1 câu trả lời (ví dụ: không thích, thích và không ý kiến): sử dụng giá trị 1, 2 và 3 tương
ứng theo câu trả lời.
o Trường hợp có từ 3 lựa chọn trở lên và có ít nhất 2 câu trả lời (ví dụ: câu hỏi về sở thích: xem tivi, đọc báo và nghe radio): Tạo 3 biến, mỗi biến là một lựa chọn và sử dụng giá trị 0 và 1 để lưu thông tin, lựa chọn nào được đánh dấu trong bảng câu hỏi thì biến tương ứng sẽ có giá trị 1, nếu không được chọn thì đánh số 0.
• Câu trả lời mở: nhập chính xác câu trả lời ghi trong bảng câu hỏi, sau đó đọc và phân nhóm câu trả lời rồi mã hóa.
Chú ý: Cần phải tạo 1 file để chứa tên và giải thích ý nghĩa của các biến có trong dữ
Hình 5. 2 Cách nhập dữ liệu vào bảng tính SPSS
Hình 5.3 Cách định nghĩa các thuộc tính của các biến sốđịnh tính và định lượng
3. THANH LỌC DỮ LIỆU (Data Screening)
3.1 Phát hiện giá trị dị biệt trong dữ liệu