1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Phương pháp nghiên cứu khoa học: Chương 9 - TS. Nguyễn Minh Hà

9 3 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Trong chương này, các bạn sẽ cùng tìm hiểu về giai đoạn nhập và xử lý số liệu trong nghiên cứu khoa học. Các nội dung cụ thể của chương gồm có: Chuẩn bị, nhập và kiểm tra dữ liệu; khám phá và trình bày dữ liệu; phân tích thống kê mô tả; phân tích dữ liệu. Mời các bạn cùng tham khảo.

1/19/2012 CHƯƠNG NHẬP VÀ XỬ LÝ SỐ LIỆU TS NGUYỄN MINH HÀ TRƯỜNG ĐH MỞ TPHCM NỘI DUNG CHUẨN BỊ, NHẬP VÀ KIỂM TRA DỮ LIỆU KHÁM PHÁ VÀ TRÌNH BÀY DỮ LIỆU PHÂN TÍCH THỐNG KÊ MƠ TẢ PHÂN TÍCH DỮ LIỆU 1/19/2012 I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Các loại liệu: - Dữ liệu phân loại - Dữ liệu mô tả/ liệu định danh - Dữ liệu xếp hạng hay thứ tự - Dữ liệu định lượng - Dữ liệu khoảng cách I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Trình bày liệu: - Trình bày liệu dạng bảng Gọi ma trận liệu - Đặt tên biến ngắn gọn, nên viết tắt (tiếng Anh/tiếng Việt không dấu) - Đặt tên biến nên theo quy luật trình tự bảng câu hỏi hay trình tự khảo sát - Có thể lưu trữ phần mềm Excel hay SPSS Số nhận dạng (ID) Biến Biến Biến Biến 15 0,4 27 1,2 18 0,9 1/19/2012 I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Mã hóa liệu: Ghi liệu mã số học a Mã hóa liệu định lượng: Các số thực tế sử dụng mã số cho liệu định lượng VD bảng b Mã hóa liệu phân loại: Các câu hỏi, biến trả lời nên mã hóa thành số Việc mã hóa tiết kiệm thời gian nhập, sử dụng để phân tích, kiểm định đối chiếu Để tạo mã hóa cho biến, cần phải: Xem xét liệu xác lập nhóm tổng quát Chia nhóm tổng quát thành nhóm nhỏ tùy vào phân tích dự định thực Phân bổ mã số cho tất phân loại Ghi câu trả lời thực tế phân bổ vào loại mã Đảm bảo phân loại hợp với mã hóa liền để thuận tiện cho việc mã hóa lại I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Nhập liệu: - Cần tạo file để chứa tên giải thích ý nghĩa biến liệu để thuận tiện phân tích kế thừa nghiên cứu - Các liệu định lượng, nhập giá trị bảng vấn - Đối với câu trả lời đóng: • • Khi câu có câu trả lời/chọn (có/khơng; Nam/nữ): sử dụng giá trị để lưu thông tin Vd: có 1, khơng 0; Nam 1, Nữ ngược lại Tình trạng gia đình (0: độc thân, 1: lập gia đình ngược lại) Khi có từ lựa chọn trở lên có câu trả lời (khơng thích/thích/khơng ý kiến): Sử dụng 1, 2, tương ứng theo câu trả lời Trường hợp hay gặp với với câu hỏi phân loại/ danh nghĩa/định danh Vd: Màu tóc (đen, đỏ, hung): 1,2,3 tương ứng đổi thứ tự Ngành kinh doanh: Nông nghiệp, công nghiệp dịch vụ Từ mã hóa 1, 2, 3, Chúng ta chuyển thành biến dummy khác dễ dàng 1/19/2012 I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Nhập liệu: • • Đối với câu trả lời thứ bậc xếp hạng: nhập theo số thứ bậc/xếp hạng mà trả lời Vd: thang đo likert (1-5) Khi có từ lựa chọn trở lên có câu trả lời (vd: sở thích xem tivi, đọc báo, nghe radio): Tạo biến, biến lựa chọn sử dụng giá trị để lưu thông tin Lựa chọn đánh dấu bảng câu hỏi biến tương ứng có giá trị 1, khơng chọn đánh số - Câu trả lời mở: Nhập xác câu trả lời ghi bảng câu hỏi, sau đọc phân nhóm câu trả lời mã hóa I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Kiểm tra sai soát lọc liệu: - Kiểm tra sai soát: - Kiểm tra mã không hợp lệ: số hay o, hay I, Sử dụng số công dụng Excel, SPSS hay chương trình khác để kiểm tra Tìm kiếm quan hệ khơng logic: Coi chừng nhập lộn số (thấp hay cao nhất) số (cao hay thấp nhất) - Phát dị biệt liệu (outliers): Sử dụng Excel: hàm min, hàm max, công cụ Auto Filter, đồ thị scatter, đồ thị plot để xác định Trong SPSS: đồ thị scatter, công cụ Frequency, để phát - Phát xử lý liệu bị khuyết tật (missing data): Sử dụng Exel: Công cụ Auto Filter Sử dụng SPSS: Công cụ Frequency Select Cases 1/19/2012 II KHÁM PHÁ VÀ TRÌNH BÀY DỮ LIỆU Sử dụng biểu đồ, đồ thị, hình vẽ, số liệu thống kê để trình bày liệu Phần phần trình bày kết NC thống kê liệu (khác với mô tả thống kê: Descriptive Statistics) - Trình bày biến cho dễ dàng đọc giá trị cụ thể - Thấy giá trị cao nhất, thấp - Thể xu hướng: dùng đường thẳng - Tỷ lệ xảy (tỷ lệ %) - Thể phân bố giá trị cho biến (vd: đa số tập trung mức 25% trên) - Thể mối quan hệ: Đồ thị/biểu đồ phân tán thống kê Vd: trình độ học vấn theo tuổi, Thu nhập theo trình độ học vấn, - So sánh biến hay so sánh biến theo đặc tính, III PHÂN TÍCH THỐNG KÊ MƠ TẢ Phân tích thống kê mô tả định lượng: - Sử dụng Excel: Công cụ Descriptive Statistics chức Data Analysis - Sử dụng SPSS: Công cụ Frequency, Descriptives, Explore chức Descriptive Statistics a Ơn lại sớ tiên thống kê: - Đo lường xu hướng trung tâm: Mode, Trung vị (Median), giá trị trung bình (Mean), Khoảng cách (Range) - Đo lường sự biến thiên: Phương sai (Variance; σ2) trung bình tổng sai sớ bình phương giá trị quan sát và giá trị trung bình Đợ lệch chuẩn (Standard Deviation; SD, σ) đo lường mức độ phân tán số liệu xung quanh giá trị trung bình 10 1/19/2012 III PHÂN TÍCH THỐNG KÊ MƠ TẢ Phân tích thống kê mơ tả định lượng: b Thống kê mô tả - Yêu cầu bảng thống kê mô tả tối thiểu gồm : Variable Obs Mean Std Dev Min Max Growth 21,217 -0.04 0.84 -1 15.27 Assetgrowth 21,205 0.08 1.03 -1 19.00 Lnage 32,766 1.91 0.62 3.43 Capital 32,766 48.79 115.86 1,344.65 AgriSector 32,766 0.01 0.09 InduSector 32,766 0.32 0.47 ServSector 32,766 0.67 0.47 11 III PHÂN TÍCH THỐNG KÊ MƠ TẢ Phân tích thống kê mơ tả định tính: - Sử dụng bảng đơn giản: Trong SPSS, sử dụng công cụ Basic Table Trong Excel, sử dụng Pivote table Ví dụ: Số mẫu Nam 140 53,8 Nữ 120 46,2 Tổng 260 Số mẫu Tỷ lệ (%) 100 Tỷ lệ (%) Nông nghiệp 22 7,2 Công nghiệp 155 50,8 Dịch vụ 128 42 Tổng 305 100 12 1/19/2012 III PHÂN TÍCH THỐNG KÊ MƠ TẢ Phân tích thống kê mơ tả định tính: - Sử dụng bảng so sánh chiều hay gọi Bảng chéo (CrossTabulation) Trong SPSS, sử dụng công cụ Basic Table Trong Excel, sử dụng Pivote table Ví dụ: Current salary (unit: dong) 2001 Total 530 Sector Sector 164 Sector 366 2002 % % 100 880 100 0.0 0.5 30.9 292 33.2 69.1 584 66.4 Level of education Sum Under 1500,0001,500,000 3,000,000 Professional degree 2,000,000 Over 3,000,000 3,000,000 Intermediate ,Colleges 15 33 count % 24.24 27.27 45.45 3.03 100.00 University 144 81 93 58 376 count % 38.30 21.54 24.73 15.43 100.00 Postgraduation university 14 26 count % 3.85 11.54 30.77 53.85 100.00 13 IV PHÂN TÍCH DỮ LIỆU - Phân tích tương quan đa cộng tuyến (correlation matrix) - Phân tích hồi quy (Regression): có mối quan hệ, có quan hệ nhân quả, cường độ tác động, dự báo giá trị, dự báo xu hướng (chuổi theo thời gian) - Phân tích khám phá EFA - Phân tích Anova (test khác nhóm) sử dụng t-test Trong excel sử dụng: Correlation, Anova regression chức Data Analysis Trong SPSS: công cụ Compare Means, Nonparametric Tests, Regression Lưu ý: cách chọn biến phụ thuộc biến độc lập hồi quy (các biến phải tương ứng với nhau) Trình bày bảng kết hồi quy 14 1/19/2012 Ví dụ: Bảng: Kết hồi quy Biến Coefficients Std.Errors Constant 0.6178 0.4400 Biến -0.0762* 0.3441 Biến 0.0142 0.1031 Biến -0.0399*** 0.0122 -0.0001 0.0001 -0.0154 0.2615 Số quan sát 11,057 R R2 R2 điều chỉnh ChiWald test Ghi chú: (nếu có) *** Ý nghĩa mức 1%, ** Ý nghĩa mức 5%, * Ý nghĩa mức 10% Bảng: Kết hồi quy Biến Hệ số Constant 0.6178 (0.4400) Biến -0.0762* (0.3441) Biến 0.0142 (0.1031) Biến -0.0399*** (0.0122) Số quan sát R R2 R2 điều chỉnh ChiWald test Ghi chú: Trong ngoặc Std Errors *** Ý nghĩa mức 1%, ** Ý nghĩa mức 5%, * Ý nghĩa mức 10% 15 IV PHÂN TÍCH DỮ LIỆU Sau phân tích thống kê, mơ tả thống kê, phân tích kết hợp (tùy theo yêu cầu nghiên cứu) phần sau: - Test correlation, sau chạy hồi quy thực số tests - Chỉ phân tích EFA - Phân tích khám phá EFA, sau chạy hồi quy - Phân tích EFA test Anova - Phân tích hồi quy test Anova - Chỉ thực test Anova - Chỉ thực mơ tả thống kê phân tích thống kê, - 16 1/19/2012 Kết thúc Thanks 17 ... hồi quy 14 1/ 19/ 2012 Ví dụ: Bảng: Kết hồi quy Biến Coefficients Std.Errors Constant 0.6178 0.4400 Biến -0 .0762* 0.3441 Biến 0.0142 0.1031 Biến -0 .0 399 *** 0.0122 -0 .0001 0.0001 -0 .0154 0.2615... (tùy theo yêu cầu nghiên cứu) phần sau: - Test correlation, sau chạy hồi quy thực số tests - Chỉ phân tích EFA - Phân tích khám phá EFA, sau chạy hồi quy - Phân tích EFA test Anova - Phân tích hồi...1/ 19/ 2012 I CHUẨN BỊ, NHẬP, VÀ KIỂM TRA DỮ LIỆU Các loại liệu: - Dữ liệu phân loại - Dữ liệu mô tả/ liệu định danh - Dữ liệu xếp hạng hay thứ tự - Dữ liệu định lượng - Dữ liệu khoảng

Ngày đăng: 26/04/2021, 18:06

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN