Bài giảng chiến lược xử lý dữ liệu

30 3 0
Bài giảng chiến lược xử lý dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chiến lược xử lý liệu Trần Tiến Khai Khoa Kinh tế Đại học Kinh Tế TP Hồ Chí Minh Cấu trúc Câu hỏi thường gặp Quy trình phân tích liệu Chuẩn hóa liệu Phân tích đơn biến Phân tích đa biến Câu hỏi thường gặp  Ta có Mục tiêu, Câu hỏi, Giả thuyết nghiên cứu nào?  Với liệu thu thập, ta phân tích liệu để đáp ứng Mục tiêu, Câu hỏi, Giả thuyết nghiên cứu?  Ta sử dụng thống kê phân tích nào?  Trình tự phân tích nên nào? Quy trình phân tích liệu Hình Các bước khám phá, trắc nghiệm phân tích q trình nghiên cứu Đề cương NC Thu thập chuẩn bị liệu Xác định lại mục tiêu, giả tthuyết Thể trực quan liệu Phân tích diễn giải liệu Phân tích thống kê mơ tả biến số Các kỹ thuật phân tích đơn biến Kế hoạch phân tích sơ khởi Làm sạch, kiểm tra, đánh giá, thăm dị liệu Phân tích thống kê mối liên quan, tương quan biến số Trắc nghiệm giả thuyết Phân tích thống kê so sánh nhóm mẫu phụ Trắc nghiệm giả thuyết Trình bày liệu (histogram, boxplots, bar, pie charts, statistical tables ) Các kỹ thuật phân tích đa biến Phân tích sâu Trắc nghiệm giả thuyết Báo cáo nghiên cứu Ra định sách Chuẩn hóa liệu  Mục tiêu: ◦ Phát loại bỏ sai sót liệu ◦ Hiểu cấu trúc đặc tính biến số ◦ Dự kiến cách thức xử lý phù hợp Chuẩn hóa liệu  Kỹ thuật: ◦ Phát giá trị dị biệt liệu ◦ Khảo sát sơ biến Chuẩn hóa liệu  Phát giá trị dị biệt ◦ Công cụ Filter Excel ◦ Công cụ biểu đồ ◦ Công cụ thống kê mô tả Dùng Excel: công cụ filter Dùng Excel: Hàm min, max Dùng SPSS: scatter, bar chart, pie chart, histogram, box plot 10 Phân tích đơn biến Mục tiêu kiểu câu hỏi nghiên cứu Mục tiêu chung Mục tiêu cụ thể Kiểu câu hỏi/ giả thuyết Kiểu thống kê Quan hệ biến So sánh nhóm Khác biệt Thống kê khác biệt (v.d t-test, ANOVA) Mức độ liên quan, biến liên quan Liên quan Thống kê liên quan (v.d tương quan, hồi quy) Thuần Mô tả Tóm lược liệu Mơ tả Thống kê mơ tả (v.d trung bình, tỷ lệ, tần suất) 16 Phân tích đơn biến (trung tâm, tính biến thiên, phân phối) Biến định lượng Tồn mẫu Phân tích theo mẫu phụ (trung tâm, tính biến thiên, phân phối) Bước Thống kê mơ tả (tần suất) Biến định tính Tồn mẫu Phân tích phân bố theo nhiều biến Hình Các bước thống kê mô tả (bảng chéo) 17 Thống kê mơ tả cho biến định lượng: cho tồn mẫu Descriptive Statistics N Min Max 169 Mean Std Error 4.69 120 Std Dev 1.559 Skewness Std Error 554 187 169 2.27 080 1.044 687 187 1.012 371 169 2.42 086 1.116 489 187 012 371 169 2.95 102 1.331 685 187 -.183 371 so lao dong nam 169 1.58 068 884 776 187 448 371 so lao dong nu 169 1.37 068 885 497 187 014 371 Valid N (listwise) 169 so nhan khau ho so luong vien nam so luong vien nu so lao dong chinh Kurtosis Std Error 223 371 18 Thống kê mô tả cho biến định lượng: cho mẫu phụ So nguoi phu thuoc Khong ngheo Statistic Mean 95% Confidence Interval for Mean Ngheo Std Error 1.66 110 Statistic Std Error 1.92 Lower Bound 1.44 1.57 Upper Bound 1.88 2.28 5% Trimmed Mean 1.60 1.92 Median 2.00 2.00 Variance 1.402 1.648 Std Deviation 1.184 1.284 Minimum 0 Maximum Range Interquartile Range Skewness 527 226 -.081 327 Kurtosis 601 447 -1.016 644 19 Thống kê mơ tả cho biến định tính: bảng tần suất bảng chéo trinh hoc van cua chu ho Valid khong di hoc Frequency 12 Percent Valid Percent 7.1 7.1 Cumulative Percent 7.1 cap 89 52.7 52.7 59.8 cap 49 29.0 29.0 88.8 cap 14 8.3 8.3 97.0 3.0 3.0 100.0 169 100.0 100.0 cao dang - dai hoc Total 20 Thống kê mơ tả cho biến định tính: bảng tần suất bảng chéo Tinh trang kinh te ho * trinh hoc van cua chu ho Crosstabulation Count trinh hoc van cua chu ho khong di hoc Tinh trang kinh te ngheo ho trung binh giau Total cap cao dang cap dai hoc 0 cap 38 42 29 11 85 14 31 12 89 49 14 169 Total 53 21 Phân tích đơn biến Biến định lượng Bước Thống kê liên quan Giữa biến: Pearson correlation coefficient (r) Giữa biến: Biến định tính Hình Các bước thống kê liên quan • Pearson chi-square, the likelihoodratio chi-square, Fisher's exact test, Yates' corrected chi-square • Spearman's correlation coefficient • Nominal: Contingency coefficient, Phi (coefficient) and Cramér's V, Lambda • Ordinal: Gamma, Kendall's tau-b, and Kendall's tau-c • Nominal by Interval: Eta • Others 22 Phân tích tương quan: so nhan khau ho Correlations so nhan khau so lao dong so lao dong so lao dong so nguoi chinh nam nu phu thuoc ho ** ** ** 653 448 534 565** Pearson Correlation Sig (2-tailed) N 169 so lao dong chinh Pearson 653** Correlation Sig (2-tailed) 000 N 169 so lao dong nam Pearson 448** Correlation Sig (2-tailed) 000 N 169 so lao dong nu Pearson 534** Correlation Sig (2-tailed) 000 N 169 so nguoi phu Pearson 565** thuoc Correlation Sig (2-tailed) 000 N 169 ** Correlation is significant at the 0.01 level (2-tailed) .000 169 000 169 752** 000 169 753** 000 169 -.257** 169 752** 000 169 000 169 133 001 169 -.247** 000 169 753** 169 133 085 169 001 169 -.139 000 169 -.257** 085 169 -.247** 169 -.139 072 169 001 169 001 169 072 169 169 23 Phân tích tương quan: Correlations Tinh trinh tinh trang hoc van ky nang trang kinh te cua chu cua chu ho ho suckhoe ho ** ** 1.000 -.237 408 410** Kendall's tau_b Tinh trang kinh Correlation te ho Coefficient Sig (2-tailed) N 169 tinh trang Correlation -.237** suckhoe Coefficient Sig (2-tailed) 001 N 169 trinh hoc Correlation 408** van cua chu ho Coefficient Sig (2-tailed) 000 N 169 ky nang cua Correlation 410** chu ho Coefficient Sig (2-tailed) 000 N 117 ** Correlation is significant at the 0.01 level (2-tailed) .001 169 1.000 000 169 -.492** 000 117 -.332** 169 -.492** 000 169 1.000 000 117 382** 000 169 -.332** 169 382** 000 117 1.000 000 117 000 117 117 24 Phân tích đơn biến Các kiểm định thống kê so sánh thường dùng phân theo thang đo liệu số lượng mẫu phụ Measurement scale One-sample Case Two-Samples Tests Related Samples Independent Samples k-Samples Tests Related Samples Independent Samples Nominal • Binomial • χ2 one-sample test • McNemar • Fisher exact test • χ2 twosample test • Cochran Q • χ2 for ksamples Ordinal • KolmogorovSmirnov onesample test • Runs test • Sign test • Wilcoxon matchedpairs test • Median test • MannWhitney U • KolmogorovSmirnov • WaldWolfowitz- • Friedman two-way ANOVA • Median extension • KruskalWallis oneway ANOVA Interval and Ratio • T-test • Z test • T-test for paired samples • T-test • Z test • Repeatedmeasured ANOVA • One-way ANOVA • n-way ANOVA 25 Phân tích đa biến Hình Phân loại phương pháp phân tích đa biến Multivariate methods Dependence methods One dependent variable Multiple dependent / independent variable relationships Several dependent variables Metric Structural equation models Interdependence methods Multiple correlation Multiple regressio n Nonmetric Conjoi nt analysi s Linear probability models Multiple discrimi -nant analysi s Metric Multivariate analysis of variance Multiple dependent and independent variables Nonmetric Canonical analysis with dummy variables Metric canonic al analysi s Metric Factor analysis Metric multidimensional scaling Nonmetric Cluster analysis Nonmetric multidimensional scaling Correspondence analysis Canonical analysis Nguồn: Hair, Anderson, Tatham and Black (1992) 26 Bài tập ứng dụng Phân tích liệu Điều tra hộ gia đình xã A Yêu cầu phân tích nhà trước giảng  Đọc kỹ slide Bài trình bày (gởi kèm), đọc tài liệu phân tích đa biến nhớ lại kỹ thuật phân tích thống kê từ giản đơn đến phức tạp biết  Sử dụng phần mềm SPSS để mở file liệu (Dieu tra tai xa A)  Quan sát phần mô tả đặc điểm biến xem kỹ thang đo biến  Suy nghĩ đề xuất mục tiêu phân tích phù hợp; phác họa chiến lược phân tích liệu theo bước 27 Bài tập ứng dụng Thống kê mơ tả ◦ Biến định lượng ◦ Biến định tính Kiểm định giả thuyết ◦ Liên quan  Phân loại nghèo theo địa phương * phân loại nghèo theo chuẩn quốc gia; dùng nước máy; dùng nước giếng; dùng gaz; có nhà tắm kiên cố; có nhà vệ sinh đạt chuẩn 28 Bài tập ứng dụng Kiểm định giả thuyết ◦ So sánh  Giá trị trung bình số nhân khẩu, số lao động chính, số lao động nam, số người phụ thuộc theo Phân loại nghèo theo chuẩn quốc gia  Giá trị trung bình số nhân khẩu, số lao động chính, số lao động nam, số người phụ thuộc theo Phân loại nghèo theo địa phương 29 Bài tập ứng dụng Kiểm định giả thuyết ◦ Tương quan  Giữa biến số nhân khẩu, số lao động chính, số lao động nam, số người phụ thuộc Các quan hệ đa biến nào? 30 ... sách Chuẩn hóa liệu  Mục tiêu: ◦ Phát loại bỏ sai sót liệu ◦ Hiểu cấu trúc đặc tính biến số ◦ Dự kiến cách thức xử lý phù hợp Chuẩn hóa liệu  Kỹ thuật: ◦ Phát giá trị dị biệt liệu ◦ Khảo sát... Tatham and Black (1992) 26 Bài tập ứng dụng Phân tích liệu Điều tra hộ gia đình xã A Yêu cầu phân tích nhà trước giảng  Đọc kỹ slide Bài trình bày (gởi kèm), đọc tài liệu phân tích đa biến nhớ... mở file liệu (Dieu tra tai xa A)  Quan sát phần mô tả đặc điểm biến xem kỹ thang đo biến  Suy nghĩ đề xuất mục tiêu phân tích phù hợp; phác họa chiến lược phân tích liệu theo bước 27 Bài tập

Ngày đăng: 11/03/2022, 11:11

Tài liệu cùng người dùng

Tài liệu liên quan