Bài giảng Phân tích dữ liệu với SPSS được biên soạn bởi TS. Nguyễn Thị Phương Giang với các nội dung phân loại dữ liệu, mã hóa, nhập liệu và một số xử lý trên biến; làm sạch dữ liệu; tóm tắt và trình bày dữ liệu; phân tích nhân tố Explore factor và kiểm định Cronbach Analysis Alpha; phân tích liên hệ giữa biến nguyên nhân định tính và biến kết quả định lượng kiểm định trung bình tổng thể; phân tích liên hệ giữa biến nguyên nhân định tính và biến kết quả định lượng phân tích phương sai; kiểm định phi tham số...
Chương I PHÂN LOẠI DỮ LIỆU, MÃ HÓA, NHẬP LIỆU VÀ MỘT SỐ XỬ LÝ TRÊN BIẾN Biên soạn: TS NGUYỄN THỊ PHƯƠNG GIANG Phone: 0944.822.211 E-Mail: nguyenthiphuonggiang@iuh.edu.vn NỘI DUNG • • • • • • • • Phân loại liệu Các loại thang đo Nguyên tắc mã hóa nhập liệu Cửa sổ làm việc SPSS Tạo tập tin liệu SPSS Một số xử lý biến Thay đổi số mặc định Tiếng việt SPSS 02/08/2017 Phân loại Dữ liệu • Dữ liệu định tính: Phản ánh tính chất, kém, khơng tính trị trung bình • Ví dụ: Giới tính, kết học tập • Dữ liệu định lượng: Phản ánh mức độ kém, thể số nên tính giá trị trung bình Các số thu thập dạng liên tục hay rời rạc 02/08/2017 Các loại thang đo • Thang đo danh nghĩa (Nominal scale): Trong thang đo này, số dùng để phân loại đối tượng • Những phép tốn thống kê sử dụng là: đếm, tính tần suất biểu 02/08/2017 Các loại thang đo • Thang đo thứ bậc (Ordinal scale): Các số thang đo danh nghĩa xếp theo qui thứ bậc Ví dụ: Bạn hài lịng mùi sản phẩm Snack Khoai tây chiên mà bạn vừa dùng thử? (Hài lịng, bình thường, khơng hài lịng) 02/08/2017 Các loại thang đo • Thang đo khoảng (Interval scale): Là dạng đặc biệt thang đo thứ bậc cho biết khoảng cách thứ bậc Thông thường thang đo khoảng có dạng dãy chữ số liên tục đặn từ đến 5, từ đến hay từ đến 10,… Dãy số có cực hai đầu thể trạng thái đối nghịch 02/08/2017 Các loại thang đo • Thang đo tỉ lệ (Ratio scale): có tất đặc tính khoảng cách thứ tự thang đo khoảng, ngồi điểm khơng thang đo khoảng giá trị thật nên thực phép chia để tính tỉ lệ Thang đo khoảng thang đo tỉ lệ đo lường nên SPSS gộp chung hai loại thang đo thành thang đo mức độ (Scale Measures) 02/08/2017 Nguyên tắc Mã hóa – Nhập liệu Giới tính Tuổi Nghề nghiệp Nữ 21 Sinh viên Nữ 32 Nhân viên văn phòng Nam 53 Về hưu … … … … n Nam 42 Nghề khác 02/08/2017 Nguyên tắc Mã hóa – Nhập liệu Giới tính Tuổi Nghề nghiệp 21 10 2 32 3 53 11 … … … … n 42 14 02/08/2017 Ngun tắc Mã hóa – Nhập liệu • Phần lớn biến tương ứng với câu hỏi cụ thể trả lời Như ta cần tạo biến • Trường hợp câu hỏi chọn nhiều trả lời phải có nhiều số để nhập nên cần phải có nhiều ô để nhập • Qui tắc nhập liệu: Từ trái qua phải (theo dòng) từ xuống (sang dịng) 02/08/2017 10 Cửa sổ làm việc SPSS • Khởi động - Click biểu chương trình cơng cụ - Từ Menu Start, chọn Program, chọn SPSS • Nội dung Menu - File: xử lý File - Edit: chỉnh sửa - 02/08/2017 View: Hiển thị 11 Cửa sổ làm việc SPSS - Data: công tác liên quan đến liệu - Transform: Chuyển đổi liệu, tính tốn, mã hóa lại biến - Analyze: Thực thủ tục thống kê - Graphs: Tạo biểu đồ, đồ thị - Windows: Sắp xếp cửa sổ làm việc SPSS 02/08/2017 12 Tạo tập tin liệu SPSS for Windows • Khai báo biến: - Click Variable view - Khai báo biến dịng, nội dung dịng thuộc tính biến - Name: Tên biến - Type: Kiểu biến - Width: Độ rộng biến 02/08/2017 13 Tạo tập tin liệu SPSS for Windows - Decimals: Số số lẻ - Label: Nhãn biến - Value: Mã hóa cho giá trị định tính - Missing: Khai báo loại giá trị khuyết - Column: Độ rộng biến nhập liệu - Align: Vị trí liệu cột - Measure: Chọn loại thang đo 02/08/2017 14 Tạo tập tin liệu SPSS for Windows • Lưu tập tin liệu: - Menu File, chọn Save - Save in: chọn nơi lưu - File name: Đặt tên file (chỉ đặt tên chính) - Click nút Save Mặc định kiểu tập tin sav 02/08/2017 15 Một số xử lý biến • Mã hóa lại biến (Recode): Sử dụng cần giảm số biểu biến định tính Hoặc muốn chuyển biến định lượng thành biến định tính - Qui trình thực hiện: - Menu Transform > Recode into Different Variables (tạo biến mới) Recode into 02/08/2017 Same Variables (thay biến cũ) 16 Một số xử lý biến - Chọn biến muốn Recode - Đặt lại Name Label, Click Change - Click Old and New Values… để xác định chuyển đổi - Click Continue OK để thực lệnh 02/08/2017 17 Một số xử lý biến • Chuyển biến dạng Category thành biến dạng Dichotomy: Biến dạng Category có nhiều trị số mã hóa tượng trưng cho nhiều trạng thái Biến Dichotomy biến phân loại có trị số mã hóa tượng trưng cho trạng thái khác (có khơng) 02/08/2017 18 Một số xử lý biến • Cách thực hiện: – Menu transform, chọn Count – Target Variable: Khai báo tên biến cần tạo – Target Label: Khai báo nhãn – Đưa biến cần chuyển vào Numeric Var – Click Define Values mở hộp thoại – Nhận vào ô Value – Click Continue OK 02/08/2017 19 Tùy chọn chương trình • Menu Edit, chọn Options: – Measurement System: Thay đổi đơn vị – Variable list: Thay đổi cách thể – Pivot Table: Chọn cách thể bảng kết – File Location: Chọn nơi lưu trữ mở file liệu – Viewer: Chọn font hiển thị kết 02/08/2017 20 Câu hỏi ôn tập Hãy cho biết loại liệu loại thang đo? Nguyên tắc mã hóa nhập liệu Trình bày cách tạo tập tin liệu SPSS For Windows Qui trình thực việc mã hóa lại biến (Recode) Chuyển Category thành Dichotomy 02/08/2017 21 CHƯƠNG II LÀM SẠCH DỮ LIỆU NỘI DUNG Sự cần thiết Các biện pháp ngăn ngừa Các phương pháp làm liệu Sự cần thiết Dữ liệu sau nhập xong chưa thể đưa vào xử lý phân tích vì: Chất lượng vấn đọc soát (hiểu sai, thu thập sai, chọn sai đối tượng, trả lời sai ý, người đọc soát chưa phát hiện,…) Nhập liệu (sai, sót, thừa) Các biện pháp ngăn ngừa Thiết kế câu hỏi rõ ràng, dễ hỏi, dễ trả lời Chọn lọc huấn luyện vấn viên kỹ lưỡng Sau vấn, câu hỏi phải đọc soát trước nhập Việc mã hóa phải tiến hành tập trung với số cá nhân phụ trách Các phương pháp làm liệu Dùng bảng tần số - Lập bảng tần số cho tất biến, đọc rà sốt giá trị lạ Sau dùng lệnh FIND để tìm lỗi Cách thực - Trong Data View, chọn cột có giá trị lỗi - Vào Menu Edit > Find - Nhập vào giá trị lỗi - Truy ngược lại số thứ tự hàng để biết câu hỏi tương ứng Các phương pháp làm liệu Dùng bảng phối hợp hai hay ba biến - Lập bảng tần số cho tất biến, đọc rà soát giá trị lạ Sau dùng lệnh FIND để tìm lỗi Cách thực - Trong Data View, chọn cột có giá trị lỗi - Vào Menu Edit > Find - Nhập vào giá trị lỗi - Truy ngược lại số thứ tự hàng để biết câu hỏi tương ứng - Vào Data > Sort Case để xếp biến filter_$ Các phương pháp làm liệu Cách tìm lỗi đơn giản cửa sổ liệu - Sử dụng lệnh Data > Sort Case để tìm lỗi đơn giản cho biến giới tính Câu hỏi ơn tập Sự cần thiết phải làm liệu Các biện pháp ngăn ngừa lỗi cho liệu Trình bày phương pháp làm liệu từ đơn giản đến phức tạp CHƯƠNG III TĨM TẮT VÀ TRÌNH BÀY DỮ LIỆU 30 10 KẾT LUẬN Các nhân số nhân tố dùng để tính tốn hình thành sau kiểm tra EFA Cronbach Alpha (thõa mãn điều kiện) Vậy, nhân tố Fi tính F1: Cơ hội đào tạo thăng tiến F2: Lãnh đạo F3: Lương, thưởng F4: Đồng nghiệp F5: Phúc lợi F6: Ban chất CV F7: Môi trường LV THANG ĐO ĐƠN HƯỚNG VÀ ĐA HƯỚNG Khái niệm gồm yếu tố / thành phần thang đo khái niệm có thành phần gọi thang đo đơn hướng (unidimensional) Khái niệm gồm nhiều yếu tố / thành phần thang đo khái niệm có nhiều thành phần gọi thang đo đa hướng (multiunidimensional) CÂU HỎI Trong phần hợp tuyển lý thuyết, nghiên cứu kết luận mơ hình gồm nhân tố tác động đến hài lòng nhân viên? Nếu phân tích EFA ta thấy có factors (nhân tố, thành phần) Ỉ Giải nào? Ỉ Kết luận: Tồn thang đo đa hướng cần điều chỉnh mơ hình? 26 Chương V PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ Các phép kiểm định trung bình Kiểm định giả thuyết trung bình tổng thể Sử dụng lệnh One-Sample T-Test Kiểm định giả thuyết trung bình tổng thể dựa mẫu độc lập rút từ tổng thể Sử dụng lệnh Independent-Sample T-Test Kiểm định giả thuyết hai trung bình tổng thể theo cách phối hợp cặp Sử dụng lệnh Paired-Sample T-Test Kiểm định giả thuyết trung bình nhiều tổng thể (Phân tích phương sai) Sử dụng lệnh One-way ANOVA Nội dung Kiểm định giả thuyết trị trung bình tổng thể - trường hợp mẫu độc lập (Independent-Samples T-Test) Kiểm định trị trung bình hai mẫu phụ thuộc hay mẫu phối hợp cặp (Paired-Sample T-Test) 27 Kiểm định giả thuyết trị trung bình tổng thể Kiểm định tuổi trung bình độc giả báo SGTT 30 Đặt Ho: Tuổi trung bình độc giả báo SGTT 30 Chuyển biến Category từ c2a.1 đến c2a.9 thành biến tên docSGTT (12) với biểu người có đọc Dùng Select Case lọc trường hợp docSGTT=1 (dùng bảng tần số Frequencies để kiểm tra số lượng) Vào menu Analyze > Compare Means > One-Sample T-Test Đưa biến tuổi vào khung Test Variable, khai báo Test Value = 30 chọn độ tin cậy 99% nút Options Click Continue OK Kiểm định giả thuyết hai trung bình tổng thể Kiểm định giả thuyết trị trung bình hai tổng thể - trường hợp mẫu độc lập (Independent-sample TTest) Đặt Ho: Quy mơ gia đình trung bình thành phố Vào menu Analyze > Compare Means > Independentsample T-Test Click biến định lượng sonk đưa vào Test Variable Click biến định tính đưa vào Grouping Variable Trường hợp biến định tính có nhiều hai nên chọn mã hóa lại biến (Transform > Recode > Into Different Variable) thành biến có biểu Click Continue click OK Kiểm định trị trung bình hai mẫu phụ thuộc hay mẫu phối hợp cặp Mở tập tin Dauphong.sav Vào menu Analyze > Compare Means > Paired- Samples T-Test Chon biến spban spthu đưa vào khung Paired Variables Click Options để chỉnh lại độ tin cập khung Confidence Interval Click Continue Click Ok 28 Lưu ý thực kiểm định với SPSS One-Sample T-Test Independent-samples T-Test Paired-sample T-Test Chương VI PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG PHÂN TÍCH PHƯƠNG SAI Nội dung Phân tích phương sai yếu tố (ANOVA) Phân tích phương sai hai yếu tố (Two-way anova) 29 Phân tích phương sai yếu tố Khái niệm – Vận dụng Phân tích phương sai mở rộng kiểm định TTest, giúp ta so sánh trị trung bình nhóm trở lên với khả sai số 5% Trong file Data thuc hanh, ta khảo sát xem mức độ quan trọng yếu tố “có tự cá nhân” có khác biệt khơng nhóm người có trình độ học vấn khác Ta đặt giả thuyết: Ho: Khơng có khác biệt đánh giá tầm quan trọng yếu tố “có tự cá nhân” nhóm trình độ học vấn Phân tích phương sai yếu tố Thực phân tích phương sai yếu tố với SPSS Menu Analyze > Compare Means > One-way ANOVA Đưa biến định lượng c36.6 vào khung Dependent list, đưa biến phân loại xác định đối tượng (hocvan) vào Factor Click nút Options Chọn Descriptive Homogeneity of variance test Click Continue, xong OK Phân tích phương sai yếu tố Đọc kết phân tích phương sai SPSS Bảng cho thấy đại lượng thống kê mô tả cho nhóm cho tồn mẫu nghiên cứu Bản thứ hai cho kết kiểm định phương sai Với mức ý nghĩa Sig cho ta đánh giá tầm quan trọng yếu tố… Bảng thứ ba trình bày kết phân tích ANOVA Với mức ý nghĩa quan sát Sig với độ chấp nhận xác định phép kiểm định có tầm quan trọng 30 Phân tích phương sai yếu tố Xác định chỗ khác biệt Có phương pháp để xác định khác biệt trị trung bình nhóm, kiểmđịnh “trước” kiểmđịnh “sau” Kiểm định trước kiểm định giả định khác trung bình nhóm trước thực phân tích ANOVA Được kiểm định hộp thoại Contrasts với tên gọi kiểm định Priori Contrasts Kiểm định sau kiểm định giả định khác trung bình nhóm sau thực phân tích ANOVA Được thực hộp thoại Post Hoc (thử kiểm định với Dunnett) Phân tích phương sai hai yếu tố Tự tham khảo CHƯƠNG VII KIỂM ĐỊNH PHI THAM SỐ 31 NỘI DUNG Kiểm định dấu kiểm định MCNEMAR Kiểm định dấu hạng WILCOXON Kiểm định MANN-WHITNEY mẫu độc lập Kiểm định KRUSKAL-WALLIS Kiểm định chi-bình phương mẫu Kiểm định KOLMOGOROV-SMIRNOV mẫu Kiểm định dấu (Sign Test) Kiểm định MCNEMAR • Mở file Dauphong.sav • Menu Analyze >Nonparametric Test > Related Sample • Chọn biến spban, spthu theo thứ tự đưa vào khung Test Pair • Chọn loại kiểm định Test type • Vào Options để chọn tùy chọn • Click OK Kiểm định dấu hạng WILCOXON • Mở file Dauphong.sav • Thực giống kiểm định dấu • Menu Analyze >Nonparametric Test > Related Sample • Chọn biến spban, spthu theo thứ tự đưa vào khung Test Pair • Chọn kiểm định Wilcoxon Test type • Click OK 32 Kiểm định MANN-WHITNEY mẫu độc lập • Mở file Bongden.sav • Menu Analyze >Nonparametric Test > Independent Sample • Trong khung Test Variable List, chọn biến tuoitho, Trong khung Grouping Variables chọn biến bongden (1 2) • Trong Test Type chọn Mann-Whitney U • Click OK Kiểm định KRUSKAL-WALLIS • Mở file Bongden.sav • Menu Analyze >Nonparametric Test > K Independent Sample • Trong khung Test Variable List, chọn biến tuoitho, Trong khung Grouping Variables chọn biến bongden (1 3) • Chọn kiểm định KrusKal-Wallis H Test type • Click OK Kiểm định Chi bình phương mẫu • Mở file Tainan.sav • Menu Analyze >Nonparametric Test > ChiSquare • Trong khung Test Variable List, chọn biến tainan • Click OK 33 Kiểm định Chi bình phương mẫu • Thực giống lệnh • Trong khung Expected Range, chọn Use specified range với Lower Upper • Trong khung Expected Value, nhập giá trị 2, 1, 1, khung Values click Add cho giá trị • Click OK Kiểm định Kolmogorov-Smirnov mẫu • Mở file Dauphong.sav • Tạo biến delta=spthu-spban (dùng lệnh Transform > Compute Variable) • Menu Analyze > Nonparametric Test > 1Sample K-S • Trong khung Test Variable List, chọn delta • Chọn phân phối chuẩn (Normal) • Click OK CHƯƠNG VIII KIỂM ĐỊNH TỶ LỆ 34 NỘI DUNG Chọn 100 mẫu ngẫu nhiên Kiểm định Ho: tỷ lệ sinh viên nam tổng thể >=40% Kiểm định Ho: tỷ lệ sinh viên học chuyên ngành Kinh tế Thủy sản tổng thể 25,7% Kiểm định Ho: tỷ lệ sinh viên học chuyên ngành Kinh tế Thủy sản tổng thể 10% Chọn 100 mẫu ngẫu nhiên • Mở file kiem dinh ty le_goc.sav • Menu Data > Select Case • Chọn Random Sample of Cases, click Sample • Chọn Exactly 100 case from the first 490 case • Click Continue Trong khung Output, chọn Copy selected cases to a new dataset gõ tên tập tin tyle_mau.sav • Click OK Kiểm định tỷ lệ sinh viên nam tổng thể >= 40% • Thực giống kiểm định dấu • Menu Analyze >Nonparametric Test > Binomial • Chọn biến gioitinh đưa vào khung Test Variable List • Chọn giá trị muốn kiểm định tỷ lệ khung Test Proportion, chọn 0.4 • Click OK 35 Kiểm định tỷ lệ sinh viên học chuyên ngành kinh tế thủy sản 25,7% • Thực giống kiểm định dấu • Menu Analyze >Nonparametric Test > Binomial • Chọn biến nganhhoc đưa vào khung Test Variable List • Chọn giá trị muốn kiểm định tỷ lệ khung Test Proportion, chọn 0.25 • Trong Define Dichotomy chọn Cut point (vì ngành kinh tế thủy sản có giá trị 1) • Click OK Kiểm định tỷ lệ sinh viên học chuyên ngành kinh tế thủy sản 10% • Thực giống kiểm định dấu • Menu Analyze >Nonparametric Test > Binomial • Chọn biến nganhhoc đưa vào khung Test Variable List • Chọn giá trị muốn kiểm định tỷ lệ khung Test Proportion, chọn 0.1 • Trong Define Dichotomy chọn Cut point (vì ngành kinh tế thủy sản có giá trị 1) • Click OK TƯƠNG QUAN VÀ HỒI QUI TUYẾN TÍNH 36 Tương quan tuyến tính Hồi qui tuyến tính Hồi qui với quan hệ phi tuyến Hồi qui với biến độc lập định tính (biến giả) Các loại đồ thị: Khơng có liên hệ Liên hệ tuyến tính thuận Liên hệ tuyến tinh nghịch Liên hệ phi tuyến Vẽ đồ thị Scatter Mở tập tin tqvahp.sav Menu Graph > Legacy Dialogs> Scatter/Dot Click chọn Simple Scatter Click Define, chọn Doanhso cho cột Y Chaohang cho cột X Click OK 37 Tính hệ số tương quan Pearson Mở tập tin tqvahp.sav Menu Analyze > Correlate > Bivariate Trong khung Variables, chọn biến Doanhso Chaohang Chọn Pearson phần hệ số tương quan (Correlation Coefficients) Click OK Tính hệ số tương quan hạng Spearman Mở tập tin tqvahp.sav Menu Analyze > Correlate > Bivariate Trong khung Variables, chọn biến Doanhso Chaohang Chọn Spearman phần hệ số tương quan (Correlation Coefficients) Click OK Tự tham khảo giáo trình 38 PHẦN LÝ THUYẾT Khảo sát biểu đồ nhánh – (Stem & Leaf) Cách tính xác định: Số trung bình (Mean) – Số trung vị (Median) số yếu vị (Mode) Phát biểu giả thuyết Ho Mối liên hệ biến đồ thị phân tán Tác dụng loại: Phân tích phương sai ANOVA, One-Sample T Test, Independent-Sample T Test Pared-Sample T Test Chức phần mềm SPSS thông tin mà SPSS xử lý Hệ số tương quan r (Peason correlation Coefficient) Dữ liệu định tính liệu định lượng Các loại thang đo phép tính thực thang đo Khi mã hóa lại biến, lúc chọn Dichotomies Categories Các loại đồ thị SPSS Mối liên hệ biến kiểm định chi bình phương Cấu trúc giao diện SPSS Phương pháp làm liệu Tác dụng lệnh: Recode, Comput 39 PHẦN THỰC HÀNH Mã hóa lại biến (Recode) Chuyển biến dạng Category thành biến dạng Dichotomy Các hình thức nhập liệu: tay, từ file Text, Excel Sử dụng lệnh Data > Sort Case Cách thức tiến hành lệnh Frequencies Cách thể bảng kết Sử dụng Custom Tables Crosstabs One-Sample T-Test Independent-sample T-Test Paired-Samples T-Test One-way ANOVA Related Sample Independent Sample K Independent Sample Kiểm định Chi bình phương mẫu Kiểm định Kolmogorov-Smirnov mẫu Kiểm định tỷ lệ 40 ... PHƯƠNG SAI Nội dung Phân tích phương sai yếu tố (ANOVA) Phân tích phương sai hai yếu tố (Two-way anova) 29 Phân tích phương sai yếu tố Khái niệm – Vận dụng Phân tích phương sai mở rộng kiểm... định với SPSS One-Sample T-Test Independent-samples T-Test Paired-sample T-Test Chương VI PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG PHÂN TÍCH PHƯƠNG SAI... Menu - File: xử lý File - Edit: chỉnh sửa - 02/08/2017 View: Hiển thị 11 Cửa sổ làm việc SPSS - Data: công tác liên quan đến liệu - Transform: Chuyển đổi liệu, tính tốn, mã hóa lại biến - Analyze: