Giáo trình cơ bản SPSS (thống kê y học)
Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm PHÂN TÍCH DỮ LIỆU BẰNG PHẦN MỀM SPSS 12.0* PHẦN Các nội dung phần này: Mở liệu từ tập tin dạng text Xem xét tương quan biến Hồi quy OLS (trường hợp đơn biến) Hồi quy OLS (trường hợp đa biến) Hồi quy trường hợp có tượng đa cộng tuyến hoàn hảo * SPSS 12.0 sản phẩm ký SPSS Inc Quoác Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm Mở liệu từ tập tin dạng text Vào Menu File, Open, Data Sau đó, vào mục Files of type để chọn loại tập tin cần truy xuất liệu Ở đây, quan tâm đến tập tin dạng text (*.txt) HÌNH Nh p ch n Text (* txt) Ví dụ: Chúng ta mở tập tin pm.txt chứa liệu FIRM, VA, K L thực hành EVIEWS HÌNH Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm Trước tiên, cần đóng tập tin lại (nếu mở xem) Sau đó, vào SPSS, chọn File, Open, Data Vào Files of type chọn Text (*.txt) Sau chọn tập tin text cần sử dụng pm.txt HÌNH Việc nhập nôi dung từ tập tin Text trải qua bước • Bước (Hình 4): Trong Bước 1, SPSS mặc định sẵn chế độ No, việc nhấp Next HÌNH Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 • Các Phương Pháp Phân Tích Tài liệu phát thêm Bước (Hình 5): Trong Bước 2, cần ý dòng chữ Are variables names included at the top of your file? , ngụ ý hỏi có phải tên biến nằm dịng tập tin khơng? Nếu phải nhấp Yes, ngược lại No Trong trường hợp tập tin pm.txt dịng có chứa tên biến nên nhấp vàp Yes Sau đó, tiếp tục nhấp vào nút Next HÌNH • Bước (Hình 6): Chú ý dịng chữ The first case of data begins on which line number?, ngụ ý hỏi liệu dòng thứ Khai báo xong, bấm Next HÌNH Trong trường hợp này, số SPSS định sẵn dòng khai báo tên biến Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 • Các Phương Pháp Phân Tích Tài liệu phát thêm Bước (Hình 7): Chú ý đến câu Which delimiters appear between variables? , ngụ ý hỏi liệu biến phân định cách Bằng Tab, khoảng trống (Space), dấu phẩy (Comma), dấu chấm phẩy (Semicolon) hay dạng cụ thể khác (Other) Ở SPSS thường mặc định vị trí Space trường hợp tập tin pm.txt, liệu biến phân cách khoảng trống nên không cần phải chọn thêm mà việc nhấn Next HÌNH • Bước (Hình 8): Bước bước mà SPSS cần xác nhận lại xem tên biến định dạng liệu mà SPSS nhận diện chưa Nếu muốn thay đổi tên biến khác với tên gốc gõ tên vào hộp thoại phía dịng chữ Variable name, hay muốn định dạng liệu lại vào Data format để điều chỉnh Cịn thấy khơng cần phải thay đổi tiếp tục nhấn Next nhấn Finish Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm HÌNH • Bước 6: Bước bước thủ tục không cần để ý đến nội dung mà cần nhấn Finish Thực ra, đến Bước nhấn Finish để kết thúc trình nhập liệu từ tập tin Text Số liệu SPSS sau import từ tập tin pm.txt có dạng sau: HÌNH Xem xét quan hệ tương quan biến Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm Để xem xét tương quan biến, vào Menu Analyze, chọn mục Correlation chọn Bivariate Sẽ xuất hình sau: HÌNH 10 Chọn ba biến VA, L K nhấp vào nút để đưa biến vào ô Variables nhấp OK Kết cửa sổ Output1 sau: Correlations VA VA L K Pearson Correlation Sig (2-tailed) N Pearson Correlation Sig (2-tailed) N Pearson Correlation Sig (2-tailed) N 27 965** 000 27 975** 000 27 L 965** 000 27 27 964** 000 27 K 975** 000 27 964** 000 27 27 ** Correlation is significant at the 0.01 level (2-tailed) Quoác Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm Hồi quy OLS (trường hợp đơn biến) Sau xem xét tương quan biến, tiến hành hồi quy VA theo L Để bắt đầu, vào menu Analyze, chọn mục Regression chọn Linear HÌNH 11 Đưa biến VA vào Dependent cịn L vào ô Independent(s) Cách đưa biến sang ô cần chọn trình bày phần Quốc Duy Nếu muốn thu giá trị dự đoán (Predicted Values) phần dư (Residuals) nhấp vào Save Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Để tính giá trị dự đốn, nhấp vào HÌNH 12 Unstandardized Tài liệu phát thêm Để tính giá trị phần dư, nhấp vào Unstandardized Sau chọn xong nhấp vào Continue để trở lại hộp thoại Linear Regression Để tiến hành hồi quy nhấp OK Kết hồi quy cửa sổ Ouput1 sau: Regression b Variables Entered/Removed Model Variables Entered La Variables Removed Method Enter a All requested variables entered b Dependent Variable: VA Model Summary Model R R Square 965a 930 Adjusted R Square 928 Std Error of the Estimate 605.74555 a Predictors: (Constant), L Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm ANOVAb Model Regression Residual Total Sum of Squares 1.23E+08 9173192 1.32E+08 df 25 26 Mean Square 122645979.7 366927.676 F 334.251 Sig .000a a Predictors: (Constant), L b Dependent Variable: VA Coefficientsa Model (Constant) L Unstandardized Coefficients B Std Error -292.397 185.269 6.533 357 Standardized Coefficients Beta 965 t -1.578 18.283 Sig .127 000 a Dependent Variable: VA Trong đó, Sheet chứa liệu chính, xuất thêm cột liệu mới, cột PRE_1 chứa giá trị dự đốn cịn cột RES_1 chứa giá trị phần dư HÌNH 13 Hồi quy OLS (trường hợp đa biến) Bây tiến hành hồi quy VA theo K L, menu Analyze, chọn mục Regression Linear Biến VA đưa vào ô Dependent, cịn K L đưa vào Independent(s) Quốc Duy 10 Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm HÌNH 14 Nếu muốn kiểm tra tượng đa cộng tuyến biến chọn Statistics Nếu muốn thu giá trị dự đốn nhấp vào Save (giống phần hồi quy đơn biến) Giả sử muốn kiểm tra tượng đa cộng tuyến, nhấp vào Statistics, hộp thoại sau: HÌNH 15 Chọn Collinearity diagnostics nhấp Continue để trở lại hộp thoại hồi quy Quốc Duy 11 Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm Sau trở lại hộp thoại hồi quy, bấm OK, kết hồi quy đa biến sau: Regression b Variables Entered/Removed Model Variables Entered K, La Variables Removed Method Enter a All requested variables entered b Dependent Variable: VA Model Summary Model R R Square 980a 960 Adjusted R Square 956 Std Error of the Estimate 469.86415 a Predictors: (Constant), K, L ANOVAb Model Regression Residual Total Sum of Squares 1.27E+08 5298536 1.32E+08 df 24 26 Mean Square 63260317.93 220772.321 F 286.541 Sig .000a a Predictors: (Constant), K, L b Dependent Variable: VA Coefficientsa Model (Constant) L K Unstandardized Coefficients B Std Error 114.338 173.431 2.338 1.039 471 112 Standardized Coefficients Beta 345 643 t 659 2.250 4.189 Sig .516 034 000 Collinearity Statistics Tolerance VIF 071 071 a Dependent Variable: VA a Collinearity Diagnostics Model Dimension Eigenvalue 2.619 365 016 Condition Index 1.000 2.681 12.699 Variance Proportions (Constant) L K 03 00 01 51 00 03 46 99 97 a Dependent Variable: VA Quoác Duy 12 14.051 14.051 Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 Các Phương Pháp Phân Tích Tài liệu phát thêm Hồi quy trường hợp có tượng đa cộng tuyến hồn hảo Giả sử liệu có thêm biến K2 = K × 2, thực lại bước phần trên, thu kết sau: Regression Model Summary Model R R Square 980a 960 Adjusted R Square 956 Std Error of the Estimate 469.86415 a Predictors: (Constant), k2, L ANOVAb Model Regression Residual Total Sum of Squares 1.27E+08 5298536 1.32E+08 df 24 26 Mean Square 63260317.93 220772.321 F 286.541 Sig .000a a Predictors: (Constant), k2, L b Dependent Variable: VA Coefficientsa Model (Constant) L k2 Unstandardized Coefficients B Std Error 114.338 173.431 2.338 1.039 236 056 Standardized Coefficients Beta t 659 2.250 4.189 345 643 Sig .516 034 000 Collinearity Statistics Tolerance VIF 071 071 14.051 14.051 a Dependent Variable: VA b Excluded Variables Model Beta In K t a Partial Correlation Sig Collinearity Statistics Minimum Tolerance Tolerance VIF 000 000 a Predictors in the Model: (Constant), k2, L b Dependent Variable: VA Trong trường hợp này, xuất bảng thông báo biến bị loại bỏ khỏi mô hình hồi quy có tượng đa cộng tuyến hồn hảo, biến K Ngun tắc loại biến SPSS loại biến bé (vì K2 = 2×K) Quốc Duy 13 ... Bước nhấn Finish để kết thúc trình nhập liệu từ tập tin Text Số liệu SPSS sau import từ tập tin pm.txt có dạng sau: HÌNH Xem xét quan hệ tương quan biến Quốc Duy Chương trình giảng dạy kinh tế Fulbright... dung từ tập tin Text trải qua bước • Bước (Hình 4): Trong Bước 1, SPSS mặc định sẵn chế độ No, việc nhấp Next HÌNH Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 • Các Phương... hỏi liệu dòng thứ Khai báo xong, bấm Next HÌNH Trong trường hợp này, số SPSS định sẵn dòng khai báo tên biến Quốc Duy Chương trình giảng dạy kinh tế Fulbright Niên khóa 2006-2007 • Các Phương Pháp