Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 48 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
48
Dung lượng
2 MB
Nội dung
TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG DỊCH TỄ THỐNG KÊ NÂNG CAO HỒI QUI TUYẾN TÍNH ĐA BIẾN MỤC TIÊU 1. Trình bày kiểm chứng giả định cho phân tích hồi qui 2. Sử dụng SPSS xây dựng mô hình hồi qui tuyến tính từ đơn biến đến đa biến phiên giải Ứng dụng hồi qui tuyến tính 1. Cung cấp mô tả tốt biến phụ thuộc 2. Dự đoán giá trị biến phụ thuộc 3. Ngoại suy cho quần thể nghiên cứu 4. Ước lượng tham số 5. Khống chế biến nhiễu 6. Phát triển mô hình thực tế Phương trình hồi qui tuyến tính - Hồi qui tuyến tính đơn biến y=a+bx+ε - Hồi qui tuyến tính đa biến y = α + β1x1 + β2x2 + +βkxk + ε Hồi quy đa biến Bệnh/Không bệnh Purchase Thu nhập Giới Income Gender Age Tuổi logit (pi) = β0 + β1X1 + β2X2 + β3X3 Các giả định xây dựng mô hình hồi qui 1. Cỡ mẫu - Ít phải có biến mô hình:1 biến phụ thuộc biến độc lập - Cần 20 đối tượng cho biến độc lập - Trong mô hình hồi qui đa biến đơn giản cần cỡ mẫu n >40 (2 biến độc lập) Các giả định xây dựng mô hình hồi qui Quan hệ tuyến tính - Biến độc lập biến phụ thuộc phải có mối quan hệ tuyến tính - Kiểm tra giả định biểu đồ chấm điểm số kiểm định thống kê ANOVA, so sánh R2 Các giả định xây dựng mô hình hồi qui Phân bố chuẩn - Tất biến đưa vào mô hình phải có phân bố chuẩn - Kiểm chứng tính chuẩn thông qua: biểu đồ histogram, biểu đồ PP plot, kiểm định goodness of fit - Nếu biến phân bố chuẩn, dùng phép biến đổi: log, hàm mũ… Các giả định xây dựng mô hình hồi qui Phân bố chuẩn Các giả định xây dựng mô hình hồi qui Phương sai đồng - Mỗi nhóm/loại biến độc lập cần phải có phương sai đồng với - Kiểm định tính đồng phương sai biến độc lập cách sử dụng kiểm định Levene, Brown & Forsythe Barlett Các bước tiến hành hồi qui tt đa biến Chọn biến phụ thuộc đưa vào ô Dependent Chọn biến độc lập đưa vào ô Independent(s) Chọn phương pháp hồi qui bạn muốn sử dụng (Enter/ stepwise/ forward/ backward) Các bước tiến hành hồi qui tt đa biến Giữ lại biến làm giảm F=0,1 khỏi mô hình Các bước tiến hành hồi qui tt đa biến Chọn Estimates Chọn Model fit, Descriptives Collinearity diagnostics tùy chọn Statistics Bạn chọn R squared change bạn không dùng phương pháp Enter Chọn DurbinWatson để tìm hiểu tượng autocorrelation Các bước tiến hành hồi qui tt đa biến Bạn xác định phân bố phần dư thực đơn Plots Kết phân tích phiên giải Descriptive Statistics Mean 24.0674 Chi so BMI Luong calorine an 2017.7167 hang So phut tap the duc 21.7947 tuan So tien danh mua thuc 638.2043 an thang (USD) Tong thu nhap 2005.1981 thang (tinh theo USD) Std Deviation 1.28663 N 1000 513.71981 1000 7.66196 1000 121.30210 1000 509.49088 1000 Kết phân tích phiên giải Correlations Pearson Correlation Sig (1-tailed) N Chi so BMI Luong calorine an hang So phut tap the duc tuan So tien danh mua thuc an thang (USD) Tong thu nhap thang (tinh theo USD) Chi so BMI Luong calorine an hang So phut tap the duc tuan So tien danh mua thuc an thang (USD) Tong thu nhap thang (tinh theo USD) Chi so BMI Luong calorine an hang So phut tap the duc tuan So tien danh mua thuc an thang (USD) Tong thu nhap thang (tinh theo USD) Chi so BMI 1.000 Luong calorine an hang 784 So phut tap the duc tuan -.310 So tien danh mua thuc an thang (USD) -.534 Tong thu nhap thang (tinh theo USD) 033 784 1.000 -.193 -.714 -.009 -.310 -.193 1.000 126 -.030 -.534 -.714 126 1.000 706 033 -.009 -.030 706 1.000 000 000 000 148 000 000 000 391 000 000 000 175 000 000 000 000 148 391 175 000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 Kết phân tích phiên giải Model Summaryc Change Statistics Model Adjusted Std Error of R Square R R Square R Square the Estimate Change F Change 784a 615 615 79852 615 1595.604 801b 641 640 77148 026 72.178 a Predictors: (Constant), Luong calorine an hang b Predictors: (Constant), Luong calorine an hang ngay, So phut tap the duc tuan c Dependent Variable: Chi so BMI df1 1 df2 Sig F Change 998 000 997 000 DurbinWatson 2.022 Kết phân tích phiên giải ANOVAc Model Regression Residual Total Regression Residual Total Sum of Squares 1017.412 636.359 1653.771 1060.371 593.400 1653.771 df 998 999 997 999 Mean Square 1017.412 638 F 1595.604 Sig .000a 530.185 595 890.790 000b a Predictors: (Constant), Luong calorine an hang b Predictors: (Constant), Luong calorine an hang ngay, So phut tap the duc tuan c Dependent Variable: Chi so BMI Kết phân tích phiên giải Coefficientsa Model (Constant) Luong calorine an hang (Constant) Luong calorine an hang So phut tap the duc tuan Unstandardized Coefficients B Std Error 20.104 102 Standardized Coefficients Beta 784 t 196.343 Sig .000 39.945 000 156.273 000 002 000 20.866 134 002 000 753 38.920 -.028 003 -.164 -8.496 Collinearity Statistics Tolerance VIF 1.000 1.000 000 963 1.039 000 963 1.039 a Dependent Variable: Chi so BMI BMI= 20,866 + 0,002* Caroline – 0,028* thethao Kết phân tích phiên giải Excluded Variablesc Model Beta In So phut tap the duc tuan So tien danh mua thuc an thang (USD) Tong thu nhap thang (tinh theo USD) So tien danh mua thuc an thang (USD) Tong thu nhap thang (tinh theo USD) -.164 t a a 054 a 040 b 050 b 035 Sig Partial Correlation Collinearity Statistics Minimum Tolerance VIF Tolerance -8.496 000 -.260 963 1.039 963 1.917 055 061 490 2.040 490 2.036 042 064 1.000 1.000 1.000 1.835 067 058 490 2.041 479 1.836 067 058 999 1.001 962 a Predictors in the Model: (Constant), Luong calorine an hang b Predictors in the Model: (Constant), Luong calorine an hang ngay, So phut tap the duc tuan c Dependent Variable: Chi so BMI Kết phân tích phiên giải Collinearity Diagnosticsa Model Dimension 2 Eigenvalue 1.969 031 2.874 104 021 a Dependent Variable: Chi so BMI Condition Index 1.000 7.984 1.000 5.253 11.566 Variance Proportions Luong So phut tap calorine an the duc (Constant) hang tuan 02 02 98 98 00 01 01 01 21 61 99 78 38 Báo cáo kết phân tích Kết phân tích hồi qui tuyến tính (mô hình 2) với phương pháp stepwise cho giá trị Ajusted R2= 0,64; F= 890,7; p[...]... hồi qui tt đa biến 1. Kiểm tra mối liên quan tuyến tính Sử dụng biểu đồ scatter plot Các bước tiến hành hồi qui tt đa biến 2 Kiểm tra tính chuẩn của các biến định lượng liên tục Biểu đồ QQ plot Các bước tiến hành hồi qui tt đa biến 3 Phân tích hồi qui tt đa biến Phương trình ví dụ: YBMI = β0 + β1*xcalorine + β2*xthethao + β3*xgioi + β4*xthunhap + ε * Sử dụng bộ số liệu BMI.sav Các bước tiến hành hồi. .. xây dựng mô hình hồi qui 5 Đa cộng tuyến - Hai hoặc nhiều biến độc lập trong mô hình hồi qui đa biến có mối liên quan chặt chẽ với nhau, thường là nếu 2 biến độc lập có hệ số tương quan r>0,8 - Không làm thay đổi khả năng dự đoán của mô hình nói chung mà chỉ ảnh hưởng đến việc tính toán hệ số của các biến độc lập Các giả định xây dựng mô hình hồi qui 5 Đa cộng tuyến Đánh giá đa cộng tuyến thông qua... hành hồi qui tt đa biến Thao tác trên SPSS Sử dụng SPSS với câu lệnh: Analyze/ Regression/ Linear Các bước tiến hành hồi qui tt đa biến Chọn biến phụ thuộc đưa vào ô Dependent Chọn các biến độc lập đưa vào ô Independent(s) Chọn phương pháp hồi qui bạn muốn sử dụng (Enter/ stepwise/ forward/ backward) Các bước tiến hành hồi qui tt đa biến Giữ lại những biến làm giảm F100à chắc chắn có hiện tượng đa. .. thấy có dấu hiệu của đa cộng tuyến, khi VIF>100à chắc chắn có hiện tượng đa cộng tuyến – Condition Index (điều kiện): Giá trị từ 10-30 cho thấy cần cân nhắc đến hiện tượng đa cộng tuyến, khi condition index > 30 à đa cộng tuyến mạnh trong mô hình Các giả định xây dựng mô hình hồi qui 6 Các quan sát độc lập - Xác định tính độc lập của các quan sát thông qua giá trị thống kê Durbin-Watson: nếu các... lượng mô hình thông qua các kết quả phân tích từ phần mềm máy tính Loại bỏ các biến không phù hợp ra khỏi mô hình Kiểm định tính phù hợp của mô hình Chiến lược xây dựng mô hình 2 Ma trận tương quan - Phân tích ma trận tương quan giữa tất cả các biến sử dụng trong mô hình - Tìm hiểu hiện tượng đa cộng tuyến thông qua hệ số tương quan giữa hai biến Chiến lược xây dựng mô hình 3 Tiếp cận dựa trên mục đích... pháp chọn biến Phương pháp Forward: lần lượt đưa dần từng biến độc lập vào mô hình và sẽ giữ chúng lại nếu như biến đó có ý nghĩa thống kê Phương pháp Backward: đưa toàn bộ các biến độc lập vào mô hình sau đó bỏ dần từng biến không có ý nghĩa thống kê Phương pháp Stepwise kết hợp 2 phương pháp forward và backward, tại mỗi một bước phương pháp này sẽ tính toán để đưa vào hoặc loại ra các biến độc lập... cẩn thận trong chọn biến để đảm bảo các mô hình được gợi ý phù hợp với kiến thức về quá trình mô hình hóa - Không có quá trình chọn biến nào có thể thay thế được sự hiểu biết sâu sắc của nhà nghiên cứu Chiến lược xây dựng mô hình 4 Tính toán tất cả các phương trình hồi qui có thể - Xây dựng tất cả các mô hình và so sánh để chọn ra mô hình tốt nhất - Chỉ áp dụng khi số lượng biến định đưa vào mô... có thể tính đếm được càng nhiều sự biến đổi của Y càng tốt Vì R2 không thể giảm khi các biến độc lập được thêm vào trong mô hình nên mô hình cho giá trị R2 lớn nhất cũng cần phải là mô hình chứa tất cả các biến độc lập Qui tắc chọn mô hình Các tiêu chí chọn mô hình - Trung bình bình phương phần dư MS(Res), Trung bình bình phương phần dư là một ước lượng cho mô hình nếu mô hình chứa tất cả các biến độc... hình có những biến không phù hợp thì MS sẽ bị sai số Nếu một biến độc lập không quan trọng có mặt trong mô hình thì sẽ có tác động nhỏ lên giá trị MS Qui tắc chọn mô hình Các tiêu chí chọn mô hình - Hệ số xác định hiệu chỉnh R2adj R2 hiệu chỉnh thường không tăng khi chúng ta thêm biến độc lập vào mô hình Giá trị R2 hiệu chỉnh liên quan chặt với MS(Res) và được kết luận tương tự như MS Qui tắc chọn