Bài giảng Ứng dụng mô hình hồi quy tuyến tính: Đánh giá mối liên quan

14 117 0
Bài giảng Ứng dụng mô hình hồi quy tuyến tính: Đánh giá mối liên quan

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nội dung của bài giảng bao gồm: mô hình hồi quy tuyến tính đa biến; đánh giá mối liên quan; hiệu chỉnh cho yếu tố nhiễu; mô hình tiên lượng. Mô hình hồi qui tuyến tính đa biến • Mô hình căn bản Y = b 0 + b1 X 1 + b 2 X 2 + ... + b p X p + e • Y là biến phụ thuộc (dependent variable), biến liên tục • X1, X2, X3, …, Xp : biến tiên lượng β1, β2, β3, ..., βp : regression coefficients (hệ số hồi qui ) ε ~ phân bố chuẩn (normal), độc lập, trung bình 0, phương sai σ2 ε ~ (0, σ2)

Tuan V Nguyen Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích liệu ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V Nguyen Đánh giá mơ hình hồi qui tuyến tính • Khái niệm 'residual' phương sai • RMSE – residual mean squared error • Hệ số xác định (coefficient of determination) Mơ hình hồi qui tuyến tính • Mơ hình Y = a + bX + e • Chúng ta khơng biết α β • Nhưng dùng liệu thí nghiệm / thực tế để ước tính tham số • Ước số (estimate) α β a b Phương pháp "Least square" yˆ i = a + bxi d i = yi - yˆ i yi Y X Tìm cơng thức (estimator) để tính a b cho tổng d2 nhỏ Least square method = Bình phương nhỏ Residuals – độ dao động dư • Mơ hình cho liệu y = a + bx + e Giá trị trung bình: E(y) = yhat = a + bx Phần dư : e = y – E(y) • Phát biểu "thường dân" Dữ liện quan sát = Mơ hình tiên lượng + Phần dư (nhiễu) Phần dư = giá trị quan sát – giá trị tiên lượng Phân tích phương sai • Mơ hình pcfat = a + b*age+ e • Giá trị quan sát = model (mơ hình) + random (ngẫu nhiên) SStotal = SSreg + SSerror SStotal = total sum of squares SSreg = sum of squares due to the regression model SSerror = sum of squares due to random component SSerror pcfat SSreg SStotal trung bình mean age SStotal = SSreg + SSerror R-square = SSreg / SStotal Hai thước đo đánh giá mơ hình HQTT • RMSE – residual mean squared error – xem 'phương sai' biến Y sau hiệu chỉnh cho X • Hệ số xác định (coefficient of determination), R2 – Phản ảnh phần trăm dao động biến Y giải thích biến X (cịn gọi "explained variation") Hệ số xác định (R2) m1 = lm(pcfat ~ age, data=ob) anova(m1) RMSE = 46.8 Analysis of Variance Table Response: pcfat Df Sum Sq Mean Sq F value Pr(>F) age 5917 5916.8 126.52 < 2.2e-16 *** Residuals 1215 56821 46.8 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ R2 = 5917 / (5917 + 56821) = 0.094 Diễn giải hệ số xác định Residual standard error: 6.839 on 1215 degrees of freedom Multiple R-squared: 0.09431, Adjusted R-squared: 0.09357 F-statistic: 126.5 on and 1215 DF, p-value: < 2.2e-16 Coefficient of determination R2 = 0.094 Diễn giải: Những khác biệt độ tuổi giải thích khoảng 9.5% tổng phương sai tỉ trọng mỡ Diễn giải RMSE • RMSE = 46.8 phương sai biến Y sau hiệu chỉnh cho biến X • Phương sai pcfat chưa có X > var(ob$pcfat) [1] 51.5935 Khác biệt gvề pcfat nam nữ: diễn giải Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 34.6724 0.1826 189.9

Ngày đăng: 22/02/2020, 20:12

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan