Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính

14 40 0
Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng trình bày đánh giá mô hình hồi quy tuyến tính; mô hình hồi quy tuyến tính; phương pháp Least square; Residuals – độ dao động từ; phân tích phương sai; hai thước đo đánh giá mô hình hồi quan tuyến tính; hệ số xác định; diễn giải hệ số xác định...

Tuan V Nguyen Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine Professor of Predictive Medicine, University of Technology Sydney Adj Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia Phân tích liệu ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V Nguyen Đánh giá mơ hình hồi qui tuyến tính • Khái niệm 'residual' phương sai • RMSE – residual mean squared error • Hệ số xác định (coefficient of determination) Mơ hình hồi qui tuyến tính • Mơ hình Y = a + bX + e • Chúng ta khơng biết α β • Nhưng dùng liệu thí nghiệm / thực tế để ước tính tham số • Ước số (estimate) α β a b Phương pháp "Least square" yˆ i = a + bxi d i = yi - yˆ i yi Y X Tìm cơng thức (estimator) để tính a b cho tổng d2 nhỏ Least square method = Bình phương nhỏ Residuals – độ dao động dư • Mơ hình cho liệu y = a + bx + e Giá trị trung bình: E(y) = yhat = a + bx Phần dư : e = y – E(y) • Phát biểu "thường dân" Dữ liện quan sát = Mơ hình tiên lượng + Phần dư (nhiễu) Phần dư = giá trị quan sát – giá trị tiên lượng Phân tích phương sai • Mơ hình pcfat = a + b*age+ e • Giá trị quan sát = model (mơ hình) + random (ngẫu nhiên) SStotal = SSreg + SSerror SStotal = total sum of squares SSreg = sum of squares due to the regression model SSerror = sum of squares due to random component SSerror pcfat SSreg SStotal trung bình mean age SStotal = SSreg + SSerror R-square = SSreg / SStotal Hai thước đo đánh giá mơ hình HQTT • RMSE – residual mean squared error – xem 'phương sai' biến Y sau hiệu chỉnh cho X • Hệ số xác định (coefficient of determination), R2 – Phản ảnh phần trăm dao động biến Y giải thích biến X (cịn gọi "explained variation") Hệ số xác định (R2) m1 = lm(pcfat ~ age, data=ob) anova(m1) RMSE = 46.8 Analysis of Variance Table Response: pcfat Df Sum Sq Mean Sq F value Pr(>F) age 5917 5916.8 126.52 < 2.2e-16 *** Residuals 1215 56821 46.8 Signif codes: ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ R2 = 5917 / (5917 + 56821) = 0.094 Diễn giải hệ số xác định Residual standard error: 6.839 on 1215 degrees of freedom Multiple R-squared: 0.09431, Adjusted R-squared: 0.09357 F-statistic: 126.5 on and 1215 DF, p-value: < 2.2e-16 Coefficient of determination R2 = 0.094 Diễn giải: Những khác biệt độ tuổi giải thích khoảng 9.5% tổng phương sai tỉ trọng mỡ Diễn giải RMSE • RMSE = 46.8 phương sai biến Y sau hiệu chỉnh cho biến X • Phương sai pcfat chưa có X > var(ob$pcfat) [1] 51.5935 Khác biệt gvề pcfat nam nữ: diễn giải Coefficients: Estimate Std Error t value Pr(>|t|) (Intercept) 34.6724 0.1826 189.9

Ngày đăng: 24/10/2020, 00:16

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan