Bài giảng phân tích thống kê chương 2 2 tương quan và hồi quy tuyến tính

46 3 0
Bài giảng phân tích thống kê   chương 2 2 tương quan và hồi quy tuyến tính

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

COURSE Tương quan & Hồi quy tuyến tính Phân tích thống kê Nhóm NCV trẻ Khương Quỳnh Long Hà Nội, 04/2020 https://gitlab.com/LongKhuong Nội dung Phân tán đồ Hệ số tương quan Hồi quy tuyến tính đơn biến Hồi quy tuyến tính đa biến Biến phụ thuộc Định lượng Kiểm định phi tham số Kiểm định tham số Đúng Phân phối bình thường Sai Biến độc lập nhóm == t test PS = Định lượng > nhóm Phương sai != t test PS != Biến độc lập Phương sai == ANOVA nhóm > nhóm Định lượng Wilcoxon Kruskall Wallis TQ Spearman != TQ Pearson, Linear reg Tình nghiên cứu • Nghiên cứu nhằm khảo sát yếu tố ảnh hưởng tới trọng lượng sơ sinh trẻ từ ivf (dữ liệu tlsosinh.dta) Tuổi thai (tuần) Tuổi mẹ Trọng lượng sơ sinh (gr) Nghề nghiệp mẹ Mẹ THA Giới tính trẻ Câu hỏi? • Mối liên quan tuổi thai trọng lượng sơ sinh? Phân tán đồ (scatter plot) Biến phụ thuộc Các quan sát Đường hồi quy Biến độc lập • Nhận xét? Phân tán đồ (scatter plot) (a) không tương quan (d) Tương quan thuận (hồn tồn) (b) khơng có mối liên hệ tuyến tính (e) Tương quan nghịch (c) Tương quan thuận (f) Tương quan nghịch (hoàn toàn) Phân tán đồ (scatter plot) • Thực Stata • Cơ twoway (scatter biếnphụthuộc biếnđộclập) twoway (scatter tlsosinh tuoithai) • Thêm đường hồi quy twoway (scatter biếnphụthuộc biếnđộclập) (lfit biếnphụthuộc biếnđộclập) twoway (scatter tlsosinh tuoithai) (lfit tlsosinh tuoithai) • Thêm label, legend… twoway (scatter tlsosinh tuoithai) (lfit tlsosinh tuoithai), ytitle(Trọng lượng sơ sinh (gr)) xtitle(Tuổi thai (tuần)) Phân tán đồ (scatter plot) • Thực Stata • • • • • Graphics  twoway (scatter, line, etc.) Create  chọn biến X (độc lập) Y (phụ thuộc)  Accept Create  chọn Fit plots  chọn biến X Y  Accept Chọn OK Tùy chỉnh label, legend… 10 Hồi quy tuyến tính Trọng lượng sơ sinh (gram) = -4865 + 206 x Tuổi thai (tuần) Ý nghĩa:  Diễn giải: Khi tuổi thai tăng lên tuần trọng lượng sơ sinh tăng thêm 206 gram  Tiên lượng: o Một người mang thai 38 tuần  tl sơ sinh dự đoán -4865 + 206*38 = 2963 gram o Một người mang thai 30 tuần  tl sơ sinh dự đoán là? 32 Kiểm định giả thuyết • Kiểm định ý nghĩa thống kê cho hệ số hồi quy:  H0: β =  Ha: β ≠ • Kết luận có ý nghĩa thống kê dựa vào giá trị p 33 Hồi quy tuyến tính đa biến • Nghiên cứu nhằm khảo sát yếu tố ảnh hưởng tới trọng lượng sơ sinh trẻ Tuổi thai (tuần) Tuổi mẹ Trọng lượng sơ sinh (gr) Nghề nghiệp mẹ Mẹ THA Giới tính trẻ 34 Hồi quy tuyến tính đa biến regress tlsosinh tuoime tang_ha tuoithai gioi i.nghenghiep Chú ý: biến phân nhóm phải thêm i trước tên biến 35 Hồi quy tuyến tính đa biến • Chọn biến số đưa vào mơ hình:  Có 2k – mơ hình (k: số biến số độc lập) • Mơ hình q nhiều biến  overfitting  10 đối tượng cho biến mơ hình (thường 30-50)1 • Mơ hình q biến  underfitting  Mơ hình xác, nhiễu Maxwell, S E (2000) Sample size and multiple regression analysis Psychological Methods, 5(4), 434 36 Đánh giá độ phù hợp mơ hình (model fit) R2: hệ số xác định (Coefficient of determination)  Phương sai giải thích mơ hình/tổng phương sai R2 hiệu chỉnh 37 Đánh giá độ phù hợp mơ hình (model fit) • F = (Phương sai giải thích mơ hình) / (Phương sai khơng thể giải thích mơ hình) • AIC (Akaike's Information Criterion) AIC = x (Số biến - log-likelihood) • BIC (Bayesian Information Criterion) BIC = log(n) x Số biến – x log-likelihood • Trong Stata estat ic 38 Các phương pháp lựa chọn mơ hình 39 Giả định hồi quy tuyến tính LINE Linear: Quan hệ tuyến tính biến độc lập phụ thuộc Independence: Các sai số độc lập Normality: Sai số ước lượng có phân phối bình thường Equal variance: Phương sai đồng (homoscedasticity) 40 Giả định hồi quy tuyến tính Linear: Quan hệ tuyến tính biến độc lập phụ thuộc • Đơn biến: phân tán đồ biến độc lập phụ thuộc • Đa biến: Phân tán đồ phần dư mơ hình biến độc lập predict res, resid acprplot {biếnđộclập}, lowess 41 Giả định hồi quy tuyến tính Independence: Các sai số độc lập Thiết kế nghiên cứu 42 Giả định hồi quy tuyến tính Normality: Sai số ước lượng có phân phối bình thường predict stdres, rstandard hist stdres, norm 43 Giả định hồi quy tuyến tính Equal variance: Phương sai đồng (homoscedasticity)\ • Biểu đồ residual vs fitted plot rvfplot • Heteroskedasticity test estat hettest 44 Nội dung học Phân tán đồ Hệ số tương quan  Ý nghĩa hệ số tương quan  Kiểm định ý nghĩa thống kê  Lựa chọn hệ số tương quan Hồi quy tuyến tính  Ứng dụng, ý nghĩa tham số hồi quy (đơn biến, đa biến)  Đánh giá độ phù hợp mơ hình  Giả định hồi quy tuyến tính 45 Bài tập • • • • • • • Dữ liệu “FEV.dta” age: tuổi fev: thể tích khí thở gắng sức giây height: chiều cao (inch) sex: = Nữ; = Nam smoker: hút thuốc Xác định yếu tố ảnh hưởng tới FEV1 46 ... huyết tương thay đổi lit? Một người có cân nặng 65 kg thể tích huyết tương lit? 25 Hồi quy tuyến tính đơn biến Thể tích huyết tương = 0.0857 + 0.043 62* trọng lượng thể 2. 92 lit 26 Hồi quy tuyến tính. .. thuộc có tương quan tuyến tính 11 Hệ số tương quan • Hệ số tương quan:     r ∈ [-1 : 1] r > 0: tương quan thuận; r < 0: tương quan nghịch r = 0: khơng tương quan • Mức độ tương quan (trị... tương quan tuyến tính • Kết luận có ý nghĩa thống kê dựa vào giá trị p • Tóm lại:  Kết luận mức độ, xu hướng tương quan  r  Kết luận có ý nghĩa thống kê  p 17 Hệ số tương quan • Hệ số tương quan

Ngày đăng: 07/03/2023, 19:37

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan