Bài giảng Hồi quy và tương quan cung cấp cho người học các kiến thức: Phân tích được sự liên quan giữa hai biến định lượng thông qua biểu đồ, Xây dựng và phiên giải đường hồi quy, Tính và phiên giải được hệ số tương quan, Kiểm định đường hồi quy.
Hồi quy tương quan ThS Nguyễn Chí Minh Trung Mục tiêu Phân tích liên quan hai biến định lượng thông qua biểu đồ Xây dựng phiên giải đường hồi quy Tính phiên giải hệ số tương quan Kiểm định đường hồi quy Hồi quy tương quan Nội dung chính: Giới thiệu chung Mơ hình hồi quy Phương trình hồi quy Đánh giá phương trình hồi quy Sử dụng mơ hình hồi quy để ước lượng dự đốn Mơ hình tương quan Giới thiệu Hồi quy (regression) : • Khẳng định mối liên hệ hai biến số, • Dự đốn ước lượng giá trị biến số từ giá trị hay nhiều biến số khác Ví dụ: dự đốn huyết áp dựa tuổi, cân nặng, Ý tưởng hồi quy nhà khoa học người Anh, Francis Galton (1822-1911) đưa lần nghiên cứu di truyền – hình thể người Giới thiệu Tương quan (correlation) • Đo lường độ lớn mối quan hệ biến số với Mơ hình hồi quy - cần đưa dự đoán ước lượng giá trị biến số từ giá trị hay nhiều biến số, - người nghiên cứu đưa mơ hình tốn học áp dụng mơ hình để phân tích quần thể - mơ hình có, xấp xỉ đại diện cho quần thể khơng - mơ hình đại diện tốt cho quần thể họ quan tâm Mơ hình hồi quy Các giả thuyết cho mơ hình hồi quy Trong mơ hình hồi quy tuyến tính: + X biến độc lập kiểm soát người nghiên cứu + Y biết đến biến phụ thuộc (còn gọi biến tiên lượng) Mơ hình hồi quy Mơ hình hồi quy dựa số giả thuyết sau: Giá trị biến X cố định có số lượng giới hạn giá trị Biến X thu thập khơng có sai số, sai số Đối với giá trị biến X ta xác định tập hợp giá trị biến Y; tập hợp giá trị Y có phân bố chuẩn Tất phương sai tập hợp giá trị Y Tất giá trị trung bình tập hợp giá trị Y nằm đường thẳng Các giá trị Y độc lập với Mô hình hồi quy Mơ hình hồi quy • Mơ hình tuyến tính Y= + bX+ e Y • Trong Y = biến phụ thuộc X = biến độc lập = giao điểm b = độ dốc e = giá trị sai số b X Hệ số xác định • R2 đo lường tỷ lệ biến thiên y lý giải biến thiên x ( x ) b2 ( xi2 i SSR n R 2 ( y ) ( y y ) i i y i n • R2 có giá trị từ đến R2 = 1: lý tưởng, đường hồi qui trùng với điểm số liệu R2 = 0: khơng có mối liên hệ x y Ví dụ SUMMARY OUTPUT Regression Statistics Multiple R R Square Adjusted R Square Standard Error Observations Hệ số xác định=0,3379, nghĩa có 33,8% biến thiên FEV lý giải biến thiên chiều cao (mơ hình chưa phải mơ hình tốt) 0.5813 0.3379 0.3011 0.5892 20 ANOVA df Regression Residual Total Intercept X Variable 1 18 19 SS 3.1894 6.2493 9.4387 MS 3.1894 0.3472 F 9.1865 Sig F 0.0072 Coef -8.4465 SE 4.0611 t Stat -2.0798 P-value 0.0521 Lower 95% -16.9786 Upper 95% 0.0856 0.0744 0.0245 3.0309 0.0072 0.0228 0.1260 Sử dụng đường hồi qui • Nếu mơ hình hồi quy mơ tả tốt cho mối quan hệ hai biến dùng mơ hình để dự đóan giá trị y: – Ước lượng điểm – Ước lượng khỏang Ước lượng điểm • Ví dụ: – Ước lượng FEV sinh viên cao 187cm: y=-8,45+0,0744*187=5,46 lít – Một sinh viên cao 187cm có dung tích thở gắng sức 5,46 lít – Kết xác nào? Ước lượng khoảng • Hai giá trị khỏang: – Ước lượng khỏang giá trị y với giá trị x yˆ t (1 / 2) s y| x ( x p x) 1 n ( xi x) – Khỏang tin cậy – ước lượng trung bình y với giá trị x yˆ t (1 / 2) s y| x ( x p x) n ( xi x ) Kiểm định F cho mơ hình hồi quy Giả thuyết thống kê H0: b = H1: b ≠ (or < 0,or > 0) ANOVA df Regression (SSReg) SS Residual (SSRes) n-2 Total n-1 SST-SSReg Bác bỏ H0 F>F1,n-2, 1- Không bác bỏ H0 F< F1,n-2, 1- MS F SSReg/ df MSR/MSE SSRes/ df Sig F Hệ số tương quan • Hệ số tương quan (Coefficient of correlation) sử dụng để đo lường độ lớn mối quan hệ hai biến số Ví dụ số giá trị hệ số tương quan Y Y Y X r = -1 X r = -.6 Y X r=0 Y r = X r=1 X Cách tính • Cơng thức r b x i xi / n y y 2 i /n • Giá trị hệ số tương quan nằm khỏang -1 đến – r = -1 (mối tương quan nghịch) r = +1 (mối tương quan thuận) tất điểm số liệu nằm đường hồi quy – r = khơng có mối tương quan Kiểm định giả thuyết cho r • Giả thuyết H0: = (không liên quan) H1: (có mối quan hệ tuyến tính) • Kiểm định t r r n2 với df = n - Ví dụ • Hệ số tương quan FEV chiều cao (0,0744 ) 547587 ,2 (3307 ,6)2 / 20 r 0,58 306,6 (77,1) / 20 • Kiểm định H0: = (khơng liên quan) H1: (có mối quan hệ tuyến tính) t>t tra bảng=2,1 bác bỏ H0, có mối quan hệ tuyến tính FEV chiều cao, t 0,58 0,58 20 2 3,02 Mơ hình tuyến tính – khơng tuyến tính Y Y X e X X e X Khơng tuyến tính, hồi quy bội Tuyến tính Hồi quy đa biến • Có nhiều biến độc lập – y = b0+b1x1 + b2x2+ +bnxn+ e • Hồi quy logistics: – y = b0+b1x1 + b2x2+ +bnxn+ e – Trong y biến phụ thuộc có hai giá trị có/khơng Tóm tắt • Hệ số tương quan: -> có/khơng, thuận/nghịch, mạnh yếu • Biểu đồ chấm điểm: • Mơ hình hồi quy tuyến tính: Y= Dự đoán: X tăng 1-> Y tăng b a + bX Y0 tương ứng X0 Hệ số xác định: -> X chi phối ?% đến Y Sử dụng SPPP • Hệ số tương quan: Analyze\Correlate\Bivariate: • Biểu đồ chấm điểm: Graphs Lagacy Dialogs Scatter Dot Simple Scatter Define • Mơ hình hồi quy tuyến tính: Analyze\Regression\Linear ... Phân tích liên quan hai biến định lượng thông qua biểu đồ Xây dựng phiên giải đường hồi quy Tính phiên giải hệ số tương quan Kiểm định đường hồi quy Hồi quy tương quan Nội dung chính: Giới thiệu... chính: Giới thiệu chung Mơ hình hồi quy Phương trình hồi quy Đánh giá phương trình hồi quy Sử dụng mơ hình hồi quy để ước lượng dự đốn Mơ hình tương quan Giới thiệu Hồi quy (regression) : • Khẳng... trình hồi quy Các bước tiến hành phân tích hồi quy 1.Đánh giá xem giả thuyết mối liên hệ tương quan tuyến tính số liệu để phân tích có thoả mãn khơng 2.Xác định phương trình đường hồi quy mơ