Chương 11 HỒI QUY VÀ TƯƠNG QUAN ĐƠN BIẾN Ths Nguyễn Tiến Dũng Viện Kinh tế Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn MỤC TIÊU CỦA CHƯƠNG ● Sau học xong chương này, người học ● Nói phạm vi ứng dụng phương pháp phân tích hồi quy tương quan đơn biến ● Biết cách thực phân tích hồi quy dựa liệu mẫu ● Nói điều kiện giả định cần thiết phân tích hồi quy ● Biết cách tính ý nghĩa hệ số tương quan Pearson hệ số tương quan hạng Spearman © 2013 Nguyễn Tiến Dũng CÁC NỘI DUNG CHÍNH ● 11.1 LÀM QUEN VỚI HỒI QUY ● 11.2 MƠ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN ● 11.3 TƯƠNG QUAN TUYẾN TÍNH ● 11.4 TƯƠNG QUAN GIỮA CÁC BIẾN ĐỊNH TÍNH © 2013 Nguyễn Tiến Dũng 11.1 Làm quen với hồi quy ● 11.1.1 Khái niệm hồi quy ● Regression, Regression to mediority: quy điểm DL biết đường lý thuyết ● Đ/nghĩa TK: ● NC mối liên hệ phụ thuộc biến phụ thuộc (biến đầu ra) hay nhiều biến độc lập (biến đầu vào), ● nhằm ước tính dự báo giá trị trung bình tổng thể biến phụ thuộc dựa giá trị biết trước biến độc lập ● Hồi quy đơn biến (simple regression): biến PT biến ĐL, DL định lượng ● TD: ● KQ học tập = f(thời gian tự học) ● KQ học tập = f(thời gian tự học, yêu thích chuyên ngành) ● Lượng tiêu thụ = f(P1, P2, P3, P4) ● Chất lượng sản phẩm = f(NVL, thiết bị, cơng nghệ, người, quản lý) © 2013 Nguyễn Tiến Dũng 11.1.2 Phân biệt liên hệ TK liên hệ hàm số phân tích hồi quy ● Liên hệ hàm số: Y = b0 + b1X ● Với giá trị X, có giá trị xác định Y ● Liên hệ TK: Y = b0 + b1.X ● X = thời gian tự học; Y = điểm GPA ● DL X: liệu mẫu ● Một X, có nhiều Y ● DL mẫu xác định đường HQ mẫu dự đoán đường HQ tổng thể © 2013 Nguyễn Tiến Dũng © 2013 Nguyễn Tiến Dũng 11.1.3 Quy ước ký hiệu tên gọi ● Biến số: Y = b0 + b1.X1 + b2X2 ● Biến độc lập, biến đầu vào, biến giải thích: X1, X2 ● Biến phụ thuộc, biến đầu ra, biến giải thích: Y ● Xki: giá trị quan sát thứ i biến Xk ● b0, b1, b2: hệ số phương trình hồi quy ● Hồi quy đơn biến hồi quy đa biến (HQ bội) ● HQ đơn biến (simple regression): biến ĐL ● HQ đa biến (multiple regression): nhiều biến ĐL © 2013 Nguyễn Tiến Dũng 11.1.4 Các dạng liên hệ biến độc lập biến phụ thuộc © 2013 Nguyễn Tiến Dũng 11.2 Mơ hình hồi quy tuyến tính đơn ● 11.2.1 Mở đầu ● NC mối liên hệ thu nhập (X) chi tiêu (Y) ● Lấy mẫu n hộ gia đình ● Đường hồi quy lý thuyết ● E(Y|Xi) = b0 + b1.Xi ● Yi = b0 + b1Xi + ei ● b0: hệ số tung độ gốc (hệ số chặn) ● b1: hệ số dốc (hệ số góc) ● ei: sai số, thể yếu tố nhiễu © 2013 Nguyễn Tiến Dũng 11.2.2 Các giả định liên quan đến yếu tố nhiễu ● Các ei Xi có phân phối bình thường ● Khơng có tương quan nhiễu, hay ei độc lập với © 2013 Nguyễn Tiến Dũng 10 11.2.8.3 KĐ ý nghĩa hệ số độ dốc ● Cặp giả thuyết KĐ ● Quy tắc bác bỏ H0: H : 1 H : 1 Bác bỏ H neáu ● TD: t tn 2; /2 t tn 2; /2 ● Chỉ tiêu KĐ tính: t = b1/sb1 ● b1 = 49,91 ● sb1 = 10,5021 ● t = 4,7524 ● t tra bảng: tn-2;α/2 = t10; 0,025=2,228 ● Bác bỏ H0 © 2013 Nguyễn Tiến Dũng 21 © 2013 Nguyễn Tiến Dũng 22 11.2.9 Phân tích phần dư ● 11.2.9.1 Kiểm tra tính đắn mơ hình HQTT ● KT mối liên hệ tuyến tính: ● Vẽ đồ thị phần dư theo biến độc lập X: e = f(X) ● Nếu điểm khơng tạo thành hình mẫu cụ thể quan hệ HQTT đắn © 2013 Nguyễn Tiến Dũng 23 11.2.9.2 KT vi phạm giả định PS ● Phương pháp đồ thị phần dư (e) theo X ● Nếu phần dư tăng dần X tăng lên có nghĩa phương sai phần dư thay đổi vi phạm ● Phương pháp Kiểm định Park © 2013 Nguyễn Tiến Dũng 24 11.2.9.3 KT giả định PP bình thường phần dư ● Vẽ đồ thị xác suất bình thường (Normal Probability Plot): e = e(z) ● Sử dụng Excel © 2013 Nguyễn Tiến Dũng 25 © 2013 Nguyễn Tiến Dũng 26 11.2.9.4 KT tính độc lập phần dư ● P.pháp đồ thị: vẽ đồ thị phần dư theo trật tự giá trị thu theo thời gian Nếu khơng xuất hình mẫu xác định KL phần dư độc lập với ● KĐ Durbin-Watson: Chỉ tiêu KĐ D © 2013 Nguyễn Tiến Dũng n D (e i ei 1 ) i 2 n e i i 1 ei : phần dư quan sát i n: số quan sát Giá trị D: D 27 © 2013 Nguyễn Tiến Dũng 28 Durbin-Watson Table © 2013 Nguyễn Tiến Dũng 29 11.2.10 Sử dụng PT hồi quy để dự đoán giá trị TB giá trị cá biệt Y ● Giá trị TB E (Y | X ) Yˆ0 eY Yˆ0 b0 b1 X eY tn 2; /2 sY | X ( X X )2 n n ( X X ) i i 1 ● Giá trị cá biệt Y0 Yˆ0 eY Yˆ0 b0 b1 X eY tn 2; /2 sY | X ( X X )2 1 n n ( X X ) i i 1 © 2013 Nguyễn Tiến Dũng 30 11.3 Tương quan tuyến tính ● 11.3.1 Hệ số tương quan tổng thể rho ● 11.3.2 Hệ số tương quan mẫu rXY XY XY cov( X , Y ) var( X ) var(Y ) XY X Y n rXY s XY s X sY (x x )( yi y ) i 1 n n ( x x ) ( y y ) i i i 1 © 2013 Nguyễn Tiến Dũng i i 1 31 Giá trị ý nghĩa hệ số tương quan: ● r < 0: có mối liên hệ tỷ lệ nghịch ● r > 0: có mối liên hệ tỷ lệ thuận ● |r| > 0,8 : TQTT mạnh ● |r| = 0,6 – 0,8: TQTT mạnh ● |r| = 0,4 – 0,6: TQTT vừa phải ● |r| = 0,2 – 0,4: TQTT yếu ● |r| < 0,2 : TQTT yếu © 2013 Nguyễn Tiến Dũng 32 KĐ ý nghĩa hệ số tương quan tuyến tính H0 : H1 : ● Cặp giả thuyết KĐ ● Chỉ tiêu KĐ ● Quy tắc bác bỏ H0 ● Bác bỏ H0 |t| > tn-2;α/2 ● TD: Trang 345 © 2013 Nguyễn Tiến Dũng t r r2 n2 r 33 n2 r2 11.4 Tương quan biến định tính ● 11.4.1 Hệ số TQ hạng Spearman ● 11.4.2 Hệ số Kendall Tau ● 11.4.3 Hệ số tq DL thứ bậc DL phân nhóm (tau c, gamma, dyx dxy) © 2013 Nguyễn Tiến Dũng 34 KĐ theo hệ số tương quan hạng Spearman rS ● Biến X1 X2 có liệu thứ bậc (hoặc DL khoảng, ● ● ● ● ● biến thành DL thứ bậc cách xếp hạng mẫu), mẫu n cặp quan sát n Tính chênh lệch hạng di = x1i – x2i (i = 1, 2, … n) d i2 Tính hệ số tương quan hạng rS rS i 1 n ( n 1) H0: Khơng có liên hệ biến (Hệ số tương quan hạng tổng thể = 0) Nếu số trường hợp có di = nhiều, cần thêm hệ số hiệu chỉnh Nếu n > 10, PP hệ số TQ hạng mẫu xấp xỉ PP bình thường với độ lệch chuẩn 1/(n – 1) Chỉ tiêu KĐ z z rS 1/ n 1 © 2013 Nguyễn Tiến Dũng rS n 35