Chương 6: HỒI QUY VÀ TƯƠNG QUAN Mối liên hệ tượng KT-XH với phương pháp hồi quy tương quan Mối liên hệ tượng KT-XH với PP hồi quy tương quan 1.1 Mối liên hệ tượng KT-XH Liên hệ tương quan tuyến tính hai tiêu thức loạ loại liên hệ Liên hệ tương quan phi tuyến tính hai tiêu thức Liên hệ tương quan tuyến tính nhiều tiêu thức (hồi quy bội) Mối liên hệ tượng KT-XH với PP hồi quy tương quan Liên hệ hàm số: Liên hệ hàm số Liên hệ tương quan Mối liên hệ tượng KT-XH với PP hồi quy tương quan Liên hệ tương quan: Mối liên hệ hoàn toàn chặt chẽ biểu dạng hàm số y = f(x) Mối liên hệ khơng hồn tồn chặt chẽ tượng nghiên cứu nghĩa biến đổi x hoàn tồn định thay đổi y Ví dụ? Khơng thấy tồn tổng thể mà thấy đơn vị riêng biệt Thường không biểu rõ đơn vị cá biệt, cần nghiên cứu tượng số lớn Phương pháp dùng nghiên cứu mối liên hệ tương quan phương pháp hồi qui tương quan Ví dụ: S = v.t Mối liên hệ tượng KT-XH với PP hồi quy tương quan Thực chất PP hồi quy tương quan Mối liên hệ tượng KT-XH với PP hồi quy tương quan 1.2 Nhiệm vụ chủ yếu PP HQ&TQ – Xác định mơ hình/hàm số Nhiệm vụ tổng quát: – Xác định mức độ chặt chẽ mối liên hệ tương Là phương pháp toán học vận dụng thống kê để biểu phân tích mối liên hệ tương quan tượng kinh tế xã hội quan 1 Mối liên hệ tượng KT-XH với PP hồi quy tương quan Nhiệm vụ cụ thể: Xác định phương trình hồi quy gồm bước B1: Dựa vào phân tích lý luận để giải thích tồn thực tế chất mối liên hệ: - Mối liên hệ tượng KT-XH với PP hồi quy tương quan B2: Xác định hình thức, tính chất mối liên hệ - Hình thức: thuận hay nghịch Tính chất: Tuyến tính hay phi tuyến tính Các tiêu thức nghiên cứu có liên hệ khơng Xác định tiêu thức nguyên nhân, tiêu thức kết Mối liên hệ tượng KT-XH với PP hồi quy tương quan B3: Xác định mơ hình hồi quy biểu diễn mối liên hệ B4: Tính tốn tham số, giải thích ý nghĩa tham số b/ Đánh giá mức độ chặt chẽ mối liên hệ tương quan Liên hệ tương quan tuyến tính tiêu thức Stt Thu nhập (x) Nhu cầu hàng hóa (y) 1,0 2,5 3,0 3,5 4,0 5,0 6,5 7,0 9,0 10 10,0 VD trang 201 Khảo sát ngẫu nhiên 10 khách hàng ta thu liệu sau: - Hệ số tương quan - Tỷ số tương quan Liên hệ tương quan tuyến tính tiêu thức • Ta thấy thu nhập tăng nhu cầu hàng hóa dịch vụ tăng Tuy nhiên mức độ tăng khơng hồn toàn .0 10 5 2 • Dùng đồ thị quan sát cho nhận xét Cầu hàng hóa • Ta xem xét mối liên hệ tuyến tính tiêu thức x y cách xây dựng mơ hình tốn học ü Mối quan hệ thu nhập cầu hàng hóa Liên hệ tương quan tuyến tính tiêu thức Đường gấp khúc đồ thị có xu hướng tăng dần Đướng gấp khúc vươn theo hướng từ bên trái phía sang bên phải phía Thu nhập bình qn 2 Liên hệ tương quan tuyến tính tiêu thức Mối quan hệ thu nhập cầu hàng hóa •Trên đồ thị, đường gấp khúc gọi đường hồi quy thực nghiệm, hình thành từ tài liệu cho Đường chưa phản ánh rõ mối liên hệ tiêu thức Liên hệ tương quan tuyến tính tiêu thức Trong đường hồi qui lý thuyết : yx = a + bx Thì: x: Trị số tiêu thức nguyên nhân Cầu hàng hóa Đường thẳng theo hướng với đường gấp khúc gọi đường hồi quy lý thuyết biểu dạng hàm số yx = a + bx 0 10 5 0 Thu nhập bình qn Có vơ số đường thẳng vẽ Chọn đường thẳng cực tiểu hóa tổng độ lệch bình phương chênh lệch giá trị thực tế yt với giá trị yx yx: Trị số tiêu thức kết y tính theo phương trình hồi quy a: Tham số tự nói lên ảnh hưởng nguyên nhân khác x y b : Hệ số hồi qui nói lên ảnh hưởng x y, cụ thể x tăng đơn vị y tăng bình quân b đơn vị Liên hệ tương quan tuyến tính tiêu thức Liên hệ tương quan tuyến tính tiêu thức Phương pháp xác định tham số PT hồi quy Xác định tham số Xác định a,b dựa vào phương pháp bình phương nhỏ Phương pháp bình phương nhỏ nhất? Tối thiểu hố tổng bình phương độ lệch giá trị thực tế yt giá trị điều chỉnh biến phụ thuộc yx Cách : Tính a, b từ hệ phương trình ∑y = na + b∑x ∑xy = a∑x + b∑x2 S = å ( yt - y x ) = Liên hệ tương quan tuyến tính tiêu thức x y (x-x) (y-y) (x-x)2 (y-y)2 1.0 1.0 1.0 1.0 1.0 (4.2) (2.6) 17.2 6.8 10.8 2.0 2.5 2.0 5.0 6.3 (2.7) (1.6) 7.0 2.6 4.2 3.0 3.0 2.0 6.0 9.0 (2.2) (1.6) 4.6 2.6 3.4 4.0 3.5 2.0 7.0 12.3 (1.7) (1.6) 2.7 2.6 2.6 5.0 4.0 3.0 12.0 16.0 (1.2) (0.6) 1.3 0.4 0.7 6.0 5.0 3.0 15.0 25.0 (0.2) (0.6) 0.0 0.4 0.1 7.0 6.5 4.0 26.0 42.3 1.4 0.4 1.8 0.2 0.5 8.0 7.0 6.0 42.0 49.0 1.9 2.4 3.4 5.8 4.4 9.0 9.0 6.0 54.0 81.0 3.9 2.4 14.8 5.8 9.2 10.0 10.0 7.0 70.0 100.0 4.9 3.4 23.5 11.6 16.5 51.5 36.0 - - 38.4 52.6 Stt x.y x2 238.0 341.75 76.525 (x-x).(y-y) Liên hệ tương quan tuyến tính tiêu thức • Từ bảng tính tốn thay số liệu vào phương trình hệ sau: 36 = 10 a + 51.5 b 238 = 51.5 a + 341.75 b • Giải hệ PT ta tìm a = 0.06195; b = 0.687 • Vậy, phương trình hồi quy có dạng • yx = 0.06195 + 0.687 x Liên hệ tương quan tuyến tính tiêu thức • a = 0.06195 mức độ xuất phát đường hồi quy lý thuyết, khơng phụ thuộc vào x, nói lên ảnh hưởng nhân tố khác tới nhu cầu hàng hóa Liên hệ tương quan tuyến tính tiêu thức Cách : Tính a, b từ công thức sách trang 206 Kết tương tự • b = 0.687 hệ số hồi quy, nói lên ảnh hưởng tiêu thức nguyên nhân x tiêu thức kết y • Có nghĩa là: Nếu thu nhập bình quân tháng tăng lên triệu nhu cầu hàng hóa tăng thêm 0.687 Liên hệ tương quan tuyến tính tiêu thức • Hệ số tương quan (rxy) Tác dụng r Ý nghĩa : Đánh giá trình độ chặt chẽ mối liên hệ tương quan tuyến tính (xem xét tiêu thức nguyên nhân tiêu thức kết có mối liên hệ với đến chứng mực nào) r xy = å ( x - x )´ ( y - y ) å (x - x ) å ( y - y ) i rxy = Trong độ lệch chuẩn tính i i – Xác định cường độ mối liên hệ – Xác định phương hướng mối liên hệ i xy - x y d x d y rxy = b Liên hệ tương quan tuyến tính tiêu thức dx dy dx = dy = (x - x ) • r > : liên hệ tương quan thuận • r < : liên hệ tương quan nghịch n (y - y )2 - Dùng nhiều phân tích dự đốn TK n Liên hệ tương quan tuyến tính tiêu thức Tính chất r : -1 ≤ rxy ≤ + rxy > : Giữa x y có mối liên quan thuận + rxy = ± : Giữa x y có mối liên hệ hàm số + rxy = : Giữa x y khơng có mối liên hệ tương quan tuyến tính + rxy tiến gần tới ± : Mối liên hệ x y chặt chẽ Liên hệ tương quan tuyến tính tiêu thức • Tiếp theo ví dụ bảng 6.1, ta tính rxy rxy = xy - x y 23,8 - 5,15 ´ 3,6 5,26 = = = 0,97 s x s y 2,766 ´1,959 5,42 • Trong đó: dx = d y = (x - x ) n ( y - y )2 n = 76 , 525 = , 766 10 = 38 , = 1, 959 10 LH tương quan phi tuyến tính tiêu thức LH tương quan phi tuyến tính tiêu thức Lập bảng để tính trị số: ∑x; ∑y; ∑xy; ∑x2; ∑x3; ∑x4… Phương trình parabol bậc yx = a + bx + cx2 Xác định a,b,c: ∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3) PT barabon bậc dùng trường hợp tiêu thức nguyên nhân tăng (giảm) với lượng tiêu thức kết biến động với lượng khơng Ví dụ: Liên hệ tuổi nghề suất lao động; lượng phân bón suất thu hoạch; thu nhập cầu hàng hóa… LH tương quan phi tuyến tính tiêu thức 70 • Ví dụ: Có tài liệu tuổi nghề suất lao động Công ty X sau: Tuổi nghề (Năm) 12 15 18 21 24 27 30 33 36 60 50 40 Series1 30 Poly (Series1) 20 10 NSLĐ (SP) 12 23 35 44 51 55 58 60 57 52 47 38 LH tương quan phi tuyến tính tiêu thức x (tuổi nghề) y (NSLĐ) x*x 12 23 x*y x*x*x 36 x*x*y 27 x*x*x*x 108 y*y 81 144 36 138 216 828 1296 529 35 81 315 729 2835 6561 1225 12 44 144 528 1728 6336 20736 1936 15 51 225 765 3375 11475 50625 2601 18 55 324 990 5832 17820 104976 3025 21 58 441 1218 9261 25578 194481 3364 24 60 576 1440 13824 34560 331776 3600 27 57 729 1539 19683 41553 531441 3249 30 52 900 1560 27000 46800 810000 2704 33 47 1089 1551 35937 51183 1185921 2209 36 38 1296 1368 46656 49248 1679616 1444 234 532 5850 11448 164268 288324 4917510 26030 10 11 12 LH tương quan phi tuyến tính tiêu thức ∑y = na + b∑x + c∑x2 (1) ∑xy = a∑x + b∑x2 + c∑x3 (2) ∑x2y = a∑x2 + b∑x3 + c∑x4 (3) 532 = 12a + 234b + 5850c 11448 = 234a + 5850b + 164268c 288324 = 5850a + 164268b + 4917510c yx = -4,5 + 5,5x – 0,1x2 LH tương quan phi tuyến tính tiêu thức x Phương trình hypebol y x = a + b Xác định a, b dựa vào hệ phương trình sau: ì ïïå y = na + b å x í ï y = a + b å x å x2 ïỵå x VD: Nghiên cứu mối liên hệ mức tiêu thụ hàng hóa với tỷ suất phí lưu thơng LH tương quan phi tuyến tính tiêu thức Phương trình hypebol dùng trường hợp trị số tiêu thức nguyên nhân tăng trị số tiêu thức kết giảm với tốc độ khơng Ví dụ: liên hệ sản lượng giá thành đơn vị sản phẩm, liên hệ mức tiêu thụ hàng hóa với tỷ suất phí lưu thông… 12 10 Mức tiêu thụ (triệu) 75 10 9.2 90 120 150 180 220 300 450 600 800 8.1 7.8 7.9 6.1 TSPLT 5.8 5.3 Tỷ suất phí lưu 10.0 9.2 8.1 7.8 7.9 7.0 6.1 5.8 5.3 5.0 thông (%) 75 LH tương quan phi tuyến tính tiêu thức 90 120 150 180 220 300 450 600 800 LH tương quan phi tuyến tính tiêu thức Tỷ số tương quan (η) - êta Ý nghĩa : Đánh giá trình độ chặt chẽ mối liên hệ tương quan phi tuyến tính (giống ý nghĩa hệ số tương quan r) d xy2 d y2 - d y2( x ) d y2( x ) h= = = 1- d y2 d y2 dy Trong : d y2 = å d y2( x ) = Quan hệ ba loại phương sai ( y - y)2 = n å(y - y ) åy n ổồyử ữ - ỗỗ ữ ố n ứ 2 x n d xy2 = d y2 - d y2( x ) LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) LH tương quan phi tuyến tính tiêu thức Trong thực tế khơng phải có tiêu thức x ảnh hưởng đến y, thay đổi y giải thích tồn diện đặt mối quan hệ với nhiều tiêu thức nguyên nhân Đây phương pháp phân tích hồi quy bội Tính chất (η) - êta Tỷ số tương quan có giá trị nằm khoảng [0 ; 1] Phương trình hồi quy: 0≤η≤1 Y = a0 + a1 x1 + a2 x2 + + an xn Nếu η = : x, y khơng có mối liên hệ tương quan Nếu η = : x, y có liên hệ hàm số Nếu η gần liên hệ tương quan chặt chẽ Trong đó: x1, x2,…,xn: nhân tố ảnh hưởng, có liên hệ tương quan với y • a1, a2, …, an: hệ số hồi quy • a0: giá trị ước lượng tiêu thức y x=0 • LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) • Xác định hệ số a dựa vào hệ phương trình å y = a n + a å x + a å x + + a å x å x y = a å x + a å x + a å x x + + a å x x å x y = a å x + a å x x + a å x + + a å x x 1 1 2 1 2 1 n 2 2 n n n n • Với tiêu thức nguyên nhân (x, z) • Phương trình hồi quy tuyến tính có dạng Yxz = a + bx + cz Với a = a0; b = a1; c = a2 Các tham số a; b; c tính từ hệ PT sau: n n n åx y =a åx LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) + a1 å x1 xn + a2 å x2 xn + + an å xn2 å y = na + bå x + cå z å xy = aå x + bå x + cå zx å yz = aå z + bå xz + cå z 2 LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) • Với tiêu thức nguyên nhân (x, z, v) • Phương trình hồi quy tuyến tính có dạng Yxzv = a + bx + cz + dv LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) Hệ số tương quan bội: Đánh giá trình độ chặt chẽ mối liên hệ tương quan tuyến tính đa biến Cơng thức: Ryy xx11xx22 xxnn = 11 ddy2y2((xx11xx22 xxnn)) ddy2y2 å å((yy yy )) å å((yy yy)) 22 == 11 x1xx12x x nxn 22 LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) • Tính chất hệ số tương quan bội • Có giá trị nằm khoảng [0 ; 1] • ≤ Ryx1x2…xn ≤ • Nếu R = : Giữa y x1, x2,…, xn khơng có liên hệ tuyến tính • Nếu R = : Giữa y x1, x2,…, xn có liên hệ hàm số • R gần 1, mối liên hệ y x1, x2,…, xn chặt chẽ LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) • Cụ thể, trường hợp có liên hệ tương quan tiêu thức x, y, z (trong y tiêu thức kết quả), hệ số tương quan bội là: Rxyz = = 1- d y2( xz ) d y2 å(y - y ) å ( y - y) i xy LH tương quan tuyến tính nhiều tiêu thức (hồi quy bội) • Hệ số tương quan riêng x y (loại trừ ảnh hưởng z) rxy ( z ) = rzy ( x ) = rxy - ryx ´ rzx (1 - r )´ (1 - r ) xy xz rzy - rxyz ´ rxz (1 - r )´ (1 - r ) xy xz ... 1728 63 36 207 36 19 36 15 51 225 765 3375 11475 5 062 5 260 1 18 55 324 990 5832 17820 1049 76 3025 21 58 441 1218 9 261 25578 194481 3 364 24 60 5 76 1440 13824 34 560 3317 76 360 0 27 57 729 1539 1 968 3... 52 900 1 560 27000 468 00 810000 2704 33 47 1089 1551 35937 51183 1185921 2209 36 38 12 96 1 368 466 56 49248 167 961 6 1444 234 532 5850 11448 164 268 288324 4917510 260 30 10 11 12 LH tương quan phi... tương quan tuyến tính tiêu thức x y (x-x) (y-y) (x-x)2 (y-y)2 1.0 1.0 1.0 1.0 1.0 (4.2) (2 .6) 17.2 6. 8 10.8 2.0 2.5 2.0 5.0 6. 3 (2.7) (1 .6) 7.0 2 .6 4.2 3.0 3.0 2.0 6. 0 9.0 (2.2) (1 .6) 4 .6 2.6