1. Tương quan Mục đích của tương quan là tìm ra một con số biểu thị mối quan hệ giữa 2 biến A và B với nhau. Tương quan phản ánh mức độ liên kết hay độ mạnh trong sự liên kết giữa biến A với biến B. Nếu sự thay đổi của biến A sẽ kéo theo sự thay đổi của biến B và ngược lại. Tương quan là mối quan hệ 2 chiều, A với B cũng như B với A, hệ số tương quan của A đối với B bằng với hệ số tương quan của B đối với A. Trong tương quan, khi 2 biến A và B di chuyển cùng hướng, tức A tăng sẽ làm B tăng và ngược lại B tăng làm A tăng, 2 biến này sẽ được coi là có tương quan dương. Nếu 2 biến di chuyển theo 2 hướng khác nhau, A tăng làm B giảm, hoặc B tăng làm A giảm, 2 biến sẽ có tương quan nghịch. Lượng thay đổi của X bằng lượng thay đổi của Y. Không có sự phân biệt biến độc lập và biến phụ thuộc, vai trò của A và B là như nhau. Tương quan là sự xem xét mối quan hệ giữa từng cặp biến với nhau. 2. Hồi quy Mục đích của hồi quy là đi tìm một phương trình mà khi biểu diễn nó trên đồ thị, chúng ta có một đường thẳng phù hợp nhất và ước tính được biến phụ thuộc Y dựa vào những thay đổi của biến độc lập X. Hồi quy phản ánh sự ảnh hưởng của việc thay đổi giá trị của biến độc lập X lên biến phụ thuộc Y. Chúng ta sẽ đi ước tính Y dựa vào những giá trị của X. Hồi quy là mối quan hệ 1 chiều từ X lên Y. Hệ số hồi quy sẽ khác nhau nếu đổi X thành biến phụ thuộc, đổi Y thành biến độc lập. Trong hồi quy, việc tăng X làm Y tăng nghĩa là biến X có sự tác động thuận chiều lên Y. Nếu X tăng làm Y giảm nghĩa là biến X có sự tác động nghịch chiều lên Y. Lượng thay đổi của X không bằng lượng thay đổi của Y. Có sự phân biệt biến độc lập X và biến phụ thuộc Y, hồi quy chỉ xem xét sự tác động của biến độc lập lên biến phụ thuộc. Hồi quy có thể xem xét sự tác động của nhiều biến độc lập lên 1 biến phụ thuộc.
CHƯƠNG VI:TƯƠNG QUAN VÀ HỒI QUY Hệ số tương quan mẫu • Cho X, Y hai BNN, phần xác suất ta biết hệ số tương quan hai BNN X Y : E[(X EX)(Y EY)] EXY EX.EY R(X,Y) VX.VY VX.VY đại lượng cho biết mức độ phụ thuộc tuyến tính X Y (X , Y ), ,(X ,Y ) • Giả sử 1 n n mẫu ngẫu nhiên (X, Hệ số tương quan mẫu r tính theo cơng thức: Y) n Xi Yi XY n i 1 XY XY r s X s Y s X s Y Ví dụ Theo dõi phụ thuộc mức suy giảm đường X(%) thời gian chờ chế biến Y, ta có kết sau: X Y ni 30 30 35 35 40 40 40 45 45 45 10 50 Hãy tính hệ số tương quan mẫu X Y Giải Ta có: n 20; 1 X n i x i 41;Sx n i x i X 6,042; n i n i 50 10 Y n ni yi 6,5; SY n n i yi Y i i XY n n i xi yi 278 i XY XY r 0,839 s X s Y 2,269 Đường hồi quy trung bình tuyến tính thực nghiệm a) Hồi quy bình phương trung bình tuyến tính • Giả sử X biến đó, Y BNN phụ thuộc vào X theo cách E(Y X x) a bX a, b số phương sai khơng phụ • Khi vào ta nói: thuộc x Y hồi quy tuyến tính theo X • Đường thẳng có phương trình y = a + bX gọi đường thẳng hồi quy lý thuyết Y theo X • a, b gọi hệ số hồi quy lý thuyết, X biến độc lập Y biến phụ thuộc Bài tốn đặt ra: Cần tìm biểu thức a + bX cho xấp xỉ Y tốt theo nghĩa cực tiểu sai số bình phương trung bình: E(Y a bX) • Ta có: 2 E(Y a bX) E (Y EY) b(X EX) (EY bEX a) E(Y EY) b E(X EX) (EY bEX a) 2bE (Y EY)(X EX) 2E (Y EY)(EY bEX a) 2E b(X EX)(EY bEX a) VY b VX 2bR VX VY (EY bEX a) • Vế phải đạt cực tiểu tam thức bậc hai theo 2 b VX 2bR VX VY VY đạt cực tiểu (EY bEX a) 0 b: 2R VX VY VY b R 2VX VX Chọ a EY bEX, n • Khi đó: VY VY E Y bX a R VX 2R R VY VX VY VY(1 R ) VX VX • Phương trình đường hồi quy trung bình tuyến tính Y theo X là: VY VY VY Y a bx EY R EX R X hay Y=EY+R (X EX) VX VX VX 2 • Sai số bình phương trung bình dùng đường hồi quy 2 Y X VY(1 trung bình tuyến tính để xấp R xỉ )Y là: b) Hồi quy bình phương trung bình tuyến tính thực nghiệm • Giả sử (X1 ,Y1 ), ,(X n ,Yn ) MNN (X, Y) • Phương trình đường hồi quy tuyến tính thực nghiệm SY Y Y+r (X X) a bX Y theo X: SX • Sai số : S2Y X SY2 (1 r ) Ví dụ Qua theo dõi tình hình sản xuất cơng nhân xí nghiệp, người ta thu số liệu sau: Tuổi nghề (năm) 10 11 12 NSLĐ (kg/ngày) 11 13 15 10 20 25 21 28 a Hãy đánh giá mối liên hệ tuyến tính suất lao động tuổi nghề b Lập hàm hồi quy bình phương trung bình tuyến tính thực nghiệm suất lao động theo tuổi nghề Giải a) Gọi X tuổi nghề, Y suất lao động, ta có: n 10,X 7,1; SX 3,42; Y 15,7; SY 7,11; XY 133,4 XY XY r 0,9 SX S Y Mối liên hệ tuổi nghề suất lao động chặt chẽ b) Hàm hồi quy tuyến tính thực nghiệm suất lao động theo tuổi nghề : SY Y Y+r (X X) 2,38 1,876X SX Bài Đo chiều cao 12 cặp bố người ta kết sau: X - Bố (inches) 65 Y - Con (inches) 68 63 67 64 68 62 70 66 68 67 69 71 66 71 66 72 66 74 69 71 70 70 72 a) Tính hệ số tương quan mẫu X Y b) Tìm hàm hồi quy tuyến tính thực nghiệm Y theo X Dựa vào hàm hồi quy, dự đoán chiều cao chiều cao bố 68,5 inches Giải 1 x xi 66,666; s x xi x 2,6562 n n a) Ta có: 1 y yi 69,583; s y yi y 2,5317 n n xy xi yi 4645,0833 n xy x y 0,9211 Do r x, y sx s y b) Hàm hồi quy tuyến tính thực nghiệm Y theo X sy y r x, y x x y 0,8779 x 11,053 sx Nếu bố có chiều cao x=68,5 inches dự đốn có chiều cao 71,19 inches Bài Tiến hành nghiên cứu mối liên quan cân nặng (kg) huyết áp người Kết khảo sát lâm sàng sau: Cân nặng 78 86 72 82 80 86 84 89 68 71 Huyết áp 14 16 134 144 180 176 174 178 12 13 a) Xác định hệ số tương quan tuyến tính mẫu cân nặng huyết áp người b) Viết phương trình đường hồi quy tuyến tính thực nghiệm huyết áp theo cân nặng Từ dự đốn huyết áp người có cân nặng 90 kg ... Con (inches) 68 63 67 64 68 62 70 66 68 67 69 71 66 71 66 72 66 74 69 71 70 70 72 a) Tính hệ số tương quan mẫu X Y b) Tìm hàm hồi quy tuyến tính thực nghiệm Y theo X Dựa vào hàm hồi quy, dự đoán... chiều cao chiều cao bố 68 ,5 inches Giải 1 x xi ? ?66 ,66 6; s x xi x 2 ,65 62 n n a) Ta có: 1 y yi ? ?69 ,583; s y yi y 2,5317 n n xy xi yi 464 5,0833 n xy x y 0,9211... cứu mối liên quan cân nặng (kg) huyết áp người Kết khảo sát lâm sàng sau: Cân nặng 78 86 72 82 80 86 84 89 68 71 Huyết áp 14 16 134 144 180 1 76 174 178 12 13 a) Xác định hệ số tương quan tuyến