Chương 6. Hồi quy và tương quan 6.1 Tổng quan - Xét hai ĐLNN X và Y, giữa chúng có thể có một số phụ thuộc +X và Y độc lập với nhau. +X và Y có mối phụ thuộc hàm số. +X và Y có mối phụ thuộc thống kê, tức là khi X thay đổi thì pp của Y thay đổi. +phụ thuộc tương quan: khi X thay đổi thì trung bình của Y thay đổi theo. - Giả sử khi quan sát X và Y ta được Để chỉ ra mối quan hệ giữa X và Y, người ta thường biểu diễn quan sát bởi một điểm trên mp, nhưng quan trọng không kém là phải đự đoán được Y khi biết X (hoặc ngược lại). Để là được điều này, người ta thường dùng một phương trình để mối quan hệ giữa hai ĐLNN và dùng nó để dự đoán. Phương trình đó gọi là pt tương quan hay pt hồi quy (hàm hồi quy). X Y 1 2 n x x x 1 2 n y y y i i (x ,y ) - Hàm hồi quy được xây dựng dựa trên ít nhất hai mục đích: dự đoán các quan sát mới và đánh giá mức độ chặt chẽ của mối phụ thuộc tương quan tuyến tính. 6.2 Xác định hàm hồi quy tuyến tính Giả sử có n cặp quan sát . Ta tìm hàm hồi quy tuyến tính mẫu của Y theo X: 1 1 2 2 (x ,y ),(x ,y ), n n ,(x ,y ) x y ax b.= + - Phương pháp bình phương bé nhất: ta phải xác định các hệ số a và b sao cho Bằng cách xem f(a,b) như là một hàm theo 2 biến a và b, ta sẽ tìm điểm cực tiểu của f để được các ước lượng của a và b bằng cách giải hệ phương trình n 2 i i i 1 f (a,b) (y ax ) min. = = − ∑ n n n 2 i i i i i 1 i 1 i 1 a n n b i i i 1 i 1 2 x a x b x x y f 0 f 0 a x nb y xy x.y a s b y ax = = = = = + = ′ = ⇔ ′ = + = − = ⇔ = − ∑ ∑ ∑ ∑ ∑ $ 6.3 Hệ số tương quan Để đánh giá mức độ phụ thuộc tương quan tuyến tính của hai ĐLNN X và Y, người ta dựa vào hệ số tương quan Trong thực hành, ta sử dụng công thức 1 2 XY X Y M(X )(Y ) R −µ −µ = σ σ xy x y xy x.y r s s − = $ $ VD 6.1: Cho X là điểm thi Toán vào đại học và Y là điểm thi cuối năm thứ nhất của 10 SV khoa Toán (thang điểm 20), ta có kết quả a) Tìm hàm hồi quy tuyến tính mẫu của Y theo X. b ) Dự đoán điểm thi cuối năm của SV có điểm thi Toán vào đại học là 15. X 2 8 5 10 14 12 18 6 8 10 Y 4 8 6 10 12 10 15 5 9 12 VD 6.2: X(%) và Y(cm) là hai chỉ tiêu của một loại sản phẩm. Điều tra một mẫu ta có bảng số liệu sau Tìm hàm hồi quy tuyến tính mẫu của Y theo X và hệ số tương quan. * Bài tập: 40, 41 trang 118- 119 80-84 84-88 88-92 92-96 1 8 3 12 9 4 6 5 11 15 10 7 12 7 3 X Y . Chương 6. Hồi quy và tương quan 6. 1 Tổng quan - Xét hai ĐLNN X và Y, giữa chúng có thể có một số phụ thuộc +X và Y độc lập với nhau. +X và Y có mối phụ thuộc hàm số. +X và Y. gọi là pt tương quan hay pt hồi quy (hàm hồi quy) . X Y 1 2 n x x x 1 2 n y y y i i (x ,y ) - Hàm hồi quy được xây dựng dựa trên ít nhất hai mục đích: dự đoán các quan sát mới và đánh giá. = − = ⇔ = − ∑ ∑ ∑ ∑ ∑ $ 6. 3 Hệ số tương quan Để đánh giá mức độ phụ thuộc tương quan tuyến tính của hai ĐLNN X và Y, người ta dựa vào hệ số tương quan Trong thực hành, ta sử dụng công