xv ¿Ẻ(X,-X/.JỈẺ(X-Ỹ)
2.2. Mơ hình hồi quy tuyến tính đơn
Trong mục này ta xét hàm hồi quy tổng thể (PRF) có dạng tuyến
tính của một biến phụ thuốc Y và một biến độc lập X:
(9.6)
Khi hàm hồi quy tổng thể có dạng tuyến tính thì ta cũng nói rằng giữa X và Y có sự phụ thuộc tương quan tuyến tính.
Chúng ta có nhận xét sau: Nếu (X,Y) là biến ngẫu nhiên phân phối
chuẩn hai chiều và giữa X và Y có sự phụ thuộc tương quan (p ^0) thì giữa X và Y có sự phụ thuộc tương quan tuyến tính. Thật vậy, giả sử (X,Y) có các tham số px,|iy,ơx,ơy và p khi đó hàm mật độ xác suất
của(X,Y) là Hàm mật độ của X là +00 f,(x)= Jf(x,y)dy = Hàm mật độ của Y là gi(y) —co y)dx =
Vậy các biến X, Ỵ cũng phân phối theo quy luật chuẩn với các
tham số px,ơx và py,ơy
Hàm mật độ có điều kiện của Y với điều kiên X=x là
Hàm mật độ có điều kiện của X với điều kiện Y=y là
Từ đó ta có
E(X/y) = Jxg(x/y)dx = px + p^-(y-py)
-ao
Vậy giữa X và Y có sự phụ thuộc tương quan tuyến tính. Hai đường thẳng hồi quy đi qua điểm M0(px,py).
Trong thực tế có nhiều biến ngẫu nhiên (X,Y) phân phối chuẩn hoặc
xấp xỉ chuẩn, đó chính là lý do ta thường gặp tương quan tuyến tính hoặc gần tuyến tính.
Để xác định dạng của hàm hồi quy người ta thường làm như sau: Từ đám đông ta lấy ra mẫu kích thước n: (Xị, Y]),... (Xn, Yn). Biểu diễn n điểm này lên mặt phẳng toạ độ Đề-các ta sẽ có một đám mây
điểm. Nếu các điểm này phân bố gần như theo một đường thẳng ta lấy dạng của hàm hồi quy là tuyến tính; nếu chúng phân bố gần ríhư đường
bậc hai thì ta lấy dạng của hàm là parabol.... Hoặc trên mặt phẳng tọa
độ vng góc ta xác định các điểm (Xị ,ỹx ) sau đó lần lượt nối chúng
lại ta được một đường gấp khúc, nếu đương gấp khúc có dạng gần như đường thẳng thì ta lấy dạng của hàm hồi quy là tuyến tính cịn nếu
đường gấp khúc có dạng gần như đường parabol thì ta lấy dạng của hàm hồi quy là bậc hai...