2003 và 2004 (1) của công ty "A"
8.2.1 Mô hình tuyến tính
Khi hai biến X,Y phụ thuộc điều đầu tiên quan tâm là quan hệ hàm Y=f(x). Nếu hàm f tuỳ ý thì đây là quan hệ rất phức tạp nên ta giới hạn vào trường hợp f có dạng tuyến tính
Y=aX+b;
Trong đó a.b là các hằng số thực cần xác định. Tuy nhiên do X,Y đều là các biến ngẫu nhiên, quan hệ trên không giống như quan hệ hàm thoe nghĩa thông thường của giải tích. Về mặt lý thuyết ta đưa vào khái niệm hồi quy tuyến tính thông qua kỳ vọng có điều kiện
Trong thực hành, để đơn giản ta tất định hoá biến X, chuyển cách viết thành x và gọi nó là biến độc lập; Y vẫn là biến phụ thuộc và là ngẫu nhiên, thể hiện của nó là yilà đáp ứng đối với giá trị xi. Vẫn chọn bộ mẫu cặp kích thước n là (x yi, i) , i=1,n. Với đơn giản đó, ta có công thức:
EY=ax+b
Trong công thức này chưa xuất hiện các yếu tố ngẫu nhiên gây ra tính bất định của
biến Y. Vì vậy người ta đưa vào khái niệm nhiễu, ký hiệu là ε, và thiết lập mô hình tuyến
tính
ax
i i i
Y = + +b ε ,i=1,n
với εi là các biến ngẫu nhiên liên quan trực tiếp và gây ra sự bất định của Yi. εi sẽ phải
thoả mãn 2 điều kiện:
1: i 0
H Eε = ∀i=1,n
2
2: ( i j) ij
H E ε ε =σ δ ;i j, =1,n
Và sẽ gọi là nhiễu trắng, ký hiệu δ =ij 0nếu i≠ j và =1 nếu i=j.
Thực tế có thể việc giả sử là các xi được xác định là không thật hợp lý. Tuy nhiên có thể yêu cầu tính bất định của biến X là không đáng kể so với Y (mà thực nghiệm có thể chấp nhận được). Mặt khác phương trình trên cũng cho thấy đã có yếu tố ngẫu nhiên, những khía cạnh ngẫu nhiên của X có thể trong chừng mực nào đó chuyển sang cho nhiễu
Để có đường hồi quy tuyến tính mẫu y=a$x b+$ trên cơ sở bộ số liệu quan sát( ; )x yi i ,
1,
i= n thì phải thực hiện các bước sau:
+ Ước lượng các hệ số hồi quy, tức là tìm a$,b$ và sau đó cảσ¶2; + Kiểm định tính phù hợp của mô hình với bộ số liệu đã cho