2.2. Phương pháp khắc phục hiện tượng tự tương quan Phương pháp sai phân tổng quát Xét bài toán 2.1: Giả sử mô hình gốc: Yt = β1 + β2 Xt + Ut (2.1) có Ut = Ut-1 + t , ≠ 0, t thỏa mãn mọi giả thiết của MH hồi quy tuyến tính cổ điển. Mô hình (2.1) mắc phải hiện tượng gì? Hãy nêu biện pháp khắc phục hiện tượng trong mô hình trên - Mô hình (2.1) mắc phải hiện tượng tự tương quan bậc 1. - Cách khắc phục hiện tượng trên là sử dụng phương pháp sai phân tổng quát. (2.1) => Yt-1 = β1 + β2 Xt-1 + Ut-1 (2.1’) .Yt-1 = .β1 + .β2 Xt-1 + .Ut-1 (2.1”) (2.1) - (2.1”) Yt - .Yt-1 = β1(1 - ) + β2(Xt - .Xt-1) + (Ut - .Ut-1) (2.1*) (2.1*) là quá trình sai phân tổng quát. Mô hình (2.1*) không có hiện tượng tự tương quan bậc 1 vì cov(t, t’) = 0 (vì t thỏa mãn mọi giả thiết của mô hình hồi quy tuyến tính cổ điển) Yt = β1 + β2 Xt + Ut (2.1) Ut = .Ut-1 + t (*), t : cov(t, t’) = 0 (*) => t = Ut - .Ut-1 => Cần biến đổi mô hình gốc về mô hình có sai số ngẫu nhiên là t. TH1 : Khi cấu trúc tự tương quan đã biết Giả sử U_t theo mô hình hồi quy bậc nhất : U_t = ρ. U_(t-1) + ε_t (2.2) Trong đó |ρ| < 1 và ε_1 thỏa mãn các giả thiết của phương pháp bình phương nhỏ nhất thông thường nghĩa là : Trung bình bằng 0 , phương sai không đổi và không tự tương quan . Giả sử (2.1) là đúng thì vấn đề tương quan chuỗi có thể được giải quyết thỏa đáng nếu hệ số tương quan ρ là đã biết . Để làm sáng tỏ chúng ta quay lại mô hình 2 biến : 〖 Y〗_t = β_1+β_2.X_t + U_t (2.3) Nếu (2.3) đúng với t thì cũng đúng với t-1 nên : 〖 Y〗_(t-1) = β_1 + β_2.X_(t-1) + U_(t-1) (2.4) Nhân hai vế (2.4) với ρ ta được : 〖 ρ.Y〗_(t-1) = ρ. β_1 + ρ.β_2.X_(t-1) + ρ.U_(t-1) (2.5) Trừ (2.3) cho (2.5) ta được : Y_t -〖 ρ.Y〗_(t-1) = β_1 ( 1- ρ) + β_2.( X_t - ρX_(t-1)) + (U_t - ρ. U_(t-1) ) = β_1 ( 1- ρ) + β_2.( X_t - ρX_(t-1)) + ε_t (2.6) Đặt β_1* = β_1 ( 1- ρ) β_2* = β_2 Y_t* = Y_t -〖 ρ.Y〗_(t-1) 〖 X〗_t* = X_t - ρX_(t-1) (2.6) có thể viết lại dưới dạng : Y_t* = β_1* + β_2*.X_t*+ ε_t (2.7) Vì ε_t thỏa mãn các giả thiết của phương pháp bình phương nhỏ nhất thông thường đối với các biến Y* và X* và các ước lượng tìm được có tất cả các tính chất tối ưu nghĩa là ước lượng tuyến tính không chệch tốt nhất . TH2 : Khi ρ chưa biết Phương pháp sai phân cấp 1 Ta có giả thiết : ρ = 0 tức là không có tương quan chuỗi. ρ = ± 1 nghĩa là có tương quan dương hoặc âm hoàn toàn. Trên thực tế khi ước lượng hồi quy người ta thường giả thiết rằng không có tự tương quan rồi sau khi tiến hành kiểm định Durbin-Watson hay các kiểm định khác để xem giả thiết này có đúng hay không .Tuy nhiên nếu ρ = ± 1 thì phương trình sai phân tổng quát (2.4) quy về phương trình sai phân cấp 1 : 〖 Y〗_t -〖 ρ.Y〗_(t-1) = β_2.( X_t - ρX_(t-1)) + (U_t - U_(t-1) ) = β_2.( X_t - ρX_(t-1)) + ε_1 Hay ∆Y_t = β_2.∆X_t+ε_1 (2.8) Trong đó ∆ là toán tử sai cấp 1 . Để ước lượng hồi quy (2.8) thì cần ước lượng các sai phân cấp 1 của biến phụ thuộc và biến giải thích và sử dụng chúng làm đầu vào trong phân tích hồi quy. Giả sử mô hình ban đầu là: Y_t=β_1+β_2.X_t + β_3 t + U_t (2.9) Trong đó t là biến xu thế còn U_t theo sơ đồ tự hồi quy bậc nhất .Thực hiện phép biến đổi sai phân cấp 1 đối với (2.8) ta được: ∆Y_t = β_2.∆X_t +β_3 +ε_1 (2.10) Trong đó : ∆Y_t =Y_t -〖 Y〗_(t-1) và ∆X_t = X_t - X_(t-1) Nếu ρ = -1 nghĩa là có tương quan chuỗi âm hòan toàn , phương trình sai phân bây giờ có dạng: 〖 Y〗_t +〖 Y〗_(t-1) = 2β_1+ β_2.( X_t + X_(t-1)) + ε_t Hay (Y_t +〖 Y〗_(t-1))/2 = β_1 + β_2.( X_t + X_(t-1))/2 + ε_t/2 (2.11) Mô hình này được gọi là mô hình hồi quy trung bình trượt ( 2 thời kỳ ) vì chúng ta hồi quy của 1 trung bình trượt đối với 1 trung bình trượt khác . Ước lượng dựa trên thống kê d- Durbin – Watson Trong phần kiểm định d chúng ta đã thiết lập các công thức : d~ 2(1- ρ ̂ ) hoặc : ρ ̂ = 1 - d/2 Đẳng thức này gợi cho ta cách thức đơn giản để thu được ước lượng của ρ từ thống kê d . Từ (2.11) chỉ ra rằng sai phân cấp 1 và ρ = ± 1 chỉ đúng khi d=0 hoặc xấp xỉ =0 . Cũng vậy khi d=2 thì ρ ̂ =0 và khi d=4 thì ρ ̂ =-1 . Do đó thống kê d cung cấp cho ta 1 phương pháp có sẵn để thu được ước lượng của ρ Khi ρ được ước lượng thì có thể biến đổi tập số liệu như đã chỉ ra ở (2.7) và tiến hành ước lượng theo phương pháp bình phương nhỏ nhất thông thường . Thủ tục lặp Cochrane – Orcutt để ước lượng ρ Phương pháp này sử dụng các phần dư e_t đã ước lượng để thu được thông tin về ρ chưa biết .Ta xét phương trình này thông qua mô hình 2 biến : 〖 Y〗_t= β_1+β_2.X_t + U_t (2.14) Trong đó U_t = ρ. U_(t-1) + ε_t Các bước tiến hành như sau: Bước 1: Ước lượng mô hình 2 biến bằng phương pháp bình phương nhỏ nhất thông thường và thu được các phần dư ε_t. Bước 2 : Sử dụng các phần dư đã ước lượng để ước lượng hồi quy: 〖 e〗_t= ρ ̂.e_(t-1) + v_i (2.15) Bước 3 : Sử dụng ρ ̂ thu được từ (2.15) để ước lượng phương trình sai phân tổng quát (2.15) cụ thể lập phương trình : 〖 Y〗_t -〖 ρ ̂.Y〗_(t-1) = β_1(1-ρ ̂ ) + β_2(X_t - 〖ρ ̂X〗_(t-1)) + (U_t-ρ ̂ . U_(t-1) ) Đặt Y_t* = Y_t -〖 ρ ̂.Y〗_(t-1) β_1* = β_1(1-ρ ̂ ) β_2* = β_2 Ta ước lượng hồi quy : Y_t*= β_1* + β_2*.X_t* + e_t* (2.16) Bước 4 : Vì chưa biết trước rằng ρ ̂ thu được từ (2.15) có phải là ước lượng tốt nhất của ρ hay không , ta thế giá trị (β_1 ) ̂* = (β_1 ) ̂(1-ρ ̂ ) và (β_2 ) ̂* thu được từ (2.16) vào hồi quy gốc ban đầu (2.14) và thu được phần dư mới e** (e_t ) ̂** = Y_t - (β_1 ) ̂* - (β_2 ) ̂*.X_t Ước lượng phương trình hồi quy tương tự với (2.15) e_t** = ρ ̂ ̂ . e_(t-1)** + W_t ρ ̂ ̂ là ước lương vòng 2 của ρ Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp của ρ khác nhau một lượng rất nhỏ chẳng hạn bé hơn 0,01 hoặc 0,005. Thủ tục Cochrane – Orcutt 2 bước : Đây là một kiểu rút gọn quá trình lặp . Trong bước 1 ta ước lượng ρ từ bước lặp đầu tiên nghĩa là từ phép hồi quy (2.14) và trong ước 2 ta sử dụng ước lượng của ρ để ước lượng phương trình sai phân tổng quát . Phương pháp Durbin – Watson 2 bước để ước lượng ρ : Phương trình sai phân tổng quát có dạng như sau : Y_t = β_1 ( 1- ρ) +β_2.X_t + ρβ_2 X_(t-1) + 〖 ρ.Y〗_(t-1) + ε_t (2.17) Thực hiện ước lượng ρ theo 2 bước : -Bước 1 : Coi (2.17) như là 1 mô hình hồi quy bội , hồi quy Y_t theo X_t, X_(t-1) , Y_(t-1) và coi giá trị ước lượng được của hệ số hồi quy 〖 Y〗_(t-1)(=ρ ̂) là ước lượng của ρ. -Bước 2: Sau khi thu được ρ ̂ biến đổi Y_t* = Y_t - 〖 ρ ̂.Y〗_(t-1) và X_t* = .X_t-〖ρ ̂X〗_(t-1) và ước lượng hồi quy bằng phương pháp bình phương nhỏ nhất thông thường trên các biến đã biến đổi đó như ở (2.7). Như vậy , theo phương pháp này thì bưới 1 là ước lượng ρ còn bước 2 để thu được các ước lượng tham số. Các phương pháp khác ước lượng ρ Ngoài các phương pháp ước lượng ρ nêu trên còn có thể sử dụng phương pháp hợp lý cực đại để ước lượng trực tiếp các tham số (2.17) mà không cần dùng đến thủ tục lặp . Tuy nhiên phương pháp này liên quan đến thủ tục phi tuyến và thủ tục của Hildreth-Lu nhưng thurtucj này tốn thời gian và không hiệu quả nên không được dùng nhiều. 2.3. Phương pháp khắc phục hiện tượng đa cộng tuyến Sử dụng phương pháp tiên nghiệm Thông tin tiên nghiệm có thể từ các công việc thực tế trước đây trong đó đã xảy ra hiện tượng cộng tuyến nhưng ít nghiêm trọng hoặc từ các lý thuyết tương ứng trong lĩnh vực nghiên cứu. Ví dụ: mô hình sản xuất Cobb-Douglas: Ln(Yi)= 1 + 2ln(Ki) + 3(Li) + Ui Có thể xảy ra đa cộng tuyến do K và L cùng tang theo quy mô sản xuất. Nếu biết hiệu suất không đổi theo quy mô tức là 2+3=1 thì: Ln(Yi)= 1 + 2 + (1- 2 ) ln(Li) + Ui Ln(Yi) – Ln(Li) = 1 + 2 [ln(Ki) -ln(Li)] + Ui Ln(Y_i/L_i ) = 1 + 2 ln(Y_i/L_i ) + Ui → Mất đa cộng tuyến Loại trừ biến giải tích ra khỏi mô hình Bước 1: Xem cặp biến có quan hệ chặt chẽ. Giả sử X3 và X4 có tương quan chặt chẽ với nhau. Bước 2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt 1 trong 2 biến. Bước 3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó lớn hơn. VD: R2 của hàm có mặt 2 biến là 0.94; R2 của mô hình không có biến X3 là 0.92; R2 của mô hình không có biến X4 là 0.87 khi đó loại biế n X3 ra khỏi mô hình. Thu thập thêm số liệu hoặc lấy mẫu mới Vấn đề đa cộng tuyến là một đặc tính của mẫu, có thể là trong một mẫu khác, các biến cộng tuyến có thể không nghiêm trọng như trong mẫu đầu tiên. Vì vậy, tăng cỡ mẫu có thể làm giảm bớt vấn đề cộng tuyến. Sử dụng sai phân cấp một Ví dụ từ hàm hồi quy : Y= α1 + 1X1t +2X2t + Ut → Yt-1 = α1 + 1X1(t-1) +2X2(t-1) + Ut-1 , trừ hai vế cho nhau ta được: Yt – Yt-1 = 1( X1t - X1(t-1)) +2( X2t - X2(t-1)) + (Ut - Ut-1) Hay ∆Yt = 1∆X1t + 2∆X2t + et Mặc dù X1 và X2 có quan hệ tuyến tính nhưng không có nghĩa sai phân của chúng cũng như vậy Giảm tương quan trong hàm hồi quy đa thức Trong thực hành, để giảm tương quan trong hồi quy đa thức, người ta sử dụng dạng độ lệch ( lệch so với giá trị trung bình). Nếu sử dụng độ lệch mà vẫn không giảm đa cộng tuyến thì người ta có thể xem xét đến kỹ thuật “ đa thức trực giao”.