3.3.1 Hiện tượng phương sai sai số thay đổi
(xxii) a. Khái niệm
Xét mô hình = + + (6.1)
Một trong những giả thiết của phương pháp LS đó là phương sai sai số ngẫu nhiên đồng đều, tức là Var( ) = (∀ ).
Nếu giả thiết này không được thỏa mãn, đó là Var( ) ≠ Var( ) (∀ ≠ ) hay Var( ) =
Khi đó ta nói mô hình có hiện tượng phương sai sai số thay đổi hay phương sai không đồng nhất. Chúng ta thường gặp phương sai không đồng nhất ở dữ liệu chéo và dữ liệu bảng.
(xxiii) b. Nguyên nhân
Nguyên nhân phương sai không đồng nhất rất đa dạng, sau đây là một số trường hợp điển hình:
(1)Gọi Y là số phế phẩm trong 100 sản phẩm của một thợ học việc, X là số giờ thực hành. Khi số giờ thực hành càng lớn thì số phế phẩm càng nhỏ và càng ít biến động. Chúng ta có trường hợp phương sai giảm dần khi X tăng dần.
(2)Khi thu nhập(X) tăng thì chi tiêu cho các mặt hàng xa xỉ tăng và mức biến động càng lớn. Chúng ta có trường hợp phương sai tăng dần khi X tăng dần.
(3)Khi cải thiện phương pháp thu thập số liệu thì phương sai giảm.
(4)Phương sai của sai số tăng do sự xuất hiện của điểm nằm ngoài, đó là các trường hợp bất thường với dữ liệu rất khác biệt(rất lớn hoặc rất nhỏ so với các quan sát khác).
(5)Phương sai thay đổi khi không xác đúng dạng mô hình, nếu một biến quan trọng bị bỏ sót thì phương sai của sai số lớn và thay đổi. Tình trạng này giảm hẳn khi đưa biến bị bỏ sót vào mô hình.
(6)Do bản chất của các hiện tượng kinh tế: Nếu các hiện tượng kinh tế theo không gian được điều tra trên những đối tượng có quy mô khác nhau hoặc các hiện tượng kinh tế theo thời gian được điều tra qua các giai đoạn có mức biến động khác nhau thì PSSS có thể không đồng đều.
(7)Do số liệu không phản ánh đúng bản chất của hiện tượng kinh tế, chẳng hạn xuất hiện các quan sát ngoại lai.
(xxiv) c. Hậu quả
- Các hệ số hồi quy ước lượng thu được bằng phương pháp LS là các ước lượng tuyến tính không chệch và vững song không còn là các ước lượng hiệu quả nhất.
- Khoảng tin cậy của các hệ số hồi quy sẽ rộng hơn, các kiểm định T, F mất hiệu lực và các dự báo sẽ không còn chính xác.
- Ước lượng cho PSSS ngẫu nhiên là ước lượng chệch.
3.3.2 Phát hiện phương sai sai số thay đổi và xử lý
(xxv) a. Phát hiện
1) Phân tích định tính
- Căn cứ vào nội dung kinh tế của các biến số trong mô hình để xem xét khả năng có xảy ra hiện tượng PSSS thay đổi hay không? Đây là cách chuẩn đoán dựa vào thông tin tiên nghiệm về hiện tượng kinh tế.
- Các số liệu chéo thường chứa đựng hiện tượng PSSS thay đổi.
2) Dựa vào thông tin trên mẫu
- Do không có toàn bộ tổng thể vì vậy ta không biết được giá trị của các = Var( ) = ( ) nên không thể biết được mô hình hồi quy tổng thể có hiện tượng PSSS thay đổi hay không.
- Các phần dư ei thu được từ mô hình hồi quy mẫu là các ước lượng điểm của các sai số ngẫu nhiên ui nên dựa vào các thông tin về chúng ta có thể đưa ra các chuẩn đoán về PSSS.
a. Quan sát đồ thị của các phần dư
+) Bước 1: Ước lượng mô hình bằng phương pháp LS tìm được các phần dư ei +) Bước 2: Vẽ đồ thị của các phần dư ei hay ei2 theo Xi, Yi, hoặc theo các quan sát +) Bước 3: Căn cứ vào các đồ thị để chuẩn đoán về hiện tượng PSSS thay đổi.
Phương pháp đồ thị. Xét đồ thị của phần dư theo giá trị Y và X.
Hình III-6. Đồ thị phân tán phần dư ei theo .
ˆ
i
Hình III-7. Đồ thị phân tán phần dư ei theo Xi
Theo các đồ thị trên thì khi giá trị dự báo Y tăng (hoặc khi X tăng) thì phần dư có xu hướng tăng, hay mô hình có phương sai của sai số thay đổi.
(xxvi) b. Các phép thử chính thức
Xét hồi quy bội
(3.24)
Trong (k-1) biến độc lập trên ta trích ra (p-1) biến làm biến độc lập cho một hồi quy phụ. Trong hồi quy phụ này phần dư từ hồi quy mô hình (3.24) làm hồi quy biến phụ thuộc.
Các dạng hồi quy phụ thường sử dụng là
= + +⋅⋅⋅ + + (3.25)
| | = + +⋅⋅⋅ + + (3.26)
( ) = + +⋅⋅⋅ + + (3.27)
Kiểm định Breusch-Pagan căn cứ vào hồi quy phụ (3.25), kiểm định Glejser căn cứ vào (3.26) và kiểm định Harvey-Godfrey căn cứ vào (3.27).
Giả thuyết không là không có phương sai không đồng nhất H0 : 2 = 3 = … = p = 0
H1 : Không phải tất cả các hệ số trên đều bằng 0.
R2 xác định từ hồi quy phụ, n là cỡ mẫu dùng để xây dựng hồi quy phụ, với cỡ mẫu lớn thì nR2 tuân theo phân phối Chi bình phương với (p-1) bậc tự do.
i i, k k i, 3 3 i, 2 2 1 i X X ... X Y b b b b
Quy tắc quyết định
Nếu ( , ) ≤ thì bác bỏ H0.
Nếu bác bỏ được H0 thì chúng ta chấp nhận mô hình có phương sai của sai số thay đổi và thực hiện kỹ thuật ước lượng mô hình như sau:
Đối với kiểm định Breusch-Pagan
= + +⋅⋅⋅ +
Đối với kiểm định Glejser
= ( + +⋅⋅⋅ + )
Đối với kiểm định Harvey-Godfrey
= ( + +⋅⋅⋅ + )
Ta có = . Đến đây chúng ta có thể chuyển dạng hồi quy theo OLS thông thường sang hồi quy theo bình phương tối thiểu có trọng số WLS.
Kiểm định Park
- Xét mô hình (3.27) và giả thiết rằng PSSS thay đổi là một hàm của biến độc lập: ( là một hằng số)
Trong đó: vi là sai số ngẫu nhiên thoả mãn mọi giả thiết của OLS.
- Ta có: (3.28)
- Thủ tục kiểm định:
Bước 1: Hồi quy mô hình (3.24) tìm được các phần dư ei Bước 2: Hồi quy mô hình (3.28) sau khi đã thay bằng . Ta ước lượng :
Bước 3: Kiểm định cặp giả thuyết
PSSS đồng đều PSSS thay đổi Tiêu chuẩn kiểm định = ( )~ ( − 2)
Với mẫu cụ thể và với mức ý nghĩa cho trước mà > ( ) thì ta bác bỏ H0, kết luận mô hình (3.24) có PSSS thay đổi.
2 2 2 ( ) vi i i i Var U X e 2 2 2 2 lni ln lnX vi i 2 i 2 i e 2 1 2 lnei lnX vi i 0 2 1 2 : 0 : 0 H H
(xxvii) c. Khắc phục
- Xét mô hình: = + + (3.29)
- Giả sử mô hình (3.29) thoả mãn tất cả các giả thiết của phương pháp OLS trừ giả thiết PSSS không thay đổi.
- Việc khắc phục hiện tượng này phụ thuộc chủ yếu vào việc đã biết hay chưa. - Việc khắc phục PSSS thay đổi cần phải dựa vào giả thiết về sự thay đổi của PSSS.
1) Trường hợp đã biết
- Giả thiết: > 0(∀ ).
- Để khắc phục hiên tượng PSSS thay đổi ta chia cả hai vế của mô hình gốc - mô hình (3.29) cho đã biết. Khi đó:
= + + ⇔ ∗ = ∗+ ∗+ ∗ (3.29’)
Trong đó: ∗ = ; ∗ = ; ∗= ; ∗ = .
Ta có: ar( ∗) = ar( ) = ar( )= = 1. Như vậy mô hình (3.29’) có PSSS không thay đổi.
- Sử dụng phương pháp OLS để ước lượng mô hình (3.29’) ta thu được các ước lượng
∗, là các ước lượng tuyến tính, không chệch có phương sai nhỏ nhất.
2) Trường hợp chưa biết
- Trong trường hợp chưa biết ta cần phải dựa vào giả thiết về PSSS thay đổi để khắc phục.
- Một số giả thiết phổ biến được đưa ra như sau:
PSSS tỷ lệ với bình phương của biến giải thích
- Giả thiết: ( ) = = ( ≠ 0)
- Biến đổi: Chia cả hai vế của mô hình gốc - mô hình (1) cho Xi: = + + . Đặt ∗ = ; ∗ = ; = . Khi đó ta có:
∗ = + ∗+ (3.30)
- Mô hình (3.30) có: ar( ) = ar( ) = ar( )= = . Tức là PSSS không thay đổi.
- Ước lượng mô hình ((3.30) bằng phương pháp OLS thu được ước lượng của các hệ số: , là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất.
- Trong mô hình (3.30) thì là ước lượng của hệ số chặn, là ước lượng của hệ số góc. Tuy nhiên trong mô hình (1) thì thì là ước lượng của hệ số góc, là ước lượng của hệ số chặn.
- Từ mô hình (3.30) để trở lại mô hình gốc thì ta nhân cả 2 vế của mô hình (3.30) với Xi
PSSS tỷ lệ với biến giải thích
- Giả thiết: ( ) = = ( > 0)
- Biến đổi: Chia cả hai vế của mô hình gốc - mô hình (1) cho :
= + + .
Đặt: ∗ = ; ∗ = ; ∗ = ; = . Khi đó ta có:
∗ = ∗ + ∗ + (3.31)
- Mô hình (3.31) có: ar( ) = ar( ) = ar( )= = . Tức là PSSS không thay đổi. - Ước lượng mô hình (3.30) bằng phương pháp OLS thu được ước lượng của các hệ số: , là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất. - Từ mô hình (3.31) để trở lại mô hình gốc thì ta nhân cả 2 vế của mô hình (3.31) với
.
PSSS tỷ lệ bình phương giá trị kỳ vọng của Y
- Giả thiết: ( ) = = ( ( )) ( ( ) ≠ 0)
- Biến đổi: Chia cả hai vế của mô hình gốc - mô hình (1) cho ( ). Tuy nhiên, do ( ) là chưa biết nên ta sử dụng ước lượng của nó là thu được từ việc ước lượng mô hình (3.29) cho dù là có hay không có hiện tượng PSSS thay đổi.
= + + ( ≠ 0).
Đặt: ∗ = ; ∗ = ; ∗ = ; = . Khi đó ta có:
∗ = ∗ + ∗ + (3.32)
- Mô hình (3.31) có: ar( ) = ar( ) = ar( )= = . Tức là PSSS không thay đổi.
- Ước lượng mô hình (3.32) bằng phương pháp OLS thu được ước lượng của các hệ số: , là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất.
Định dạng lại dạng hàm
- Dạng đúng của mô hình: = + + ( , > 0) (3.33) - Việc ước lượng mô hình (3.33) sẽ làm giảm PSSS thay đổi do tác động của phép biến đổi loga nên các ước lượng thu được từ mô hình (3.33) có thể tốt hơn các ước lượng thu được từ mô hình (3.29).
Ta thử ước lượng một trong các mô hình sau:
3.3.3 Hiện tượng tự tương quan
(xxviii) a. Khái niệm
Tự tương quan: Là sự tương quan giữa các thành phần của chuỗi các quan sát theo thời gian hay không gian.
Ta xét mô hình hồi quy đơn với số liệu thời gian như sau
= + + (3.34) Một trong các giả thiết của phương pháp LS đó là
Cov(ut, ut-p) = 0 ∀ ≠ 0, ∈N
Nếu giả thiết trên không được thỏa mãn, tức là ∃ ≠ 0 mà Cov(ut , ut-p)≠ 0 thì mô hình (3.34) có tự tương quan bậc p
+) Trường hợp tự tương quan bậc 1, ứng với p = 1 ta có ( , ) ≠ 0 hay = +
Với gọi là hệ số tự tươngquan bậc nhất thỏa mãn −1 ≤ ≤ 1 còn là sai số ngẫu nhiên thỏa mãn các giả thiết của phương pháp LS
+) Trường hợp tự tương quan bậc p ta có
( , ) ≠ 0 hay = + + ⋯ + + Với gọi là hệ số tự tương quan bậc j ( = 1 ÷ ) thỏa mãn −1 ≤ ≤ 1
1 2 lnYi lnX Ui i 1 2 lnYi X Ui i 1 2ln i i i Y X U
Hình III-8. Các dạng tự tương quan
Chúng ta hãy xem xét một số các dạng dễ hiểu của tự tương quan và không tự tương quan được cho trong Hình 3.8 giữa các u. Hình 3.8a cho thấy dạng chu kỳ; Hình 3.8b và c cho thấy các xu hướng tuyến tính đi lên hay đi xuống của các nhiễu; trong khi Hình 3.8d chỉ ra cả hai từ xu hướng tuyến tính và bình phương đều có mặt trong các nhiễu. Chỉ có Hình 3.8e là cho thấy dạng không có hệ thống, ủng hộ cho giả định không có tự tương quan của mô hình hồi qui tuyến tính cổ điển.
Xét mô hình sau đây với số liệu thời gian : Yt = b1+ b2Xt + Ut - Nếu Ut =Ut-1+t (-1 1) (a)
Trong đó : t thỏa các giả thiết của mô hình hồi qui tuyến tính cổ điển : E(t ) = 0 t
Var (t)=2 t Cov(t, t’)=0 (t t’)
Thì (a) được gọi là lược đồ tự tương quan bậc nhất Markov, ký hiệu AR(1) và
được gọi là hệ số tự tương quan bậc nhất. - Nếu Ut =1Ut-1+ 2Ut-2 +…+ pUt-p+ t (b) (-1 1,…, p 1)
Trong đó : t thỏa các giả thiết của mô hình hồi qui tuyến tính cổ điển . Thì (b) được gọi là lược đồ tự tương quan bậc p Markov, ký hiệu AR(p).
TTQ bậc 1- AR(1):
Trong đó: ρ là hệ số tương quan bậc 1 là SSNN thỏa mãn mọi giả thiết OLS
- Nếu -1 ≤ ρ < 0: Mô hình (1) có TTQ âm bậc 1 - Nếu ρ = 0: Mô hình (1) không có TTQ bậc 1 - Nếu 0 < ρ ≤ 1: Mô hình (1) có TTQ dương bậc 1
- Nếu ρ = ± 1: Mô hình (1) có TTQ dương/âm bậc 1 hoàn hảo
TTQ bậc p- AR(p):
Trong đó: ρj (j = 1, 2,…, p) là hệ số tương quan bậc j vt là SSNN thỏa mãn mọi giả thiết OLS
- Nếu -1 ≤ ρj < 0: Mô hình (1) có TTQ âm bậc j - Nếu ρj = 0: Mô hình (1) không có TTQ bậc j - Nếu 0 < ρj ≤ 1: Mô hình (1) có TTQ dương bậc j
- Nếu ρj = ± 1: Mô hình (1) có TTQ dương/âm bậc j hoàn hảo
(xxix) b. Nguyên nhân
Nguyên nhân khách quan:
- Các hiện tượng kinh tế có tính chất quán tính - Các hiện tượng kinh tế có tính chất mạng nhện
Nguyên nhân chủ quan:
- Do quá trình xử lý số liệu: Tách biến, gộp biến, nội suy, ngoại suy các biến. - Do chọn sai dạng hàm
(xxx) c. Hậu quả
- Các ước lượng hồi quy thu được không phải là các ước lượng tốt nhất. - Các khoảng tin cậy sẽ rộng hơn và các kiểm định T, F sẽ mất hiệu lực.
- Giá trị là ước lượng chệch của và R2 thường lớn hơn giá trị thực của nó.
1 t t t U U v 1 1 2 2 ... t t t p t p t U U U U v 2 ˆ 2
- Các dự báo cũng mất tính chính xác.
3.3.4 Phát hiện tự tương quan và xử lý
(xxxi) a. Phát hiện
- Xét mô hình: (1)
- Dựa vào thông tin của các phần dư thu được từ mô hình hồi quy mẫu ta có thể đưa ra các chuẩn đoán về hiện tượng TTQ của các sai số ngẫu nhiên.
1) Quan sát đồ thị phần dư
- Bước 1: Hồi quy mô hình (1) thu được các phần dư - Bước 2: Vẽ đồ thị của theo và nhận xét
2) Dùng hồi quy phụ
- Bước 1: Hồi quy mô hình (1) thu được các phần dư
- Bước 2: Hồi quy mô hình: Tìm được R2
Trong đó: là sai số ngẫu nhiên thoả mãn mọi giả thiết của OLS - Bước 3: Kiểm định cặp giả thuyết:
Mô hình gốc không có TTQ Mô hình gốc không có TTQ
Với tiêu chuẩn kiểm định và miền bác bỏ giả thuyết
H0 là
- Nếu có hiện tượng TTQ thì có thể xác định được bậc của TTQ bằng kiểm định:
Mô hình gốc không có TTQ bậc j Mô hình gốc có TTQ bậc j
Với tiêu chuẩn kiểm định và miền bác bỏ giả thuyết H0 là 1 2 t t t Y X U 1 , t t e e t e et1 1 , ,..., t t t p e e e 1 1 2 2 ... t t t p t p t e e e e v t v 2 0 2 1 : 0 : 0 H R H R 2 2 / ~ ( ; ) (1 ) /( ) R p F F p n p R n p ( ; ) { : p n p} W F F f 0 1 : 0 : 0 j j H H ˆ ~ ( ) ˆ ( ) j j T T n p Se ( ) { : n p} W T T t
3) Kiểm định Durbin – Watson (DW)
- Tiêu chuẩn kiểm định:
nhưng do nên
Trong đó: là ước lượng điểm của
- Tiêu chuẩn kiểm định DW có thể sử dụng nếu thoả mãn các điều kiện sau: + Dùng để kiểm định hiện tượng TTQ bậc nhất - AR(1)
+ Mô hình phải có hệ số chặn.
+ Mô hình không phải là mô hình tự hồi quy, tức là không chứa biến trễ của biến phụ thuộc với tư cách là biến giải thích:
+ Không có quan sát nào bị mất trong tệp số liệu + Biến X là phi ngẫu nhiên
- Với mức ý nghĩa , kích thước mẫu bằng n và số biến giải thích là k’ = k-1 Durbin và Watson đã xây dựng bảng các giá trị cận dưới dL, cận trên dU để làm căn cứ kết luận như sau:
+ Nếu thì kết luận mô hình không có AR(1)
+ Nếu thì mô hình có TTQ dương hoàn hảo bậc nhât. + Nếu thì mô hình có TTQ âm hoàn hảo bậc nhất.