2 .Tổng quan các nghiên cứu trước đây
3.2.2 .Kiểm định tính dừng cho các biến nghiên cứu
Khi các nghiên cứu sử dụng dữ liệu dưới dạng chuỗi dữ liệu thời gian, việc đầu tiên cần nên làm là kiểm tra xem những biến mà nghiên cứu sử dụng trong mơ hình nghiên cứu là dừng hay khơng dừng. Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và phương sai của phương trình khơng thay đổi theo thời gian và giá trị của đồng phương sai giữa hai đoạn chỉ phụ thuộc vào khoảng cách hay độ trễ về thời gian giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính. Cụ thể
Trung bình :E Y t const
Phương sai : 2
t
Var Y const
Đồng phương sai :CovarY Yt, t k gk
Tính dừng của chuỗi dữ liệu thời gian là một khái niệm vơ cùng quan trọng, vì thực tế hầu hết tất cả những mơ hình thống kê đều được thực hiện dưới giả định là chuỗi dữ liệu thời gian phải dừng. Do vậy một khi ước lượng các tham số hoặc kiểm định giả thuyết của các mơ hình, nếu khơng kiểm định thuộc tính dừng của dữ liệu thì các kỹ thuật phân tích thơng thường (kỹ thuật phân tích bình phương bé nhất OLS) sẽ khơng chính xác và hợp lý. Những kết quả xuất phát từ những phân tích kinh tế khi sử dụng dữ liệu khơng dừng đều là giả (Granger and Newbold, 1977).Ngoài ra, để thực hiện mơ hình VAR, điều đầu tiên cần phải làm là tiến hành kiểm định tính dừng của dữ liệu.Vì vậy, tính dừng cho chuỗi dữ liệu thời gian của mơ hình sẽ được kiểm tra trước tiên.
Để kiểm tra tính dừng của chuỗi dữ liệu thời gian, đề tài sử dụng kiểm định Augmented Dickey Fuller, đây là một trong những phương cách phổ biến trong kiểm định tính dừng của chuỗi thời gian. Theo đó các độ trễ thời gian sẽ được lựa theo tiêu chuẩn AIC (Akaike Information Criteria). Nếu chuỗi dữ liệu không dừng, đề tài sẽ sử dụng kỹ thuật sai phân để đưa chuỗi dữ liệu về dạng dừng.
Kiểm định nghiệm đơn vị (Unit root test)
được sử dụng khá phổ biến để kiểm tra xem một chuỗi dữ liệu thời gian là dừng hay khơng dừng. Cụ thể:
Giả sử ta có phương trình tự tương quan như sau:
1
t t t
Y Y u với 1 1
Giả thiết :H0: 1 (Yt là chuỗi không dừng)
1: 1
H (Ytlà chuỗi dừng)
Phương trình (10) tương đương:
Giả thuyết có thể được viết lại như sau:
Giả thuyết : =0 (Yt là chuỗi không dừng)
(Yt là chuỗi dừng)
Dickey và Fuller cho rằng giá trị t ước lượng của hệ số Yt-1 sẽ theo phân phối xác
suất ( : tau statistic, =giá trị ước lượng/sai số của hệ số ). Kiểm định thống
kê còn được gọi là kiểm định Dickey-Fuller (DF). Kiểm định DF được sử dụng
dưới 3 hình thức:
Khi Yt là một bước ngẫu nhiên không hằng số:
∆Yt = δYt-1 + ut
Khi Yt là một bước ngẫu nhiên có hằng số:
∆Yt = β1 + δYt-1 + ut
Khi Yt là một bước ngẫu nhiên có hằng số xoay quanh một đường xu thế
ngẫu nhiên:
∆Yt = β1 + β2TIME + δYt-1 + ut
Để kiểm định H0, so sánh giá trị thống kê tính tốn với giá trị thống kê
tra bảng DF. Tuy nhiên bởi vì có hiện tượng tương quan chuỗi giữa các ut do thiếu
Dickey- Fuller test). Kiểm định này được thực hiện bằng cách đưa vào phương trình
(13) biến trễ của sai phân biến phụ thuộc ∆Yt:
∆Yt = β1 + β2TIME + δYt-1 + αi Σ∆Yt-i + εt
Nếu tính tốn giá trị ADF (ADF test statistic) suy ra không bác bỏ
giả thiết H0, hay tồn tại nghiệm đơn vị (chuỗi dữ liệu không dừng).
Nếu tính tốn giá trị ADF (ADF test statistic) suy ra bác bỏ giả
thiết H0, hay không tồn tại nghiệm đơn vị (chuỗi dữ liệu là dừng).
Tuy nhiên, trong các phần mềm kinh tế lượng để hạn chế công việc tra bảng thì đa số các phần mềm đều cung cấp giá trị p-value, ta có thể dùng giá trị này để thay thế
cho giá trị trong việc đọc kết quả là nên bác bỏ hay chấp nhận H0. Theo đó:
Nếu p-value < mức ý nghĩa α thì bác bỏ giả thuyết H0 hay chuỗi dữ liệu là
dừng.
Nếu p-value > mức ý nghĩa α thì chập nhận giả thuyết H0 hay chuỗi dữ liệu
là không dừng.
3.2.3. Lựa chọn mơ hình tự hồi quy AR(p)
Dựa trên chuỗi dữ liệu dừng của các biến nghiên cứu và kết hợp với lược đồ tương quan của từng biến, đề tài sẽ tiến hành lựa chọn độ trễ p cho từng biến nghiên cứu. Theo Nguyễn Trọng Hoài, việc lựa chọn độ trễ p dựa trên lược đồ tương quan tại độ trễ mà giá trị PAC nằm ngồi đường viền thì sẽ cho mơ hình tự hồi quy tốt nhất. Khi mà mơ hình có nhiều độ trễ, việc lựa chọn độ trễ tốt nhất sẽ dựa trên tiêu chí sai số dự báo (Root Mean Square Error – RMSE), mơ hình có RMSE càng nhỏ thì mơ hình đó sẽ được lựa chọn.