CHƯƠNG 3 : DỮ LIỆU VÀ MÔ HÌNH THỰC NGHIỆM
3.1. Phương pháp kinh tế lượng
3.1.1. Kiểm định tính dừng
Các chuỗi thời gian (time series) là một trong hai dữ liệu đầu vào quan trọng trong các phân tích kinh tế thực nghiệm (Ramanathan, 2002). Trong kỹ thuật hồi quy OLS, điều kiện của phần dư phải có trung bình bằng khơng, phương sai thuần nhất và không tự tương quan. Mặt khác, các biến giải thích phải phi ngẫu nhiên. Các giả định này ngầm định rằng chuỗi thời gian phải dừng (Ramanathan, 2002). Nếu ta thực hiện hồi quy OLS với các chuỗi thời gian khơng dừng, các kết quả từ mơ hình khơng cịn là các ước lượng tuyến tính khơng chệch tốt nhất (BLUE). Mặt khác, nếu ta thực hiện hồi quy với chuỗi thời gian không dừng, kết quả ước lượng có thể là giả mạo (spurious) nếu các chuỗi thời gian có cùng xu thế. Vì vậy, kiểm tra tính dừng là một nội dung quan trong trước khi thực hiện các thủ tục ước lượng.
Khái niệm dừng được (Ramanathan, 2002) phát biểu như sau: “Một quá trình ngẫu nhiên được coi là dừng nếu như trung bình và phương sai của nó khơng đổi theo thời gian và giá trị của đồng phương sai giữa hai thời đoạn chỉ phụ thuộc vào khoảng cách và độ trễ về thời gian giữa hai thời đoạn này và không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính.”12 Khái niệm này được trình bày một cách trực quan thơng qua ba phương trình:
Trung bình: E (Yt) = (14)
Phương sai: Var (Yt) = E (Yt - )2 = 2 (15)
Đồng phương sai: k = E [(Yt - ) Yt+k - )] (16)
Nếu một trong ba giả định trên bị vi phạm, chuỗi thời gian được xem xét được xem là khơng dừng. Để kiểm định tính dừng của một chuỗi thời gian, ta thực hiện kiểm định nghiệm đơn vị, với chuỗi thời gian như sau:
Yt = Yt-1 + ut (17)
Nếu =1 và ut có trung bình bằng khơng, phương sai không đổi và không
tự tương quan, ta kết luận ut là một nhiễu trắng (white noise) và Yt là một chuỗi không dừng thể hiện một nghiệm đơn vị (random walk). Từ phương trình (17), ta thực hiện biến đổi như sau:
Yt = (- 1) Yt-1 + ut = Yt-1 + ut (18)
Phương trình (18) thể hiện dạng sai phân của Yt. Tuỳ thuộc vào tính chất của chuỗi thời gian, ta có các dạng sau:
Yt = Yt-1 + ut (19)
Yt = 1 + Yt-1 + ut (20) Yt = 1 + 2t +Yt-1 + ut (21)
Các phương trình trên thể hiện quá trình mở rộng các giả định về tính chất của chuỗi thời gian, trong đó t thể hiện cho biến xu hướng và 1 thể hiện tham số chặn. Nếu =0 và ut nhiễu trắng, phương trình (19) thể hiện một chuỗi thời gian có tính chất
nghiệm đơn vị, phương trình (20) thể hiện một chuỗi nghiệm đơn vị có bụi (random walk with drift), và phương trình (21) thể hiện một nghiệm đơn vị có xu hướng. Cuối cùng, một chuỗi thời gian bất kỳ có thể biểu diễn thành phương trình mở rộng tổng quát như sau:
Yt t
Yti ∑m
Yt−i + t
(22)
Phương trình (22) được gọi là phương trình Dickey-Fuller mở rộng ADF (Augmented Dickey-Fuller) theo tên của hai nhà kinh tế đã đề xuất phương pháp kiểm định này. Các giá trị thống kê t từ phương trình ADF khơng tn theo phân phối student kể cả trường hợp mẫu lớn, để kiểm định giả thiết = 0 Dickey và
Fuller đề xuất trị thống kê (tau) bằng cách lấy kết quả ước lượng chia cho độ
lệch chuẩn và so sánh với các giá trị tới hạn. Trong đó, các giá trị tới hạn này là khác nhau tuỳ thuộc vào giả định về tính chất của chuỗi thời gian như đã trình bày. Quy tắc kiểm định như sau:
Giá trị kiểm định: =
̂
se(̂)
Giả thiết H0: = 0 H1: ≠ 0
tuân theo quy luật phân phối ADF. Nếu ││>│α│ta
bác bỏ giả thiết H0, chuỗi là dừng. Các trị thống kê được cung cấp bởi phần mềm Eviews theo (Mackinnon, 1990).
Một điểm quan trọng là số lượng trễ cần đưa vào trong mơ hình kiểm định. Dưới quan điểm thực nghiệm, kiểm định cần phải được xác định trễ thông qua các tiêu chuẩn đánh giá độ thích hợp như tiêu chuẩn AIC (Akaike Information Criterion), tiêu chuẩn HQC (Hannan-Quinn Criterion), tiêu chuẩn SIC (Schwarz Info Criterion). (Ting, 2009) cho rằng các tiêu chuẩn kiểm định AIC là phù hợp nhất với các mẫu quan sát có kích thước nhỏ (dưới 60 quan sát). Vì vậy, tác giả sẽ sử dụng tiêu chuẩn AIC để xác định giá trị trễ, với công thức được cho như sau:
�
�� = − 2� + 2� (23)
� �
Trong đó, L là giá trị của hàm hợp lý log-likelihood, k là số tham số và n là số quan sát.