CHƯƠNG 3 : DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
3.1. Dữ liệu
3.2.1. Phân tích nghiệm đơn vị bảng
Khi ta ước lượng một mơ hình với chuỗi thời gian mà chuỗi thời gian này khơng dừng thì vấn đề tương quan giả tạo sẽ có thể xuất hiện. Nếu mơ hình có ít nhất một biến độc lập không dừng, biến này thể hiện một xu thế tăng (hoặc giảm) và biến phụ thuộc cũng có xu hướng như vậy thì khi ước lượng mơ hình có thể ta sẽ thu được các hệ số thống kê và R2 cao nhưng điều này có thể là giả mạo. R2 cao có thể do hai biến này có cùng xu thế. Như vậy trước khi phân tích hồi quy với chuỗi thời gian việc kiểm tra xem các biến trong mơ hình có thể hiện tính dừng hay khơng là một địi hỏi cấp thiết.
Hạn chế chính của các nghiên cứu chuỗi thời gian đối với các nước riêng biệt đó là khả năng kiểm định nghiệm đơn vị bị hạn chế trong các mẫu hữu hạn. Yếu điểm trong khả năng kiểm định thống kê thường là vấn đề kinh tế học đáng quan tâm nếu chiều dài của dữ liệu rất ngắn như là trường hợp trong nghiên cứu hiện tại nơi mà độ dài giai đoạn kiểm định chi khoảng 9 năm với dữ liệu năm. Để giảm thiểu thiếu sót này, nghiên cứu này sử dụng chuỗi các kiểm định mới đang được phát triển một cách nhanh chóng dựa trên dữ liệu bảng tận dụng những ưu điểm từ việc sử dụng tổng hợp dữ liệu chéo và dữ liệu chuỗi thời gian. Một ưu thế khác của dữ liệu bảng thay cho dữ liệu chuỗi thời gian là các thống kê kiểm định thường được phân bổ cho các quy mô mẫu giới hạn thường gặp trong kinh tế học. Kiểm định nghiệm đơn vị (panel unit root tests) được đề suất bởi nhiều nhà nghiên cứu, đặc biệt là bởi Im et al (1997, 2003) và Maddala and Wu (1999).
Im, Pesaran and Shin (1997,2003) đề suất một kiểm định dựa vào quá trình thu thập dữ liệu dưới đây:
31
Trong đó αi = (1- ϕi)ui, βi = (1- ϕi) và ∆ là sai phân của yit , giả thiết của kiểm định nghiệm đơn vị là H0: βi = 0 với mọi i = 1, 2,… N giả thuyết bác bỏ H1: βi < 0 với i = 1, 2,… N1 và H1: βi = 0 với i = N1+1, N1+2,… N do đó giải thuyết bác bỏ cho phép βi khác với các yếu tố chéo. Thống kê kiểm định được xây dựng thành 2 giai đoạn. Đầu tiên các thống kê t-statistics Augmented Dickey Fuller (ADF) được lấy giá trị trung bình cho mỗi nước. Tiếp đó chỉ số t-bar statistic chuẩn hóa được tính tốn như sau:
(2)
Trong đó ty = (1/N)ƩNi=1 tyi , N là số lượng đơn vị chéo trong bảng dữ liệu, kt và vt là giá trị trung bình và phương sai ước tính của mỗi tyt. Im et al (1997) lập các giá trị quan trọng chính xác của kt và vt cho mỗi kết hợp khác nhau của N và T. Một trở ngại trong kiểm định t-bar là nó khơng thể áp dụng khi có sự hiện diện của sự phụ thuộc chéo. Tuy nhiên, Im et al (2003) đề suất phương pháp khắc phục trở ngại này đó là: dữ liệu có thể được điều chỉnh bằng cách hạ thấp tiêu chuẩn. Họ mô phỏng thống kê t-bar hội tụ tới phân phối chuẩn trong giới hạn nào đó và có các đặc tính mẫu hữu hạn tốt.
Maddala and Wu (1999) chỉ trích kết quả của Im et al (1997) và các kiểm định tương tự dựa trên các căn cứ sau: Đầu tiên, các kiểm định dựa trên giả định ngầm là dữ liệu bảng là cân do đó giá trị kỳ vọng và phương sai của thống kê t-statistic là tương tự nhau đối với các đơn vị riêng trong bảng. Thứ hai, các kiểm định hạn chế một cách ngầm định ứng dụng thực tế của chúng đối với độ trễ thời gian tương tự nhau cho tất cả các thành phần bảng. Trong thực tế, độ trễ khác nhau có thể được địi hỏi cho các đơn vị chéo khác nhau trong bảng. Thứ ba, giá trị tiệm cận của các kiểm định phụ thuộc vào số lượng các đơn vị trong bảng (N). Mặc dù điều này có thể khơng gây hại một cách nghiêm trọng tới sự phù hợp của kiểm định cho các mẫu có giới hạn, họ lập luận rằng một kiểm định mà giá trị
32
của nó khơng phụ thuộc vào N (N tiến tới vơ cùng) có thể là một lựa chọn tốt hơn.
Maddala and Wu (1999) đề suất rằng kiểm định Fisher là một cách để giảm thiểu những thất bại. Không như kiểm định Im et al (2003) bao gồm dữ liệu thống kê bảng có được bằng cách tổ hợp các thống kê kiểm định từ các đơn vị chéo quan trọng, kiểm định Fisher kết hợp các mức ý nghĩa (p-values) từ thống kê ADF (ADF statistics). Kiểm định Fisher là phi tham số và có phân phối chi bình phương với hệ hố tự do 2N. Sử dụng các thuộc tính thêm vào của biến chi bình phương, Maddala and Wu (1999) lấy được số liệu thống kê kiểm định như sau:
λ = -2 I (3)
Trong đó πi là p-value của thống kê kiểm định cho mỗi đơn vị chéo i. Thông qua nghiên cứu mô phỏng, Maddala and Wu (1999) cho thấy kiểm định trên cho kết quả tốt hơn của Im et al (2003).