CHƯƠNG 3 PHƯƠNG PHÁP VÀ DỮ LIỆU NGHIÊN CỨU
3.6 Phương pháp kiểm định dữ liệu trước khi phân tích hồi quy
Cho dù có sử dụng mơ hình ước lượng nào thì, các giả thuyết nghiên cứu cũng sẽ được tiến hành kiểm định thông qua dữ liệu nghiên cứu của phương trình hồi quy được xây dựng. Tiêu chuẩn kiểm định sử dụng thống kê t và giá trị p-value (Sig.) tương ứng, độ tin cậy lấy theo chuẩn 95%, giá trị p-value sẽ được so sánh trực tiếp với giá trị 0.05 để kết luận chấp thuận hay bác bỏ giả thuyết nghiên cứu.Để xem xét sự phù hợp dữ liệu và sự phù hợp của mơ hình ta sử dụng hệ số R-square, thống kê t và thống kê F để kiểm định. Để đánh giá sự quan trọng của các nhân tố ta xem xét hệ số Beta tương ứng trong phương trình hồi quy bội được xây dựng từ dữ liệu nghiên cứu.
Kiểm định hiện tượng đa cộng tuyến trong mơ hình: Đa cộng tuyến là một hiện tượng trong đó các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề của hiện tượng đa cộng tuyến là chúng cung cấp cho mơ hình những thơng tin giống nhau và rất khó tách ảnh hưởng của từng biến một. Đối với hiện tượng đa cộng tuyến, độ sai lệch cho phép (tolerance) hoặc hệ số phóng đại phương sai VIF
(variance inflation factor) khi VIF nhỏ hơn hoặc bằng 2 nghĩa là các biến độc lập khơng có tương quan tuyến tính với nhau.
Kiểm định hiện tượng phương sai sai số thay đổi: Phương sai thay đổi là hiện
tượng phương sai của các số hạng này không giống nhau. Khi phương sai của các sai số thay đổi thì các ước lượng của các hệ số hồi quy không hiệu quả, các kiểm định t và F khơng cịn đáng tin cậy. Nếu độ lớn của phần dư chuẩn hóa tăng hoặc giảm theo giá trị dự đoán thì có khả năng giả thuyết phương sai không đổi bị vi phạm.
Kiểm định tính dừng:
Hồi quy dữ liệu bảng hoặc chuỗi thời gian, nếu dữ liệu khơng dừng thì sẽ vi phạm độ tin cậy của hồi quy, đó là hiện tượng hồi quy giả mạo được giải thích đầu tiên bởi Phillips (1986). Nếu chuỗi dữ nghiên cứu dừng tại bậc gốc, có thể cho phép thực hiện hồi quy tránh được hồi quy giả mạo.
Dữ liệu dừng cho phép thực hiện mơ hình hồi quy mà không cần phải thực hiện kiểm định đồng liên kết. Nếu dữ liệu không dừng ở bậc gốc, lý thuyết định lượng buộc phải thực hiện kiểm định đồng liên kết để tránh hồi quy giả mạo.
Kiểm định tính dừng trên dữ liệu bảng có hai thế hệ, thế hệ thứ nhất giả định phần nhiễu với đặc điểm tương quan chéo độc lập. Gồm các nghiên cứu của Banerjee (1999); Levin và các cộng sự., (2002); Im et al., (2003,IPS); Maddala và Wu (1999).
Δyit = αi+ βiyi,t-1 + it , t = 1,…,T; i = 1,…,N.
Trong đó các sai số là độc lập cho cả i và t, giả thuyết Ho của kiểm định dạng này được viết:
Thế hệ kiểm định tính dừng thứ hai cho phép kiểm soát tính đặc trưng của sai số tương quan phụ thuộc chéo. Đó là các nghiên cứu của Bai và Ng (2004); Moon và Perron (2004); Pesaran (2007).
Tiếp cận trung bình hóa yếu tố tương quan phụ thuộc chéo nhằm kiểm soát vấn đề tương quan phụ thuộc chéo của Pesaran (2007) được trình bày dưới hàm sau:
Δyit = αi+ βiyi,t-1 + γ’itft + iyt , t = 1,…,T; i = 1,…,N.
Trong đó ft đại diện cho các nhân tố tương quan phụ thuộc chéo không thể quan sát được. Giả thuyết Ho của kiểm định là:
Chuỗi dữ liệu dừng.
Tác giả sử dụng kiểm định được trình bày bởi Levin–Lin–Chu (2002), sử dụng phương pháp trung bình hóa tự tương quan phụ thuộc chéo. Lý do lựa chọn phương pháp kiểm định này là vì cỡ mẫu bài nghiên cứu tiệm cận điều kiện cỡ mẫu của kiểm định và phương pháp trung bình tương quan phụ thuộc chéo khắc phục được vấn đề tương quan phụ thuộc chéo trong dữ liệu bảng (theo nghiên cứu Levin–Lin– Chu, 2001).