2.3.1.1. Các công cụ sử dụng
Dữ liệu trong luận án sử dụng dữ liệu bảng. Trong đó mô hình tổng quát của dữ liệu bảng như sau:
Yit= βit+ β2 X2it+ β3X3it+ uit i = 1, 2, 3, 4 t = 1, 2, ...,
Để phân tích dữ liệu bảng, luận án sử dụng 4 phương pháp gồm: phương pháp phân tích ảnh hưởng cố định (fixed effect), phương pháp phân tích ảnh hưởng ngẫu nhiên (random effect) và phương pháp GSL, PCSE để khắc phục những khuyết tật của mô hình nếu có.
Mô hình tác động cố định
Hiệu ứng cố định được sử dụng khi cần phân tích tác động giữa các biến thay đổi theo thời gian. FE khám phá mối quan hệ giữa biến dự báo và biến kết quả trong một thực thể (như trong một công ty). Trong mỗi thực thể lại có những đặc điểm riêng có ảnh hưởng hoặc không thể ảnh hưởng đến các biến dự báo (ví dụ, hoạt động kinh doanh của một công ty có thể ảnh hưởng đến giá cổ phiếu của nó).
Khi sử dụng FE, giả định rằng có điều gì đó bên trong thực thể có thể tác động các biến dự báo hoặc kết quả và cần kiểm soát điều này. Đây là nền tảng đằng sau giả định rằng có mối tương quan giữa lỗi của thực thể và các biến dự báo. FE loại bỏ ảnh hưởng của các đặc điểm bất biến theo thời gian đó để chúng ta có thể đánh giá ảnh hưởng ròng của các yếu tố dự báo lên biến kết quả.
STT Giả thuyết Căn cứ
1 Quy mô tổng tài sản có tác động thuận chiều với chỉ OE đo bằng chỉ số hiệu quả Färe-Primont của các ngân hàng của các ngân hàng
Kotabe (2002), Haar (1989) và Morck (1991),
2 Chỉ tiêu chi phí quản lý có tác động ngược chiều với chỉ OE đo bằng chỉ số hiệu quả Färe-
Primont của các ngân hàng của các ngân hàng
Christophe (2005),
3 Quy mô vốn chủ sở hữu có tác động ngược chiều với chỉ OE đo bằng chỉ số hiệu quả Färe-
Primont của các ngân hàng của các ngân hàng
Một giả định quan trọng khác của mô hình FE là các đặc điểm bất biến theo thời gian đó là duy nhất đối với cá nhân và không nên tương quan với các đặc điểm cá nhân khác. Mỗi thực thể là khác nhau, do đó, thuật ngữ lỗi của đơn vị và hằng số (ghi lại các đặc điểm riêng lẻ) không được tương quan với những đối tượng khác. Nếu các điều khoản lỗi có tương quan, thì FE không phù hợp vì các suy luận có thể không đúng và bạn cần phải mô hình hóa mối quan hệ đó (có thể sử dụng hiệu ứng ngẫu nhiên), đây là điều chính cơ sở lý luận cho phép thử Hausman (được trình bày ở phần sau của tài liệu này).
Phương trình cho mô hình hiệu ứng cố định trở thành: Yit = β1Xit + αi + uit Trong đó: αi (i = 1… .n) là vùng chặn chưa biết cho mỗi thực thể (n vùng chặn dành riêng cho thực thể). Yit là biến phụ thuộc (DV) trong đó i = thực thể và t = thời gian. Xit đại diện cho một biến độc lập. β1 là hệ số của biến đó. uit là sai số
Về cơ bản, các mô hình hiệu ứng cố định được thiết kế để nghiên cứu nguyên nhân của những thay đổi bên trong một thực thể. Hiệu ứng cố định sẽ không hoạt động tốt với dữ liệu mà sự thay đổi trong cụm là tối thiểu hoặc đối với các biến thay đổi chậm theo thời gian.
Mô hình tác động ngẫu nhiên
Trong các mô hình hiệu ứng cố định, mỗi biến giả loại bỏ một bậc tự do khỏi mô hình. Do đó, các mô hình hiệu ứng cố định hoạt động tốt khi có một số khoảng thời gian đáng kể. Để tránh mất bậc tự do và sử dụng cả thông tin về sự thay đổi theo thời gian của một đơn vị nhất định và thông tin về sự khác biệt giữa các đơn vị, mô hình hiệu ứng ngẫu nhiên ngẫu nhiên.
Mô hình tác động ngẫu nhiên vẫn phân tích phần dư: Yit = α + Xitβ + ui + eit trong đó ui biểu thị hiệu ứng của đơn vị i và eit là hiệu ứng dư cho thời điểm t đối với đơn vị đó. Nhưng trong một mô hình tác động ngẫu nhiên, phần dư đơn vị ui không có giá trị cụ thể - ui là một biến ngẫu nhiên phân phối chuẩn (do đó có tên - tác động ngẫu nhiên).
Ý tưởng cơ bản là bắt đầu với phương trình: Yit = β1i + β2X2it + β3X3it + uit Thay vì coi β1i như là hằng số thì mô hình tác động ngẫu nhiên giả định rằng đây là một biến ngẫu nhiên với giá trị trung bình là β1 (không có ký hiệu dưới dòng i ở đây). Và giá trị tung độ gốc đối với một công ty đơn lẻ có thể được biểu thị như sau:
β1i + β1 + εi i = 1, 2, . . . , N trong đó εi là một số hạng sai số ngẫu nhiên có giá trị trung bình là 0 và phương sai σ2e.
Bản chất của các hệ số β cũng thay đổi khi chúng ta đi từ mô hình tác động cố định sang một mô hình tác động ngẫu nhiên. Trong mô hình tác động ngẫu nhiên, chúng ta không chỉ dự đoán sự thay đổi theo thời gian mà còn giải thích sự khác biệt giữa các đơn vị. Do đó, dữ liệu về sự thay đổi theo mặt cắt ngang được sử dụng để ước tính ảnh hưởng của các biến độc lập. Nguyên nhân do các yếu tố dự báo được sử dụng để giải thích không chỉ thay đổi theo thời gian mà còn cả sự khác biệt giữa các đơn vị, phân dư của đơn vị ngẫu nhiên u được giả định là không tương quan với Xβ: corr (u_i, Xb) = 0.
Hệ số tác động ngẫu nhiên có tính chất kép: chúng giải thích đồng thời sự thay đổi theo thời gian và sự khác biệt mặt cắt giữa các đơn vị.
Lựa chọn công cụ mô hình tác động cố định hay ngẫu nhiên
Để kiểm tra việc sử dụng mô hình tác động cố định hay mô hình tác động ngẫu nhiên, phép thử Hausman được sử dụng. Giả thuyết Ho là các hệ số được ước tính bởi công cụ ước tính tác động ngẫu nhiên hiệu quả giống với các hệ số được ước tính bởi công cụ ước tính tác động cố định nhất quán. Nếu đúng như vậy, sẽ an toàn khi sử dụng mô hình hiệu ứng ngẫu nhiên. Nếu hai bộ hệ số khác nhau đáng kể, thì mô hình tác động ngẫu nhiên có vấn đề.
Xử lý các khuyết tật của mô hình nếu có
Đặc điểm dữ liệu là long data với T và N tương ứng là 46 và 7. Do đó có 3 công cụ ước lượng được lựa chọn để khắc phục các khuyết tật của mô hình để xem xét:
- Sử dụng Generalized least squares với lựa chọn panel specific AR (1) để xử lý hiện tượng tự tương quan (autocorrrelation) và lựa chọn heteroskedastic and correlated để xử lý hiện tượng phương sai sai số thay đổi và cross-section correlation.
- Sử dụng Linear regression with panel corrected standard errors với lựa chọn panel specific AR (1) để xử lý hiện tượng tự tương quan (autocorrrelation). Đồng thời trong mô hình PCSE bổ sung thêm lựa chọn heteroskedastic and correlated để xử lý hiện tượng phương sai sai số thay đổi và cross-section correlation.
Giữa 2 mô hình GLS và PCSE, mô hình GLS sẽ được ưu tiên hơn theo quy tắc được đề xuất bởi Reed and Ye (2011). Trong đó mục tiêu chính của mô hình tính chính xác và tỷ lệ T/N là > 1,5.
Bảng 2.10: Quy tắc lựa chọn giữa GLS và PCSE
Nguồn: tác giả tổng hợp
- Sử dụng Random effects linear model with AR(1) disturbances. Việc lựa chọn công cụ ước lượng này do đặc điểm dữ liệu có N là 7 trong khi T là 46 nên xử lý khuyết tật về tương quan chuỗi (serial correlation) được tập trung hơn, trong khi các khuyết tật về phương sai sai số thay đổi (heteroskedasticity) và tương quan chéo (cross section correlation) có thể linh hoạt hơn..
2.3.1.2. Trình tự thực hiện phân tích
Trình tự thực hiện phân tích định lượng như sau:
Bước 1. Lựa chọn mô hình
Trước hết sử dụng kiểm định F làm căn cứ để lựa chọn giữa mô hình pools OLS và mô hình tác động cố định (fixed impact model)
Tiếp tục sử dụng kiểm định Breusch-Pagan để lựa họn giữa mô hình pools OLS và mô hình tác động ngẫu nhiên (random impact model)
Cuối cùng sử dụng kiểm định hausman để lựa chọn giữa mô hình tác động cố định và tác động cố định.
Quy tắc lựa chọn như sau:
Bảng 2.11: Quy tắc lựa chọn mô hình
Park estimator without cross sectional dependence
Khi mục tiêu chính là ước lượng hiệu qủa và T/N <1,5
command = xtgls options = corr(ar1) panels(heteroscedastic) Park estimator Khi mục tiêu chính là ước
lượng hiệu quả và T/N >1,5
command = xtgls options = corr(ar1) panels(correlated) PCSE Khi mục tiêu chính là kiểm
định giả thuyết command = xtpcse options = corr(ar1) FE vs OLS Ho = µ1 = µ2 = … = µ F Test RE vs OLS Ho = Var(µi) = 0 Breusch – Pagan Test
Mô hình lựa chọn
Ho không bị bác bỏ → Bỏ mô hình FE
Ho không bị bác bỏ →Bỏ mô hình RE
Nguồn: tác giả tổng hợp
Kiểm tra tự tương quan của từng chuỗi thời gian bằng Kiểm định Levin-Lin- Chu unit-root test và Kiểm định Levin-Lin-Chu unit-root test. Việc kiểm tra này nhằm đảm bảo chuỗi thời gian có tính dừng.
Bước 2. Kiểm tra các khuyết tật của mô hình lựa chọn
Trước hết thực hiện các kiểm định để phát hiện các khuyết tật của mô hình gồm phương sai sai số thay đổi, tương quan chuỗi, tương quan giữa các sectional và đa cộng tuyến.
Sau khi xác định các khuyết tật dựa trên đặc điểm dữ liệu, lựa chọn công cụ xử lý khuyết tật phù hợp
Bước 3. Đánh giá kết quả mô hình thu được