6. Ý nghĩa thực tiễn của bài nghiên cứu:
3.2. Phương pháp nghiên cứu
3.2.1. Phương pháp hồi quy
Các nghiên cứu thực nghiệm trước đây về tham nhũng thường sử dụng phương pháp hồi quy bình phương nhỏ nhất (OLS) với dữ liệu gộp của các quốc gia. Phương pháp OLS sử dụng dữ liệu chéo gộp các quốc gia có thể giải quyết tất cả các dữ liệu như thể chỉ có một điểm thời gian duy nhất. Mô hình được đưa ra:
Yi,t= α+ βXi,t + ɛi,t (3.3)
Mô hình theo phương trình (3.3) không quan tâm đến bất kỳ sự khác biệt tồn tại giữa các quốc gia hay những tác động theo thời gian. Bởi vì, tham nhũng thực chất là do văn hóa và nền tảng thể chế tạo ra nên có thể đặc điểm văn hóa và thể chế khác nhau sẽ ảnh hưởng khác nhau đến tham nhũng, việc xử lý dữ liệu của các quốc gia như nhau, không có sự khác biệt sẽ gây ra sự sai lệch, do giả định bỏ qua sự không đồng nhất giữa các quốc gia.
Hầu hết, các nghiên cứu thực nghiệm gần đây khi nghiên cứu về các quốc gia thường sử dụng phương pháp dữ liệu bảng để kiểm soát và loại bỏ những đặc điểm tác động khác biệt của các quốc gia, không quan sát được.
Theo Baltagi (2008), thực hiện nghiên cứu dữ liệu bảng đạt được 6 ưu điểm sau: dữ liệu bảng liên hệ đến các quốc gia theo thời gian, nên chắc chắn có tính không đồng nhất trong các quốc gia này. Các kỹ thuật ước lượng dựa trên dữ liệu bảng có thể tính đến tính không đồng nhất đó một cách rõ ràng bằng cách bao gồm biến chuyên biệt theo quốc gia; kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta “dữ liệu chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn”; nghiên cứu quan sát lập đi lập lại của các đơn vị chéo, dữ liệu bảng phù hợp hơn cho việc nghiên cứu sự động thái thay đổi theo thời gian của các đơn vị chéo này; có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu chuỗi thời gian hay dữ liệu chéo thuần túy; có thể nghiên cứu các mô hình hành vi phức tạp hơn; cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tượng chệch có thể xảy ra nếu chúng ta gộp các quốc gia.
Thay thế cho mô hình theo phương trình (3.3) là mô hình có hệ số chặn α là khác nhau giữa các quốc gia:
Yi,t= αi + βXi,t + ɛi,t (3.4)
Các "đặc điểm khác biệt không quan sát được" được biểu hiện bởi các hằng số αi khác nhau giữa các quốc gia.
Mô hình dữ liệu bảng trong phương trình (3.4) xem xét đặc điểm riêng của các quốc gia và kỹ thuật ước lượng tập trung sử dụng các thông tin có sẵn về sự khác biệt trong biến thiên có thể quan sát được thông qua phương pháp biến giả. Bài nghiên cứu xác định sự khác biệt tự nhiên và chỉ rõ mô hình dựa trên các kiểm định thống kê lựa chọn giữa mô hình OLS (pooled regression) và mô hình đặc trưng dữ liệu bảng (mô hình yếu tố cố định - fixed effect regression, mô hình yếu tố ngẫu nhiên - random effect regression). Sau đó, lựa chọn mô hình thực sự phù hợp với đặc điểm dữ liệu mẫu nghiên cứu.
Giả sử rằng có một dữ liệu bảng chứa thông tin liên quan đến khoảng thời gian t (t=1,2,…,T) và một số lượng i như là các quốc gia…(i=1,2,…,n), mô hình có K biến
hoặc biến hồi quy. Hãy xem xét một mô hình có hệ số chặn thay đổi theo các quốc gia… nhưng nó không đổi theo thời gian và độ dốc là không đổi đối với các quốc gia… và theo thời gian:
Yi,t= αi + ∑βk Xkit + ɛi,t (3.5)
Để ước lượng mô hình này chúng ta có thể đặt giả định về hệ số chặn : αi = τ + vi (3.6)
Điều này có nghĩa rằng có một phần hệ số chặn theo thời gian không đổi cho tất cả các quốc gia… (τ) và một phần hệ số chặn sẽ thay đổi cho mỗi quốc gia… (vi). Dựa vào phương trình (3.6), có hai loại mô hình được thảo luận: mô hình tác động cố định và mô hình tác động ngẫu nhiên. Trong mô hình tác động cố định, vi là một tham số cố định và Xkit và vi tương quan. Trong khi đó, trong một mô hình tác động ngẫu nhiên, vi là một biến ngẫu nhiên và Xkit và vi là không tương quan. Mô hình hiệu ứng cố định có thể được ước tính bởi mô hình hồi quy bình phương nhỏ nhất biến giả (LSDV), trong đó các tác động trong mô hình và giữa các mô hình có hiệu lực. Mô hình tác động ngẫu nhiên được ước tính bằng phương pháp bình phương nhỏ nhất tổng quát (GLS) và phương pháp bình phương nhỏ nhất tổng quát khả thi (FGLS). Khi cấu trúc dữ liệu tồn tại phương sai thay đổi, phương pháp GLS được sử dụng Greence (2000). Nếu chưa biết, FGLS được sử dụng.
Để kiểm soát vấn đề nội sinh giữa các nhân tố biến độc lập và biến phục thuộc - tác động ngược - thường tồn tại trong các học thuyết kinh tế. Tác giả sử dụng phương pháp GMM, đề xuất trên dữ liệu bảng Arellano và Bond (1991) với kiểm soát hồi quy hai bước.