6. Kết cấu của báo cáo nghiên cứu
3.2 Phươngpháp nghiên cứu 2 4-
Các nghiên cứu thực nghiệm trước đây về tham nhũng thường sử dụng phương pháp hồi quy bình phương nhỏ nhất (OLS) với dữ liệu gộp của các quốc gia. Phương pháp OLS sử dụng dữ liệu chéo gộp các quốc gia có thể giải quyết tất cả các dữ liệu như thể chỉ có một điểm thời gian duy nhất. Mơ hình được đưa ra:
Yi,t= α+ βXi,t + ɛi,t (1)
Mơ hình theo phương trình (1) khơng quan tâm đến bất kỳ sự khác biệt tồn tại giữa các tỉnh hay những tác động theo thời gian. Bởi vì, các yếu tố ảnh hưởng có thể cịn là do yếu tố nội tại của tỉnh thành đang xét như văn hóa, nhân viên, mức độ khoảng sản, khí hậu… việc xử lý dữ liệu của các tỉnh thành như nhau, khơng có sự khác biệt (trên mơ hình dữ liệu khơng gian hoặc mơ hình Pooled) sẽ gây ra sự sai lệch, do giả định bỏ qua sự không đồng nhất giữa các tỉnh.
Hầu hết, các nghiên cứu thực nghiệm gần đây khi nghiên cứu về các quốc gia thường sử dụng phương pháp dữ liệu bảng để kiểm soát và loại bỏ những đặc điểm tác động khác biệt của các quốc gia, không quan sát được.
Theo Baltagi (2008), thực hiện nghiên cứu dữ liệu bảng đạt được 6 ưu điểm sau: dữ liệu bảng liên hệ đến các quốc gia theo thời gian, nên chắc chắn có tính khơng đồng nhất trong các quốc gia này. Các kỹ thuật ước lượng dựa trên dữ liệu bảng có
Tỷ lệ FDI trong GDP Tỷ lệ FDI trong GDP Niên giám tổng cục thống kê Tỷ lệ thương mại trong GDP Tỷ lệ của xuất nhập khẩu trong GDP Niên giám tổng cục thống kê
thể tính đến tính khơng đồng nhất đó một cách rõ ràng bằng cách bao gồm biến chuyên biệt theo quốc gia; kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta “dữ liệu chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn”; nghiên cứu quan sát lập đi lập lại của các đơn vị chéo, dữ liệu bảng phù hợp hơn cho việc nghiên cứu sự động thái thay đổi theo thời gian của các đơn vị chéo này; có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu chuỗi thời gian hay dữ liệu chéo thuần túy; có thể nghiên cứu các mơ hình hành vi phức tạp hơn; cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tượng chệch có thể xảy ra nếu chúng ta gộp các quốc gia.
Thay thế cho mơ hình theo phương trình (1) là mơ hình có hệ số chặn α là khác nhau giữa các tỉnh:
Yi,t= αi + βXi,t + ɛi,t (2)
Các "đặc điểm khác biệt không quan sát được" được biểu hiện bởi các hằng số αi khác nhau giữa các tỉnh.
Mơ hình dữ liệu bảng trong phương trình (2) xem xét đặc điểm riêng của các tỉnh và kỹ thuật ước lượng tập trung sử dụng các thơng tin có sẵn về sự khác biệt trong biến thiên có thể quan sát được thơng qua phương pháp biến giả. Bài nghiên cứu xác định sự khác biệt tự nhiên và chỉ rõ mơ hình dựa trên các kiểm định thống kê lựa chọn giữa mơ hình OLS (pooled regression) và mơ hình đặc trưng dữ liệu bảng (mơ hình yếu tố cố định - fixed effect regression, mơ hình yếu tố ngẫu nhiên - random effect regression). Sau đó, lựa chọn mơ hình thực sự phù hợp với đặc điểm dữ liệu mẫu nghiên cứu.
Giả sử rằng có một dữ liệu bảng chứa thơng tin liên quan đến khoảng thời gian t (t=1,2,…,T) và một số lượng i như là các tỉnh…(i=1,2,…,n), mơ hình có K biến hoặc biến hồi quy. Hãy xem xét một mơ hình có hệ số chặn thay đổi theo các tỉnh… nhưng nó khơng đổi theo thời gian và độ dốc là không đổi đối với các tỉnh… và theo thời gian:
Yi,t= αi + ∑βk Xkit + ɛi,t (3)
Để ước lượng mơ hình này chúng ta có thể đặt giả định về hệ số chặn : αi = τ + vi (4)
Điều này có nghĩa rằng có một phần hệ số chặn theo thời gian không đổi cho tất cả các tỉnh… (τ) và một phần hệ số chặn sẽ thay đổi cho mỗi tỉnh… (vi). Dựa vào phương trình (4), có hai loại mơ hình được thảo luận: mơ hình tác động cố định và mơ hình tác động ngẫu nhiên. Trong mơ hình tác động cố định, vi là một tham số cố định và Xkit và vi tương quan. Trong khi đó, trong một mơ hình tác động ngẫu nhiên, vi là một biến ngẫu nhiên và Xkit và vi là khơng tương quan. Mơ hình hiệu ứng cố định có thể được ước tính bởi mơ hình hồi quy bình phương nhỏ nhất biến giả (LSDV), trong đó các tác động trong mơ hình và giữa các mơ hình có hiệu lực. Mơ hình tác động ngẫu nhiên được ước tính bằng phương pháp bình phương nhỏ nhất tổng quát (GLS) và phương pháp bình phương nhỏ nhất tổng quát khả thi (FGLS). Khi cấu trúc dữ liệu tồn tại phương sai thay đổi, phương pháp GLS được sử dụng Greence (2000). Nếu chưa biết, FGLS được sử dụng.
Để kiểm soát vấn đề nội sinh giữa các nhân tố biến độc lập và biến phụ thuộc - tác động ngược - thường tồn tại trong các học thuyết kinh tế. Tác giả sử dụng phương pháp GMM, đề xuất trên dữ liệu bảng Arellano và Bond (1991) với kiểm soát hồi quy hai bước.
3.2.2 Các kiểm định mơ hình 3.2.2.1 Hiện tượng đa cộng tuyến 3.2.2.1 Hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là hiện tượng tương quan giữa các biến độc lập (các biến giải thích) với nhau. Hiện tượng đa cộng tuyến có thể phân ra hai loại: đa cộng tuyến hồn hảo và đa cộng tuyến khơng hồn hảo.
Trong quá trình hồi quy, kết quả hồi quy có hệ số xác định R2 cao nhưng tỷ số t thấp, tương quan cặp giữa các biến giải thích cao, xét tương quan riêng, hồi quy phụ
thấy có tồn tại hiện tượng tương quan giữa các biến độc lập thì mơ hình đã vi phạm giả thiết hồi quy - hiện tượng đa cộng tuyến.
Hiện tượng đa cộng tuyến sẽ dẫn đến một số hậu quả như: phương sai và hiệp phương sai của các ước lượng OLS lớn, khoảng tin cậy rộng lớn, tỷ số t mất ý nghĩa, hệ số xác định cao nhưng tỷ số t mất ý nghĩa, các ước lượng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu,dấu của các ước lượng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến cịn lại có thể thay đổi rất lớn và thay đổi cả dấu của chúng.
Tác giả sử dụng hệ số tương quan giữa các biến độc lập và nhân tử phóng đại phương sai để kiểm định đa cộng tuyến. Theo Baltagi (2008), hệ số tương quan lớn hơn 0.8, nhân tử phóng đại phương sai lớn hơn 10 thì tồn tại đa cộng tuyến nghiêm trọng.
3.2.2.2. Hiện tượng phương sai thay đổi
Hiện tượng phương sai thay đổi là hiện tượng các yếu tố nhiễu ui xuất hiện trong hàm hồi quy có phương sai thay đổi (homoscedasticity, cịn gọi là phương sai có điều kiện thay đổi); tức là các yếu tố nhiễu ui không đồng nhất phương sai.
Trong quá trình hồi quy, tác giả sẽ tập trung xem xét lại bản chất của vấn đề nghiên cứu, đồ thị phần dư và dùng một số kiểm định Goldfeld-Quandt, Breusch- Pagan, White, Park trên OLS và phương pháp Greene (2000) trên dữ liệu bảng để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng phương sai thay đổi. Hiện tượng phương sai thay đổi sẽ dẫn đến một số hậu quả như: các ước lượng OLS vẫn là khơng chệch nhưng khơng cịn hiệu quả nữa, ước lượng của các phương sai sẽ bị chệch, như vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.
3.2.2.3. Hiện tượng tự tương quan
Tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian hoặc khơng gian.
Để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng tự tương quan. Trong quá trình hồi quy, tác giả sẽ dùng phương pháp đồ thị và kiểm định d (Durbin-Watson) để phát hiện tượng tự tương quan trong mơ hình hồi quy OLS (pooled regression). Ở khía cạnh kiểm tra phương sai thay đổi dữ liệu bảng, tác giả sử dụng kiểm định được đề xuất bởi Wooldrige (2002) và Drukker (2003).
Hiện tượng tự tương quan sẽ dẫn đến một số hậu quả như: uớc lượng OLS vẫn là ước lượng tuyến tính khơng chệch, nhưng khơng là ước lượng hiệu quả nữa; phương sai các ước lượng OLS là bị chệch, đôi khi quá thấp so với phương sai thực và sai số tiêu chuẩn, dẫn đến phóng đại tỷ số t; các kiểm định t và F không đáng tin cậy; cơng thức thơng thường để tính phương sai của sai số là ước lượng chệch của phương sai thực và trong một số trường hợp dường như ước lượng thấp của phương sai thực; có thể hệ số xác định khơng đáng tin cậy và dường như là nhận giá trị ước lượng cao; các phương sai và số tiêu chuẩn của dự đốn khơng có hiệu quả.
3.2.2.4. Hiện tượng nội sinh
Hiện tượng nội sinh xảy ra khi giả thiết về sự không tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập trong mơ hình vừa đóng vai trị là biến ngoại sinh (do tác động đến Y) vừa là biến nội sinh (do bị sai số tác động).
Để phát hiện vi phạm giả thiết hồi quy - hiện tượng nội sinh, tác giả sẽ sử dùng kiểm định phương pháp Hansen - Sargan để kiểm tra sự phù hợp của việc thay thế biến nội sinh bởi biến công cụ.