Biến phụ thuộc Biến kiểm soát Biến độc lập
Đầu tư trực tiếp nước ngồi (FDI)
Quy mơ thị trường (+)
Tham nhũng CPI, FFC (+) Năng suất lao động (+)
Giá trị gia tăng trong ngành sản xuất (+)
Độ mở thương mại (+) Ổn định chính trị (+)
Tỷ lệ tiết kiệm trong nước (-) Tỷ giá hối đoái (+)
Shock (-)
Nguồn: tác giả tổng hợp
3.2. Phương pháp nghiên cứu 3.2.1. Phương pháp hồi quy 3.2.1. Phương pháp hồi quy
Các nghiên cứu thực nghiệm trước đây về tham nhũng thường sử dụng phương pháp hồi quy bình phương nhỏ nhất (OLS) với dữ liệu gộp của các quốc gia. Phương pháp OLS sử dụng dữ liệu chéo gộp các quốc gia có thể giải quyết tất cả các dữ liệu như thể chỉ có một điểm thời gian duy nhất. Mơ hình được đưa ra:
Yi,t= α+ β Xi,t + ɛi,t (3.3)
Mơ hình theo phương trình (3.3) khơng quan tâm đến bất kỳ sự khác biệt tồn tại giữa các quốc gia hay những tác động theo thời gian. Bởi vì, tham nhũng thực chất là do văn hóa và nền tảng thể chế tạo ra nên có thể đặc điểm văn hóa và thể chế khác nhau sẽ ảnh hưởng khác nhau đến tham nhũng, việc xử lý dữ liệu của các quốc gia như nhau, khơng có sự khác biệt sẽ gây ra sự sai lệch, do giả định bỏ qua sự không đồng nhất giữa các quốc gia.
Hầu hết, các nghiên cứu thực nghiệm gần đây khi nghiên cứu về các quốc gia thường sử dụng phương pháp dữ liệu bảng để kiểm soát và loại bỏ những đặc điểm tác động khác biệt của các quốc gia, không quan sát được.
Theo Baltagi (2008), thực hiện nghiên cứu dữ liệu bảng đạt được 6 ưu điểm sau: dữ liệu bảng liên hệ đến các quốc gia theo thời gian, nên chắc chắn có tính khơng đồng nhất trong các quốc gia này. Các kỹ thuật ước lượng dựa trên dữ liệu bảng có thể tính đến tính khơng đồng nhất đó một cách rõ ràng bằng cách bao gồm biến chuyên biệt theo quốc gia; kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta “dữ liệu chứa nhiều thơng tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn”; nghiên cứu quan sát lập đi lập lại của các đơn vị chéo, dữ liệu bảng phù hợp hơn cho việc nghiên cứu sự động thái thay đổi theo thời gian của các đơn vị chéo này; có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu ch̃i thời gian hay dữ liệu chéo thuần túy; có thể nghiên cứu các mơ hình hành vi phức tạp hơn; cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tượng chệch có thể xảy ra nếu chúng ta gộp các quốc gia.
Thay thế cho mơ hình theo phương trình (3.3) là mơ hình có hệ số chặn α là khác nhau giữa các quốc gia:
Yi,t= αi + βXi,t + ɛi,t (3.4)
Các "đặc điểm khác biệt không quan sát được" được biểu hiện bởi các hằng số αi khác nhau giữa các quốc gia.
Mơ hình dữ liệu bảng trong phương trình (3.4) xem xét đặc điểm riêng của các quốc gia và kỹ thuật ước lượng tập trung sử dụng các thơng tin có sẵn về sự khác biệt trong biến thiên có thể quan sát được thơng qua phương pháp biến giả. Bài nghiên cứu xác định sự khác biệt tự nhiên và chỉ rõ mơ hình dựa trên các kiểm định thống kê lựa chọn giữa mơ hình OLS (pooled regression) và mơ hình đặc trưng dữ liệu bảng (mơ hình yếu tố cố định - fixed effect regression, mơ hình yếu tố ngẫu nhiên - random effect regression). Sau đó, lựa chọn mơ hình thực sự phù hợp với đặc điểm dữ liệu mẫu nghiên cứu.
Giả sử rằng có một dữ liệu bảng chứa thơng tin liên quan đến khoảng thời gian t (t=1,2,…,T) và một số lượng i như là các quốc gia…(i=1,2,…,n), mơ hình có K biến
hoặc biến hồi quy. Hãy xem xét một mơ hình có hệ số chặn thay đổi theo các quốc gia… nhưng nó khơng đổi theo thời gian và độ dốc là không đổi đối với các quốc gia… và theo thời gian:
Yi,t= αi + ∑βk Xkit + ɛi,t (3.5)
Để ước lượng mơ hình này chúng ta có thể đặt giả định về hệ số chặn :
αi = τ + vi (3.6)
Điều này có nghĩa rằng có một phần hệ số chặn theo thời gian khơng đổi cho tất cả các quốc gia… (τ) và một phần hệ số chặn sẽ thay đổi cho mỗi quốc gia… (vi). Dựa vào phương trình (3.6), có hai loại mơ hình được thảo luận: mơ hình tác động cố định và mơ hình tác động ngẫu nhiên. Trong mơ hình tác động cố định, vi là một tham số cố định và Xkit và vi tương quan. Trong khi đó, trong một mơ hình tác động ngẫu nhiên, vi là một biến ngẫu nhiên và Xkit và vi là khơng tương quan. Mơ hình hiệu ứng cố định có thể được ước tính bởi mơ hình hồi quy bình phương nhỏ nhất biến giả (LSDV), trong đó các tác động trong mơ hình và giữa các mơ hình có hiệu lực. Mơ hình tác động ngẫu nhiên được ước tính bằng phương pháp bình phương nhỏ nhất tổng quát (GLS) và phương pháp bình phương nhỏ nhất tổng quát khả thi (FGLS). Khi cấu trúc dữ liệu tồn tại phương sai thay đổi, phương pháp GLS được sử dụng Greence (2000). Nếu chưa biết, FGLS được sử dụng.
Để kiểm soát vấn đề nội sinh giữa các nhân tố biến độc lập và biến phục thuộc - tác động ngược - thường tồn tại trong các học thuyết kinh tế. Tác giả sử dụng phương pháp GMM, đề xuất trên dữ liệu bảng Arellano và Bond (1991) với kiểm soát hồi quy hai bước.
3.2.2. Các kiểm định mơ hình: 3.2.2.1. Hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là hiện tượng tương quan giữa các biến độc lập (các biến giải thích) với nhau. Hiện tượng đa cộng tuyến có thể phân ra hai loại: đa cộng tuyến hồn hảo và đa cộng tuyến khơng hồn hảo.
Trong q trình hồi quy, kết quả hồi quy có hệ số xác định R2 cao nhưng tỷ số t thấp, tương quan cặp giữa các biến giải thích cao, xét tương quan riêng, hồi quy phụ
thấy có tồn tại hiện tượng tương quan giữa các biến độc lập thì mơ hình đã vi phạm giả thiết hồi quy - hiện tượng đa cộng tuyến.
Hiện tượng đa cộng tuyến sẽ dẫn đến một số hậu quả như: phương sai và hiệp phương sai của các ước lượng OLS lớn, khoảng tin cậy rộng lớn, tỷ số t mất ý nghĩa, hệ số xác định cao nhưng tỷ số t mất ý nghĩa, các ước lượng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu, dấu của các ước lượng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến cịn lại có thể thay đổi rất lớn và thay đổi cả dấu của chúng.
Tác giả sử dụng hệ số tương quan giữa các biến độc lập và nhân tử phóng đại phương sai để kiểm định đa cộng tuyến. Theo Baltagi (2008), hệ số tương quan lớn hơn 0.8, nhân tử phóng đại phương sai lớn hơn 10 thì tồn tại đa cộng tuyến nghiêm trọng.
3.2.2.2. Hiện tượng phương sai thay đổi
Hiện tượng phương sai thay đổi là hiện tượng các yếu tố nhiễu ui xuất hiện trong hàm hồi quy có phương sai thay đổi (homoscedasticity, cịn gọi là phương sai có điều kiện thay đổi); tức là các yếu tố nhiễu ui không đồng nhất phương sai.
Trong quá trình hồi quy, tác giả sẽ tập trung xem xét lại bản chất của vấn đề nghiên cứu, đồ thị phần dư và dùng một số kiểm định Goldfeld-Quandt, Breusch- Pagan, White, Park trên OLS và phương pháp Greene (2000) trên dữ liệu bảng để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng phương sai thay đổi. Hiện tượng phương sai thay đổi sẽ dẫn đến một số hậu quả như: các ước lượng OLS vẫn là không chệch nhưng khơng cịn hiệu quả nữa, ước lượng của các phương sai sẽ bị chệch, như vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.
3.2.2.3. Hiện tượng tự tương quan
Tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian hoặc không gian.
Để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng tự tương quan. Trong quá trình hồi quy, tác giả sẽ dùng phương pháp đồ thị và kiểm định d (Durbin-Watson) để phát hiện tượng tự tương quan trong mơ hình hồi quy OLS (pooled regression). Ở khía cạnh kiểm tra phương sai thay đổi dữ liệu bảng, tác giả sử dụng kiểm định được đề xuất bởi Wooldrige (2002) và Drukker (2003).
Hiện tượng tự tương quan sẽ dẫn đến một số hậu quả như: uớc lượng OLS vẫn là ước lượng tuyến tính khơng chệch, nhưng khơng là ước lượng hiệu quả nữa; phương sai các ước lượng OLS là bị chệch, đôi khi quá thấp so với phương sai thực và sai số tiêu chuẩn, dẫn đến phóng đại tỷ số t; các kiểm định t và F không đáng tin cậy; công thức thơng thường để tính phương sai của sai số là ước lượng chệch của phương sai thực và trong một số trường hợp dường như ước lượng thấp của phương sai thực; có thể hệ số xác định khơng đáng tin cậy và dường như là nhận giá trị ước lượng cao; các phương sai và số tiêu chuẩn của dự đốn khơng có hiệu quả.
3.2.2.4. Hiện tượng nội sinh
Hiện tượng nội sinh xảy ra khi giả thiết về sự không tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập trong mơ hình vừa đóng vai trị là biến ngoại sinh (do tác động đến Y) vừa là biến nội sinh (do bị sai số tác động).
Để phát hiện vi phạm giả thiết hồi quy - hiện tượng nội sinh, tác giả sẽ sử dùng kiểm định phương pháp Hansen, Sargan để kiểm tra sự phù hợp của việc thay thế biến nội sinh bởi biến công cụ.
3.2.3. Phương pháp hồi quy khắc phục: Phương pháp GMM (Generalized Method of Moments) Method of Moments)
3.2.3.1. Phương pháp GMM
Giả sử rằng, chúng ta có mơ hình đơn giản dưới đây:
Yi =Xi + i, trong đó giả định rằng E(Xi i)=0
Phương pháp ước lượng GMM thiết lập bảng đối chiếu mẫu của điều kiện này đến 0: 0 ) ˆ ( 1 1 N i i i Xi Y X N , trong đó 2 ˆ i i X Y X
. Đây là ước lượng OLS
Bây giờ, giả định E(Xi i) 0 nhưng E(Zi i) = 0, Z là một vài biến khác. Nếu chúng ta thiết lập bảng đối chiếu mẫu của mô men điều kiện này đến 0, chúng ta có:
i i i i IV X Z Y Z
ˆ , là cái giống như ước lượng của biến công cụ.
Lưu ý: nếu các biến đã được chuẩn hóa, mẫu số là tương quan giữa X và Z vì vậy các ước lượng không xác định nếu tương quan là 0.
Hai điều kiện cho một biến số công cụ: tương quan với các biến phụ thuộc; không tương quan với sai số.
Bây giờ giả sử rằng X là N x K, Z là N x L và L> K. Chúng ta có nhiều biến cơng cụ có sẵn hơn biến hồi quy.
Mơ hình ma trận có dạng: Y X + , trong đó E(X') 0, mơ men điều kiện là: E(Z') = 0
Bởi vì, chúng ta có nhiều mơ men điều kiện hơn thơng số, chúng ta có thể bỏ qua các mơ men điều kiện mở rộng nhưng điều này không dẫn đến hệ số tốt nhất.
Vì vậy, việc cần thực hiện là thay vì tìm hệ số đó thì làm cho nhỏ nhất: Min[(Z')'W (Z')], trong đó W là ma trận trọng lượng N x N
Nếu thay thế cho : Min[(Z'(Y-X)'W (Z'(Y-X)] Giải pháp tối ưu cho : ˆ = (X'ZWZ'X)-1 X'ZWZ'Y.
3.2.3.2. Ưu điểm của phương pháp GMM
Phương pháp ước lượng bình phương bé nhất (OLS) là phương pháp được dùng rất phổ biến trong lĩnh vực kinh tế lượng. Ưu điểm của phương pháp này không quá phức tạp nhưng hiệu quả. Với một số giả thiết ban đầu, phương pháp này sẽ dễ dàng xác định các giá trị ước lượng hiệu quả, không chệch và vững.
Tuy nhiên, khi nghiên cứu về ch̃i dữ liệu thời gian, có nhiều ch̃i vi phạm một hoặc một số giả định của OLS. Khi đó, các ước lượng thu được sẽ bị bóp méo, mất tính vững và sẽ là sai lầm nếu sử dụng chúng để phân tích. Một trong những dạng vi phạm giả định phổ biến là hiện tượng nội sinh, một trường hợp khi hệ số ước lượng (hoặc biến) tương quan với phần dư.
Phương pháp cơ bản trong trường hợp các biến độc lập tương quan với phần dư là ước lượng một phương trình có dùng các biến cơng cụ (Instrumental Variables - hồi quy IV). Ý tưởng của phương pháp hồi quy này là tìm một bộ biến, được gọi là biến công cụ, thỏa mãn cả hai điều kiện: (1) tương quan với các biến giải thích trong phương trình và (2) khơng tương quan với phần dư. Những biến công cụ như vậy được dùng để loại bỏ sự tương quan giữa các biến giải thích và phần dư.
Có nhiều phương pháp hồi quy dựa trên nền tảng của hồi quy IV như phương pháp bình phương bé nhất hai giai đoạn (2SLS), phương pháp Maximum Likelihood trong điều kiện giới hạn thông tin (LIML), phương pháp ước lượng Moment tổng quát (GMM).
Làm thế nào để một hồi quy IV ước lượng ra hệ số với sự tham gia của biến cơng cụ?
Xem xét mơ hình đơn giản sau:
𝑦𝑖 = 𝛽𝑥𝑖 + €𝑖
Trong đó: i là quan sát thứ i, yi là biến phụ thuộc, xi là biến độc lập, €𝑖 là phần dư của mơ hình. Khi đó hệ số ước lượng 𝛽 sẽ được xác định như sau:
𝛽𝑂𝐿𝑆 = 𝑥′𝑦
𝑥′𝑥 =
𝑥′(𝛽𝑥 + €) 𝑥′𝑥
Với x, y, € là các ma trận cột 𝑛 × 1. Nếu x và € không tương quan với nhau thì 𝛽̂ ước lượng được là vững và khơng chệch. Tuy nhiên nếu điều ngược lại xảy ra, hệ số ước lượng sẽ bị chệch và không vững, mô hình khơng cịn hiệu quả, tác động của biến x lên biến y không đáng tin cậy.
Một biến công cụ z, tương quan với biến giải thích x nhưng không tương quan với phần dư € sẽ được đưa vào mơ hình, phương pháp hồi quy IV sử dụng biến giả đó để xác định hệ số ước lượng như sau:
𝛽𝐼𝑉 = 𝑧′𝑦
𝑧′𝑥 =
𝑧′(𝛽𝑥 + €) 𝑧′𝑥
Vì biến z không tương quan với € nên hệ số ước lượng là vững và không chệch. Phương pháp này có thể tổng qt lên với một mơ hình nhiều biến. Ta gọi X là ma trận 𝑛×K các biến giải thích, Z là ma trận 𝑛×L các biến công cụ với K là số lượng biến giải thích, L là số lượng biến cơng cụ và n là số quan sát của mỡi biến. Khi đó phương pháp IV có thể được dùng để ước lượng mơ hình và hệ số ước lượng sẽ được xác định như sau:
𝛽̂ = (𝑍𝐼𝑉 ′𝑋)−1𝑍′𝑌
3.2.3.3. Tính chất của phương pháp ước lượng GMM
Khi số lượng mẫu phù hợp giá trị β ước lượng được sẽ vững, khi đó giá trị ước lượng được sẽ càng gần với giá trị thực của nó. Ước lượng GMM sẽ cho ra các giá trị ước lượng tuân theo phân phối chuẩn, đây là thuộc tính rất quan trọng vì đó là cơ sở để chúng ta xây dựng giá trị dự đoán ở các độ tin cậy (confidence bands) và thực hiện các kiểm định khác. Phương pháp GMM cũng cho ra kết quả là các giá trị ước lượng hiệu quả, nghĩa là giá trị phương sai trong mơ hình ước lượng là nhỏ nhất.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU
Chương 3 đã trình bày phương pháp nghiên cứu được sử dụng để xây dựng, đánh giá các khái niệm nghiên cứu và kiểm nghiệm mơ hình lý thuyết. Chương 3 cũng đưa ra cách đo lường các biến trong mơ hình. Chương 4 sẽ trình bày kết quả nghiên cứu thu được từ q trình phân tích số liệu của các biến tham nhũng, đầu tư trực tiếp nước ngồi và một số biến kiểm sốt khác, trong thời gian từ năm 1995 - 2014 trên dữ liệu bảng với ưu điểm dữ liệu bảng đã được trình bày trong chương 3.
4.1. Phân tích thống kê mơ tả