6. Ý nghĩa thực tiễn của bài nghiên cứu:
3.2.2. Các kiểm định mô hình:
3.2.2.1. Hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là hiện tượng tương quan giữa các biến độc lập (các biến giải thích) với nhau. Hiện tượng đa cộng tuyến có thể phân ra hai loại: đa cộng tuyến hoàn hảo và đa cộng tuyến không hoàn hảo.
Trong quá trình hồi quy, kết quả hồi quy có hệ số xác định R2 cao nhưng tỷ số t thấp, tương quan cặp giữa các biến giải thích cao, xét tương quan riêng, hồi quy phụ
thấy có tồn tại hiện tượng tương quan giữa các biến độc lập thì mô hình đã vi phạm giả thiết hồi quy - hiện tượng đa cộng tuyến.
Hiện tượng đa cộng tuyến sẽ dẫn đến một số hậu quả như: phương sai và hiệp phương sai của các ước lượng OLS lớn, khoảng tin cậy rộng lớn, tỷ số t mất ý nghĩa, hệ số xác định cao nhưng tỷ số t mất ý nghĩa, các ước lượng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu, dấu của các ước lượng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến còn lại có thể thay đổi rất lớn và thay đổi cả dấu của chúng.
Tác giả sử dụng hệ số tương quan giữa các biến độc lập và nhân tử phóng đại phương sai để kiểm định đa cộng tuyến. Theo Baltagi (2008), hệ số tương quan lớn hơn 0.8, nhân tử phóng đại phương sai lớn hơn 10 thì tồn tại đa cộng tuyến nghiêm trọng.
3.2.2.2. Hiện tượng phương sai thay đổi
Hiện tượng phương sai thay đổi là hiện tượng các yếu tố nhiễu ui xuất hiện trong hàm hồi quy có phương sai thay đổi (homoscedasticity, còn gọi là phương sai có điều kiện thay đổi); tức là các yếu tố nhiễu ui không đồng nhất phương sai.
Trong quá trình hồi quy, tác giả sẽ tập trung xem xét lại bản chất của vấn đề nghiên cứu, đồ thị phần dư và dùng một số kiểm định Goldfeld-Quandt, Breusch- Pagan, White, Park trên OLS và phương pháp Greene (2000) trên dữ liệu bảng để kiểm tra xem mô hình đã vi phạm giả thiết hồi quy - hiện tượng phương sai thay đổi. Hiện tượng phương sai thay đổi sẽ dẫn đến một số hậu quả như: các ước lượng OLS vẫn là không chệch nhưng không còn hiệu quả nữa, ước lượng của các phương sai sẽ bị chệch, như vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.
3.2.2.3. Hiện tượng tự tương quan
Tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian hoặc không gian.
Để kiểm tra xem mô hình đã vi phạm giả thiết hồi quy - hiện tượng tự tương quan. Trong quá trình hồi quy, tác giả sẽ dùng phương pháp đồ thị và kiểm định d (Durbin-Watson) để phát hiện tượng tự tương quan trong mô hình hồi quy OLS (pooled regression). Ở khía cạnh kiểm tra phương sai thay đổi dữ liệu bảng, tác giả sử dụng kiểm định được đề xuất bởi Wooldrige (2002) và Drukker (2003).
Hiện tượng tự tương quan sẽ dẫn đến một số hậu quả như: uớc lượng OLS vẫn là ước lượng tuyến tính không chệch, nhưng không là ước lượng hiệu quả nữa; phương sai các ước lượng OLS là bị chệch, đôi khi quá thấp so với phương sai thực và sai số tiêu chuẩn, dẫn đến phóng đại tỷ số t; các kiểm định t và F không đáng tin cậy; công thức thông thường để tính phương sai của sai số là ước lượng chệch của phương sai thực và trong một số trường hợp dường như ước lượng thấp của phương sai thực; có thể hệ số xác định không đáng tin cậy và dường như là nhận giá trị ước lượng cao; các phương sai và số tiêu chuẩn của dự đoán không có hiệu quả.
3.2.2.4. Hiện tượng nội sinh
Hiện tượng nội sinh xảy ra khi giả thiết về sự không tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập trong mô hình vừa đóng vai trò là biến ngoại sinh (do tác động đến Y) vừa là biến nội sinh (do bị sai số tác động).
Để phát hiện vi phạm giả thiết hồi quy - hiện tượng nội sinh, tác giả sẽ sử dùng kiểm định phương pháp Hansen, Sargan để kiểm tra sự phù hợp của việc thay thế biến nội sinh bởi biến công cụ.
3.2.3. Phương pháp hồi quy khắc phục: Phương pháp GMM (Generalized Method of Moments) Method of Moments)
3.2.3.1. Phương pháp GMM
Giả sử rằng, chúng ta có mô hình đơn giản dưới đây:
Yi =Xi + i, trong đó giả định rằng E(Xi i)=0
Phương pháp ước lượng GMM thiết lập bảng đối chiếu mẫu của điều kiện này đến 0: 0 ) ˆ ( 1 1 N i i i Xi Y X N , trong đó 2 ˆ i i X Y X
. Đây là ước lượng OLS
Bây giờ, giả định E(Xi i) 0 nhưng E(Zi i) = 0, Z là một vài biến khác. Nếu chúng ta thiết lập bảng đối chiếu mẫu của mô men điều kiện này đến 0, chúng ta có:
i i i i IV X Z Y Z
ˆ , là cái giống như ước lượng của biến công cụ.
Lưu ý: nếu các biến đã được chuẩn hóa, mẫu số là tương quan giữa X và Z vì vậy các ước lượng không xác định nếu tương quan là 0.
Hai điều kiện cho một biến số công cụ: tương quan với các biến phụ thuộc; không tương quan với sai số.
Bây giờ giả sử rằng X là N x K, Z là N x L và L> K. Chúng ta có nhiều biến công cụ có sẵn hơn biến hồi quy.
Mô hình ma trận có dạng: Y X + , trong đó E(X') 0, mô men điều kiện là: E(Z') = 0
Bởi vì, chúng ta có nhiều mô men điều kiện hơn thông số, chúng ta có thể bỏ qua các mô men điều kiện mở rộng nhưng điều này không dẫn đến hệ số tốt nhất.
Vì vậy, việc cần thực hiện là thay vì tìm hệ số đó thì làm cho nhỏ nhất: Min[(Z')'W (Z')], trong đó W là ma trận trọng lượng N x N
Nếu thay thế cho : Min[(Z'(Y-X)'W (Z'(Y-X)] Giải pháp tối ưu cho : ˆ = (X'ZWZ'X)-1 X'ZWZ'Y.
3.2.3.2. Ưu điểm của phương pháp GMM
Phương pháp ước lượng bình phương bé nhất (OLS) là phương pháp được dùng rất phổ biến trong lĩnh vực kinh tế lượng. Ưu điểm của phương pháp này không quá phức tạp nhưng hiệu quả. Với một số giả thiết ban đầu, phương pháp này sẽ dễ dàng xác định các giá trị ước lượng hiệu quả, không chệch và vững.
Tuy nhiên, khi nghiên cứu về chuỗi dữ liệu thời gian, có nhiều chuỗi vi phạm một hoặc một số giả định của OLS. Khi đó, các ước lượng thu được sẽ bị bóp méo, mất tính vững và sẽ là sai lầm nếu sử dụng chúng để phân tích. Một trong những dạng vi phạm giả định phổ biến là hiện tượng nội sinh, một trường hợp khi hệ số ước lượng (hoặc biến) tương quan với phần dư.
Phương pháp cơ bản trong trường hợp các biến độc lập tương quan với phần dư là ước lượng một phương trình có dùng các biến công cụ (Instrumental Variables - hồi quy IV). Ý tưởng của phương pháp hồi quy này là tìm một bộ biến, được gọi là biến công cụ, thỏa mãn cả hai điều kiện: (1) tương quan với các biến giải thích trong phương trình và (2) không tương quan với phần dư. Những biến công cụ như vậy được dùng để loại bỏ sự tương quan giữa các biến giải thích và phần dư.
Có nhiều phương pháp hồi quy dựa trên nền tảng của hồi quy IV như phương pháp bình phương bé nhất hai giai đoạn (2SLS), phương pháp Maximum Likelihood trong điều kiện giới hạn thông tin (LIML), phương pháp ước lượng Moment tổng quát (GMM).
Làm thế nào để một hồi quy IV ước lượng ra hệ số với sự tham gia của biến công cụ?
Xem xét mô hình đơn giản sau:
𝑦𝑖 = 𝛽𝑥𝑖 + €𝑖
Trong đó: i là quan sát thứ i, yi là biến phụ thuộc, xi là biến độc lập, €𝑖 là phần dư của mô hình. Khi đó hệ số ước lượng 𝛽 sẽ được xác định như sau:
𝛽𝑂𝐿𝑆 = 𝑥′𝑦
𝑥′𝑥 =
𝑥′(𝛽𝑥 + €) 𝑥′𝑥
Với x, y, € là các ma trận cột 𝑛 × 1. Nếu x và € không tương quan với nhau thì 𝛽̂ ước lượng được là vững và không chệch. Tuy nhiên nếu điều ngược lại xảy ra, hệ số ước lượng sẽ bị chệch và không vững, mô hình không còn hiệu quả, tác động của biến x lên biến y không đáng tin cậy.
Một biến công cụ z, tương quan với biến giải thích x nhưng không tương quan với phần dư € sẽ được đưa vào mô hình, phương pháp hồi quy IV sử dụng biến giả đó để xác định hệ số ước lượng như sau:
𝛽𝐼𝑉 = 𝑧′𝑦
𝑧′𝑥 =
𝑧′(𝛽𝑥 + €) 𝑧′𝑥
Vì biến z không tương quan với € nên hệ số ước lượng là vững và không chệch. Phương pháp này có thể tổng quát lên với một mô hình nhiều biến. Ta gọi X là ma trận 𝑛×K các biến giải thích, Z là ma trận 𝑛×L các biến công cụ với K là số lượng biến giải thích, L là số lượng biến công cụ và n là số quan sát của mỗi biến. Khi đó phương pháp IV có thể được dùng để ước lượng mô hình và hệ số ước lượng sẽ được xác định như sau:
𝛽̂ = (𝑍𝐼𝑉 ′𝑋)−1𝑍′𝑌
3.2.3.3. Tính chất của phương pháp ước lượng GMM
Khi số lượng mẫu phù hợp giá trị β ước lượng được sẽ vững, khi đó giá trị ước lượng được sẽ càng gần với giá trị thực của nó. Ước lượng GMM sẽ cho ra các giá trị ước lượng tuân theo phân phối chuẩn, đây là thuộc tính rất quan trọng vì đó là cơ sở để chúng ta xây dựng giá trị dự đoán ở các độ tin cậy (confidence bands) và thực hiện các kiểm định khác. Phương pháp GMM cũng cho ra kết quả là các giá trị ước lượng hiệu quả, nghĩa là giá trị phương sai trong mô hình ước lượng là nhỏ nhất.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU
Chương 3 đã trình bày phương pháp nghiên cứu được sử dụng để xây dựng, đánh giá các khái niệm nghiên cứu và kiểm nghiệm mô hình lý thuyết. Chương 3 cũng đưa ra cách đo lường các biến trong mô hình. Chương 4 sẽ trình bày kết quả nghiên cứu thu được từ quá trình phân tích số liệu của các biến tham nhũng, đầu tư trực tiếp nước ngoài và một số biến kiểm soát khác, trong thời gian từ năm 1995 - 2014 trên dữ liệu bảng với ưu điểm dữ liệu bảng đã được trình bày trong chương 3.
4.1. Phân tích thống kê mô tả
Sau khi thu thập và tính toán dữ liệu, kết quả trình bày theo bảng thống kê mô tả trong bảng 4.1 dưới đây. Kết quả chỉ ra phạm vi, giá trị trung bình và độ lệch chuẩn của các biến sử dụng trong nghiên cứu này.
Bảng 4.1. Thống kê mô tả giữa các biến trong mô hình
Variable Obs Mean Std. Dev. Min Max
i 200 21.13133 1.887871 15.30871 24.93573 cpi 173 3.625594 2.226296 1.3 9.4 ffc 161 36.4559 24.27758 10 94 sav 200 28.04285 15.92931 -3.7 64.4 prd 140 14963.89 13278.77 2328 49719 gdp 180 24.52729 1.62819 21.12773 26.87963 exr 200 3590.081 5440.555 1.24957 21148 pos 200 -0.24213 0.9510247 -2.12 1.4 opn 200 65.03711 52.02311 0.2 230.3 va 180 22.98498 2.044924 18.50149 26.00592
Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập của 10 quốc gia trong giai đoạn 1995 - 2014 (Phụ lục 01).
Kết quả phân tích thống kê mô tả các biến trong mô hình cho thấy:
Dòng vốn đầu tư trực tiếp nước ngoài ròng (I) của các quốc gia trong mẫu biến động từ mức thấp nhất 15.30871đến cao nhất 24.93573. Dòng vốn đầu tư trực tiếp ròng trung bình của mẫu trong giai đoạn 1995-2014 là 21.13133 với độ lệch chuẩn là 1.887871.
Biến chỉ số cảm nhận tham nhũng (CPI) của các quốc gia trong mẫu có giá trị trung bình là 3.625594 điểm, với độ lệch chuẩn là 2.226296 điểm. Trong đó quốc gia có giá trị thấp nhất là 1.3 điểm (Campuchia) và quốc gia giá trị cao nhất là 9.4 điểm (quốc gia Singapore).
Biến chỉ số tự do không bị tham nhũng (FFC) của các quốc gia trong mẫu có giá trị trung bình là 36.4559 điểm và độ lệch chuẩn là 24.27758 điểm. Trong đó quốc gia có giá trị thấp nhất là 10 điểm (Campuchia) và quốc gia có giá trị cao nhất là 94 điểm (Singapore).
Biến tỷ lệ tiết kiệm trong nước (SAV) biến động trong khoảng từ -3.7% đến 64.4%, như vậy trong mẫu có quốc gia chi tiêu dùng quá lớn so với tổng sản phẩm quốc nội cả nước dẫn đến thâm hụt, có quốc gia tiết kiệm trong nước khá lớn so với tổng sản phẩm quốc nội cả nước; trong đó tỷ lệ tiết kiệm trong nước trung bình là 28.04285% với độ lệch chuẩn là 15.92931%.
Biến năng suất lao động (PRD) của các quốc gia trong mẫu có mức biến động trung bình là 14963.89 với độ lệch chuẩn là 13278.77, trong đó mức biến động thấp nhất là 2328 và mức biến động cao nhất là 49719.
Biến quy mô thị trường (GDP) của các quốc gia biến động từ 21.12773 đến 26.87963, với trung bình là 36.4559 và độ lệch chuẩn là 24.27758.
Biến tỷ giá hối đoái (EXR) có mức biến động trong khoảng từ 1.24957 đến 21148, với tỷ giá hối đoái trung bình là 3590.081 và độ lệch chuẩn là 5440.555.
Biến ổn định chính trị (POS) của các quốc gia trong mẫu trong khoảng thời gian từ 1995-2014 biến động từ -2.12 đến 1.4, với chỉ số ổn định chính trị trung bình là -0.24213 và độ lệch chuẩn là 0.951025. Điều này có nghĩa tình hình ổn định chính trị ở các quốc gia trong mẫu chưa thực sự tốt, thỉnh thoảng còn xảy ra các cuộc bạo động gây mất ổn định an ninh trật tự như ở Thái Lan hay Campuchia.
Biến độ mở thương mại (OPN) các quốc gia trong mẫu có mức biến động trung bình là 65.03711%, trong đó quốc gia có giá trị thấp nhất là 0.2% và quốc gia có giá trị cao nhất là 230.3% và độ lệch chuẩn là 52.02311%.
Biến giá trị gia tăng trong ngành sản xuất (VA) của các quốc gia trong mẫu biến động trong khoảng từ 18.50149 đến 26.00592, với giá trị gia tăng trong ngành sản xuất trung bình là 22.98498 và độ lệch chuẩn là 2.044924.
Các biến có độ lệch chuẩn không quá lớn so với trung bình. Dữ liệu tương đối đồng đều ở các biến. Cỡ mẫu nghiên cứu dao động trong khoảng từ 140 - 200 quan sát, là cỡ mẫu đủ lớn trong thống kê. Dữ liệu đầu vào phù hợp thực hiện hồi quy định lượng.
4.2. Kiểm định sự tương quan và đa cộng tuyến
4.2.1. Ma trận tương quan đơn tuyến tính giữa các cặp biến
Hệ số tương quan dùng để chỉ mức độ tương quan giữa các biến trong mô hình. Dựa vào kết quả ma trận tương quan, tác giả sẽ phân tích mối tương quan giữa các biến phụ thuộc với các biến độc lập trong mô hình và mối tương quan giữa các biến độc lập với nhau.
Bảng 4.2: Kết quả ma trận tự tương quan
Biến I CPI FFC SAV PRD GDP EXR POS OPN VA
I 1 CPI 0.6068 1 FFC 0.5572 0.9542 1 SAV 0.6853 0.8171 `0.8223 1 PRD 0.658 0.9631 0.9414 0.8504 1 GDP 0.5469 0.1935 0.1955 0.4833 0.3006 1 EXR -0.0802 -0.4231 -0.4482 -0.2689 -0.4807 -0.1526 1 POS 0.3829 0.7023 0.6828 0.5977 0.6281 -0.1997 -0.0272 1 OPN 0.5389 0.9489 0.9219 0.7784 0.93 0.034 -0.3419 0.7348 1
VA 0.5586 0.1743 0.1871 0.4556 0.2899 0.9731 -0.2103 -0.2167 0.0204 1
Nguồn: kết quả tổng hợp từ Phần mềm Stata trên số liệu tác giả thu thập của 10 quốc gia trong giai đoạn 1995 - 2014 (Phụ lục 02).
Bảng kết quả phân tích ma trận tự tương quan giữa các biến trong mô hình theo bảng 4.2 cho thấy, tồn tại các hệ số tự tương quan cặp giữa các biến độc lập lớn hơn 0.8, tồn tại hiện tượng đa cộng tuyến nghiêm trọng giữa các cặp biến độc lập trong mô hình.
4.2.2. Kiểm định đa cộng tuyến
Bảng 4.3: Kết quả kiểm tra đa cộng tuyến với nhân tử phóng đại phương sai
Mô hình CPI VIF 1/VIF
PRD 29.7 0.033672 GDP 25.59 0.039085 OPN 23.63 0.04232 CPI 22.12 0.045211 VA 21.5 0.046514 SAV 7 0.142894 POS 3.98 0.251245