3.4.1. Phân tích thống kê mô tả giữa các biến trong mô hình
Mô tả thống kê liên quan đến việc kiểm tra những đặc tính của các biến. Giống như so sánh để suy diễn thống kê về mối quan hệ giữa các biến trong mô hình đang xem xét. Thống kê mô tả cho tác giả có cách nhìn tổng quan về dữ liệu, cung cấp đơn giản về mẫu dữ liệu nghiên cứu và các thước đo phản ánh tổng quát đối tượng nghiên cứu. Việc xem xét các giá trị tính được từ việc mô tả thống kê giúp cho ta xem xét nhanh mức độ thay đổi cũng như sự đồng đều của dữ liệu ở các biến thu thập trong nghiên cứu thực nghiệm. Thông qua đó có thể phát hiện những giá trị dao động sai lệch trong cỡ mẫu. Kết quả thực hiện thống kê bằng phần mềm Stata
chỉ ra phạm vi khoảng giá trị, giá trị trung bình và độ lệch chuẩn của các biến sử dụng trong nghiên cứu của các biến độc lập và phụ thuộc.
Bảng 3.7. Thống kê mô tả giữa các biến trong mô hình
BIẾN Cỡ mẫu Trung bình
Độ lệch
chuẩn Min value Min value
ROA 168 0.0059 0.0042 0.0011 0.0121 ROE 168 0.0758 0.0769 0.0085 0.2175 NIM 168 0.0219 0.0050 0.0147 0.0319 SIZE 168 7.9564 0.0638 7.2447 8.2472 OC 168 0.0141 1.2099 0.0008 0.0212 CR 168 0.6428 0.0651 0.3633 0.8970 KAP 168 0.0935 0.1029 0.0549 0.1469 LQ 168 (0.4489) 0.0274 (0.6262) (0.2710) LOTA 168 0.3255 0.1712 0.3633 0.4442 GDP 168 0.3766 0.0060 0.0291 4.5800 INF 168 0.0730 0.2705 7.2447 0.2312
Nguồn: Kết quả tổng hợp từ Phần mềm Rstudio trên số liệu tác giả thu thập và tính toán.
Từ bảng 4.2, biến ROA có độ biến động trong khoảng từ giá trị 0.0011 đến giá trị 0.0121 với giá trị trung bình của cỡ mẫu 0.0059, ứng với độ lệch chuẩn của mẫu là 0.0042. Dữ liệu dao động nhìn chung ổn định, chênh lệch giữa độ lệch chuẩn và trung bình không đáng kể.
Biến ROE có độ biến động trong khoảng từ giá trị 0 đến giá trị 0.2 với giá trị trung bình của cỡ mẫu 0.075, ứng với độ lệch chuẩn của mẫu là 0.076. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Biến NIM có độ biến động trong khoảng từ giá trị 0 đến giá trị 0.03 với giá trị trung bình của cỡ mẫu 0.02, ứng với độ lệch chuẩn của mẫu là 0.005. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Biến SIZE có độ biến động trong khoảng từ giá trị 7.2447 đến giá trị 8.2472 với giá trị trung bình của cỡ mẫu 7.9564, ứng với độ lệch chuẩn của mẫu là 0.0638. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Biến OC có độ biến động trong khoảng từ giá trị 0.0008 đến giá trị 0.0212 với giá trị trung bình của cỡ mẫu 0.0141, ứng với độ lệch chuẩn của mẫu 1.2099. Dữ liệu dao động không ổn định, giá trị của độ lệch chuẩn lớn hơn so với giá trị trung bình.
Biến CR có độ biến động trong khoảng từ giá trị 0.3633 đến giá trị 0.8970 với giá trị trung bình của cỡ mẫu 0.6428, ứng với độ lệch chuẩn của mẫu là 0.0651. Dữ liệu dao động ổn định, chênh lệch giữa độ lệch chuẩn và giá trị trung bình nhỏ.
Biến KAP có độ biến động trong khoảng từ giá trị 0.0549 đến giá trị 0.1469 với giá trị trung bình của cỡ mẫu 0.0935, ứng với độ lệch chuẩn của mẫu là 0.1029. Dữ liệu dao động không ổn định, giá trị của độ lệch chuẩn lớn hơn so với giá trị trung bình.
Biến LQ có độ biến động trong khoảng từ giá trị -0.6262 đến giá trị -0.2710 với giá trị trung bình của cỡ mẫu -0.4489, ứng với độ lệch chuẩn của mẫu là 0.0274. Dữ liệu dao động không ổn định, trị tuyệt đối của độ lệch chuẩn lớn hơn so với giá trị trung bình.
Biến LOTA có độ biến động trong khoảng từ giá trị 0.2201 đến giá trị 0.4442 với giá trị trung bình của cỡ mẫu 0.3255, ứng với độ lệch chuẩn của mẫu là 0.1712. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Biến GDP có độ biến động trong khoảng từ giá trị 0.0291 đến giá trị 4.5800 với giá trị trung bình của cỡ mẫu 0.3766, ứng với độ lệch chuẩn của mẫu là 0.0060. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Biến INF có độ biến động trong khoảng từ giá trị 0.0063 đến giá trị 0.2312 với giá trị trung bình của cỡ mẫu 0.0730, ứng với độ lệch chuẩn của mẫu là 0.2705. Dữ liệu dao động ổn định, giá trị của độ lệch chuẩn không lớn hơn so với giá trị trung bình.
Qua phân tích thống kê mô tả chung cho các biến trong mô hình theo bảng 4.2, Các biến quan sát thu thập được có dao động ổn định, phần lớn các giá trị độ lệch chuẩn của mẫu nghiên cứu đều nhỏ hơn so với giá trị trung bình. Cỡ mẫu nghiên cứu gồm 14 quan sát cho mỗi biến, là số quan sát được chấp nhận để thực hiện hồi quy và các kiểm định trong thống kê.
3.4.2. Kiểm định sự tương quan các biến trong mô hình và đa cộng tuyến
3.4.2.1. Ma trận tương quan đơn tuyến giữa các cặp biến
Hệ số tương quan dùng để chỉ mối quan hệ giữa các biến trong mô hình. Dựa vào kết quả ma trận tương quan, tác giả sẽ phân tích mối tương quan giữa các biến phụ thuộc với các biến độc lập trong mô hình và mối tương quan giữa các biến độc lập với nhau.
Bảng 3.8. Ma trận tương quan tuyến tính đơn giữa các cặp biến
ROA ROE NIM SZE OC CR KAP LQ LOTA GDP INF ROA 1.00 ROE 0.69 1.00 NIM 0.24 0.17 1.00 SIZE -0.25 0.14 -0.14 1.00 OC 0.14 -0.04 0.54 0.00 1.00 CR -0.04 -0.04 0.04 0.07 0.29 1.04 KAP 0.42 -0.15 0.34 -0.6 0.27 1.00 LQ 0.07 -0.08 0.27 0.12 0.14 -0.26 0.16 1.00 LOTA -0.41 0.12 -0.34 0.75 -0.11 0.07 -0.86 -0.16 1.00 GDP 0.01 0.08 -0.15 -0.22 -0.24 -0.05 0.00 0.08 -0.04 1.00 INF 0.00 0.07 0.10 -0.03 0.08 0.04 -0.01 -0.11 0.01 -0.62 1.00 (Nguồn: Kết quả tổng hợp từ phần mềm Rstudio trên số liệu tác giả tính toán) Hệ số tương quan được tính toán để chỉ ra mức độ tương quan đơn tuyến tính giữa các biến độc lập nhằm phát hiện hiện tượng đa cộng tuyến ở các biến giải thích. Ở đây tác giả chỉ tập trung nhấn mạnh những hệ số tương quan có trị tuyệt đối lớn hơn 0.81. để thấy được mức độ đa cộng tuyến của các biến trong mô hình.
Kết quả phân tích ma trận tự tương quan giữa các biến trong mô hình theo bảng 4.3 cho thấy được, tồn tại các hệ số tự tương quan cặp biến LOTA và KAP lớn hơn 0.81, do đó tồn tại hiện tượng đa cộng tuyến. Kết luận: Tồn tại hiện tượng đa cộng tuyến với tiêu chuẩn tương quan cặp tuyến tính theo dữ liệu thu thập.
3.4.2.2. Kiểm định đa cộng tuyến trong mô hình bằng nhân tử phóng đại phương sai VIF
Bảng 3.9. Kết quả kiểm tra đa cộng tuyến với nhân tử phóng đại phương sai
Biến VIF LOTA 4.04 KAP 3.76 SIZE 2.55 GDP 2.65 INF 2.00 OC 1.45 LQ 1.27 CR 1.23 Trung bình VIF 2.04
(Nguồn: Kết quả tổng hợp từ phần mềm Rstudio trên số liệu tác giả thu thập)
Dựa vào bảng 4.4, có thể thấy kết quả kiểm tra đa cộng tuyến với nhân tử phóng đại phương sai, giá trị trung bình VIF của các biến trong mô hình đều nhỏ hơn 5. Đồng thời các biến đều có VIF nhỏ hơn 5, nên không xảy ra hiện tượng đa cộng tuyến mạnh trong mô hình dữ liệu nghiên cứu.
Kết luận: Với tiêu chuẩn nhân tử phóng đại phương sai VIF, mô hình không tồn tại hiện tượng đa cộng tuyến trong mẫu dữ liệu nghiên cứu.
3.4.2. Kiểm định lựa chọn mô hình dữ liệu bảng FEM và mô hình Pooled
Giả định của kiểm định là các quan sát giữa các Ngân hàng qua các năm không tìm thấy sự khác biệt, mô hình Pooled phù hợp với dữ liệu. Khi dữ liệu mẫu tồn tại sự khác biệt các Ngân hàng qua các năm thì dữ liệu bảng FEM phù hợp với mẫu nghiên cứu hơn.
Bài luận văn sử dụng kiểm định lựa chọn mô hình Pooled và mô hình dữ liệu bảng FEM.
Giải thuyết 𝐻0 : Mô hình Pooled phù hợp với mẫu nghiên cứu Giả thuyết 𝐻1: Mô hình FEM phù hợp với mẫu nghiên cứu.
Bảng 3.10. Kết quả kiểm định lựa chọn FEM và Pooled
Mô hình Giá trị thống kê P P-value
ROA 1.04 0.4413
ROE 4.05 0.0000
NIM 7.53 0.0000
(Nguồn: Kết quả tổng hợp từu phần mềm Rstudio trên số liệu tác giả tính toán) Kiểm định cho p-value của mô hình với biến phụ thuộc ROE và NIM nhỏ hơn 0.05 đủ cơ sở bác bỏ giả thuyết 𝐻0. Vậy mô hình ROE và NIM hồi quy theo FEM sẽ phù hợp so với mô hình Pooled OLS hơn. Ở mô hình ROA thì giá trị p-value bằng 0.4113 lớn hơn 0.05 nên chưa đủ cơ sở để bác bỏ giả thuyết 𝐻0, vậy mô hình ROA phù hợp với Pooled OLS hơn.
Tác giả tiếp tục kiểm định Breusch, T. S. và A. R. Pagan. (1980) [7] lựa chọn mô hình Pooled và REM với giả thuyết như sau:
Giả thuyết 𝐻0: Mô hình Pooled phù hợp dữ liệu mẫu hơn REM. Giả thuyết 𝐻1: Mô hình REM phù hợp dữ liệu mẫu hơn Pooled.
Bảng 3.11. Kết quả kiểm định lựa chọn REM và Pooled
Mô hình Chi bình phương P-value
ROA 0.01 1.0001
ROE 10.54 0.0007
NIM 65.86 0.0000
(Nguồn: Kết quả tổng hợp từu phần mềm Rstudio trên số liệu tác giả tính toán) Kiểm định cho giá trị p-value của mô hình ROE và NIM đều nhỏ hơn 0.05, nên chúng ta đủ cơ sở để bác bỏ giả thuyết 𝐻0. Vậy mô hình REM phù hợp hơn mô hình Pooled OLS. Còn ở mô hình ROA giá trị p-value lớn hơn 0.05 nên chưa đủ cơ sở để bác bỏ giả thiết 𝐻0. Nên mô hình ROA thì hồi quy theo phương pháp Pooled OLS phù hợp hơn so với phương pháp REM.
3.4.3. Kiểm định lựa chọn mô hình FEM và mô hình dữ liệu bảng REM
Tác giả tiếp tục kiểm định Hausman nhằm lựa chọn giữa hai mô hình REM và FEM với giả thuyết:
Giả thuyết 𝐻0 : Mô hình REM phù hợp với dữ liệu mẫu hơn FEM. Giả thuyết 𝐻1: Mô hình FEM phù hợp với dữ liệu mẫu hơn REM.
Bảng 3.12. Kết quả kiểm định lựa chọn REM và FEM
Mô hình Chi bình phương P-value
ROA 8.62 0.1984
ROE 23.54 0.0004
NIM 11.57 0.0745
(Nguồn: Kết quả tổng hợp từ phần mềm Rstudio trên số liệu tác giả tính toán) Kiểm định cho p-value cho từng mô hình ROE, NIM đều nhỏ hơn 0.1, nên đủ cơ sở để bác bỏ giả thuyết 𝐻0 ở mức ý nghĩa 10%. Vậy mô hình ROE và NIM hồi quy theo phương pháp FEM phù hợp với dữ liệu mẫu hơn mô hình REM. Còn ở giá trị p value của mô hình ROA lớn hơn 0.1 nên chưa đủ cơ sở để bác bỏ giả thiết 𝐻0, nên mô hình REM sẽ phù hợp hơn.
Sau khi phân tích lựa chọn kiểm định mô hình, đối với mô hình biến phụ thuộc là roa tác giả lựa chọn mô hình Pooled OLS và mô hình hiệu ứng ngẫu nhiên REM là mô hình nghiên cứu cho khung biến này. Còn đối với 2 mô hình ROE và NIM lần lượt đại diện cho biến phụ thuộc ROE và NIM sẽ được hồi quy theo phương pháp FEM – hiệu ứng tác động cố định và REM – hiệu ứng tác động ngẫu nhiên.
3.4.4. Kiểm định hiện tượng phương sai thay đổi phần dư trên dữ liệu bảng Greene (năm 2000)
Hiện tượng phương sai thay đổi có thể ảnh hưởng đến tính hiệu quả của ước lượng mô hình, mất tính tin cậy của kiểm định hệ số. Vì thế, tác giả tiến hành kiểm định phương sai số thay đổi bằng phương pháp kiểm định Greene (năm 2000) với giả thuyết sau:
Giả thuyết 𝐻0 : Mô hình không có hiện tượng phương sai thay đổi. Giả thuyết 𝐻1: Mô hình có hiện tượng phương sai thay đổi.
Bảng 3.13. Kết quả kiểm tra phương sai thay đổi của 3 mô hình
Mô hình Chi bình phương P-value
ROA 1.3e+04 0.0001
ROE 1214.30 0.0001
NIM 916.82 0.0001
Từ bảng 4.8, kết quả kiểm định Greene (năm 2000) cho thấy kết quả với p- value đều bằng 0.0001 < α = 0.05. Suy ra đủ cơ sở để bác bỏ giả thuyết 𝐻0 ở mức ý nghĩa 5%. Qua đó, cho thấy tồn tại hiện tượng phương sai thay đổi trong mô hình dữ liệu nghiên cứu. Kết luận: Tồn tại hiện tượng phương sai thay đổi trong mô hình ở mức ý nghĩa 5%.
3.4.5. Phân tích kết quả hồi quy
Tác giả đã tiếp cận mô hình từ mô hình đơn giản đến mô hình nâng cao nhằm mục đích là khắc phục các nhược điểm kiểm định của mô hình hồi quy ban đầu. Mở đầu với các mô hình hồi quy dữ liệu bảng, ước lượng hồi quy Pooled OLS, mô hình hiệu ứng tác động cố định (Fixed effect – FEM) và mô hình tác động ngẫu nhiên (Random effects – REM).
Tuy nhiên, cả 3 mô hình dữ liệu bảng thông thường như Pooled, FEM và REM không thể kiểm soát được hiện tượng phương sai thay đổi của nhiễuvà tự tương quan của phần dư, do đó tác giả sẽ tiến hành hồi quy thêm phương pháp FGLS. Theo kết quả nghiên cứu của Greene (2012), phương pháp FGLS là một phương pháp ước lượng hồi quy trong trường hợp mô hình tồn tại phương sai thay đổi của nhiễu, hiện tượng tương quan. Mô hình FGLS kiểm soát được hiện tượng tự tương quan phần dư, hiện tượng phương sai thay đổi.
Ngoài ra, nghiên cứu này còn kiểm soát tương quan phụ thuộc chéo, là điểm mới của đề tài so với các nghiên cứu trước đây. Các nghiên cứu trước đây kết quả có thể bị ảnh hưởng bởi độ tin cậy khi các nghiên cứu này không kiểm soát hiện tượng tương quan phụ thuộc chéo (cross-section dependence), Baltagi (2008) [6] cho rằng tương quan phụ thuộc chéo có ảnh hưởng đến độ tin cậy của kết quả định lượng, khi có cú sốc trong mối quan hệ về các yếu tố tác động đến lợi nhuận trên ngân hàng này sẽ ảnh hưởng đến mối quan hệ ngân hàng kia.
Giả thuyết kiểm định như sau:
Giả thuyết 𝐻0: Mô hình không có hiện tượng tương quan phụ thuộc chéo. Giải thuyết 𝐻1: Mô hình có hiện tượng tương quan phụ thuộc chéo.
Bảng 3.14. Kết quả kiểm tra tự tương quan 3 mô hình
Mô hình Thông kê Pesaran P-value
ROA 5.546 0.0000
ROE 3.160 0.0000
NIM 6.715 0.0000
Tương quan phụ thuộc chéo được coi là yếu tố tồn tại trong mỗi hệ thống ngân hàng khi các ngân hàng trong hệ thống hoạt động có tính tương tác và liên kết với nhau rất rõ ràng vì đặc điểm chung trong cùng một thị trường cạnh tranh và chịu sự quản lý của Ngân hàng Nhà nước. Kết quả kiểm định đã củng cố thêm bằng chứng khi cả 3 mô hình đều cho kết quả với mức ý nghĩa rất cao, p-value đều nhỏ hơn 1%. Vì vậy, tồn tại hiện tượng tương quan phụ thuộc chéo.
Nhằm đảm bảo kết quả hồi quy tin cậy, bài luận văn này kiểm soát hiện tượng tương quan phụ thuộc chéo nhằm đảm bảo kết quả tin cậy bằng phương pháp Robust standard errors được giới thiệu bởi Driscoll and Kraay’s (1998). Daniel (2007) phát triển nghiên cứu này và chứng minh sự hiệu quả của phương pháp nghiên cứu bằng mô phỏng Monte Carlo được trình bày ở nghiên cứu của mình năm 2007. Phương pháp này có thể khắc phục hiệu quả hiện tượng phương sai của nhiễu thay đổi, tự tương quan giữa các phần dư, nội sinh biến trong mô hình và tương quan phụ thuộc chéo trong cả cỡ mẫu nhỏ và lớn.
Bảng 3.15. Kết quả hồi quy mô hình với biến phụ thuộc ROA
(1) (2) (3) (4)
POOLED REM SCC FGLS
ROA ROA ROA ROA
SIZE 0.00264* 0.00264* 0.00264* 0.000654 (1.75) (1.75) (5.24) (1.41) OC 0.184 0.184 0.184 0.0464 (0.97) (0.97) (0.89) (0.73) CR -0.000910 -0.000910 -0.000910 0.000579 (-0.21) (-0.21) (-0.37) (0.52) KAP 0.115** 0.115** 0.115** -0.0217
(2.42) (2.42) (2.75) (-0.85) LQ -0.00758 -0.00758 -0.00758*** -0.00395 (-0.79) (-0.79) (-3.32) (-1.06) LOTA -0.0744* -0.0744* -0.0744*** -0.0681*** (-1.76) (-1.76) (-3.88) (-3.25) GDP 0.00386 0.00386 0.00386*** 0.00283*** (1.16) (1.16) (2.75) (3.31) INF 0.000279 0.000279 0.000279 0.000241** (0.84) (0.84) (1.42) (2.31) Cons -0.0441 -0.0441 -0.0441** 0.0332 (-0.70) (-0.70) (-2.84) (1.22) N 168 168 168 168
*, **, *** tương ứng với mức ý nghĩa 10%, 5% và 1%