CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU
3.4 Phương pháp và dữ liệu nghiên cứu
3.4.1 Phương pháp nghiên cứu
Dữ liệu luận văn là một dữ liệu bảng không cân bằng, các phương pháp ước lượng trên dữ liệu bảng thường được sử dụng là mô hình hồi quy OLS bình thường (Pooled Ordinary Least Square –Pooled OLS), mô hình các ảnh hưởng cố định (Fixed Effects Model –FEM), mô hình các ảnh hưởng ngẫu nhiên (Random Effects Model –REM), mô hình hồi quy theo phương pháp ước lượng bình phương nhỏ nhất tổng quát – GLS (Generalied least squares) và mô hình GMM (Generalized Method of Moments). Tuy rằng bản thân mỗi phương pháp nghiên cứu đều có điểm
ưu và nhược riêng của nó song tùy thuộc vào đặc điểm dữ liệu thu thập mà phương pháp nghiên cứu nào sẽ thực sự phát huy tác dụng và cho kết quả chính xác nhất.
Cụ thể:
- Phương pháp ước lượng bình phương nhỏ nhất tổng quát – GLS (Generalied least squares) có giả định rằng mô hình hoàn toàn xác định, có sự khác biệt về phương sai sai số ở mỗi nhóm đối tượng, nhưng là không đổi trong phạm vi từng đối tượng. Qua đó đem lại ước lượng không chệch, và có tính hiệu quả cao. Đồng thời việc ước lượng cũng cho phép khắc phục hiện tượng tự tương quan và phương sai sai số thay đổi trong mô hình hồi quy với dữ liệu bảng.
- Phương pháp GMM có thể giải quyết được các hiện tượng nội sinh và các khuyết tật trong mô hình dữ liệu bảng. Tôi sẽ sử dụng phương pháp hồi quy bảng mô hình điều chỉnh động từng phần (Dynamic Partial Adjustment Model) đã được dùng các nghiên cứu trước như nghiên cứu của Fama và French (2002), Oztekin và Flannery (2012). Với việc sử
dụng mô hình này, ta có thể xem xét có tồn tại cấu trúc vốn mục tiêu/tối
ưu với các ngân hàng hay không và xem độ điều chỉnh của của ngân hàng
để đạt mức tối ưu đó. Hơn nữa, mô hình cũng cho phép kiểm soát các tác
động tiềm năng của những biến không được lấy vào mẫu, biến không phụ
thuộc vào thời gian và các nhân tốảnh hưởng khác đến khả năng sinh lợi của ngân hàng.
Vì dữ liệu thu thập được từ báo cáo tài chính của các NHTM (2008-2015) chưa được đầy đủ và liên tục giữa các năm (Agribank..) nên mô hình có hiện tượng nộisinh và phương sai thay đổi. Do đó, để đảm bào tính chính xác của kết quả hồi quy tác giả sẽ sử dụng phương pháp GMM. Phần kết quả mô hình FE, RE và GLS sẽ trình bày trong Phần phụ lục để tham khảo thêm.
3.4.2 Chọn mẫu nghiên cứu, thu thập và xử lý số liệu
Để tổng hợp số liệu, tôi sử dụng tiêu chí số quan sát thu được là lớn nhất. Do vậy, đề tài đã lựa chọn 27 NHTM tại Việt Nam, bao gồm 4 NHTM nhà nước và 23 NHTM cổ phần trong giai đoạn 2008 – 2015, tức 8 năm để đưa vào mẫu nghiên cứu.
Dữ liệu nghiên cứu bao gồm các số liệu từ báo cáo tài chính đã được kiểm toán và báo cáo thường niên của của 27 NHTM Việt Nam trong 8 năm từ 2008 – 2015. Mẫu nghiên cứu không bao gồm các ngân hàng bị chi phối chủ yếu bởi ngân hàng mẹ như: NHTM 100% vốn đầu tư nước ngoài, ngân hàng liên doanh và các ngân hàng bị chi phối bởi mục đích điều hành kinh tế xã hội của chính phủ như các ngân hàng chính sách xã hội. Sau khi bỏđi các quan sát bất thường (các quan sát có giá trị biến độc lập chênh lệch quá lớn và không hợp lý so với dãy số liệu cùng tính chất) bài viết có được một bảng dữ liệu không cân bằng với tổng cộng 214 quan sát cho 27 ngân hàng.
Dữ liệu nghiên cứu được thu thập từ báo cáo tài chính hợp nhất đã được kiểm toán của các ngân hàng được chọn quan sát. Cụ thể hơn, các chỉ số như tổng tài sản, nợ phải trả, dư nợ cho vay, vốn chủ sở hữu, tổng nguồn vốn huy động bình
quân được được tính toán và lấy từ bảng cân đối kế toán; các yếu tố như chi phí dự phòng rủi ro, lợi nhuận sau thuế được thu thập từ báo cáo kết quả kinh doanh của ngân hàng thương mại trong từ năm.
Do đặc thù về nguồn dữ liệu, nên tôi không cần phải tiến hành khảo sát, đo lường và chọn mẫu mà chỉ cần xử lý bằng phương trình hồi quy. Có nhiều phần mềm hỗ trợ trong việc thống kê, tính toán như Eview, Stata, SPSS…Trong đề tài nghiên cứu này, tác giả sử dụng phần mềm Stata 13.0 MP để xử lý số liệu.
3.4.3 Các kiểm định
Thống kê mô tả các biến
Bước tiếp theo sau khi đã thu thập được dữ liệu từ các nguồn đáng tin cậy là tiếp tục xử lý thứ cấp các số liệu đó thành các biến số như yêu cầu của mô hình. Sau khi đã có bộ dữ liệu đầy đủ, tác giả sẽ tiến hành thông kê mô tả để nhận định một số đặc điểm riêng của biến số như giá trị trung bình, phương sai, độ lệch chuẩn, giá trị lớn nhất và giá trị nhỏ nhất.
Đây là bước thực nghiệm khá đơn giản nhưng không kém phần quan trọng, vì nó cung cấp một cái nhìn chung nhất về biến số của mô hình nghiên cứu.
Kiểm định hiện tượng đa cộng tuyến
Mô hình hồi quy tốt sẽ loại trừ các trường hợp những biến độc lập có mối quan hệ chi phối lẫn nhau. Nếu xảy ra đa cộng tuyến, dấu của hệ số hồi quy sẽ bị sai lệch, khoảng tin cậy bị nới rộng bất thường.
Để xác định hiện tượng đa cộng tuyến, tác giả sẽ căn cứ theo quy tắc kinh nghiệm tức là VIF (hệ số phóng đại phương sai của các biến giải thích) lớn hơn 10 thì được xem là đa cộng tuyến. Trường hợp xuất hiện hiện tượng đa cộng tuyến, tác giả sẽ loại trừ các biến số có VIF lớn 10, từ đó loại bỏ hiện tượng đa cộng tuyến trong mô hình.
Kiểm định phương sai sai số thay đổi
Nếu phương sai của sai số không đổi thì phép hồi quy đạt tiêu chuẩn về tính hiệp phương sai đồng nhất. Ngược lại, nếu chỉ số này thay đổi thì những kết luận từ quá trình kiểm định, ước lương thường dễ bị sai lầm.
Kiểm định phương sai sai số thay đổi được thực hiện sau kiểm định Hausman. Nếu mô hình được chọn là mô hình FEM tôi sẽ sử dụng lệnh xttest3 để
kiểm định phương sai sai số thay đổi. Ngược lại mô hình sử dụng là mô hình REM tôi sử dụng lệnh xttest0.
Điểm chung của các kiểm định này là giả thiết H0. H0: Phương sai sai số không đổi, nếu P-value lớn 0.05 thì với mức ý nghĩa 5% chấp nhận H0. Mô hình
không có hiện tượng phương sai sai số thay đổi.
Nếu kết quả kiểm định thu được cho biết mô hình có hiện tượng phương sai sai số thay đổi tôi sẽ tiếp tục hồi quy theo phương pháp GLS để khắc phục tình trạng trên nhằm đảm bảo kết quả hồi quy là chính xác nhất.
Kiểm định hiệu tương tự tương quan
Khi xảy ra hiện tượng tự tương quan sẽ làm cho các ước lượng R2 quá cao so với thực tế, ước lượng bị sai chệch. Gây ảnh hưởng xấu đến mô hình hồi quy.
Kiểm định này có giả thuyết như sau. H0: Không có hiện tượng tự tương
quan, nếu P – value lớn hơn 0.05 thì với mức ý nghĩa 5%, chấp nhận H0. Mô hình
không có hiện tượng tự tương quan.
Trường hợp nếu mô hình nghiên cứu hồi quy theo phương pháp GLS thì sẽ
không cần thực hiện kiểm định tự tương quan nữa.
Kiểm định lựa chọn mô hình
Sau khi thông kê mô tả và kiểm định đa cộng tuyến, tác giả sẽ tiến hành chạy
hai mô hình hồi quy FEM và REM song song với nhau. Tiếp đó sử dụng kiểm định
Kiểm định Hausman có giả thuyết H0 như sau: Không có sự khác biệt có tính hệ thống giữa hai phương pháp FEM và REM. Nếu P-value nhỏ hơn 0.05 thì với
mức ý nghĩa 5%, giả thuyết H0 bị bác bỏ, từ đó lựa chọn FEM thay vì REM, tuy
nhiên, nếu P-value lớn hơn 0.05, thì với mức ý nghĩa 5%, ta chấp nhận H0. Sử dụng
REM để tránh làm mất quá nhiều bậc tự do và hạn chế đa cộng tuyến.
Kiểm định sự phù hợp của mô hình hồi quy và nghĩa thống kê của biến độc lập
Căn cứ P-value, nếu P-value nhỏ hơn 0.05, thì với mức ý nghĩa 5%, phương
trình hồi quy tuyến tính bội thực sự có ý nghĩa. Đồng thời dựa vào hệ số xác định
bội R2 hay chính xác hơn là sử dụng Adjusted R2, tác giả sẽ nhận định được độ phù
hợp của phương trình hồi quy.
Tương tự cho các biến độc lập, để biết được các biến độc lập có ý nghĩa
thông kê hay không, ta căn cứ vào từng P-value của của các biến độc lập. Nếu P-
value nhỏ hơn 0.01 hay 0.05 hay 0.1 thì tương ứng với mức ý nghĩa 1%, 5%, 10% biến độc lập có ý nghĩa thống kê. Đồng thời căn cứ vào hệ số hồi quy để đánh giá mối tương quan giữa biến độc lập với biến phụ thuộc.
Kết luận chương 3
Dựa trên những cơ sở lý thuyết của chương 2, chương 3 đã trình bày được các nhân tố được chọn đưa vào mô hình. Giải thích về phương pháp nghiên cứu, trình bày cách xử lý dữ liệu và các bước nghiên cứu và kiểm định.
Chương 3 đã tạo ra tiền đề khá vững chắc cho việc tiến hành hồi quy và kiểm định mô hình ở chương 4.
CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU 4.1 THỐNG KÊ MÔ TẢ BIẾN
Thống kê mô tả biến được trình bày trong Bảng 4.1.
Biến Obs Mean Std Min Max
BIẾN PHỤ THUỘC – Hiệu quả hoạt động ngân hàng ROE 216 9.04% 0.070 -29.9 49.48 ROA 216 0.87% 0.008 -5.50 4.75 BIẾN ĐỘC LẬP – Tỷ lệ nợ D_A 216 89.26% 0.0561 64.37% 96.00% D_E 216 10.36 4.5691 1.80 23.97 BIẾN KIỂM SOÁT – Control DEP 216 0.86 0.058 0.63 0.94 LLP 216 0.52% 0.004 0.01% 1.89% LDR 216 41.88% 0.181 0.00 0.78 GRO 216 2.64% 0.011 0.00 2.71 BSIZE 216 18.04 1.239 20.91 44.84
Bảng 4.1 Thống kê mô tả các biến
Bảng mô tả các biến cung cấp thông tin về số liệu thống kê mô tả các biến trong chuỗi dữ liệu trong bài. Đầu tiên, tỷ lệ ROE và ROA lần lượt là 9.04% và 0.87%, cả hai đều có biên độ dao động khá rộng (từ -29.94% đến 49.49% đối với ROE và -5.51% đến 4.75% đối với ROA). Nếu so sánh với các số liệu trong cùng khu vực thì tỷ lệ này là tương đối thấp (thể hiện trong biểu đồ 4.1). Tuy
nhiên nếu so sánh với các bài nghiên cứu trong nước trước đây ở các ngân hàng Việt Nam như nghiên cứu của Minh và Dũng (2015) hay nghiên cứu của Dung (2015) thì con số này khá tương đồng.
Đối với chỉ số tỷ lệ nợ D_A nằm ở mức cao, dao động từ 64% đến 96% và trung bình ở mức 89.26%. Tỷ lệ này khi quy đổi ra tỷ lệ sử dụng đòn bẩy sẽ
là: Cứ 10 đồng vốn thì chỉ có 1 đồng là của vốn chủ sở hữu và 9 đồng là nợ. Điều này cũng lý giải cho sự chênh lệch lớn (gấp ~10 lần) của ROE và ROA. Nếu so sánh tỷ lệ sử dụng vốn này với các ngân hàng các nước trong khu vực thì tỷ lệ
này ở Việt Nam thuộc mức trung bình.
Biểu đồ 4.1: So sánh hiệu quả hoạt động các nước trong khu vực
(Source: ASEAN | Deciphering the region’s banking sector)
Chỉ số GRO có ước lượng trung bình là 2.62%, đây được cho là một chỉ
số khá thấp (<3%) và có xu hướng tăng dần. Con số này năm 2009 tương ứng là 3.1% và giảm vào những năm sau đó (2010: 4.91%, 2011: 4.44%), cho thấy cuộc
đua huy động vốn của các ngân hàng diễn ra vào đầu năm 2010 nhưng vừa phải duy trì lãi suất đã kiến tỷ lệ thu ngoài lãi và lợi nhuận thu từ các hoạt động ngoài tín dụng giảm sút.
Tỷ lệ vốn huy động (DEP) chiếm tỷ lệ khá cao trong các Ngân hàng Việt Nam (63% - 94%). Các chỉ số còn lại của biến kiểm soát LLP, LDR và BSIZE có kết quả trung bình và mức biến thiên tương tự như đã trình bày trong phần 2, cho thấy dữ liệu và nguồn dữ liệu tin cậy, có mức tương đồng cao với các bài
0.% 1.% 1.% 2.% 2.% 3.% 3.% 4.% 0% 5% 10% 15% 20% 25% 30% 35%
Việt Nam Indonesia Singapore Malaysia Philippine
RO
A
RO
E
4.2 KẾT QUẢ CÁC KIỂM ĐỊNH
Kết quả kiểm định phương sai thay đổi1 của biến ROA và ROE được trình bày trong Bảng 4.2 cho thấy cả hai biến ROA và ROE đều xảy ra hiện tượng này. Để khắc phục hiện tượng phương sai thay đổi, thay vì sử dụng robust2 để xử
lý như các bài nghiên cứu trước đây thì với giới hạn về mẫu, việc sử dụng phương pháp GMM nhưđã đề cập là điều cần thiết.
Mô hình 1a (ROE – D_A):
Mô hình 1b (ROE – D_E):
Mô hình 2b (ROA – D_A):
1 Xảy ra hiện tượng phương sai thay đổi sẽ ảnh hưởng tới các ước lượng thu được vì vậy ước lượng của các phương sai sẽ bị chệch, do đó các kiểm định mức ý nghĩa và khoảng tin cậy dựa theo phân phối T và F không còn đáng tin cậy nữa.
2Mô hình tồn tại hiện tượng phương sai thay đổi vẫn cho các hệ số ước lượng đáng tin cậy nhưng các sai số chuẩn của hệ số không còn là nhỏ nhất, do đó các sai số chuẩn này kéo theo giá trị thông kê t, làm
giảm hoặc mất đi ý nghĩa thống kê. Ý nghĩa của Robust standart errors (sai số chuẩn mạnh) là cởi bỏ
2Mô hình tồn tại hiện tượng phương sai thay đổi vẫn cho các hệ số ước lượng đáng tin cậy nhưng các sai
số chuẩn của hệ số không còn là nhỏ nhất, do đó các sai số chuẩn này kéo theo giá trị thông kê t, làm
giảm hoặc mất đi ý nghĩa thống kê. Ý nghĩa của Robust standart errors (sai số chuẩn mạnh) là cởi bỏ ràng buộc “tối thiểu sai số” của phương trình và đưa các sai số này về giá trị thật của nó. Phương pháp
Prob > chi2 = 0.0192 chi2(1) = 5.49
Variables: fitted values of roe Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest
Prob > chi2 = 0.0372 chi2(1) = 4.34
Variables: fitted values of roe Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest
Mô hình 2b (ROA – D_E):
Bảng 4.2 Kiểm định phương sai thay đổi
Bảng 4.3 là kết quả của kiểm định tự tương quan giữa các biến. Hầu hết các mối tương quan của các biến đều ở mức trung bình hoặc thấp (<= 70%), do
đó sẽ không có khó khăn gì trong việc hồi quy mô hình. Có một sự đáng chú ý
giữa mối tương quan của BSIZE vớiD_A (chỉ số tương quan ở mức 66.47%) và BSIZE với D_E (chỉ số tương quan ở mức 70.50%) cho thấy các ngân hàng sẽ có xu hướng sử dụng đòn bẩy tài chính nhiều hơn khi mở rộng quy mô ngân hàng. Hay nói cách khác, tài sản của ngân hàng tăng lên do đóng góp của nợ nhiều hơn. Đối với các ngân hàng Việt Nam cũng có xu hướng gia tăng vốn như nước ngoài, đó là trong những năm đầu tỷ lệ nợ của ngân hàng sẽ ở mức thấp, sau đó phát triển và bắt đầu sử dụng đòn bẩy nhiều hơn, điều này đã dẫn đến sự tương quan trên, đặc biệt là trong thời điểm Việt Nam đang dần hội nhập sâu hơn vào kinh tế thế giới và áp lực gia tăng vốn từ bên trong lẫn bên ngoài).
Prob > chi2 = 0.0000 chi2(1) = 41.97
Variables: fitted values of roa Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest
Prob > chi2 = 0.0000 chi2(1) = 43.13
Variables: fitted values of roa Ho: Constant variance
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity . hettest
Bảng 4.3 Kiểm định tự tương quan
Mức tương quan của GRO và ROA, ROE vào khoảng 30 – 40% phần nào cho thấy tác động của sự phát triển kinh tế ảnh hưởng tích cực đến tỷ suất sinh lợi như trong các bài nghiên cứu trước, khi GRO luôn được đưa vào làm biến kiểm soát với ROA và ROE để đo lường tỷ suất sinh lợi doanh nghiệp.