CHƯƠNG 4 : PHƯƠNG PHÁP, DỮ LIỆU VÀ KẾT QUẢ NGHIÊN CỨU
4.2. Xây dựng giả thuyết nghiên cứu
4.2.3. Mối quan hệ giữa tỷ lệ cho vay trên tổng tài sản với tỷ suất lợi nhuận
Chỉ tiêu dự nợ cũng có thể đem lại các ảnh hưởng tích cực đến tỷ suất lợi nhuận khi cho vay được nhiều và chất lượng các khoản vay tốt. Tuy nhiên nếu cho vay nhiều mà chất lượng các khoản vay khơng tốt thì hoạt động này hồn tồn có thể kéo lợi nhuận ngân hàng sụt giảm theo nghiên cứu của Aper và Anbar (2011).
Chính vì lí do này, tác giả xây dụng giả thuyết nghiên cứu số 3:
H3: tỷ lệ cho vay trên tổng tài sản có ảnh hưởng đến tỷ suất lợi nhuận ngân hàng.
4.2.4. Mối quan hệ giữa dự phịng rủi ro tín dụng trên tổng dư nợ với tỷ suất lợi nhuận
Dự phịng rủi ro tín dụng trên tổng dư nợ là một chỉ tiêu đại diện cho rủi ro tín dụng mà các ngân hàng thương mại phải đối mặt trong hoạt động kinh doanh. Các nghiên cứu cuả Sufian (2011), Alexio và Sofoklis (2009), Alper và Abbar (2011) đều cho thấy mối quan hệ nghịch biến giữa rủi ro tín dụng và lợi nhuận.
Từ những luận điểm trên, tác giả đặt giả thuyết nghiên cứu số 4:
H4: dự phịng rủi ro tín dụng trên tổng dư nợ có ảnh hưởng đến tỷ suất lợi nhuận ngân hàng.
4.2.5. Mối quan hệ giữa tăng trưởng GDP với tỷ suất lợi nhuận
Một nền kinh tế ổn định, tăng trưởng tốt thúc đẩy cho hoạt động kinh doanh của tất cả các chủ thể trong nền kinh tế thuận lợi và phát triển trong đó có ngân hàng
và ngược lại. Các nghiên cứu trước đó của (Albertazzi và Gambacorta, 2009; Athanasoglou & cộng sự, 2008; Bikker và Hu, 2002; Demirguc-Kunt và Huizinga, 1999) đều chứng minh cho điều này.
Vì vậy, tác giả thiết lập giả thuyết nghiên cứu cuối cùng như sau:
H5: Tăng trưởng GDP có ảnh hưởng đến tỷ suất lợi nhuận ngân hàng.
4.3. Phương pháp nghiên cứu
Tác giả dùng phương pháp nghiên cứu định lượng và sử dụng phần mềm stata để phân tích với các mục tiêu:
Thống kê mô tả: Tập hợp dữ liệu và phân tích tổng quan về dữ liệu thu thập
được như số lượng quan sát, giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất, giá trị lớn nhất của các biến.
Phân tích tương quan: Xác định mức độ tương quan giữa các biến trong mơ
hình hồi qui.
Phân tích hồi quy trên dữ liệu bảng: Thực hiện hồi quy tuyến tính theo
phương pháp bình qn tối thiểu (OLS). Sau đó, nghiên cứu sử dụng phương pháp bình quân tối thiểu tổng quát khả thi (FGLS) để khắc phục hiện tượng tự tương quan giữa các sai số và hiện tượng phương sai thay đổi nhằm đảm bảo ước lượng thu được vững và hiệu quả.
4.3.1. Phương pháp bình phương tối thiểu - OLS
Phương pháp bình phương tổi thiểu (OLS) là một thủ thuật toán học được sử dụng để ước lượng mối tương quan giữa các biến khác nhau.
Kiểu tương quan đơn giản nhất với giá trị thực tế là:
i i
i X e
Y 01
Trong đó:
Yi là biến phụ thuộc (biến được giải thích) Xi là biến độc lập (biến giải thích)
0
và
1
là các hằng số cần được ước lượng
ei là phần dư (chênh lệch giữa giá trị thực tế và biến phụ thuộc có được từ mơ hình).
Giá trị ước lượng được viết như sau:
i i X Y 0 1 Sai số: ei = Yi - i Y Vậy, ta phải tìm 0
, 1sao cho tổng bình phương sai số là nhỏ nhất. Tức là:
Các giả thuyết của OLS:
Giả thuyết 1: Mơ hình tuyến tính theo các tham số.
Giả thuyết 2: Các giá trị Xi cho trước và không ngẫu nhiên.
Giả thuyết 3: Các sai số Ui là đại lượng ngẫu nhiên có giá trị trung bình bằng
0.
E (Ui | Xi) = 0
Giả thuyết 4: Các sai số Ui là đại lượng ngẫu nhiên có phương sai khơng thay
đổi.
Var (Ui | Xi) = 2= const
Giả thuyết 5: Khơng có sự tương quan giữa các sai số Ui.
Cov (Ui, Uj | Xi, Xj) = 0, i ≠ j
Giả thuyết 6: Khơng có đa cộng tuyến một cách hoàn hảo giữa các biến X
trong mơ hình.
4.3.2. Kiểm định các giả thuyết hồi quy
+ Kiểm định khơng có sự tự tương quan giữa các biến độc lập trong mơ hình (khơng bị hiện tượng đa cộng tuyến)
Đa cộng tuyến là hiện tượng các biến độc lập trong mơ hình tương quan tuyến tính với nhau. Đa cộng tuyến nghiêm trọng sẽ làm các ước lượng khơng chính xác mặc dù hệ số R bình phương cao. Theo Hair và các cộng sự (2006), kiểm định giả thuyết không bị hiện tượng đa cộng tuyến bằng cách dùng chỉ tiêu VIF. Nếu VIF < 10 thì khơng có đa cộng tuyến một cách nghiêm trọng. Theo kinh nghiệm thì VIF < 5 là tốt nhất.
+ Kiểm định phương sai của sai số không đổi (không bị hiện tượng phương sai thay đổi)
Phương sai của sai số thay đổi sẽ làm cho các ước lượng thu được bằng phương pháp OLS vững nhưng không hiệu quả, các kiểm định hệ số hồi quy khơng cịn đáng tin cậy. Từ đó dẫn đến hiện tượng ngộ nhận các biến độc lập trong mơ hình nghiên cứu có ý nghĩa, lúc đó kiểm định hệ số hồi quy và R bình phương khơng dùng được. Bởi vì phương sai của sai số thay đổi làm mất tính hiệu quả của ước lượng, nên cần thiết phải tiến hành kiểm định giả thuyết phương sai của sai số không đổi bằng kiểm định White, với giả thuyết H0: Khơng có hiện tượng phương sai thay đổi.
+ Kiểm định giữa các sai số khơng có mối quan hệ tương quan với nhau (không bị hiện tượng tự tương quan)
Giữa các sai số có mối quan hệ tương quan với nhau sẽ làm cho các ước lượng thu được bằng phương pháp OLS vững nhưng không hiệu quả, các kiểm định hệ số hồi qui khơng cịn đáng tin cậy. Nghiên cứu sử dụng kiểm định Wooldridge cho hiện tượng tự tương quan trên dữ liệu bảng, với giả thuyết H0 : khơng có sự tự tương quan.
4.3.3. Phương pháp bình phương tối thiểu tổng quát khả thi (Feasible General Least Square – FGLS)
Phương pháp FGLS được sử dụng để khắc phục hiện tượng tự tương quan giữa các sai số và hiện tượng phương sai thay đổi nhằm đảm bảo ước lượng thu được vững và hiệu quả (theo Wooldridge (2002)).
Để đơn giản và khơng mất tính tổng phát, xét mơ hình một biến độc lập:
i i
i X U
Y 12 2
Giả thuyết của phương pháp bình phương bé nhất OLS yêu cầu phương sai sai số là đồng nhất.
2
) (Ui
Var (với mọi i), 2 là một hằng số dương cố định. Khi đó phương sai
sai số được gọi là không đổi, đồng đều hay thuần nhất.
Khi giả thuyết không được thỏa mãn, phương sai sai số ứng với quan sát i là những đại lượng không bằng nhau: Var(Ui)Var(Uj),(i j). Nếu đặt Var(Ui)i2
thì 2 2
j
i
. Khi đó, phương sai sai số được gọi là thay đổi, không đồng đều hay
không thuần nhất.
Nguyên nhân của phương sai thay đổi:
Hiện tượng phương sai thay đổi có thể bắt nguồn từ nhiều nguyên nhân sau: + Do bản chất của các hiện tượng kinh tế: Có nhiều hiện tượng kinh tế tự bản thân nó đã chứa đựng hiện tượng này. Ví dụ như quan hệ giữa thu nhập và tiết kiệm, khi thu nhập tăng thì biến động của tiết kiệm cũng tăng.
+ Mơ hình học tập – sai lầm: Điều này là do con người học được sai lầm trong quá khứ.
+ Kỹ thuật thu thập số liệu được cải tiến. Kĩ thuật thu thập số liệu càng cải tiến thì sai lầm phạm phải càng ít hơn.
+ Do xuất hiện các quan sát ngoại lai trong bộ dữ liệu. Các quan sát ngoại lai là các quan sát có khác biệt rất nhiều so với các quan sát khác như quá nhỏ hoặc quá lớn. Việc đưa vào hoặc loại bỏ các quan sát này đều ảnh hưởng rất lớn đến phân tích hồi quy.
+ Mơ hình bị định dạng sai: Có thể do bị sót biến quan trọng hoặc định dạng hàm bị sai.
4.4. Thống kê mô tả dữ liệu nghiên cứu
4.4.1. Thu thập và xử lý dữ liệu nghiên cứu 4.4.1.1. Nguồn số liệu 4.4.1.1. Nguồn số liệu
Dữ liệu được thu thập từ báo cáo tài chính của tám NHTM niêm yết trên TTCK Việt Nam trong giai đoạn 2007-2014. Các biến được thu thập và tính theo cơng thức trong bảng 4.1 trên excel. Các dữ liệu được sắp xếp theo dữ liệu kiểu bảng để thể hiện được mối quan hệ giữa các đối tượng theo thời gian.
Cuối cùng tác giả sử dụng phần mềm Stata 12.0 để cho ra các kết quả nghiên cứu.
4.4.1.2. Phương pháp thu thập dữ liệu
Hiện nay, các bài nghiên cứu trên thế giới phổ biến với ba loại dữ liệu: dữ liệu chuỗi thời gian (time series data), dữ liệu chéo (cross sectional data) và dữ liệu bảng (panel data). Mỗi loại dữ liệu được thiết kế riêng cho từng mục đích và điều kiện nghiên cứu.
Dữ liệu chuỗi thời gian: thể hiện thông tin về một đối tượng trong một khoảng
thời gian dài. Nghiên cứu loại dữ liệu này có thể thấy được sự thay đổi của đối tượng trong thời gian nghiên cứu, từ đó dự báo xu hướng dài hạn của đối tượng đó trong tương lai.
Dữ liệu chéo: thể hiện thông tin về nhiều đối tượng vào một thời điểm nhất
định.
Ưu điểm của dữ liệu chéo:
+ Việc thu thập dữ liệu được thực hiện nhanh chóng vì loại bỏ được yếu tố thời gian.
+ Dữ liệu chéo có chi phí thu thập thấp hơn dữ liệu theo thời gian. Nhược điểm của dữ liệu chéo:
+ Dữ liệu chéo thiếu phân tích chi tiết như dữ liệu chuỗi thời gian. Vì loại dữ liệu này cho chúng ta thấy sự khác nhau giữa các chủ thể nghiên cứu nhưng không cho ta thấy dữ liệu qua một thời kỳ nghiên cứu.
+ Dữ liệu chéo không so sánh quá khứ với tương lai, nên làm giảm hiệu lực của kết luận nghiên cứu.
Dữ liệu bảng: là sự kết hợp của dữ liệu chéo và dữ liệu chuỗi thời gian. Dữ
liệu bảng thể hiện thông tin về một nhóm đối tượng nghiên cứu theo thời gian. Ưu điểm của dữ liệu bảng:
+ Thể hiện sự thay đổi của từng biến qua thời gian. + Thiết lập trật tự thời gian của các biến.
+ Thể hiện được mối quan hệ giữa các đối tượng theo thời gian.
Nhược điểm của dữ liệu bảng: Khó thu thập được cùng nhóm đối tượng theo thời gian.
Ngành ngân hàng Việt Nam có lịch sử phát triển khá non trẻ trong điều kiện các qui định cơng khai về tài chính chưa được nghiêm ngặt nên có khá nhiều các ngân hàng không công bố đầy đủ số liệu của mình trong suốt quá trình hoạt động. Đặc điểm này gây nhiều khó khăn cho các bài nghiên cứu về ngân hàng. Trong điều kiện như vậy, tác giả chọn cách thu thập số liệu theo dữ liệu bảng để đảm bảo số lượng đối tượng thu thập được nhiều nhất.
4.4.2. Thống kê mô tả dữ liệu nghiên cứu
Phần mềm Stata cho kết quả thống kê mô tả bộ dữ liệu nghiên cứu như trên bảng 4.2.
Trong đó, mỗi biến đều có số lượng quan sát là 64. Giá trị trung bình của các biến được thể hiện trong cột Mean. Theo đó giá trị trung bình của ROA và ROE lần lượt là 1.27% và 15.44% (tương tự cho các biến khác). Cột Std. Dev thể hiện độ lệch chuẩn của các biến. Hai biến ROA và PROVILOAN có mức độ phân tán thấp khi độ lệch chuẩn chỉ dưới 1%. Các biến TCTR và LOANTA lại có mức độ phân tán cao. Điều này thể hiện sự khơng đồng đều về tỷ lệ chi phí trên doanh thu và dư nợ trên
tổng tài sản giữa các ngân hàng. Cột Min và Max lần lượt thể hiện giá trị nhỏ nhất và lớn nhất trong bộ dữ liệu. Ngân hàng có ROA thấp nhất là SHB vào năm 2012 với 0.03%, cao nhất là STB vào năm 2007 với 3.13%. Tương tự, ngân hàng có ROE thấp nhất là SHB vào năm 2012 với 0.34% và cao nhất là ACB vào năm 2007 với 44.49%.
Bảng 4.2. Thống kê mô tả dữ liệu nghiên cứu
Variable Obs Mean Std. Dev. Min Max
ROA 64 .0126844 .0059644 .0003 .0313 ROE 64 .15445 .0743121 .0034 .4449 TCTR 64 .4364328 .1190073 .2664 .7858 LOANTA 64 .5425781 .1085946 .3308 .7244 ETA 64 .0870703 .0384501 .0426 .2662 PROVILOAN 64 .0146531 .0073533 .0019 .0378 GDP 64 .0614875 .0102856 .0503 .0846
Nguồn: Kết quả chạy hồi quy từ phần mềm Stata.
4.5. Kết quả nghiên cứu
4.5.1. Mơ hình 1: Hồi quy với ROA 4.5.1.1. Phân tích tương quan 4.5.1.1. Phân tích tương quan
Dựa vào bảng phân tích tương quan trên bảng 4.3 ta thấy:
+ Các biến độc lập TCTRit, LOANTAit, PROVILOANit tác động ngược chiều đến ROAit.
+ Các biến độc lập còn lại tác động cùng chiều đến ROAit.
+ Khơng có hiện tượng đa cộng tuyến nghiêm trọng (tự tương quan giữa các biến độc lập trong mơ hình) do các hệ số tương quan có giá trị khá thấp (cao nhất là 0.4178, chuẩn so sánh theo Farrar & Glauber (1967) là 0.8).
Kết quả tương quan trên phù hợp với hầu hết các nghiên cứu trước trên thế giới và phù hợp với kỳ vọng của tác giả trong giai đoạn nghiên cứu này tại Việt Nam ngoại trừ biến LOANTAit.
Bảng 4.3. Tương quan giữa các biến trong mơ hình phân tích 1
Variable ROA TCTR LOANTA ETA PROVILOAN GDP
ROA 1.0000 TCTR -0.6891 1.0000 LOANTA -0.5139 0.4057 1.0000 ETA 0.3932 -0.2389 -0.2759 1.0000 PROVILOAN -0.3286 -0.0331 0.2716 -0.3106 1.0000 GDP 0.4151 -0.4178 -0.2225 0.1830 -0.1665 1.0000
Nguồn: Kết quả chạy hồi quy từ phần mềm Stata.
4.5.1.2. Kết quả hồi qui OLS với ROA
Bảng 4.4. Kết quả hồi quy OLS với biến ROA
Các biến Hệ số hồi quy Giá trị t Mức ý nghĩa
TCTR -.0286037 -5.91 0.000 LOANTA -.0089929 -1.79 0.078 ETA .01847 1.38 0.174 PROVILOAN -.2055111 -2.88 0.006 GDP .0441909 0.86 0.393 _cons .0287333 5.42 0.000 R2 điều chỉnh = 60.8%
Kết quả chạy hồi quy các biến độc lập với biến phụ thuộc là ROA được thể hiện trong bảng 4.4. Theo đó, ở mức ý nghĩa 10% có ba biến tác động có ý nghĩa đến ROA đó là tỷ lệ chi phí trên doanh thu, tỷ lệ dư nợ trên tổng tài sản và tỷ lệ dự phòng rủi ro tín dụng trên tổng dư nợ. Hai biến vốn chủ sở hữu trên tổng tài sản và GDP tác động khơng có ý nghĩa thống kê lên ROAit.
Hệ số R2 điều chỉnh tương đối cao và bằng 60.8% cho thấy trong điều kiện các
yếu tố khác khơng đổi thì các biến độc lập có trong mơ hình giải thích được 60.8% sự biến thiên về mặt trung bình của ROA. Đây là kết quả tương đối tốt. Tuy nhiên ta cần kiểm định lại mơ hình hồi quy để xem các kết quả thu được có tuyến tính, ko chệch và hiệu quả hay khơng.
4.5.1.3. Kiểm định các giả thuyết hồi quy
+ Đa cộng tuyến:
Hệ số VIF của tất cả các biến độc lập đều nhỏ hơn 5 (theo bảng 4.5) nên hiện tượng đa cộng tuyến được đánh giá là khơng nghiêm trọng hay khơng có hiện tượng đa cộng tuyến hồn hảo trong mơ hình hồi qui OLS.
Bảng 4.5. Hệ số VIF của mơ hình 1
Variable VIF 1/VIF
TCTR 1.50 0.667752 LOANTA 1.34 0.744808 GDP 1.26 0.792110 PROVILOAN 1.24 0.803737 ETA 1.20 0.830254 Mean VIF 1.31
+ Phương sai của sai số không đổi:
Để kiểm định hiện tượng phương sai sai số không đổi ta sử dụng kiểm định White. Với mức ý nghĩa alpha = 5%, kiểm định White cho kết quả là: Prob = 0.0113 (Bảng 4.6). Do, Prob < 5% nên ta bác bỏ giả thuyết H0 hay có hiện tượng phương sai thay đổi.
Bảng 4.6. Kiểm định White của mơ hình 1
White’s test for Ho: Homoskedasticity
against Ha: unrestricted heteroskedasticity
Chi2 (20) = 37.14
Prob > chi2 = 0.0113
Nguồn: Kết quả chạy hồi quy từ phần mềm Stata.
+ Kiểm định hiện tượng tự tương quan:
Sử dụng kiểm định Wooldridge cho kết quả là: Prob = 0.2029. Với mức ý nghĩa alpha = 10% do Prob > 10% nên chấp nhận giả thuyết H0 hay khơng có sự tự tương quan (Bảng 4.7).
Bảng 4.7. Kiểm định Wooldridge của mơ hình 1.
Wooldridge test for autocorrelation in panel data H0: no first order autocorrelation
F (1, 7) = 1.973
Prob > F = 0.2029
Nguồn: Kết quả chạy hồi quy từ phần mềm Stata.