Theo Park (2011), đối với dữ liệu bảng, có 03 mô hình ƣớc lƣợng theo dạng hồi quy tuyến tính nhƣ sau:
- Mô hình hệ số không thay đổi (Pooled OLS): mô hình này có các hệ số không biến đổi. Trong bối cảnh không tồn tại những hiệu ứng đặc thù theo không gian hay thời gian, thì có thể gộp chung toàn bộ số liệu chéo và chuỗi thời gian rồi chạy mô hình hồi quy bằng phƣơng pháp bình phƣơng nhỏ nhất thông thƣờng (OLS) hay còn đƣợc gọi là mô hình hồi quy gộp (Pooled OLS). Mô hình có dạng nhƣ sau:
Yit = β1 + β2 X2it + β3 X3it +…+ βk Xkit + uit (3.2)
Tuy nhiên, trên thực tế việc đồng nhất hiệu ứng đặc thù theo không gian và thời gian là điều không thể. Vì mỗi không gian sẽ có đặc thù riêng và có thể thay đổi theo thời gian. Vì vậy, trong mô hình Pooled OLS rất dễ vi phạm các giả định về mô hình hồi quy cổ điển nhƣ tự tƣơng quan, phƣơng sai thay đổi và đa cộng tuyến.
- Mô hình hiệu ứng cố định (FEM): mô hình này có tung độ gốc biến đổi theo đơn vị không gian (không đổi theo thời gian). Vì vậy, ngƣời ta thƣờng dùng biến giả để thay thế cho các biến bị bỏ qua, nhằm nắm bắt những đặc điểm riêng biệt theo không gian của các quan sát, nên mô hình này còn đƣợc gọi là mô hình biến giả bình phƣơng nhỏ nhất (LSDV). Mô hình hiệu ứng cố định (FEM) có dạng sau:
Trong đó, tung độ gốc βi là giá trị trung bình của tất cả các tung độ gốc theo đơn vị không gian và uit là hạng sai số theo không gian và chuỗi thời gian kết hợp.
Với mô hình FEM, do đƣa vào nhiều biến giả sẽ làm giảm số bậc tự do; và có khả năng xảy ra đa cộng tuyến. Mô hình FEM lại không đo lƣờng những yếu tố không đổi theo thời gian nhƣ giới tính, màu da, ...
- Mô hình hiệu ứng ngẫu nhiên (REM): mô hình này với tung độ gốc ngẫu nhiên. Kết quả ngẫu nhiên này là tổng của một giá trị trung bình là β1 và sai số ngẫu nhiên đặc trƣng cho từng đơn vị không gian là εi. Mô hình hiệu ứng ngẫu nhiên (REM) có dạng sau:
Yit = β1 + εi + β2 X2it + β3 X3it +…+ βk Xkit + uit (với wit = εi + uit là sai số kết hợp) (3.4). Mô hình hiệu ứng ngẫu nhiên (REM) đƣợc viết lại nhƣ sau:
Yit = β1 + β2 X2it + β3 X3it +…+ βk Xkit + wit (3.5)
Với 2 mô hình hiệu ứng cố định (FEM) và hiệu ứng ngẫu nhiên (REM), cần lựa chọn mô hình tốt hơn phù hopự với dữ liệu nghiên cứu. Theo Park (2011), việc lựa chọn mô hình REM hay FEM có thể dựa trên T (số thời đoạn của dữ liệu thời gian) và N (số đơn vị theo không gian) nhƣ sau:
(i) Nếu sai số ngẫu nhiên εi và một hay nhiều biến X tƣơng quan nhau thì mô hình FEM phù hợp.
(ii)Nếu T lớn, N nhỏ, các giá trị ƣớc lƣợng của hai mô hình có thể không khác nhau. Vì thế, việc chọn lựa ở đây dựa vào sự thuận tiện trong tính toán.
(iii)Khi N lớn, T nhỏ, các giá trị ƣớc lƣợng thu đƣợc khác nhau đáng kể. Trong trƣờng hợp này FEM là phù hợp.
(iv) Nếu N nhỏ và T nhỏ, và các điều kiện trong REM thoả thì ƣớc lƣợng REM sẽ hiệu quả hơn FEM.
Ngoài việc sử dụng các tiên nghiệm nêu trên, kiểm định Hausman có thể lựa chọn giữa hai mô hình FEM và REM.
3.1.2 Các bước lựa chọn mô hình dữ liệu bảng
Theo Park (2011), các thủ tục tiến hành cần thiết để lựa chọn mô hình đối với dữ liệu bảng đƣợc thực hiện nhƣ sau:
Bƣớc 1: Gộp toàn bộ dữ liệu và chạy hồi quy mô hình Pooled OLS, sau đó kiểm định các giả định của mô hình hồi quy cổ điển.
Bƣớc 2: Chạy hồi quy mô hình FEM và REM sau đó thực hiện kiểm định Hausman để lựa chọn giữa mô hình FEM và REM. Nếu kết quả kiểm định bác bỏ giả thuyết H0 có nghĩa là mô hình FEM phù hợp và chuyển sang bƣớc 3. Ngƣợc lại, chuyển sang bƣớc 4.
Bƣớc 3: Thực hiện kiểm định F để lựa chọn giữa mô hình FEM và Pooled OLS. Nếu kết quả kiểm định F bác bỏ giả thuyết H0 có nghĩa mô hình FEM phù hợp và tiếp tục thực hiện các kiểm định phƣơng sai thay đổi, tự tƣơng quan, đa cộng tuyến cho mô hình. Ngƣợc lại, chuyển sang bƣớc 5.
Bƣớc 4: Thực hiện kiểm định LM để lựa chọn giữa mô hình REM và Pooled OLS. Nếu kết quả kiểm định LM bác bỏ giả thuyết H0 có nghĩa là mô hình REM phù hợp và tiếp tục thực hiện các kiểm định phƣơng sai thay đổi, tự tƣơng quan, đa cộng tuyến cho mô hình. Ngƣợc lại, chuyển sang bƣớc 5.
Bƣớc 5: Thực hiện kiểm định Chow. Nếu kết quả kiểm định Chow chấp nhận giả thuyết H0 có nghĩa là, mô hình Pooled OLS phù hợp. Ngƣợc lại, sử dụng mô hình hệ số ngẫu nhiên.
Đề tài nghiên cứu sẽ cố gắng trình bày theo đúng các bƣớc và thực hiện các kiểm định nhằm tìm ra mô hình phù hợp cho nghiên cứu. Với ba mô hình đề xuất trên Pooled OLS, FEM và REM, nghiên cứu sẽ tóm tắt một số kiểm định nhằm lựa chọn mô hình phù hợp là kiểm định Hausaman, F, LM và Chow:
- Kiểm định Hausman: là kiểm định nhằm lựa chọn mô hình FEM hay REM phù hợp cho hồi quy dữ liệu bảng, dựa trên giả định H0 không có sự tƣơng quan giữa biến giải thích và các sai số ngẫu nhiên εi vì tƣơng quan là nguyên nhân tạo nên sự khác biệt giữa FEM và REM.
H0: Không có tƣơng giữa biến giải thích và các sai số ngẫu nhiên (chọn mô hình REM).
H1: Có tƣơng quan giữa biến giải thích và các sai số ngẫu nhiên (chọn mô hình FEM).
Nếu P-value < 0.05, thì bác bỏ giả thiết H0 hay chọn mô hình FEM và ngƣợc lại thì chọn mô hình REM.
- Kiểm định LM của Breusch – Pagan: là kiểm định nhằm lựa chọn mô hình REM hay Pooled OLS, dựa trên giả định phƣơng sai của các sai số ngẫu nhiên εi bằng 0.
H0: Phƣơng sai các sai số ngẫu nhiên εi bằng 0 (chọn mô hình Pooled OLS).
H1: Phƣơng sai các sai số ngẫu nhiên εi khác 0 (chọn mô hình REM).
Nếu P-value < 0.05, thì bác bỏ giả thiết H0 hay chọn mô hình REM và ngƣợc lại thì chọn mô hình Pooled OLS.
- Kiểm định F: là một kiểm định nhằm lựa chọn mô hình FEM hay Pooled OLS, dựa trên giả định không có sự khác biệt giữa tung độ gốc theo đơn vị không gian. Kiểm định này đƣợc Stata 11 hỗ trợ khi sử dụng nhóm lệnh “xt”.
H0: Tung độ gốc theo các đơn vị không gian bằng 0 (chọn mô hình Pooled
OLS).
H1: Có sự khác biệt của các tung độ gốc theo đơn vị không gian (chọn mô hình FEM).
Nếu P-value < 0.05, thì bác bỏ giả thiết H0 hay chọn mô hình FEM và ngƣợc lại thì chọn mô hình Pooled OLS.
- Kiểm định Chow: là một kiểm tra đối với hệ số độ dốc của dữ liệu bảng dựa trên giả định không có sự khác biệt giữa các hệ số độ dốc theo đơn vị không gian. Kiểm định này đƣợc Stata 11 hỗ trợ khi sử dụng nhóm lệnh “xt”
H0: Hệ số độ dốc theo các đơn vị không gian bằng nhau (phù hợp với mô hình Pooled OLS).
H1: Có sự khác biệt của các hệ số độ dốc theo đơn vị không gian.
Nếu P-value < 0.05, thì bác bỏ giả thiết H0 hay có thể chọn mô hình hệ số ngẫu nhiên. Ngƣợc lại, phù hợp với mô hình Pooled OLS.
3.2 Xây dựng mô hình nghiên cứu
3.2.1 Điều kiện của dữ liệu thu thập và biến lựa chọn trong mô hình nghiên cứu nghiên cứu
Việc lựa chọn các biến và dữ liệu sử dụng trong mô hình phải đáp ứng đƣợc các yêu cầu sau:
Thứ nhất, số liệu đƣợc lựa chọn là số liệu đƣợc công bố trên báo cáo tài chính hợp nhất đã đƣợc kiểm toán hoặc báo cáo thƣờng niên hàng năm của các NHTMCP. Các thông tin khác liên quan đến các nền kinh tế phải đƣợc công bố trong các báo cáo kinh tế - xã hội hàng năm của Chính Phủ.
Thứ hai, các biến trong mô hình phải có đầy đủ dữ liệu trong giai đoạn 2005-2014, ngoài ra dữ liệu của các biến không có tƣơng quan chặt với nhau (hệ số tƣơng quan r > 0.6).
Thứ ba, mô hình hồi quy và các biến đƣợc lựa chọn phải là mô hình bao gồm các biến đã đƣợc các nhà kinh tế khác nghiên cứu và công bố trong các bài báo cáo trƣớc đây.
3.2.2 Lựa chọn biến phụ thuộc
Trong các mô hình nghiên cứu đã đƣợc trình bày tại chƣơng 1, các biến phụ thuộc đã đƣợc sử dụng bao gồm: NIM (Ongore, Balachandher); ROA (Ongore, Balachandher, Haizinga, Flamirini, Wo); ROE (Roman, Ongore, Nguyễn Văn Hùng). Trong 3 biến phụ thuộc thƣờng đƣợc sử dụng, biến NIM chỉ phản ánh lợi nhuận đạt đƣợc từ hoạt động cấp tín dụng, ROE phản ánh lợi nhuận đạt đƣợc so với vốn chủ sở hữu, do đó sẽ bị ảnh hƣởng nhiều đến tỷ lệ đòn bẩy tài chính. Với mục tiêu của đề tài hƣớng đến là đánh giá lợi nhuận một cách tổng quát trong hoạt động của các ngân hàng. Do đó tác giả lựa chọn ROA làm biến phụ thuộc.
3.2.3 Lựa chọn biến độc lập
Thứ nhất, về các biến vĩ mô. Các biến vĩ mô đƣợc đƣa vào mô hình nhằm kiểm soát các yếu tố tác động đến lợi nhuận của ngân hàng thƣơng mại. Dựa vào các biến vĩ mô có thể tác động đến lợi nhuận đã đƣợc trình bày tại chƣơng 2, trong luận văn này, tác giả sử dụng các biến: Tốc độ tăng trƣởng kinh tế (%), tỷ lệ lạm phát hàng năm (%). Với dữ liệu của chính sách tiền tệ (tốc độ tăng trƣởng cung tiền tệ M2) và chính sách tài khóa (tốc độ tăng trƣởng trong chi ngân sách Nhà nƣớc). Kết quả phân tích hệ số tƣơng quan cho thấy: Chính sách tài khóa có tƣơng quan chặt với tỷ lệ lạm phát (r = 0,77); Đồng thời, Chính sách tiền tệ có tƣơng quan chặt với tốc độ tăng trƣởng kinh tế (r = 0,665). Do đó, biến dữ liệu thể hiện chính sách tiền tệ và chính sách tài khóa không đƣợc đƣa vào mô hình.
Qua phân tích trên cho thấy, việc chỉ đƣa hai biến thể hiện tỷ lệ lạm phát (INF) và tốc độ tăng trƣởng kinh tế (GDP) là phù hợp.
Thứ hai, về các biến vi mô, yêu cầu của việc lựa chọn các biến này là phải thể hiện đầy đủ các nhóm tính chất đã đƣợc trình bày tại bảng 2.3. Các biến số về chi phí, thu nhập sẽ không đƣợc đƣa vào mô hình vì đây là yếu tố tác động trực tiếp đến lợi nhuận: Một sự gia tăng trong chi phí (thu nhập) sẽ làm giảm (tăng) mức lợi nhuận đạt đƣợc và ngƣợc lại. Vì vậy, các biến số thể hiện tính chất thu nhập hoặc chi phí sẽ không đƣợc sử dụng trong mô hình. Ngoài ra, các nhóm tính chất chỉ có một biến giải thích là: ảnh hƣởng của việc đầu tƣ góp vốn dài hạn đến lợi nhuận (tỷ lệ đầu tƣ, góp vốn dài hạn/ TTS), Chất lƣợng tín dụng (tỷ lệ nợ xấu) nên các biến tỷ lệ đầu tƣ, góp vốn dài hạn/TTS (INTA), tỷ lệ nợ xấu (NPL) đƣợc đƣa vào mô hình. Phần dƣới đây trình bày lý do chọn lựa các biến còn lại trong mô hình nghiên cứu.
- Nhóm biến về quy mô ngân hàng. Theo lý thuyết về ảnh hƣởng của quy mô đến hoạt động của doanh nghiệp (Mankiw 1996, Rose 1999), các tác giả thƣờng đề cập đến quy mô TTS. Do đó, tác giả đã lựa chọn TTS của ngân hàng làm biến số phản ảnh quy mô ngân hàng trong mô hình nghiên cứu.
- Cơ cấu nguồn vốn. Theo bảng 2.3, có hai cách đo lƣờng cơ cấu nguồn vốn là vốn chủ sở hữu so với tổng tài sản và tiền gửi so với tổng tài sản (ETA). Trong đó, tỷ lệ tiền gửi so với tổng tài sản phản ảnh vốn huy động và các khoản chiếm dụng đƣợc trong tổng tài sản. Ngƣợc lại, ETA phản ánh đƣợc tấm đệm “vốn tự có” của NH. Với mục tiêu phản ánh cơ cấu nguồn vốn, đồng thời thể hiện khả năng tự chủ tài chính của ngân hàng nên tác giả lựa chọn biến số ETA để đƣa vào mô hình.
- Khả năng thanh khoản. Theo bảng 2.3, các biến thể hiện tính thanh khoản bao gồm L2, cho vay trên tổng tài sản hoặc tổng vốn huy động. Mặc dù L2 là đo lƣờng khả năng thanh khoản của ngân hàng một cách trực tiếp. Tuy nhiên, sự sẵn có về mặt số liệu của biến số này là hạn chế. Đồng thời, tỷ lệ cho vay so với vốn huy động chƣa phản ánh đầy đủ về khả năng thanh khoản của ngân hàng vì tỷ lệ này cao nhƣng nhà quản lý có thể sử dụng các nguồn vốn khác để dự trữ thanh
khoản. Vì vậy, tác giả lựa chọn biến tỷ lệ cho vay so với tổng tài sản vào mô hình.
- Tốc độ mở rộng hoạt động. Do cấp tín dụng là hoạt động chủ yếu mang lại nguồn thu nhập cho NHTMCP. Vì vậy, chính sách tín dụng rất đƣợc các nhà quản trị ngân hàng quan tâm. Với mục tiêu phân tích các yếu tố tác động đến lợi nhuận NHTMCP, trong đó những yếu tố liên quan đến hoạt động tín dụng đƣợc nhấn mạnh nhằm đƣa ra các chính sách có liên quan đến hoạt động cấp tín dụng của NHTMCP. Vì vậy, trong các biến giải thích về tính chất mở rộng hoạt động, tác giả lựa chọn biến về tốc độ tăng trƣởng trong hoạt động cho vay để đƣa vào mô hình.
Bảng 3.1 trình bày lại các biến đƣợc sử dụng và dấu kì vọng của chúng trong mô hình nghiên cứu.
Bảng 3.1 Các biến độc lập đƣợc sử dụng trong luận văn
STT Tên biến Cách xác định Ký hiệu
Kỳ vọng dấu tác
động
1 Khả năng tự chủ tài chính Vốn CSH/Tổng tài sản ETA +/-
2 Tỷ lệ cho vay Cho vay/ Tổng tài sản LOANTA +
3 Tốc độ mở rộng quy mô hoạt
động (Dƣ nợt – Dƣ nợt-1)/ Dƣ nợ t-1 LOANGR +/-
4 Tỷ lệ nợ xấu Nợ xấu/ Tổng dƣ nợ NPL -
5 Tỷ lệ góp vốn, đầu tƣ dài hạn Giá trị góp vốn, đầu tƣ dài
hạn/ Tổng tài sản INTA +/-
6 Quy mô tổng tài sản Logarit tổng tài sản LnSIZE +/- 7 Tốc độ tăng trƣởng kinh tế (GDP t –GDP t-1)/ GDP t-1 GDP +
8 Tỷ lệ lạm phát Tỷ lệ lạm phát INF +/-
3.2.4 Dạng của mô hình hồi quy
Trong giới hạn của đề tài, tác giả xây dựng mô hình hồi quy nhằm xác định các yếu tố ảnh hƣởng đến lợi nhuận của các NHTMCP Việt Nam giai đoạn 2005-2014. Các số liệu đƣợc lấy từ BCTC hợp nhất đã đƣợc kiểm toán của các ngân hàng, số quan sát nghiên cứu là 250, mức ý nghĩa đƣợc lựa chọn là 5%. Dựa vào dạng mô hình hồi quy của các nghiên cứu trƣớc, mô hình hồi quy có dạng tuyến tính nhƣ sau:
ROA = c +β1(ETA) +β2 (LOANTA) +β3(LOANGR) +β4(NPL) + β5(INTA) + β6(LnSIZE) + β7(GDP) + β8(INF) + Ui.
KẾT LUẬN CHƢƠNG 3
Dựa trên các nghiên cứu thực nghiệm trƣớc đây đã đƣợc đề cập tại chƣơng 2 và tình hình dữ liệu thu thập đƣợc tại Việt Nam. Trong mô hình đƣợc xây dựng trong đề tài này, tác giả sử dụng biến phụ thuộc là ROA, biến độc lập gồm 8 biến: Tỷ lệ VCSH/ TTS (ETA), tỷ lệ cho vay/ tổng tài sản (LOANTA), tốc độ tăng trƣởng cho vay (LOANGR), tỷ lệ nợ xấu (NPL), tỷ lệ góp vốn đầu tƣ dài hạn/ TTS (INTA), tổng tài sản (LnSIZE), tốc độ tăng trƣởng kinh tế (GDP) và tỷ lệ lạm phát (INF). Mô hình hồi quy có dạng tyến tính và đƣợc thực hiện theo phƣơng pháp OLS.
Trong chƣơng 4, tác giả trình bày những kết quả phân tích định tính và định lƣợng theo phƣơng pháp nghiên cứu đã đƣợc trình bày trong chƣơng 3.
CHƢƠNG 4: PHÂN TÍCH DỮ LIỆU VÀ KẾT QUẢ NGHIÊN CỨU
Nội dung chương 4 gồm hai phần, phần thứ nhất trình bày các kết quả nghiên cứu theo phương pháp định tính về lợi nhuận của các NHTMCP trong giai đoạn 2005-2014. Phần thứ hai lần lượt trình bày các kết quả nghiên cứu theo phương pháp định lượng nhằm xác định các yếu tố tác động đến lợi nhuận của NHTMCP.
4.1Thực trạng lợi nhuận của Ngân hàng thƣơng mại cổ phần Việt Nam giai đoạn 2005-2014 giai đoạn 2005-2014
4.1.1 Phân tích bối cảnh nền kinh tế Việt Nam giai đoạn 2005-2014