Dữ liệu của luận văn thuộc dạng dữ liệu bảng bao gồm 17 ngân hàng thương mại tại Việt Nam trong giai đoạn từ năm 2010 đến năm 2019 (từ năm 2010 dữ liệu cho toàn bộ các ngân hàng thương mại được lựa chọn trong nghiên cứu mới đầy đủ và dữ liệu cập nhật mới nhất đến năm 2019). Bộ dữ liệu của 17 ngân hàng thương mại tại Việt Nam trong giai đoạn 2010-2019 được thu thập từ nguồn báo cáo tài chính ngân hàng thương mại, dữ liệu về các yếu tố kinh tế vĩ mô được tác giả thu thập từ ngân hàng Thế giới (World Bank). Danh sách 17 ngân hàng thương mại bao gồm các ngân hàng: ACB, Bắc Á, BIDV, Vietinbank, Eximbank, Hdbank, Kiên Long, Liên Việt, Quân Đội, Quốc Dân, SHB, Sacombank, Techcombank, Tiên Phong, Vietcombank, VIB, Vpbank.
Dữ liệu của luận văn được tập hợp theo dạng dữ liệu bảng (panel data) nhằm tiến hành phân tích các mối quan hệ theo đơn vị chéo là các ngân hàng thương mại và đơn vị thời gian là qua các năm trong giai đoạn 2010-2019. Dữ liệu bảng là một dạng dữ liệu được sử dụng phổ biến trong các nghiên cứu thực nghiệm, trong cả kinh tế vi mô, nghiên cứu về hộ gia đình, doanh nghiệp và đặc biệt trong nghiên cứu kinh tế vĩ mô, khi nghiên cứu về các quốc gia, các tỉnh thành.... Dữ liệu bảng là sự kết hợp cả dữ
liệu đơn vị chéo và dữ liệu theo chuỗi thời gian, việc kết hợp này mang lại nhiều uu điểm trong phân tích các mối quan hệ kinh tế, đặc biệt khi muốn phân tích sự biến động của các đối tuợng nghiên cứu theo thời gian cũng nhu phân tích sự khác biệt giữa các giữa các nhóm đối tuợng nghiên cứu.
Trong các mô hình nghiên cứu của luận văn, để đảm bảo độ chính xác của kết quả uớc luợng thì tác giả sử dụng dữ liệu bảng cho các ngân hàng thuơng mại theo chuỗi thời gian với tần suất là năm. Luận văn sử dụng dữ liệu bảng vì dữ liệu bảng có các uu điểm sau đây: dữ liệu bảng liên quan đến các đối tuợng (ngân hàng, doanh nghiệp, quốc gia...) theo thời gian, nên nhất định phải có đặc điểm riêng (không đồng nhất) trong các đơn vị này. Kỹ thuật uớc luợng dữ liệu bảng có xem xét những đặc điểm riêng này bằng cách xem xét các biến số có tính đặc thù theo từng đối tuợng. Dữ liệu bảng có thể phát hiện và đo luờng một cách tốt hơn sự tác động không thể quan sát đuợc theo dữ liệu chỉ theo thời gian hoặc chỉ theo không gian thuần túy, tránh đuợc phần nào bỏ xót các biến số có ý nghĩa trong mô hình, giúp phát hiện đuợc sự khác biệt giữa các đối tuợng khác nhau, thời gian khác nhau. Bằng việc kết hợp những chuỗi quan sát theo thời gian và không gian, số quan sát tăng lên rõ rệt, do đó dữ liệu cung cấp nhiều thông tin hơn, đa dạng hơn, dữ liệu bảng hạn chế đuợc hiện tuợng đa cộng tuyến giữa các biến độc lập, bậc tự do đuợc tăng thêm và hiệu quả hơn. Dữ liệu bảng có thể làm phong phú các phân tích thực nghiệm theo những phuơng pháp mà có thể không đạt đuợc đối với dữ liệu chuỗi thời gian hoặc dữ liệu không gian thuần túy.
Qua những lợi thế trên, việc sử dụng dữ liệu bảng trong các mô hình nghiên cứu của luận văn đuợc kỳ vọng có thể mang lại kết quả uớc luợng đảm bảo đuợc các tính vững, tính hiệu quả và tính không chệch. Luận văn sẽ có nhiều góc nhìn phong phú hơn so với việc phân tích dữ liệu chéo hay dữ liệu chuỗi thời gian.
3.1.2 Phương pháp ước lượng dữ liệu bảng
Sau khi tiếp cận các nghiên cứu thực nghiệm truớc đây để xây dựng mô hình nghiên cứu và thu thập dữ liệu, với bộ dữ liệu nghiên cứu thuộc dữ liệu bảng thì tác giả
sẽ trình bày lý thuyết phân tích định lượng về các phương pháp ước lượng cho dữ liệu bảng được sử dụng trong luận văn. Đầu tiên, phương pháp ước lượng cho mô hình Pooled OLS, FEM và REM được sử dụng cho luận văn này. Sự khác biệt giữa 3 mô hình này được trình bày như sau:
❖Mô hình hồi quy gộp (Pooled OLS Model)
Khi các đối tượng là đồng nhất, không tồn tại có sự khác biệt về đặc điểm riêng giữa các đối tượng (Zi = 0), hoặc đặc điểm riêng không tác động đến biến phụ thuộc Yit
thì có thể dùng ước lượng OLS để hồi quy dữ liệu bảng. Mô hình Pooled OLS có dạng:
Yit = β1 + β2x2it ■■' βkxki +
uit
❖Mô hình hồi quy tác động cố định (FEM-Fixed Effects Model)
Khi các đối tượng là không đồng nhất, có tồn tại sự khác biệt về đặc điểm riêng giữa các đối tượng (Zi ≠ 0), đặc điểm riêng Zi có tác động đến biến phụ thuộc Yit và có tương quan với các biến độc lập Xit. Vì vậy, biến Zi sẽ phải đưa vào mô hình, nếu đưa Zi vào sai số Uit thì mô hình sẽ bị nội sinh do biến độc lập có tương quan với sai số. Biến Zi đưa vào mô hình nằm trong thành phần của hằng số, biến Zi được xem như là một tham số của mô hình. Mô hình hồi quy tác động cố định có dạng là: Yit = β1 Xit1 + β2 Xit2 + Zi + Uit . Vì biến Zi có tương quan với các biến độc lập Xit cho nên mô hình bị đa cộng tuyến vì vậy không thể dùng phương pháp OLS để ước lượng. Có 3 phương pháp ước lượng mô hình tác động cố định (FEM): hồi quy với biến giả (LSDV), hồi quy trong cùng nhóm (within regression) và hồi quy sai phân (difference regression).
❖Hồi quy với biến giả (LSDV)
Chuyển FEM sang dạng mô hình biến giả bình phương tối thiểu (LSDV- Least Squares Dummy Variable). Để đo lường chênh lệch hệ số chặn giữa những đối tượng (n đối tượng), ta dùng n-1 biến giả thêm vào mô hình. Khi đó mô hình trở thành : Yit =
với một đối tượng trong mẫu, biến giả này được định nghĩa như sau: Djit = 1 nếu là đối tượng j và Djit = 0 nếu không là đối tượng j
• Hồi quy trong cùng nhóm (within regression)
Chuyển dạng bên trong của mô hình FEM. Chuyển dạng bên trong bằng cách tính biến số đã trừ trung bình để loại trừ thành phần αi khỏi mô hình.
Y it = β1 + β 2 X 2it +. ∙.+ βk Xkit + α i + uit(1) Ỹ it = β1 + β 2 X 2it + ■ ■■ β k Xkit + α i + Ũ it (2)
(1) -(2) ÷(Yit - Ỹit) = β2 (X2it - X2it) + ■ + βk (Xkit - Xkit)+(uit - Ũ it)
Mô hình lúc này có thể ước lượng bằng phương pháp OLS, hồi quy (Yit - Ỹit) theo (X2it - X2it) và (Xkit - Xkit) để thu được ước lượng của các hệ số β2. βk.
• Hồi quy sai phân (difference regression)
Chuyển FEM sang dạng sai phân, để loại bỏ thành phần αi khỏi mô hình.
Y it = β1 + β 2 X 2it + ■ ■■ β k X kit + α i + uit (1) Y i,t-1 = β1 + β 2 X 2i,t-1 + ■ ■■ β k X ki,t-1 + α i + ui,t-1 (2)
(1) - (2) ÷ ∆Yit = β2 ∆χ2it+■+ βk ∆χkit + ∆ Uit
Mô hình lúc này có thể ước lượng bằng phương pháp OLS, hồi quy ∆Yit theo ∆X2it.. . ∆Xkit để thu được ước lượng của các hệ số β2. βk.
• Mô hình hồi quy tác động ngẫu nhiên (REM-Random Effects Model)
Khi các đối tượng là không đồng nhất, có tồn tại sự khác biệt về đặc điểm riêng giữa các đối tượng (Zi ≠ 0), đặc điểm riêng Zi có tác động đến biến phụ thuộc Yit và không có tương quan với các biến độc lập Xit. Vì vậy, biến Zi sẽ không cần phải đưa vào mô hình, mà biến Zi có thể để trong sai số Uit (vì không bị hiện tượng nội sinh). Biến Zi nằm trong thành phần sai số của mô hình. Mô hình hồi quy tác động ngẫu
hợp, gồm sai số của biến Zi đại diện cho các yếu tố không quan sát đuợc thể hiện sự khác nhau giữa các đối tuợng nhung không thay đổi theo thời gian và Uit là sai số chung cho mọi đối tuợng)
❖Phương pháp ước lượng GMM
Các phuơng pháp uớc luợng tuyến tính cổ điển của mô hình dữ liệu bảng nhu Pooled OLS, Fixed effect (FE, LSDV, FD) và REM đuợc sử dụng chủ yếu để uớc luợng các mô hình dữ liệu bảng tĩnh tuyến tính. Đối với mô hình dạng bảng động (mô hình dạng bảng động là mô hình có xuất hiện biến trễ của biến phụ thuộc làm biến độc lập) thì uớc luợng bằng phuơng pháp OLS sẽ không còn đáng tin cậy và cho kết quả uớc luợng bị thiên lệch. Khi đó, phuơng pháp uớc luợng GMM đuợc xem là lựa chọn thay thế phù hợp.
GMM (Generized Method of Moments) đuợc gọi là phuơng pháp moment tổng quát, đuợc sử dụng trong các uớc luợng dữ liệu bảng động tuyến tính hoặc các dữ liệu bảng vi phạm tính chất HAC-Heteroskedasticity and Autocorrelation (đa cộng tuyến và tự tuơng quan). Mô hình bảng động tuyến tính là mô hình dữ liệu bảng tồn tại các vấn đề tự tuơng quan của các sai số, cũng nhu tính chất động của mô hình đuợc thể hiện qua các biến trễ phụ thuộc (vấn đề biến nội sinh) sẽ làm thiên chệch kết quả uớc luợng. Một số đặc điểm khi sử dụng phuơng pháp GMM: dữ liệu bảng có T nhỏ, N lớn (rất nhiều quan sát với ít mốc thời gian). Tồn tại mối quan hệ tuyến tính giữa biến phụ thuộc với các biến giải thích. Mô hình động với 1 hoặc 2 vế của phuơng trình có chứa biến trễ. Các biến độc lập không phải là một biến ngoại sinh ngặt, nghĩa là chúng có thể tuơng quan với các phần du hoặc tồn tại biến nội sinh trong mô hình. Tồn tại vấn đề phuơng sai thay đổi hoặc tự tuơng quan ở các sai số đo luờng. Tồn tại các tác động cố định riêng rẽ. Tồn tại phuơng sai thay đổi và tự tuơng quan trong mỗi đối tuợng (nhung không tồn tại giữa các đối tuợng). Để uớc luợng dữ liệu bảng động có 2 phuơng pháp sau: D-GMM và S-GMM.
Xét phương trình gốc (level equation): Yit = β1 + β2χ2it ■■' βkχki + θYi,t-ι + α
i +
uit(1)
Xét phương trình sai phân (difference equation / first-differenced equation): ∆Yit = β1
+ β2 ∆X2it +... + βk ∆X ki + θ∆Y1,t-1 + ∆Uit (2) Ta có: ∆Yi,t-1 = Yi,t-1 - Y1,t-2 và ∆Uit = Uit - Yi,t-1
Yi,t-2 có tương quan với biến bị nội sinh ∆Yi,t-1 nhưng không tương quan với sai số ∆Uit
÷ Yi,t-2có thể dùng làm biến công cụ, tương tự Yi,t-3, Yl,∣-.∣...cùng có thể dùng làm biến
công cụ. Arellanol Bond (1995) đề xuất dùng GMM trên phương trình sai phân để xử lý nội sinh của ∆Yi,t-1 và xử lý tự tương quan của ∆Uit. Việc xử lý nội sinh cho phương trình sai phân bằng GMM được gọi là phương pháp DGMM (Difference GMM). Hay nói cách khác, dùng GMM trên phương trình sai phân gọi là DGMM.
❖ Phương pháp SGMM (System GMM)
Theo Blundell and Bond (1998) nếu biến phụ thuộc y gần với bước ngẫu nhiên thì kết quả ước lượng của phương pháp D-GMM sẽ kém hiệu quả bởi vì các dữ liệu quá khứ chứa ít thông tin để dự báo sự thay đổi trong tương lai, vì thế các biến trễ không biến đổi đại diện không tốt cho các biến biến đổi trong mô hình. Để tăng tính hiệu quả Blundell and Bond phát triển một phương pháp tiếp cận mới gọi là phương pháp ước lượng S-GMM được đề cập trong Arellano and Bover (1995) nhằm loại bỏ vấn đề thiên chệch động. S-GMM sẽ giải quyết vấn đề biến công cụ yếu đối với mô hình bảng động. Xét phương trình gốc bị nội sinh do Yi,t.1 tương quan với sai số gộp Vit = Oi + Uịt. Biến công cụ phù hợp cho phương trình gốc là biến ∆Yi,t-1 (∆Yi,t.1 = Yi,t-1 - Yi,t-2). Biến
∆Yi,t.1 là biến công cụ phù hợp vì: ∆Yi,t1 có tương quan với Yi,t.1 và không tương quan với sai số gộp Vit vì đã khử αi. Khi đó, ta có thể xử lý nội sinh cho phương trình gốc với biến công cụ ∆Yi,t-1 vừa tìm được. Tuy nhiên, việc gộp phương trình gốc và phương trình sai phân như một hệ SUR sẽ đem lại ước lượng hiệu quả hơn so với việc chạy từng phương trình. Do đó, khi gộp phương trình gốc và phương trình sai phân ta được phương pháp SGMM (System GMM).
3.2 Mô hình nghiên cứu của luận văn
Mục đích chính trong phân tích định lượng của luận văn là đánh giá chính xác tác động của các yếu tố vĩ mô và đặc trưng ngân hàng đến khả năng sinh lời của các ngân hàng thương mại tại Việt Nam. Để phân tích định lượng tác động của các yếu tố vĩ mô và đặc trưng ngân hàng đến khả năng sinh lời của các ngân hàng thương mại luận văn kế thừa mô hình nghiên cứu của Sara Kanwal và Muhammad Naddeem (2013) để xây dựng các mô hình nghiên cứu của luận văn như sau:
Để giải quyết mục tiêu nghiên cứu này, tác giả xem xét cả hai mô hình dạng bảng tĩnh và dạng bảng động.
❖ Mô hình dạng bảng tĩnh: phân tích tác động của các yếu tố vĩ mô và đặc trưng ngân hàng đến khả năng sinh lời của các ngân hàng thương mại bằng mô hình dạng bảng tĩnh.
ROEit = β1+ β2INFt + β3GDPt + β4IRt + β5SIZEit + β6LDit + β7PCLit + β8LAit + β9DPit + uit (1)
❖ Mô hình dạng bảng động: phân tích tác động của các yếu tố vĩ mô và đặc trưng ngân hàng đến khả năng sinh lời của các ngân hàng thương mại bằng mô hình dạng bảng động:
ROEit = β1+ β2ROEit-1 + β3INFt + β4GDPt + β5IRt + β6SIZEit + β7LDit + β8PCLit + β9LAit + β10DPit + uit (2)
INF Tỷ lệ lạm phát (%) Ngân hàng Thế giới GDP Tốc độ tăng trưởng kinh tế (%) Ngân hàng Thế giới
LD Tính thanh khoản của ngân hàng = tài sản có tính thanh khoản cao / tổng tài sản
Báo cáo tài chính các ngân hàng thuơng mại PCL Rủi ro tín dụng = Dự phòng rủi ro tín dụng
đuợc trích lập / Tổng du nợ tín dụng
Báo cáo tài chính các ngân hàng thuơng mại
LA Cho vay = tổng số tiền cho vay / tổng tài
sản
Báo cáo tài chính các ngân hàng thuơng mại DP Cấu trúc vốn = vốn chủ sở hữu / tổng tài sản Báo cáo tài chính các
Tóm tắt chương 3
Với mục tiêu nghiên cứu của luận văn đó là xem xét tác động của các yếu tố đặc trung bên trong ngân hàng và yếu tố kinh tế vĩ mô bên ngoài ngân hàng đến khả năng sinh lời của ngân hàng thuơng mại tại Việt Nam trong giai đoạn 2010-2019. Trong chuơng 3 của luận văn đã trình bày những nội dung sau:
Đầu tiên, chuơng 3 đã dựa vào cơ sở lý thuyết và các nghiên cứu thực nghiệm truớc đây liên quan đến đề tài để xây dựng mô hình nghiên cứu của luận văn.
Bên cạnh đó, luận văn đã giải thích ý nghĩa, nguồn thu thập dữ liệu và cách đo luờng của từng biến trong mô hình nghiên cứu.
Cuối cùng, trong chuơng 3 tác giả trình bày các kỹ thuật xử lý dữ liệu và các mô hình Pooled OLS, mô hình FEM, mô hình REM và phuơng pháp GMM dành cho dữ liệu bảng nhằm đạt đuợc các mục tiêu nghiên cứu đề ra và làm cơ sở cho các chuơng tiếp theo.
Biến Giá trị trung bình Độ lệch chuẩn Giá trị nhỏ nhất Giá trị lớn nhất ROE 0.1150676 0.0876419 -0.5633 0.2879
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
Nội dung chương 4 trình bày kết quả nghiên cứu bao gồm: thống kê mô tả dữ liệu của các biến trong mô hình nghiên cứu, kết quả kiểm định các khuyết tật của mô hình, kết quả hồi quy của từng mô hình và xử lý các khuyết tật mô hình gặp phải. Kết quả nghiên cứu thực nghiệm về tác động của các yếu tố đặc trưng bên trong ngân hàng và yếu tố kinh tế vĩ mô bên ngoài ngân hàng đến khả năng sinh lời của ngân hàng thương mại Việt Nam lần lượt được trình bày với kết quả ước lượng mô hình Pooled OLS, FEM, REM và phương pháp GMM cho mô hình dạng bảng động.
4.1 Thống kê mô tả
Để thực hiện nghiên cứu phân tích định lượng nhằm giải quyết các mục tiêu nghiên cứu, luận văn tiến hành thu thập bộ dữ liệu của 17 ngân hàng thương mại tại Việt Nam trong giai đoạn 2010-2019 được thu thập từ nguồn báo cáo tài chính của các