CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.3. Phương pháp nghiên cứu
Nghiên cứu sử dụng dữ liệu đƣợc thu thập từ báo cáo tài chính hằng năm của 25 NHTM mẫu đƣợc lựa chọn trong hệ thống NHTM Việt Nam từ năm 2009 đến năm 2019, tương ứng 275 quan sát. Quá trình lựa chọn các NHTM làm mẫu nghiên cứu dựa trên các tiêu chí và cân nhắc khác nhau.
- Tiêu chí đầu tiên là tính sẵn có và đầy đủ của dữ liệu trong giai đoạn 2009 – 2019, chỉ những ngân hàng có báo cáo tài chính đã đƣợc kiểm toán độc lập và dữ liệu có đầy đủ từ năm 2009 đến năm 2019 mới đƣợc chọn.
- Tiêu chí thứ hai cũng là tiêu chí quan trọng nhất là tính đại diện của mẫu.
Theo số liệu do NHNN công bố, tại thời điểm cuối năm 2019, tổng tài sản của khối ngân hàng quốc doanh và NHTM cổ phần vào khoảng 10.652.207 tỷ đồng.
Số lƣợng ngân hàng sẽ đƣợc lựa chọn có tổng tài sản cuối năm 2019 chiếm hơn 77% tổng tài sản toàn thị trường ngân hàng. Vì vậy, các ngân hàng mẫu này có thể đƣợc coi là đại diện đáng kể cho hệ thống ngân hàng ở Việt Nam.
Theo các tiêu chí đã đề cập, có 25 NHTM CP đƣợc lựa chọn (Phụ lục 1).
Đối với dữ liệu kinh tế vĩ mô, nghiên cứu sử dụng dữ liệu đƣợc thu thập và tính toán từ các báo cáo thống kê và thông tin do Tổng cục Thống kê Việt Nam và Ngân hàng Nhà nước Việt Nam công bố trong giai đoạn từ năm 2009 đến năm 2019.
Để thực hiện nghiên cứu các tác động của các nhân tố ảnh hưởng đến hiệu quả hoạt động kinh doanh của NHTM, đề tài sử dụng dữ liệu bảng (Panel Data).
Dữ liệu bảng còn có cách gọi khác là dữ liệu kết hợp vì nó có sự kết hợp của dữ liệu chéo và chuỗi thời gian. Xét trong đề tài nghiên cứu này, dữ liệu chéo là các ngân hàng đƣợc lấy thông tin (25 NHTM) trong chuỗi thời gian theo năm (giai đoạn 2009 – 2019). Dữ liệu bảng đƣợc sử dụng vì nó có các ƣu điểm trong phân tích nhƣ sau:
40
- Xem xét đƣợc tính không đồng nhất của các dữ liệu thu thập bởi vì các đối tƣợng nghiên cứu theo thời gian nên chắc chắn là có sự không đồng nhất trong các đối tƣợng này.
- Bằng cách kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng sẽ chứa nhiều thông tin hữu ích hơn, đa dạng hơn, ít xảy ra hiện tƣợng đa cộng tuyến giữa các biến số; giúp nghiên cứu những mô hình hành vi phức tạp và có thể giảm đến mức thấp nhất sự sai lệch có thể xảy ra khi tổng hợp số liệu các đơn vị thành số liệu tổng.
- Có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian hay dữ liệu chéo theo không gian thuần túy.
Mô hình hồi quy dữ liệu dạng bảng có 03 phương pháp phân tích thường được sử dụng là Mô hình hồi quy ước lượng bình phương nhỏ nhất (Pooled OLS), Mô hình hồi quy tác động cố định (Fixed Effective Model - FEM) và Mô hình hồi quy tác động ngẫu nhiên (Random Effective Model - REM). Trong nghiên cứu này sẽ sử dụng 03 phương pháp này để ước lượng, phân tích đánh giá tác động của các nhân tố đến hiệu quả hoạt động kinh doanh của NHTM.
3.3.2. Phương pháp phân tích và xử lý dữ liệu
Nghiên cứu định lượng nhằm đánh giá các nhân tố ảnh hưởng đến hiệu quả hoạt động kinh doanh của ngân hàng bằng cách sử dụng phương pháp hồi quy dữ liệu bảng cân bằng. Phương pháp phân tích dữ liệu bảng cân bằng được coi là phù hợp nhất với mục đích của nghiên cứu vì nó sẽ cung cấp nhiều thông tin hơn và kết quả ít sai lệch hơn so với chỉ phân tích chuỗi thời gian và mặt cắt truyền thống. Đối với mô hình hồi quy dữ liệu bảng, ba phương pháp ước lượng được sử dụng sử dụng phổ biến là:
+ Mô hình ước lượng bình phương nhỏ nhất (Pooled OLS) là mô hình không kiểm soát đƣợc từng đặc điểm riêng của từng ngân hàng trong nghiên cứu. Mô hình xem xét các ngân hàng là đồng nhất, tất cả các quan sát đƣợc nhóm chung lại bất kể có sự khác biệt giữa các ngân hàng hay không. Điều này
41
thường không phản ánh đúng thực tế vì mỗi ngân hàng là một thực thể có những đặc thù riêng có thể ảnh hưởng đến hàm mục tiêu. Như vậy mô hình Pooled OLS có thể dẫn đến các ƣớc lƣợng bị sai lệch khi không xét đến các tác động riêng biệt này.
+ Mô hình hồi quy tác động cố định (FEM) phát triển từ mô hình Pooled OLS khi có thêm kiểm soát đƣợc từng đặc điểm khác nhau giữa các ngân hàng và có sự tương quan giữa phần dư của mô hình (điểm riêng biệt) và các biến độc lập.
+ Mô hình hồi quy tác động ngẫu nhiên (REM) phát triển từ mô hình Pooled OLS khi có thêm kiểm soát đƣợc từng đặc điểm khác nhau giữa các ngân hàng nhưng không có sự tương quan giữa phần dư của mô hình (điểm riêng biệt) và các biến độc lập.
Lựa chọn phương pháp ước lượng phù hợp:
+ Dùng kiểm định F để lựa chọn giữa Pooled OLS và FEM.
+ Dùng kiểm định Hausman để lựa chọn giữa FEM và REM.
+ Dùng kiểm định LM (Breusch and Pagan Lagrange Multiplier) để lựa chọn giữa Pooled OLS và REM.
Sau đó, để tăng độ tin cậy và tính phù hợp của mô hình đƣợc chọn, các kiểm định về khuyết tật mô hình đƣợc thực hiện bao gồm:
+ Hiện tƣợng đa cộng tuyến của các biến độc lập.
+ Phương sai sai số thay đổi.
+ Hiện tượng tự tương quan.
+ Hiện tương tương quan đơn vị chéo.
Nếu xảy ra các khuyết tật mô hình, tùy theo mức độ và nguyên nhân mà có các biện pháp xử lý khác nhau.
42
TÓM TẮT CHƯƠNG 3
Trong chương 3, luận văn trình bày rõ phương pháp nghiên cứu, cụ thể các giả thuyết nghiên cứu của đề tài, mô hình nghiên cứu và đo lường các biến, dữ liệu, phương pháp phân tích và xử lý dữ liệu.
Việc lƣợng hóa các biến và kỳ vọng của tác giả về mối quan hệ giữa các biến độc lập và biến phụ thuộc để xem xét các tác động có thể có của các nhân tố đến hiệu quả hoạt động kinh doanh của NHTM đƣợc dựa trên kết quả của các nghiên cứu trước đây. Dữ liệu được thu thập từ 25 NHTM Việt Nam được chọn lựa phù hợp dựa trên tiêu chí tính sẵn có, đầy đủ và mang tính chất đại diện đáng kể cho hệ thống ngân hàng ở Việt Nam (có thị phần chiếm hơn 77% tổng tài sản toàn thị trường tại thời điềm cuối năm 2019). Nghiên cứu sử dụng ba mô hình hồi quy dữ liệu bảng bao gồm mô hình hồi quy ước lượng bình phương nhỏ nhất (Pooled OLS), mô hình tác động cố định (FEM) và mô hình tác động ngẫu nhiên (REM); thực hiện các kiểm định để lựa chọn mô hình phù hợp nhất và kiểm định các khuyết tật phổ biến của mô hình. Nếu xảy ra các khuyết tật mô hình, tùy theo mức độ và nguyên nhân mà có các biện pháp xử lý khác nhau.
43