CHƯƠNG 3 : DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
3.1. DỮ LIỆU NGHIÊN CỨU
Bài nghiên cứu sử dụng bộ dữ liệu nghiên cứu sơ cấp, mô hình dữ liệu dạng bảng (Data Panel) các chỉ số về mối quan tâm của công chúng (thông qua lượt tìm kiếm tất cả tên gọi tại công cụ Google Search) và các chỉ tiêu báo cáo tài chính nhằm đánh giá hiệu quả sinh lời và lành mạnh tài chính của 30 ngân hàng thành lập và hoạt động tại Việt Nam trong khoảng thời gian 11 năm hoạt động (từ năm 2007 đến năm 2017), tương ứng với 245 biến quan sát.
Nguồn cơ sở dữ liệu mà tác giả thu thập đều mang tính chất khách quan. Về biến giải thích, tác giả tổng hợp và tính toán dữ liệu về sự quan tâm của công chúng về các ngân hàng thông qua công cụ Google Trend. Google Trends (hay còn gọi là Google Xu hướng) rất hữu ích trong việc xác định các từ khóa đã được tìm kiếm nhiều nhất trong 1 khoảng thời gian nhất định, từ đó thấy được xu hướng quần chúng đang thực sự quan tâm tới vấn đề, sự vật, hiện tượng nào. Tên chung của biến giải thích là BANK_GOOGLE - Tổng số lượt tìm kiếm các ngân hàng thông qua các tên gọi. Trong bài nghiên cứu, nhằm làm rõ hơn sự ảnh hưởng từ các hạng mục tên gọi và tìm kiếm của ngân hàng tới sự hiệu quả hoạt động tài chính trong ngân hàng, tác giả phân loại cụ thể hơn thành các biến yếu tố như sau:
+ SEARCH 1: Tổng số lượt tìm kiếm các ngân hàng thông qua tên đầy đủ của các ngân hàng đó. Thông thường, các nhà hoạch định chính sách, các đơn vị hành chính công sự, các cơ quan nhà nước hay các nhà nghiên cứu tài chính, kinh tế mới sử dụng tên đầy đủ của các ngân hàng này bởi có liên quan tới yếu tố pháp lý và tính công khai, minh bạch. Khi thu thập dữ liệu, từ khóa tác giả tìm kiếm tại Google Xu hướng sẽ là tên đầy đủ của các ngân hàng, ví dụ: Ngân hàng thương mại cổ phần Á Châu, Ngân hàng thương mại cổ phần Ngoại thương Việt Nam, hoặc Ngân hàng TMCP Công thương Việt Nam.
+ SEARCH 2: Tổng số lượt tìm kiếm các ngân hàng thông qua tên thông dụng. Đối với mọi tầng lớp quần chúng nhân dân, họ luôn muốn tìm ra những tên gọi ngắn gọn, dân dã, dễ nhớ nhất mà vẫn đảm bảo đúng đặc trưng của Ngân hàng
đó. Và đó cũng là tên gọi thường được công chúng tìm kiếm khi nhắc về ngân hàng. Ví dụ, khi tìm kiếm từ khóa thu thập dữ liệu về tên thông dụng của ngân hàng Nông nghiệp và Phát triển Nông thông Việt Nam, tác giả sử dụng từ khóa tìm kiếm “Ngân hàng Nông nghiệp” hoặc “Ngân hàng Agribank”.
+ SEARCH 3: Tổng số lượt tìm kiếm các ngân hàng thông qua các tên gọi khác (tên Tiếng Anh, tên viết tắt, tên cổ phiếu niêm yết,...). Chủ yếu sử dụng những tên gọi khác này là một số ít các nhà nghiên cứu (trong nước hoặc nước ngoài) có những công trình nghiên cứu về ngân hàng bằng ngôn ngữ tiếng Anh, hay các nhà đầu tư chứng khoán tìm kiếm về cổ phiếu của một số ngân hàng thương mại đã niêm yết trên sàn giao dịch chứng khoán,...Ví dụ về từ khóa thu thập dữ liệu tại biến SEARCH 3: Millitary Bank, MBB (Ngân hàng thương mại cổ phần Quân đội); Petrolimex Group Joint-stock Commercial Bank, PGBank, PGB (Ngân hàng thương mại cổ phần Xăng dầu Petrolimex),...
Về các biến phụ thuộc, bài luận đã lựa chọn 6 biến chính là các chỉ tiêu thể hiện sự hoạt động hiệu quả và lành mạnh tài chính của ngân hàng, cụ thể là ROA (Tỷ suất sinh lời trên tổng tài sản), ROE (Tỷ suất sinh lời trên vốn chủ sở hữu), EPS (Lợi nhuận trên một cổ phiếu), NIM (Chênh lệch giữa thu nhập lãi và chi phí lãi phải trả), CAR (Hệ số an toàn vốn), NO XAU (Tỷ lệ nợ xấu). Bên cạnh đó, tác giả còn bổ sung thêm một số biến đặc điểm của ngân hàng trong khi chạy mô hình định lượng, bao gồm VCSH (Vốn chủ sở hữu), TIEN GUI (Khối lượng tiền gửi), CHO VAY (Khối lượng cho vay), DU PHONG (Dự phòng rủi ro tín dụng), HHI (Chỉ tiêu phản ánh mức độ cạnh tranh), AGE (Tuổi thọ của ngân hàng). Tất cả các biến nêu trên đều được tác giả sử dụng nguồn dữ liệu sơ cấp, thu thập từ các báo cáo tài chính hợp nhất đã kiểm toán của các ngân hàng thương mại.
Trong bài nghiên cứu, chỉ số HHI - chỉ số Herfindahl (Herfindahl index) là chỉ tiêu phản ánh mức tập trung người bán (ngân hàng) ở trên thị trường, có tính đến tổng số ngân hàng trên một thị trường và quy mô tương đối của ngân hàng (tức tỷ trọng trong tổng sản lượng cung ứng cho thị trường). HHI được tính bằng cách
Tên Biến Số quan sát Giá trị Trung vị Độ lệch chuẩn Giá trị nhỏ nhất Giá trị Biến phụ thuộc
lấy thị phần của từng công ty trong ngành, bình phương và tổng kết, với công thức cụ thể như sau:
HHI = (S1)2 + (S2)2 + (S3)2 + ... + (Sn)2
(trong đó S là thị phần của mỗi ngân hàng được thể hiện như một số nguyên, không phải là thập phân)
Giới hạn giá trị của chỉ số là 0 ≤ HHI ≤ 1. Nếu giá trị của chỉ số gần với giới hạn dưới (gần 0) chứng tỏ tất cả các ngân hàng có quy mô gần như nhau, thị trường hiện tại là thị trường cạnh tranh hoàn hảo. Nếu giá trị của HHI tiền dần tới giới hạn trên (gần 1) nghĩa là thị trường đang dần có sự bất cân xứng về quy mô giữa các ngân hàng, có nguy cơ dẫn tới hiện tượng độc quyền nhóm. Đặc biệt, giới hạn trên của chỉ số bằng 1 và điều này xảy ra khi có thị trường độc quyền.
* Quá trình thu thập, lọc và xử lí dữ liệu:
- Thu thập dữ liệu thô từ năm 2007 đến năm 2017 của các biến và thống kê vào trang tính excel. Chi tiết như sau:
+ Về biến giải thích, tác giả tổng hợp và tính toán dữ liệu về sự quan tâm của công chúng về các ngân hàng thông qua công cụ Google Trend, với các từ khóa tìm kiếm về tên đầy đủ, tên thông dụng và tên gọi khác (tên viết tắt, tên niêm yết theo cổ phiếu chứng khoán, tên đầy đủ bằng tiếng Anh) của ngân hàng và xếp lần lượt theo thứ tự các biến SEARCH.
+ Về biến phụ thuộc và biến đặc điểm của ngân hàng, tác giả sử dụng dữ liệu từ các báo cáo tài chính hợp nhất hằng năm có kiểm toán để đảm bảo về độ tin cậy của số liệu. Tất cả các biến được sắp xếp theo thứ tự trong cùng một bảng tính.
+ Tiếp theo, tác giả liên kết dữ liệu bảng và chạy dữ liệu thông qua phần mềm STATA. Bên cạnh những phần mềm SPSS, EVIEWS, R, SAS... đã trở thành quen thuộc với đại đa số nhà nghiên cứu trong các lĩnh vực kinh tế, xã hội, khoa học chính trị,. thì phần mềm STATA là một trong những công cụ được các chuyên gia đánh giá cao trong việc thống kê phân tích dữ liệu. STATA có giao diện đơn giản hỗ trợ người dùng có thể dùng cả tập lệnh cũng như thao tác trên các tools trên thanh công cụ. Đặc biệt phần mềm này rất mạnh trong việc hỗ trợ phân tích dữ liệu mảng (panel data) với các mô hình GMM, mô hình 2SLS, mô hình 3SLS. Chính vì thế mạnh này, tác giả đã lựa chọn STATA làm công cụ hỗ trợ việc tính toán trong bài luận, cụ thể tác giả đã sử dụng STATA 14 - phiên bản mới nhất với các tính năng mới cũng như sử dụng mượt mà hơn phiên bản cũ.
Các biến tác giả sử dụng trong bài nghiên cứu sẽ được thống kê mô tả cụ thể trong Bảng 3.1 dưới đây.
ROA 322 0.0083 0.0075 0.0078 -0.0551 0.0595 ROE 322 0.0844 0.0784 0.0812 -0.8200 0.3628 EPS 318 6.6151 6.8746 1.1766 1.9773 8.8085 NIM 322 0.0281 0.0275 0.0126 -0.0198 0.0789 CAR 258 0.1560 0.1311 0.0843 0.0670 0.7790 NO XAU 299 0.0226 0.0205 0.0156 0 0.1140 Biến độc lập BANK GOOGLE 322 1107.94 1043 678.57 0 3848 SEARCH 1 321 333.23 275 284.86 0 964 SEARCH 2 321 415.32 294 362.90 17 1769 SEARCH 3 321 362.83 297 303.22 0 1660
Biến đặc điểm của ngân hàng
VCSH 322 29.4733 29.3887 1.0028 26.9587 31.7862 TIEN GUI 322 0.8147 0.8508 0.1185 0.0906 1.0074 CHO VAY 321 1.0009 0.8601 1.0494 0.2351 15.5222 DU PHONG 291 0.7649 0.6263 0.6022 0.1379 6.5859 HHI 322 0.0943 0.0864 0.0169 0.0809 0.1309 AGE 322 20.8199 20 10.961 5 1 61
Nguồn: Tác giả tự tính toán
Bài nghiên cứu đã thống kê các biến sử dụng trong bài nghiên cứu và tính toán giá trị trung bình, trung vị, độ lệch chuẩn, giá trị nhỏ nhất và giá trị lớn nhất
ROA, ROE và NIM lần lượt là -0,0551; -0,8200 và -0,0198. Tuy nhiên, các biến này vẫn mang ý nghĩa thống kê, bởi đây chỉ là hệ số chặn của biến.
Giá trị trung vị của biến BANK_GOOGLE là 1043. Giá trị trung bình của SEARCH 2 (Tên thông dụng) là lớn nhất trong 2 biến yếu tố SEARCH (giá trị là 415,32), tiếp theo lần lượt là SEARCH 3 (362,83) và nhỏ nhất là SEARCH 1 (333,23).
Từ bảng thống kê, ta có thể thấy rằng:
+ Đa số các ngân hàng có vốn chủ sở hữu chiếm khoảng gần 30% trên tổng tài sản
+ Tỷ lệ nợ xấu trong các ngân hàng trung bình khoảng 2%
+ Tỷ lệ tiền gửi trong các ngân hàng chiếm tỷ trọng rất lớn, chủ yếu trên 80%. Đây là một kết quả đúng và phù hợp với đặc tính kinh doanh của ngân hàng thương mại. Tuy nhiên, giá trị lớn nhất của biến TIEN GUI là 1,0074; nghĩa là tỷ lệ tiền gửi trong ngân hàng có lúc đã lên tới hơn 100%. Điều này chứng tỏ rằng, có một số ngân hàng, trong khoảng thời gian nhất định đã kinh doanh thua lỗ và làm giảm vốn chủ sở hữu, hoạt động kinh doanh hoàn toàn dựa vào số tiền gửi huy động từ quần chúng.
+ Về chỉ số Herfindahl thể hiện mức độ cạnh tranh về cung cấp dịch vụ của các ngân hàng, giá trị của chỉ số nằm trong giới hạn 0 ≤ HHI ≤ 1. Về ý nghĩa của chỉ số: Nếu giá trị của chỉ số gần với giới hạn dưới (gần 0) chứng tỏ tất cả các ngân hàng có quy mô gần như nhau, thị trường hiện tại là thị trường cạnh tranh hoàn hảo. Nếu giá trị của HHI tiền dần tới giới hạn trên (gần 1) nghĩa là thị trường đang dần có sự bất cân xứng về quy mô giữa các ngân hàng, có nguy cơ dẫn tới hiện tượng độc quyền nhóm. Đặc biệt, giới hạn trên của chỉ số bằng 1 và điều này xảy ra khi có thị trường độc quyền. Giá trị của chỉ số HHI tại bảng trên không quá 0,2 cho thấy lĩnh vực ngân hàng có sự cạnh tranh hoàn hảo, không hề xuất hiện đơn nào quá nổi trội và thâu tóm thị phần lớn.
(1) (2) (3) (4) (5) (6) (7) 8 9 10 11 12 13 14 15 1 ROA 1 2 ROE 0.74** * 1 3 EPS 0.61** * 0.85*** 1 4 NIM 0.55** * 0.35*** 0.34*** 1 BANK 5 GOOGLE 0.2*** 0.41*** 0.43*** 0.04 1 6 SEARCH 1 0.32*** 0.42*** 0.44*** 0.22*** 0.8*** 1 7 SEARCH 2 0.18*** 0.39*** 0.42*** 0 0.74*** 0.44*** 1 8 SEARCH 3 -0.06 0.06 0.06 - 0.12** 0.6*** 0.32** * 0.04 1 9 VCSH -0.09* 0.24*** 0.22*** 0.02 0.45** * 0.33*** 0.49*** 0.1 1 10 CAR 0.24** * -0.28*** -0.2*** 0.22*** -0.22** -0.14** -0.24** -0.1 -0.48*** 1 11 NO XAU - 0.2*** - 0.18*** - 0.31*** 0 -0.13** -0.08 - 0.16** -0.04 0.12** 0.04 1 12 CHO VAY 0.06 0.01 0.04 - 0.12** - 0.17** - 0.12** -0.1* -0.15** -0.07 0.47*** -0.06 1 13 DU PHONG 0.08 0.14** 0.26*** -0.11* 0.28*** 0.16** *0.23** 0.23*** 0.11* -0.2*** 0.48***- -0.04 1 14 HHI 0.32** * 0.19*** 0.2*** 0 0.2*** 0.26** * 0.16** * 0.04 - 0.42*** 0.22*** - 0.23*** 0.08 0.12* * 1 15 AGE -0.05 0.22*** 0.19*** 0.06 0.31** * 0.12** 0.46** * 0.02 0.58*** - 0.26*** 0.11* - 0.16** -0.05 -0.17*** 1
* p<0.1, ** p<0.05, *** p<0.01
Nguồn: Tác giả tự tính toán
Từ bảng ma trận hệ số tương quan, ta có thể thấy rằng:
+ Bảng 3.2 trình bày hệ số tương quan giữa các biến trong mô hình. Các hệ số tương quan giữa các biến được dùng để kiểm tra sự xuất hiện hiện tượng đa cộng tuyến giữa các biến trong mô hình nghiên cứu. Kết quả cho thấy không có khả năng xuất hiện hiện tượng đa cộng tuyến trong mô hình hồi quy giữa các biến độc lập vì hầu hết các hệ số tương quan giữa các biến đều khá nhỏ.
+ Nhóm các biến phụ thuộc là chỉ số thể hiện hiệu quả sinh lời trong ngân hàng (ROA, ROE, EPS, NIM) đều có sự tương quan mật thiết tới nhau với mức ý nghĩa cao (P-value <0,01).
+ Biến giải thích BANK GOOGLE có mức độ ảnh hưởng lớn với ROA, ROE, EPS nhưng không tác động tới biến NIM.
+ Các biến yếu tố SEARCH có những điểm đáng chú ý sau: SEARCH 2 hoàn toàn không tương quan với NIM; SEARCH 3 không tương quan với ROA, ROE, EPS và làm giảm NIM trong giá trị thống kê.
+ Đa phần các biến đều có mối liên hệ với mức ý nghĩa cao. Tuy kiểm tra kết quả mô hình không có khả năng xuất hiện đa cộng tuyến, bài nghiên cứu vẫn cần chú ý trong việc lựa chọn ghép nhóm các biến đưa vào cùng một mô hình và kiểm định để tránh xảy ra quan hệ nhân quả nghịch đảo và phương sai sai số thay đổi.
3.2. PHƯƠNG PHÁP NGHIÊN CỨU:
Bài luận sử dụng phương pháp nghiên cứu định lượng, cụ thể là 2 mô hình: Mô hình tác động cố định và Mô hình system GMM (system Generalized Method of Moment). Chi tiết hơn:
+ Nhằm thể hiện rõ nhất sự tác động trực tiếp và một chiều của mối quan tâm của công chúng tới hiệu quả hoạt động tài chính trong ngân hàng (khả năng sinh lời và an toàn tài chính), cũng như để xử lý các vấn đề về các yếu tố không quan sát được (unobserved heterogeneity), tác giả sử dụng mô hình tác động cố định với công thức:
Y = βo + βι*BANK GOOGLE + β2*VCSH + Ịh*TIENGUI + β4*CHO-VAY + β5*∣)UJPH)NG + β6*HHI + β7*AGE + a, + bl + Uit
Trong đó: - Y: Biến phụ thuộc
- BANK GOOGLE: Tổng số lượt tìm kiếm về ngân hàng qua công cụ Google Search - VCSH: Vốn chủ sở hữu trong ngân hàng
- TIEN_GUI: Tỷ lệ tiền gửi trong ngân hàng - CHO_VAY: Tỷ lệ cho vay tại ngân hàng - DU_PHONG: Tỷ lệ dự phòng tín dụng - HHI: Chỉ tiêu phản ánh mức độ cạnh tranh - AGE: Tuổi thọ của ngân hàng
- aɪ: fixed effect theo ngân hàng - bɪ: fixed effect theo năm - uit: phần dư trong mô hình
Với Y tương ứng lần lượt là các biến phụ thuộc: tỷ suất sinh lời trên tổng tài sản (ROA), tỷ suất sinh lời trên vốn chủ sở hữu(ROE), lợi nhuận trên một cổ phiếu (EPS), chênh lệch giữa thu nhập lãi và chi phí lãi phải trả của ngân hàng (NIM), hệ số an toàn vốn (CAR) và tỷ lệ nợ xấu (NO XAU) (chi tiết về đặc điểm được ghi nhận tại Phụ lục), tác giả dự đoán có những giả thuyết về kết quả của các biến sau khi chạy mô hình:
H1: Mối quan tâm của công chúng có sức ảnh hưởng lớn tới tỷ suất sinh lời trên tổng tài sản (ROA) trong ngân hàng
H2: Mối quan tâm của công chúng tác động tích cực tới tỷ suất sinh lời trên vốn chủ sở hữu (ROE) trong ngân hàng
H3: Mối quan tâm của công chúng có tác động thuận chiều với sự chênh lệch giữa thu nhập lãi và chi phí lãi phải trả của ngân hàng (NIM)
H4: Mối quan tâm của công chúng có tác động cùng chiều với lợi nhuận trên một cổ phiếu (EPS)
H5: Mối quan tâm của công chúng có ảnh hưởng tích cực tới hệ số an toàn vốn (CAR) trong ngân hàng
H6: Mối quan tâm của công chúng có tác động ngược chiều với tỷ lệ nợ xấu (NOXAU) trong ngân hàng
Bên cạnh đó, nhận thấy rủi ro về hiện tượng phương sai phần dư thay đổi (heteroskedasticity) và phần dư tự tương quan, tác giả sử dụng mô hình tác động cố định của Petersen (2009) với điều chỉnh sai số chuẩn (fixed effect model clustered robust standard errors) theo từng ngân hàng để tránh hiện tượng rủi ro trên.
+ Tiếp theo, nhằm tránh hiện tượng tương quan ngược và tương quan đồng thời, hay còn gọi là quan hệ nhân quả nghịch đảo trong mô hình, mô hình hồi quy system GMM (system Generalized Method of Moment) được đề xuất sử dụng theo nghiên cứu của Arellano và Bond (1991).
Theo Lê Thị Phương Vy và Phan Thị Bích Nguyệt (Đại học Kinh tế TP. Hồ Chí Minh) phân tích: “Một trong những ưu điểm của mô hình GMM so với mô hình