Dữ liệu nghiên cứu

Dữ liệu vi mô để tính toán các biến được sử dụng trong bài nghiên cứu được thu thập chủ yếu từ báo cáo tài chính cuối năm đã được kiểm toán trên sàn HOSE, HNX và trang web finance.stock.vn của 31 NHTM Việt Nam. Các số liệu được lấy từ bảng cân đối kế toán và kết quả kinh doanh của tổng cộng 31 ngân hàng với tổng số quan sát cho từng đơn vị là 325 trong khoảng thời gian nghiên cứu từ 2010-2020. Còn đối với 2 yếu tố vĩ mô

là tốc độ tăng trưởng kinh tế GDP và tỉ lệ lạm phát INF, số liệu chính thức đều được lấy từ trang thông tin điện tử tổng cục thống kê nhằm đảm bảo sự chính xác và thống nhất.

Dữ liệu được sử dụng trong nghiên cứu là dữ liệu bảng (Panel data), do sự kết hợp

thô chưa qua xử lý và để thuận tiện cho việc tính toán khóa luận, tác giả sẽ dùng đơn vị tính là triệu đồng thay vì đồng và xử lý bằng phần mềm Stata.

Lý do mà tác giả lựa chọn 31 ngân hàng này là vì đây là tất cả các NHTM cổ phần

đang hoạt động tại Việt Nam bao gồm các ngân hàng với quy mô lớn và nhỏ khác nhau có thời gian tồn tại, hoạt động liên tục và được thực hiện thống kê các số liệu một cách đầy đủ, rõ ràng trong suốt giai đoạn nghiên cứu.

Mốc thời gian từ năm 2010 đến 2020 được tác giả chọn để nghiên cứu, vì đây là giai đoạn gần với khóa luận cũng như có đủ dữ liệu công khai trên các phương tiện truyền thông để người viết có căn cứ sát thực nhận định thực trạng hiện tại và đóng góp các kiến nghị có ích cho nền kinh tế trong tương lai. Giai đoạn này cũng nằm trong chiến lược phát triển kinh tế xã hội 10 năm 2011-2020 của Việt Nam, trong đó bao gồm việc cơ cấu lại các

tổ chức tín dụng gắn với xử lý nợ xấu được triển khai đồng bộ, hiệu quả hơn, bảo đảm ổn định, an toàn hệ thống. Khung khổ pháp lý về tiền tệ, tín dụng, ngân hàng từng bước được hoàn thiện, tiệm cận với chuẩn mực, thông lệ quốc tế và phù hợp với điều kiện thực tiễn của Việt Nam.

3.3 Phương pháp nghiên cứu3.3.1 Hồi quy dữ liệu bảng 3.3.1 Hồi quy dữ liệu bảng

Dữ liệu bảng (Panel Data) là dạng dữ liệu được sử dụng rộng rãi nhất trong các nghiên cứu cả về vi mô (trong phạm vi hộ gia đình, doanh nghiệp) và vĩ mô (trong phạm vi thành phố hoặc quốc gia). Dữ liệu bảng là dữ liệu có sự kết hợp về cả thời gian lẫn không

gian. Cấu trúc dữ liệu bảng được kết hợp từ 2 thành phần: thành phần dữ liệu chéo (cross - section: tập hợp thông tin của nhiều chủ thể tại 1 thời điểm cụ thể) và thành phần dữ liệu theo chuỗi thời gian (time series: tập hợp các quan sát của một chủ thể được thu thập theo thời gian gắn liền với một tần suất quan sát cụ thể). Việc kết hợp 2 loại dữ liệu có nhiều lợi thế và thuận lợi trong phân tích, đặc biệt khi muốn quan sát, phân tích sự thay đổi của các đối tượng nghiên cứu sau khi xảy ra các biến cố hay theo thời gian cũng như phân tích sự khác biệt giữa các nhóm đối tượng nghiên cứu.

sát nào. Ngược lại, dữ liệu bảng không cân bằng khi thiếu mất một số thông tin của một hoặc nhiều đối tượng nghiên cứu.

Hiện nay, các tác giả ưa chuộng sử dụng dữ liệu bảng là vì những ưu điểm sau: - Thứ nhất, dữ liệu bảng cho phép giải thích sự khác biệt hay sự không đồng nhất

(heterogeneity) của các đơn vị chéo. Các đơn vị chéo khác nhau thường không

đồng nhất

với nhau. Dữ liệu bảng cung cấp dữ liệu của nhiều đơn vị chéo theo thời gian, nên cũng

chứa những đặc điểm không đồng nhất giữa chúng. Phân tích dữ liệu bảng có thể

tính đến

đặc trưng của từng đơn vị chéo (individual specific).

- Do kết hợp của yếu tố thời gian và đơn vị chéo, dữ liệu bảng có số lượng quan sát lớn

hơn, cung cấp nhiều thông tin hơn. Trong nghiên cứu thực nghiệm, mối quan hệ

giữa các

biến số theo thời gian là vấn đề thường được quan tâm. Nếu sử dụng dữ liệu chuỗi thời

gian, cần phải có một bộ dữ liệu rất dài để có đủ quan sát thực hiện các kiểm định giả

thuyết có ý nghĩa. Nếu sử dụng dữ liệu bảng, nhà nghiên cứu chỉ cần kết hợp nhiều

đơn vị

chéo trong một khoảng thời gian nhất định, nhờ đó gia tăng số lượng quan sát, gia

tăng bậc

tự do, theo đó là sức mạnh của kiểm định. Ngoài ra, việc kết hợp các dữ liệu theo

cách này

còn làm giảm bớt hiện tượng đa cộng tuyến thường gặp trong các mô hình dữ liệu chuỗi

thời gian nhiều biến giải thích.

- Sử dụng dữ liệu bảng có thể nghiên cứu những vấn đề rộng hơn và giải quyết được những

- Những thiên lệch (chệch) do tổng hợp số liệu về các công ty hoặc các cá nhân sẽ

giảm đi

hoặc triệt tiêu trong dữ liệu bảng. Do đó dữ liệu bảng sẽ tạo ra những biến chính

xác hơn

so với số liệu thu thập và đo lường ở giác độ vĩ mô.

- Bằng cách cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức

thấp nhất hiện tượng thiên chệch có thể xảy ra nếu chúng ta gộp các cá nhân hay

các doanh

nghiệp theo nhứng số liệu tổng hợp.

3.3.2 Phương pháp hồi quy dữ liệu

Những phương pháp hồi quy dữ liệu với dữ liệu dạng bảng được sử dụng phổ biến

nhất bao gồm 3 mô hình: Pooled OLS, Fixed Effect Model (FEM) và Random Effect Model

(REM). Trong nghiên cứu này sẽ sử dụng 3 phương pháp định lượng này để ước lượng, phân tích đánh giá tác động của các nhân tố tác động đến hiệu quả hoạt động của các NHTM.

3.3.2.1 Phương pháp bình phương bé nhất dữ liệu dạng gộp (Pooled OLS)

Phương pháp OLS dữ liệu dạng gộp (Pooled OLS) được sử dụng với giả định không có sự khác biệt giữa các đơn vị chéo, theo đó, hằng số (M) được sử dụng chung cho

tất cả đơn vị chéo. Giả định này chỉ đúng khi tất cả đơn vị chéo là đồng nhất, và điều này hiếm xảy ra trong thực tế. Mô hình Pool OLS được viết dưới dạng: c

Yit = M + N 1Xit1 + N2Xit2 + ... + NkXitk + uit

Trong mô hình, các tham số ước lượng đều là tham số chung cho tất cả các đơn vị chéo. Mô hình trên cho thấy biến Yit sẽ chịu tác động như thế nào của các biến Xitk mà không quan tâm đến đặc trưng riêng của từng đơn vị chéo. Nói cách khác, mô hình không kiểm soát được từng đặc điểm riêng của từng ngân hàng trong nghiên cứu. Mô hình xem xét các ngân hàng là đồng nhất, tất cả các quan sát được nhóm chung lại bất kể có sự khác biệt giữa các ngân hàng hay không. Điều này thường không phản ánh đúng thực tế vì mỗi ngân hàng là một thực thể có những đặc thù riêng có thể ảnh hưởng đến hàm mục tiêu.

giữa các đơn vị chéo, nhưng các hệ số chặn hồi quy được phân biệt giữa các đơn vị chéo. Mô hình FEM có dạng:

Yit = Mi + N 1X1,it + N2X2,it + ∙.. + NkXk,it + Uit

Các tham số ước lượng trong mô hình trên có ý nghĩa như sau:

- Tham số Nk phản ánh chung cho tất cả các đơn vị chéo (các ngân hàng) có tốc độ tăng

giống nhau

- Tham số Mi bao gồm hệ số chặn và biến bị bỏ sót của từng đơn vị chéo, được gọi là tham

số đặc trưng của đối tượng, đồng thời cũng được gọi là thành phần tác động cố

định (không

thay đổi theo thời gian). Sự xuất hiện của Mi giúp phản ánh sự hông đồng nhất giữa

các đơn

vị chéo do tác động của các biến không thể quan sát được, nhờ đó, FEM giải quyết được

vấn đề biến bị bỏ sót.

Vì vậy, mô hình hồi quy tác động cố định (FEM) phát triển từ mô hình Pooled OLS khi có thêm kiểm soát được từng đặc điểm khác nhau giữa các ngân hàng và có sự tương quan giữa phần dư của mô hình (điểm riêng biệt) và các biến độc lập.

3.3.2.3 Phương pháp tác động ngẫu nhiên (REM)

Mô hình tác động ngẫu nhiên còn được gọi là mô hình thành phần sai số. Tương tự như FEM, REM có thể xác định được các hệ số chặn khác nhau cho từng đơn vị chéo và tác động chung của các biến giải thích. Tuy nhiên, khác với FEM, trong REM, các hệ số chặn của từng đơn vị chéo được phát sinh từ:

- Một hệ số chặn chung M không đổi theo đối tượng và thời gian.

- Một biến ngẫu nhiên £i (không tương quan với Xk,it) là một thành phần của sai số

thay đổi

theo đối tượng nhưng không đổi theo thời gian. Mô hình REM được trình bày như sau:

Yit = Mi + N 1X1,it + N2X2,it + .. ∙ + NkXk,it + Pit

Với Pit = £i + Qit

3.3.3. Lựa chọn mô hình ước lượng phù hợp

3.3.3.1. Kiểm định lựa chọn phương pháp hồi quy Pooled OLS, FEM, REM

• Kiểm định F hạn chế (F-test)

Kiểm định F-test dùng để lựa chọn mô hình phù hợp giữa 2 mô hình Pooled OLS và FEM.

Giả thuyết H0 cho rằng không có sự khác biệt giữa các đối tượng hoặc các thời điểm khác nhau.

Nếu Prof F ≤ M thì bác bỏ H0, mô hình Pooled OLS không có ý nghĩa. => Mô hình FEM phù hợp hơn và ngược lại.

• Kiểm định Breusch-Pagan

Giả thuyết H0 cho rằng σ2 = 0, nghĩa là sai số của ước lượng thô không bao gồm các sai lệch giữa đối tượng (hay phương sai giữa các đối tượng hoặc các thời điểm là không đổi). Bác bỏ giả thuyết H0 cho thấy sai số trong ước lượng có bao gồm cả sự sai lệch giữa các nhóm, và phù hợp với ước lượng tác động ngẫu nhiên.

Lựa chọn REM và Pooled OLS

Giả thuyết HO được phát biểu như sau: H0: σ2 = 0 (Mô hình Pooled OLS là phù hợp) H1: σ2 ≠ 0 (Mô hình REM là phù hợp)

Lưuý: Nếu σ2 = 0 thì mỗi đối tượng sẽ có cùng một tham số cắt và vì vậy, mô hình Pooled OLS phù hợp. Nếu σ2 ≠ 0 thì mỗi đối tượng khác nhau sẽ có một hệ số cắt khác nhau và vì vậy, mô hình REM là mô hình phù hợp.

• Kiểm định Hausman

Kiểm định Hausman để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định (FEM) và ước lượng tác động ngẫu nhiên (REM).

Giả thuyết: HO: Ước lượng của FEM và REM không khác nhau (NFEM = NREM) H1: Ước lượng của FEM và REM khác nhau (NFEM ≠ NREM)

Nếu p-value < M: Bác bỏ giả thuyết H0 nên REM không phù hợp và sử dụng mô hình FEM.

Thuật ngữ đa cộng tuyến có nghĩa là sự tồn tại mối tương quan cao giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy. Nói cách khác, một biến độc lập có thể sử dụng để dự đoán một biến độc lập khác. Điều này sẽ dẫn đến việc tạo ra các thông

tin dư thừa, làm sai lệch kết quả của mô hình hồi quy đa biến. Hiện tượng đa cộng tuyến vi phạm giả định của mô hình hồi quy tuyến tính là các biến độc lập không có mối quan hệ

tuyến tính với nhau.

Các hệ quả của đa cộng tuyến là: khi các biến độc lập có sự tương tương quan, các

biến độc lập có xu hướng thay đổi đồng nhất. Sự thay đổi trong một biến sẽ liên kết làm thay đổi một biến khác. Mối tương quan càng mạnh thì càng khó thay đổi một biến mà không thay đổi một biến khác. Mô hình trở nên khó khăn trong việc ước tính mối quan hệ giữa từng biến độc lập và biến phụ thuộc một cách độc lập: Gia tăng sai số chuẩn của các hệ số, khoảng tin cậy lớn và kiểm định T ít ý nghĩa. Các ước lượng trong phân tích hồi quy

không thật chính xác.

• Kiểm định về hiện tượng tự tương quan với dữ liệu bảng

Hiện tượng tự tương quan là hiện tượng khi các sai số trong mô hình có mối quan hệ với nhau, nguyên nhân sử dụng dữ liệu thời gian, độ trễ của số liệu, hiện tượng quán tính của số liệu, hậu quả dẫn đến ước lượng sẽ bị chệch.

Kiểm định Wooldridge được dùng để kiểm định tự tương quan trong dữ liệu bảng. H0: Không có hiện tương tự tương quan.

H1: Có hiện tượng tự tương quan

Nếu P-value > a: giả thuyết H0 được chấp nhận.

P-value < a: giả thuyết H0 bị bác bỏ, nghĩa là có hiện tượng tự tương quan

• Kiểm định phương sai sai số thay đổi

Một trong các giả định quan trọng khi thực hiện hồi quy tuyến tính đa biến là giả định phương sai của sai số không đổi (hay còn gọi là phương sai đồng nhất). Nếu xảy ra hiện tượng phương sai thay đổi, kết quả của phương trình hồi quy thu được khi sử dụng phương

Nếu p-value < a: Bác bỏ giả thuyết H0, nghĩa là bị vi phạm phương sai sai số thay đổi và ngược lại.

KẾT LUẬN CHƯƠNG 3

Trong chương 3, tác giả đã trình bày cụ thể cách chọn biến và lý giải lý do chọn biến trong mô hình. Đồng thời tác giả cũng làm rõ các nguồn dữ liệu đặc thù cũng như dữ liệu vĩ mô được thu nhập từ các chỉ tiêu trong bảng cân đối kế toán và báo cáo kết quả kinh

doanh thu thập từ báo cáo tài chính của 31 ngân hàng trong giai đoạn 2010-2020. Điểm nổi

bật của chương này là xét trong điều kiện các nhân tố không đổi đưa ra 7 giả thuyết như sau: H1: Tồn tại tương quan thuận giữa quy mô ngân hàng và hiệu quả hoạt động của ngân

hàng. H2: Tồn tại tương quan thuận giữa tỷ lệ tiền gửi trên tổng tài sản và hiệu quả hoạt động. H3: Tồn tại mối tương quan thuận giữa tỉ lệ tổng lãi ròng trên tổng tài sản và hiệu quả hoạt động của NH. H4: Tồn tại tương quan nghịch giữa ti lệ chỉ phí hoạt động trên thu

nhập và hiệu quả hoạt động. H5: Tồn tại mối tương quan thuận giữa tỉ lệ vốn chủ sở hữu với hiệu quả hoạt động của NH. H6: Tồn tại tương quan thuận giữa tốc độ tăng trưởng kinh

CHƯƠNG 4: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU

4.1 Khái quát thực trạng hoạt động của NHTM Việt Nam

4.1.1 Khái quát về hệ thống NHTM Việt Nam giai đoạn 2010-2020

Cho đến nay, ngành ngân hàng VN đã trải qua hơn 59 năm (bắt đầu từ 06.05.1951) xây dựng và phát triển, với nhiều chặng đường gay go và phức tạp nhưng vẫn ổn định và phát triển tốt. Đặc biệt là chặng đường từ năm 1986 cho đến nay, chặng đường đổi mới căn

bản và toàn diện của hệ thống ngân hàng Việt Nam. Thực hiện đường lối đổi mới toàn diện. Chủ tịch HĐBT (nay là Thủ tướng chính phủ) ký quyết định ngày 03.07.1987 cho làm thử việc chuyển hoạt động ngân hàng sang hạch toán kinh tế và kinh doanh XHCN, sau đó tổng kết và Chủ tịch HĐBT đã ban hành Nghị định 53/HĐBT ngày 26.03.1988 đổi mới mô hình tổ chức bộ máy ngân hàng VN, với sự ra đời của hệ thống ngân hàng chuyên doanh. Đến năm 1990, cơ chế đổi mới ngân hàng được hoàn thiện thông qua việc công bố hai Pháp lệnh ngân hàng vào ngày 24.05.1990 (Pháp lệnh Ngân hàng Nhà nước VN và Pháp lệnh ngân hàng, hợp tác xã tín dụng và công ty tài chính) đã chính thức chuyển cơ chế hoạt động của hệ thống NHVN từ “một cấp” sang “hai cấp”, trong đó NHNN hiện nay

chủ yếu hoạt động như một ngân hàng trung ương, trong khi các ngân hàng và các công ty tài chính có thể hoạt động độc lập với các hoạt động thương mại.Như vậy, hệ thống ngân hàng thương mại VN đã chính thức đánh dấu sự ra đời và phát triển khoảng 20 năm (từ 1990 đến nay).

Hệ thống các Ngân hàng thương mại ở Việt Nam phát triển mạnh đi kèm với số lượng tổ chức ngân hàng tăng với tốc độ rất nhanh: Tính đến năm 2020, ngành Ngân hàng Việt Nam có: 2 ngân hàng chính sách, 4 ngân hàng thương mại quốc doanh, 31 ngân

Hiệu quả hoạt động kinh doanh của NHTM

Các nhân tố bên ngoài