Quy trình thu thập dữ liệu và mẫu nghiên cứu

Một phần của tài liệu (LUẬN văn THẠC sĩ) các yếu tố tác động đến khả năng sinh lời của các ngân hàng thương mại cổ phần việt nam (Trang 39 - 46)

3.5.1. Nguồn dữ liệu

Nghiên cứu sử dụng bộ dữ liệu của 17 ngân hàng TMCP Việt Nam (BID, ACB, CTG, EIB, HDB, MBB, NVB, SHB, STB, TCB, TPB, VCB, VPB, BAB, KLB, LPB, VIB) trong giai đoạn 2011-2018 (136 quan sát), các dữ liệu liên quan đến ngành ngân hàng, kinh tế vĩ mô được lấy từ các ebsite của Tổng cục thống kê, NHNN, Ngân hàng phát triển châu Á, World Bank bao gồm 136 quan sát trong những năm từ 2011 đến 2018 để phân tích dữ liệu nhằm xác định được các yếu tố ảnh hưởng đến khả năng sinh lời. Bảng số liệu được trình bày ở Phụ lục 01. Việc chọn 17 ngân hàng niêm yết trên sàn thì việc thu thập số liệu được công khai, minh bạch, rõ ràng và trình bày đầy đủ trong báo cáo, thông tin sẽ được thể hiện chính xác, kịp thời cho người đọc, từ đó luận văn sẽ có cơ sở để thu thập dễ dàng và chính xác.

Trong luận văn này có 8 biến độc lập, 2 biến phụ thuộc dùng để tiến hành phân tích nhân tố nên số lượng mẫu đã thu thập được là 136 mẫu, được chấp nhận để dùng cho nghiên cứu của luận văn. Luận văn sử dụng:

Biến phụ thuộc: tỷ suất sinh lời trên tổng tài sản (ROA), tỷ lệ thu nhập lãi cận biên (NIM). Biến độc lập: Quy mô tổng tài sản (SIZE), Tỷ lệ vốn chủ sỡ hữu (CAP), Rủi ro tín dụng (NPL), Hiệu quả quản lý (CIR), Tính thanh khoản (LDR), Đầu tư công nghệ (TE) , Tỷ lệ tăng trưởng kinh tế (GDP), Lãi suất (IR).

Thống kê mô tả dữ liệu: Bộ dữ liệu để chạy mô hình là dữ liệu bảng (theo Dr. Nguyen Thi My Linh and Bui Ngoc Toan), có cấu trúc cân xứng bao gồm 136 quan sát. Dữ liệu bảng bao gồm hai yếu tố là: (1) dữ liệu chéo – các nhân tố thuộc dữ liệu chéo được phản ánh bởi các ngân hàng TMCP Việt Nam khác nhau⺁ (2) dữ liệu chuỗi thời gian – khoảng thời gian nghiên cứu từ 2011 – 2018. Dữ liệu bảng được sử dụng phổ biến hơn so với dữ liệu thời gian, dữ liệu chéo đơn thuần bởi nó có thể kiểm soát tốt hiện tượng tự tương quan và kiểm soát được hiện tượng đa cộng tuyến giữa các biến độc lập, dữ liệu bảng có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu chuỗi thời gian hay dữ liệu chéo thuần túy.

Phân tích hồi quy bảng nhằm tìm ra mối quan hệ giữa các biến độc lập (Quy mô tổng tài sản, Tỷ lệ vốn chủ sỡ hữu, Rủi ro tín dụng, Hiệu quả quản lý, Tính thanh khoản, Đầu tư công nghệ, Tỷ lệ tăng trưởng kinh tế, Lãi suất) đối với khả năng sinh lời (được đo lường bằng ROA, NIM) của các ngân hàng TMCP Việt Nam giai đoạn 2011-2018: luận văn áp dụng phân tích hồi quy theo phương pháp bình phương nhỏ nhất tổng quát (General Least Square - GLS) để xác định các nhân tố ảnh hưởng đến khả năng sinh lời của các ngân hàng TMCP Việt Nam.

Phương pháp thu thập dữ liệu: nghiên cứu lượng hóa các biến nghiên cứu bằng những con số cụ thể được thu thập từ nguồn dữ liệu từ báo cáo tài chính, báo cáo thường niên, IMF, World Bank và sử dụng hàm Logarithm cơ số tự nhiên để loại bỏ sự khác nhau trong đơn vị dữ liệu thu thập.

3.5.2. Chọn mẫu

Nghiên cứu sử dụng dữ liệu theo tần suất năm từ năm 2011 đến năm 2018.

3.5.3. Phân tích dữ liệu

Nghiên cứu sử dụng phần mềm Stata để kiểm định tác động của các biến với độ tin cậy 95 %.

3.5.4. Thống kê mô tả

Nghiên cứu tiến hành thống kê mô tả để giới thiệu tổng quan về bộ dữ liệu thu thập được, bao gồm: số quan sát, giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất, giá trị lớn nhất của các biến trong mô hình.

3.5.5. Phân tích tương quan

Phân tích tương quan cho thấy mức tương quan giữa các cặp biến trong mô hình nghiên cứu, chẳng hạn tương quan giữa một biến độc lập với biến phụ thuộc, hoặc một biến độc lập với một biến độc lập khác. Kết quả phân tích sẽ cho thấy tác động cùng chiều hoặc ngược chiều của từng biến độc lập lên các biến phục thuộc. Nếu hệ số tương quan có giá trị cao nhất > 0.8 - chuẩn so sánh theo Farrar và Glauber (1967) thì có thể có hiện tượng đa cộng tuyến nghiêm trọng (tự tương quan cao giữa các biến độc lập trong mô hình). Ở bước xem xét tương quan này, nghiên cứu chỉ ước tính việc xảy ra đa cộng tuyến dựa vào giá trị của hệ số tương quan. Điều này chỉ dừng lại ở việc xem xét chủ quan, việc chứng minh bằng những con số chính xác để xác định có hay không hiện tượng đa cộng tuyến sẽ được kiểm định thông qua hệ số phóng đại phương sai VIF. Qua kết quả phân tích tương quan có thể thấy mối quan hệ ban đầu giữa các biến với nhau. Ngoài sự tương quan giữa các biến độc lập và biến phụ thuộc, một số biến độc lập cũng có tương quan khá chặt với nhau, dự kiến phải thực hiện kiểm định về tính đa cộng tuyến của mô hình.

3.5.6. Kiểm định F-Test

Là một kiểm tra giả định thống kê trong kinh tế lượng sử dụng để so sánh hai phương pháp ước lượng Pooled Regression (Pooled OLS) và Fixed effects model (FEM). Hay nói cách khác để xem xét mô hình Pooled OLS hay FEM phù hợp hơn, ta sử dụng kiểm định F-Test.

Giả thuyết H0: Mô hình Pooled Regression là phù hợp. Giả thuyết H1: Mô hình FEM là phù hợp.

Nếu kiểm định cho kết quả là Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ giả thuyết H0(chọn mô hình Pooled OLS), tức là mô hình FEM là phù hợp với nghiên cứu của tác giả.

3.5.7. Kiểm định Hausman Test

Là một kiểm tra giả định thống kê trong kinh tế lượng được đặt theo tên của James Durbin, De-Min Wu và Jerry A. Hausman. Thuật toán này sử dụng để so sánh hai phương pháp ước lượng Fixed effects model (FEM) và Random effects model (REM). Hay nói cách khác để xem xét mô hình FEM hay REM phù hợp hơn, ta sử dụng kiểm định Hausman Test. Thực chất kiểm định Hausman Test để xem

xét có tồn tại tự tương quan giữa εi và các biến độc lập hay không. Kiểm định Hausman Test nhằm mục đích xác định mô hình tác động cố định hay ngẫu nhiên là phù hợp trong mô hình dữ liệu bảng. Kiểm định này nhằm xác định sai số ui có tương quan với các biến giải thích hay không.

Giả thuyết H0: Mô hình REM là phù hợp Giả thuyết H1: Mô hình FEM là phù hợp.

Nếu kiểm định cho kết quả là Prob > chi2 nhỏ hơn mức ý nghĩa thì bác bỏ giả thuyết H0(chọn mô hình REM), tức là mô hình FEM là phù hợp với nghiên cứu của tác giả.

3.5.8. Kiểm định Breusch and Pagan Lagrangian Multiplier

Là một kiểm tra giả định thống kê trong kinh tế lượng sử dụng để so sánh hai phương pháp ước lượng Pooled Regression (Pooled OLS) và Random effects model (REM). Hay nói cách khác để xem xét mô hình Pooled OLS hay REM phù hợp hơn, ta sử dụng kiểm định Breusch and Pagan Lagrangian Multiplier.

Giả thuyết H0: Mô hình Pooled Regression là phù hợp. Giả thuyết H1: Mô hình REM là phù hợp.

Nếu kiểm định cho kết quả là Prob > chi2 nhỏ hơn mức ý nghĩa thì bác bỏ giả thuyết H0(chọn mô hình Pooled OLS), tức là mô hình REM là phù hợp với nghiên cứu của tác giả.

3.5.9. Kiểm định phương sai thay đổi (còn gọi là phương sai của sai số thay đổi)

Một giả thiết quan trọng trong mô hình hồi quy tuyến tính cổ điển là các yếu tố nhiễu ui (hay còn gọi là phần dư residuals) xuất hiện trong hàm hồi quy tổng thể có phương sai không thay đổi (homoscedasticity, còn gọi là phương sai có điều kiện không đổi)⺁ tức là chúng có cùng phương sai. Nếu giả thiết này không được thỏa mãn thì có sự hiện diện của phương sai thay đổi. Khi có phương sai thay đổi, các ước lượng bình phương bé nhất vẫn là ước lượng không chệch nhưng không phải là ước lượng hiệu quả (ước lượng có phương sai nhỏ nhất), ước lượng của các phương sai sẽ bị chệch, do đó các kiểm định mức ý nghĩa và khoảng tin cậy dựa theo phân phối t và F không còn đáng tin cậy nữa. Nhưng nếu nghiên cứu vẫn sử dụng các công thức OLS thông thường, các kiểm định t và F dựa vào chúng có thể gây ra

những kết luận sai lầm. Phương sai của sai số thay đổi sẽ dẫn đến hiện tượng ngộ nhận các biến độc lập trong mô hình có ý nghĩa, lúc đó kiểm định hệ số hồi quy không dùng được (Hoàng Ngọc Nhậm 2007).

Bởi vì phương sai của sai số thay đổi làm mất tính hiệu quả của ước lượng, nên cần thiết phải tiến hành kiểm định giả thuyết phương sai của sai số không đổi với giả thuyết:

H0: Không có hiện tượng phương sai thay đổi. H1: Có hiện tượng phương sai thay đổi

Kiểm định phương sai thay đổi của mô hình OLS sẽ sử dụng kiểm định White , hoặc dùng kiểm định Breusch-Pagan, REM sẽ sử dụng kiểm định LM – Breusch and pagan Lagrangian Multiplier, mô hình FEM sẽ sử dụng kiểm định Wald.

Nếu kiểm định cho kết quả là Prob > chi2 lớn hơn mức ý nghĩa thì chấp nhận giả thuyết H0, không có hiện tượng phương sai thay đổi, ngược lại Prob > chi2nhỏ hơn mức ý nghĩa thì bác bỏ giả thuyết H0,chấp nhận giả thuyết H1.

Theo Wooldridge (2002), có thể sử dụng phương pháp bình phương nhỏ nhất tổng quát (General Least Square - GLS) để khắc phục hiện tượng phương sai thay đổi nhằm đảm bảo ước lượng thu được vững và hiệu quả.

3.5.10.Kiểm định đa cộng tuyến

Trong mô hình hồi qui bội, giả thiết giữa các biến giải thích của mô hình không có hiện tượng cộng tuyến, tức là các biến giải thích không có tương quan với nhau. Nếu xảy ra trường hợp một biến giải thích nào đó có tương quan với một số biến giải thích khác thì có nghĩa mô hình xảy ra hiện tượng cộng tuyến (Hoàng Ngọc Nhậm 2007).

Cụ thể, nếu các biến độc lập có quan hệ chặt với nhau, các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tương quan chặt, mạnh với nhau thì sẽ có hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện được dưới dạng hàm số. Ví dụ có hai biến độc lập A và B, khi A tăng thì B tăng, A giảm thì B giảm…. thì đó là một dấu hiệu của đa cộng tuyến. Nguyên nhân có thể khi chọn các biến độc lập mối quan có quan hệ nhân quả hay có tương quan cao vì đồng thời phụ thuộc vào một điều kiện khác. Hiện tượng đa cộng tuyến vi phạm giả

định của mô hình hồi qui tuyến tính cổ điển là các biến độc lập không có mối quan hệ tuyến tính với nhau. Để phát hiện đa cộng tuyến có thể sử dụng hệ số tương quan cặp giữa các biến giải thích cao như đã trình bày tại phân tích tương quan.

Nghiên cứu tiến hành kiểm định giả thuyết không bị hiện tượng đa cộng tuyến nghiêm trọng bằng cách dựa vào hệ số phóng đại phương sai VIF. Nếu VIF của tất cả các biến độc lập đều lớn hơn hoặc bằng 10, hiện tượng đa cộng tuyến được coi là nghiêm trọng (Gujrati 2003).

Các giải pháp khắc phục đa cộng tuyến: loại trừ biến độc lập ra khỏi mô hình (điều này xảy ra với giả định rằng không có mối quan hệ giữa biến phụ thuộc và biến độc lập bị loại bỏ mô hình). Hoặc bổ sung dữ liệu hoặc tìm dữ liệu mới, tìm mẫu dữ liệu khác hoặc gia tăng cỡ mẫu. Tuy nhiên nếu mẫu lớn hơn mà vẫn còn đa cộng tuyến thì vẫn có giá trị vì mẫu lớn hơn sẽ làm cho phương sai nhỏ hơn và hệ số ước lượng chính xác hơn so với mẫu nhỏ. Hoặc thay đổi dạng mô hình,mô hình kinh tế lượng có nhiều dạng hàm khác nhau. Thay đổi dạng mô hình cũng có nghĩa là tái cấu trúc mô hình, tức là phải thay đổi mô hình nghiên cứu.

3.5.11.Kiểm định tự tương quan

Nguyên nhân của tự tương quan là thứ nhất do hầu hết các chuỗi thời gian trong kinh tế là quán tính: như tổng sản phẩm quốc gia, chỉ số giá, thất nghiệp mang tính chu kỳ. Vì vậy trong hồi quy của chuỗi thời gian, các quan sát kế tiếp đó có nhiều khả năng phụ thuộc lẫn nhau, thứ hai là trong việc thu thập số liệu thứ cấp từ các nguồn dữ liệu, thì việc các ngân hàng làm tròn số liệu trên báo cáo đã làm giảm sự dao động trong số liệu. Chính sự làm tròn này có thể dẫn đến sai số có hệ thống và gây ra tự tương quan (Hoàng Ngọc Nhậm 2007).

Giữa các sai số có mối quan hệ tương quan với nhau sẽ làm cho các ước lượng thu được bằng phương pháp hồi quy thông thường trên dữ liệu bảng vững nhưng không hiệu quả, các kiểm định hệ số hồi quy không còn đáng tin cậy. Tiến hành kiểm định tự tương quan trong dữ liệu bảng theo nghiên cứu của Wooldridge (2002) với giả thuyết:

H0: Không có hiện tượng tự tương quan giữa các phần dư. H1: Có hiện tượng tự tương quan giữa các phần dư.

Nếu kiểm định cho kết quả là Prob > F nhỏ hơn mức ý nghĩa thì bác bỏ giả thuyết H0, tức là có hiện tượng tự tương quan giữa các phần dư, ngược lại Prob > F lớn hơn mức ý nghĩa thì bác bỏ giả thuyết H0, chấp nhận giả thuyết H1, mô hình không có hiện tượng tự tương quan giữa các phần dư.

Theo Wooldridge (2002), có thể sử dụng phương pháp bình phương nhỏ nhất tổng quát (General Least Square - GLS) để khắc phục hiện tượng tự tương quan nhằm đảm bảo ước lượng thu được vững và hiệu quả.

3.5.12.Phương pháp bình phương nhỏ nhất tổng quát (General Least Square - GLS)

Để khắc phục hiện tượng tự tương quan, hiện tượng phương sai thay đổi nhằm đảm bảo ước lượng thu được vững và hiệu quả.

Mô hình nghiên cứu được xem là không phù hợp khi tất cả các hệ số hồi quy bằng 0, và mô hình được xem là phù hợp nếu có ít nhất một hệ số hồi quy khác 0.

Giả thuyết:

H0: các hệ số hồi quy đều bằng không. H1: có ít nhất một hệ số hồi quy khác không.

Nếu kết quả nghiên cứu cho thấy Prob > chi2nhỏ hơn mức ý nghĩa thì bác bỏ giả thuyết H0, kết quả mô hình là phù hợp và có thể sử dụng được.

Tóm tắt chương 3

Trong Chương 3, luận văn đã xây dựng mô hình hồi quy đa biến cho mô hình nghiên cứu đề xuất ban đầu, gồm hai biến phụ thuộc và tám biến độc lập. Bài nghiên cứu sử dụng dữ liệu bảng (panel data) theo ba phương pháp Pooled Regression (Pooled OLS)/ Fixed effects model (FEM)/ Random effects model (REM), thực hiện các kiểm định để chọn ra phương pháp phù hợp nhất đo lường khả năng sinh lời, sử dụng phương pháp GLS để khắc phục hiện tượng tự tương quan, hiện tượng phương sai thay đổi nhằm đảm bảo ước lượng thu được vững và hiệu quả.

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU

Một phần của tài liệu (LUẬN văn THẠC sĩ) các yếu tố tác động đến khả năng sinh lời của các ngân hàng thương mại cổ phần việt nam (Trang 39 - 46)

Tải bản đầy đủ (PDF)

(100 trang)