Yếu tố đại diện biến nghiên cứu và kỳ vọng dấu

Một phần của tài liệu Luận văn thạc sĩ UEH các yếu tố ảnh hưởng đến lợi nhuận của các ngân hàng thương mại việt nam (Trang 48 - 58)

STT Ký hiệu

biến Đo lường

Dấu kỳ vọng

Biến phụ thuộc

ROA Lợi nhuận sau thuế/ Tổng tài sản ROE Lợi nhuận sau thuế/Tổng vốn sở hữu NIM (Thu nhập lãi – chi phí lãi)/Tổng tài sản

Biến độc lập

1 SIZE Logarit tự nhiên của tổng tài sản +/- 2 OC Chi phí hoạt động chia cho tổng tài sản +/- 3 CR

𝐶𝑅 =(𝑛ợ đã 𝑥ử 𝑙ý − 𝑛ợ đã 𝑥ử 𝑙ý đã 𝑡ℎ𝑢 ℎồ𝑖 đượ𝑐)𝑡

4 KAP Tỷ số vốn cổ phần trên tổng tài sản +/- 5 LQ [(Tiền gửi không kỳ hạn + Cam kết cho vay chưa sử

dụng) - (Tiền mặt và Tiền gửi tại các tổ chức khác + Chứng khoán kinh doanh + Tiền gửi tại Ngân hàng nhà nước + Thương phiếu+chứng khoán đầu tư sẵn sàng để bán + cho vay liên ngân hàng + Chứng khoán phái sinh ròng)]/Tổng tài sản.

-

6 LOTA Tổng dư nợ / Tổng tài sản +/-

7 GDP Tốc độ tăng trưởng GDP +/-

8 INF Chỉ số lạm phát CPI +/-

Trước khi tiến hành chạy hồi quy, nghiên cứu sẽ tiến hành kiểm định các khuyết tật của mơ hình như: hiện tượng phương sai của sai số thay đổi, hiện tượng tự tương quan, hiện tượng đa cộng tuyến, và tương quan phụ thuộc chéo.

4.2 THU THẬP VÀ XỬ LÝ DỮ LIỆU 4.2.1 Dữ liệu nghiên cứu 4.2.1 Dữ liệu nghiên cứu

Bài luận văn này được tiến hành dựa trên mẫu nghiên cứu là các NHTM tại Việt Nam. Bài luận văn sử dụng dữ liệu thứ cấp, được lấy từ các báo cáo tài chính được kiểm tốn và cơng bố hằng năm của các ngân hàng, bankscope. Các dữ liệu kinh tế vĩ mô được thu thập từ trang website của ngân hàng thế giới.

Bài luận văn được thực hiện dựa trên số liệu của 17 NHTM tại Việt Nam trong giai đoạn 2006-2015, danh sách ngân hàng trình bày ở phụ lục. Cơ sở của việc lựa chọn NHTM được trình bày như sau:

 NHTM trong mẫu nghiên cứu khơng bao gồm các ngân hàng có hiện tượng hợp nhất-sáp nhập, nếu số liệu báo cáo tài chính của ngân hàng sau khi hợp nhất-sáp nhập có biến động quá lớn so với số liệu báo cáo tài chính của ngân hàng trước khi hợp nhất-sáp nhập thì sẽ bị loại khỏi mẫu nghiên cứu.

 Không bao gồm những ngân hàng nước ngoài và những ngân hàng liên doanh giữa Việt Nam và các nước tính đến thời điểm 2015 theo báo cáo tài chính cơng bố.

 Số liệu về các biến đo lường (biến phụ thuộc, biến độc lập) phải được công bố minh bạch và đầy đủ nhất theo từng năm trong giai đoạn 2006-2015. Nguyên nhân loại bỏ một số ngân hàng ra khỏi mẫu nghiên cứu là do một số cân nhắc sau:

 Số liệu của các ngân hàng hợp nhất, sáp nhập sẽ không cịn phản ứng đúng tình hình hoạt động của ngân hàng trước khi hợp nhất, sáp nhập.

 Số liệu về các biến đo lường của những ngân hàng nước ngoài và những ngân hàng liên doanh thường không được công bố rộng rãi, cấu trúc của các ngân hàng thường chịu ảnh hưởng từ các ngân hàng mẹ ở nước ngoài, cách thức hoạt động và tổ chức cũng không đồng đều với các ngân hàng trong nước. Sự khác biệt này có thể dẫn đến sai lệch kết quả nghiên cứu.

 Số liệu các biến đo lường không đầy đủ của các NHTM sẽ làm cho mẫu bị thiếu và sẽ làm sai lệch hoàn toàn kết quả của nghiên cứu.

4.2.2 Sự phù hợp của kích thước mẫu

Kết quả sau khi lấy dữ liệu 17 NHTM từ năm 2006 đến 2015, mẫu nghiên cứu có tổng cộng 170 quan sát phù hợp. Kích thước mẫu nghiên cứu trong luận văn này có thể căn cứ vào một trong những kỹ thuật xác định kích cỡ mẫu Green (1991). Cụ thể, tác giả khuyến nghị công thức xác định cỡ mẫu nghiên cứu như sau:

Trong đó, n là kích thước mẫu tối thiểu cần thiết và m là số lượng biến độc lập trong mơ hình. Căn cứ theo cơng thức trên, với số lượng biến độc lập trong mơ hình là 8 nên kích thước mẫu nghiên cứu tối thiểu phải là 114 số quan sát. Mặt khác, kích cỡ mẫu nghiên cứu của luận văn này là 170 mẫu quan sát nên mẫu nghiên cứu hoàn toàn chấp nhận được.

4.2.3 Phương pháp xử lý dữ liệu

Thực nghiệm trong kinh tế là giải thích mối quan hệ giữa các đại lượng độc lập đối với biến phụ thuộc. Hay nói cách khác là nghiên cứu thực nghiệm muốn biết sự tác động của Xi| lên Y theo chiều hướng lẫn độ tác động như thế nào. Để trả lời được vấn đề này thì phải dựa vào mẫu dữ liệu thu thập nhằm có một kết quả ước lượng không chệch của biến độc lập đối với biến phụ thuộc. Việc kiểm soát được kết quả ước lượng trong mơ hình hồi quy thì điều tiên quyết là phải kiểm sốt được các biến nhiễu trong mơ hình, bao gồm những biến quan sát được và không quan sát được. Đối với những thành phần nhiễu quan sát được thì việc mơ hình tuyến tính cổ điển Gauss (CLRM) có thể giải quyết được những vấn đề thường xuyên gặp phải trong mơ hình như: Phương sai của nhiễu, tương quan phần dư của nhiễu, tính đa cộng tuyến. Đồng thời ước lượng OLS trên mơ hình thuộc dạng dữ liệu quan sát nhiễu được như thế này sẽ mang ước lượng khơng có độ thiên lệch (khơng chệch) hoặc sai số đặc trưng, có tính nhất qn và hiệu quả nhất (tính chất BLUE). Cịn đối với các biến nhiễu khơng quan sát được, điều đó tùy vào đặc điểm, tính chất khác nhau của từng lớp đối tượng và thời gian mà lựa chọn mơ hình hồi quy tác động cố định (FEM) hay mơ hình hồi quy tác động ngẫu nhiên (REM) cho phù hợp. Cả hai mơ hình này đều địi hỏi chúng ta phải thao tác và sử dụng dữ liệu bảng (panel data).

Dữ liệu bảng đơi khi cịn được gọi là dữ liệu gộp (longitudinal data) mô tả nhiều đại lượng tương ứng với tần số quan sát qua nhiều đối tượng (cá nhân, doanh nghiệp, tỉnh, thành phố, quốc gia) theo một chuỗi thời gian xác định cho từng đối tượng là như nhau. Có thể nói dữ liệu bảng là sự kết hợp của dữ liệu chéo (cross-

ta cần tiến hành thu thập một hoặc nhiều đặc điểm của đối tượng nghiên cứu trong cùng một khoảng thời gian. Dữ liệu bảng có nhiều ưu thế hơn so với nhóm dữ liệu thơng thường, điển hình dữ liệu bảng có 2 điểm nổi trội như sau:

Đầu tiên, các ước lượng tham số trong mơ hình hồi quy bằng dữ liệu bảng sẽ cho kết quả có độ tin cậy cao hơn, điều này được thể hiện qua ba yếu tố: Thứ nhất dữ liệu bảng sẽ kiểm sốt được những thành phần khơng quan sát được. Các thành phần này có thể không giống nhau giữa các đối tượng nhưng không thay đổi theo thời gian hoặc có thay đổi theo thời gian nhưng giống nhau giữa các đối tượng. Điều này phần nào đã làm thay đổi để giảm sự chênh lệch trong ước lượng tham số mơ hình. Yếu tố thứ hai, thông thường sự biến động trong dữ liệu bảng thường nhiều hơn so với dữ liệu chéo hoặc dữ liệu thời gian. Sự biến động cho một đặc điểm trong dữ liệu càng nhiều thì hiển nhiên độ chính xác của các ước lượng đó càng tăng, tức là có nhiều biến động thì càng có nhiều giải thích cho việc ước lượng tham số. Yếu tố thứ ba, có ít đa cộng tuyến trong các biến giải thích ở dữ liệu bảng hơn so với dữ liệu chéo hoặc dữ liệu thời gian. Vì vậy kết quả ước lượng trong mơ hình dữ liệu bảng được nâng độ chính xác cao hơn.

Thứ hai, dữ liệu bảng xác định và đo lường được những tác động mà những tác động đó khơng được tìm thấy hay khơng xác định khi sử dụng dữ liệu chéo hoặc theo chuỗi dữ liệu thời gian riêng lẻ. Chẳng hạn, xét một ví dụ cụ thể về đánh giá lợi thế thu nhập theo kinh nghiệm làm việc và trình độ của nhiều cá nhân trong một lĩnh vực cụ thể. Với dữ liệu chéo, ta có thể dự báo được sự thay đổi của trình độ của từng cá nhân. Đối với dữ liệu theo thời gian, thì khơng thể tách riêng được yếu tố lợi thế thu nhập theo trình độ dựa vào kinh nghiệm làm việc của cá nhân. Giả định nghiên cứu trong dữ liệu thời gian là thu nhập không đổi theo kinh nghiệm làm việc. Tuy nhiên, đây là một phương pháp không đáng tin cậy. Với dữ liệu bảng ta có thể xác định và đo lường cả hai yếu tố lợi thế thu nhập theo kinh nghiệm dựa vào trình độ của từng cá nhân.

Tóm lại, việc sử dụng hồi quy theo dữ liệu bảng sẽ thu được những kết quả khả quan trong việc ước lượng các hệ số gốc của các biến độc lập trong mơ hình có nhiều yếu tố đặc trưng, đảm bảo được tính chất ước lượng trong hồi quy là khơng có độ chệch, mang tính hiệu quả. Trong khi dữ liệu theo thời gian thuần túy hoặc dữ liệu chéo thì khơng thể xác định được.

4.2.3.1 Các bước lựa chọn mơ hình phù hợp phân tích.

Các bước phân tích để lựa chọn mơ hình phù hợp cụ thể như sau:

Bước 1: Tác giả sử dụng phép toán và các câu lệnh trong phần mềm Stata

tiến hành thực hiện phân tích phương pháp hồi quy Pooled OLS và FEM, sau đó so sánh kết quả để lựa chọn 1 mơ hình phù hợp nhất trong 2 mơ hình này. Sau khi ước lượng với FEM, sử dụng kiểm định F để kiểm định giả thuyết H0: α1 = α2 = … αN = α. Nếu kết quả kiểm định bác bỏ giả thuyết H0, chúng ta nên chọn FEM, ngược lại, chọn Pooled OLS.

Bước 2: Tác giả so sánh giữa 2 mơ hình Pooled OLS với REM, phương pháp

nhân tử Lagrange (LM) với kiểm định Breusch-Pagan được sử dụng để kiểm chứng tính phù hợp của ước lượng. Theo đó, giả thuyết H0 cho rằng sai số của ước lượng thô không bao gồm các sai lệch giữa các doanh nghiệp hoặc các năm (phương sai giữa các doanh nghiệp) là không đổi. Bác bỏ giả thuyết H0, cho thấy sai số trong ước lượng có bao gồm cả sự sai lệch giữa các nhóm, và phù hợp với mơ hình REM, ngược lại, Pooled OLS là phù hợp hơn REM.

Sau khi thực hiện xong 2 bước trên, nếu kết quả kiểm định cho thấy, cả 2 bước này Pooled OLS đều phù hợp hơn FEM và REM, tác giả sẽ lựa chọn phương pháp hồi quy Pooled OLS. Nếu không phải kết quả này, tác giả sẽ thực hiện tiếp bước thứ 3 như sau:

Bước 3: Tác giả thực hiện ước lượng với FEM và REM, sử dụng kiểm định

thuyết H0, tác giả chọn FEM. Nếu kết quả kiểm định không bác bỏ giả thuyết H0, tác giả sẽ chọn REM.

Bởi vì, một mơ hình chỉ có ý nghĩa giải thích khi các giả định của nó đã được thỏa mãn. Do vậy, trong luận văn này, tác giả sẽ phải kiểm tra các giả định trước khi diễn giải các kết quả của mơ hình. Q trình kiểm tra các giả định có thể được thực hiện thơng qua việc phát hiện khuyết tật có thể có của mơ hình. Nội dung kế tiếp sẽ thực hiện các kiểm định này.

4.2.3.2 Kiểm định các khuyết tật của mơ hình và lựa chọn mơ hình hồi quy.

(1) Giả định phương sai của sai số không đổi:

Phương sai thay đổi nghĩa là phương sai của các phần dư là không phải hằng số, nghĩa là chúng khác nhau ở các quan sát khác nhau. Điều này sẽ dẫn đến vấn đề nếu các phương sai khơng bằng nhau thì độ tin cậy tương đối của mỗi quan sát (dữ liệu) sẽ không bằng nhau. Phương sai càng lớn thì mức độ quan trọng gán cho quan sát càng nhỏ. Vấn đề sẽ rõ ràng hơn khi giá trị của phương sai có mối quan hệ với một hoặc một số biến giải thích. Điều này vi phạm giả định rằng các phân phối của phần dư phải khơng có tương quan với bất kì biến giải thích nào.

Hiện tượng phương sai thay đổi sẽ dẫn đến một số hậu quả như: các ước lượng OLS vẫn là khơng chệch nhưng khơng cịn hiệu quả nữa, ước lượng của các phương sai sẽ bị chệch, như vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.

Trong quá trình hồi quy, tác giả sẽ tập trung xem xét lại bản chất của vấn đề nghiên cứu, đồ thị phần dư và dùng một số kiểm định Goldfeld-Quandt, Breusch- Pagan, White, Park trên OLS và phương pháp Greene (2000) trên dữ liệu bảng để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng phương sai thay đổi.

(2) Giả định khơng có sự tương quan giữa các phần dư:

Tự tương quan là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gian, hoặc sắp xếp theo thứ tự không gian, đối với các số liệu theo không gian.

Để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng tự tương quan. Trong quá trình hồi quy, tác giả sẽ dùng phương pháp đồ thị và kiểm định d (Durbin-Watson) để phát hiện tượng tự tương quan trong mơ hình hồi quy OLS (pooled regression). Ở khía cạnh kiểm tra phương sai thay đổi dữ liệu bảng, tác giả sử dụng kiểm định được đề xuất bởi Wooldridge (2002) và Drukker (2003).

Hiện tượng tự tương quan sẽ dẫn đến một số hậu quả như: ước lượng OLS vẫn là ước lượng tuyến tính khơng chệch, nhưng khơng là ước lượng hiệu quả nữa; phương sai các ước lượng OLS là bị chệch, đôi khi quá thấp so với phương sai thực và sai số tiêu chuẩn, dẫn đến phóng đại tỷ số t; các kiểm định t và F khơng đáng tin cậy; cơng thức thơng thường để tính phương sai của sai số là ước lượng chệch của phương sai thực và trong một số trường hợp dường như ước lượng thấp của phương sai thực; có thể hệ số xác định không đáng tin cậy và dường như là nhận giá trị ước lượng cao; các phương sai và số tiêu chuẩn của dự đốn khơng có hiệu quả.

(3) Giả định khơng có mối tương quan giữa các biến độc lập (không xảy ra hiện tượng đa cộng tuyến):

Đa cộng tuyến nghĩa là hai hay nhiều biến giải thích trong biểu thức hồi quy có mối quan hệ tuyến tính với nhau. Nếu các biến có mối quan hệ tuyến tính thì các hệ số ước lượng và thống kê T sẽ khơng cịn hợp lý.

Trong q trình hồi quy, kết quả hồi quy có hệ số xác định R2 cao nhưng tỷ số t thấp, tương quan cặp giữa các biến giải thích cao, xét tương quan riêng, hồi quy phụ thấy có tồn tại hiện tượng tương quan giữa các biến độc lập thì mơ hình đã vi phạm giả thiết hồi quy - hiện tượng đa cộng tuyến.

Hiện tượng đa cộng tuyến sẽ dẫn đến một số hậu quả như: phương sai và hiệp phương sai của các ước lượng OLS lớn, khoảng tin cậy rộng lớn, tỷ số t mất ý nghĩa, hệ số xác định cao nhưng tỷ số t mất ý nghĩa, các ước lượng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu, dấu của các ước lượng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến cịn lại có thể thay đổi rất lớn và thay đổi cả dấu của chúng.

Đa cộng tuyến giữa các biến luôn tồn tại và khuyết tật chỉ xảy ra nếu mức độ đa cộng tuyến đủ lớn để gây ra sự thiên chệch các kết quả ước lượng.

Theo Gujarati (2004), một số cách kiểm tra vấn đề đa cộng tuyến như sau: - Nhiều trường hợp mơ hình có R2 lớn hơn 0.8 nhưng | t | thấp.

- Hệ số tương quan giữa các cặp biến độc lập cao. Nếu giá trị tuyệt đối của hệ số tương quan giữa 2 biến lớn hơn 0.8 cho thấy có tồn tại hiện tượng đa cộng tuyến giữa 2 biến này.

Một phần của tài liệu Luận văn thạc sĩ UEH các yếu tố ảnh hưởng đến lợi nhuận của các ngân hàng thương mại việt nam (Trang 48 - 58)

Tải bản đầy đủ (PDF)

(106 trang)