Tác giả sử dụng phuơng pháp phân tích hồi quy đa biến cho dữ liệu bảng (panel data). Dữ liệu bảng là dữ liệu có hai chiều: chiều không gian và chiều thời gian. Nói cách khác, dữ liệu bảng là sự mở rộng dữ liệu chéo (cross section) theo thời gian (time series). Việc lựa chọn sử dụng dữ liệu bảng sẽ có nhiều uu điểm hơn so với dữ liệu chuỗi thời gian hay dữ liệu chéo. Hồi quy bằng dữ liệu bảng thuờng
36
sử dụng ba phương pháp hồi quy theo các mô hình Pooled, mô hình tác động ngẫu nhiên và mô hình tác động cố định.
Tác giả sử dụng phần mềm hỗ trợ Eviews 8 để thực hiện mô hình và kiểm định mô hình. Các bước trong quy trình được thực hiện chi tiết như sau:
Bước 1: Thống kê mô tả dữ liệu.
Thống kê mô tả được sử dụng nhằm mô tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu qua các cách thức khác nhau. Qua thống kê mô tả này trình bày được giá trị trung bình của các biến thông qua tiêu chí giá trị trung bình, giá trị nhỏ nhất và giá trị lớn nhất, giá trị trung vị và sai số chuẩn giữa các giá trị. Thông qua các tiêu chí được thống kê đó, ta có thể hiểu được các hiện tượng và đưa quyết định đúng đắn về chuỗi dữ liệu nghiên cứu.
Bước 2: Lựa chọn mô hình hồi quy phù hợp giữa Pooled OLS, FEM và REM.
Thực hiện phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập quy định các biến phụ thuộc như thế nào. Kết quả hồi quy được xem là bằng chứng thực nghiệm để đánh giá tác động. Các mô hình hồi quy được tác giả xem xét gồm có: Pooled OLS, Fixed effect, Random effect. Để chọn ra được mô hình phù hợp nhất cho bài nghiên cứu, chúng ta cần phải xem xét các nội dung và đặc điểm của các mô hình ước lượng này:
Mô hình hồi quy Pooled OLS:
Yit = α + βX1t + μ1t
Trong đó:
Yit: Biến phụ thuộc của quan sát i trong thời kỳ t Xit: Biến độc lập của quan sát i trong thời kỳ t
Đối với phương pháp Pooled OLS thực chất là việc sử dụng dữ liệu bảng để phân tích bằng hình thức sử dụng tất cả dữ liệu theo cách xếp chồng không phân biệt từng đơn vị chéo riêng. Đây là phương pháp đơn giản nhất, giống sử dụng dữ liệu như một phân tích OLS bình thường, không kể đến kích thước không gian và thời gian của dữ liệu bảng.
37
Nhược điểm của phương pháp Pooled OLS là bỏ qua các đặc điểm riêng khác nhau của các đơn vị về thời gian lẫn không gian.
Mô hình tác động cố định - FEM
Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, FEM phân tích mối tương quan này giữa phần dư của mỗi đơn vị với các biến giải thích qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực (net effects) của biến giải thích lên biến phụ thuộc.
Mô hình hồi quy sử dụng: Yit = O1 + βXit + μ1t
Trong đó:
Yit: biến phụ thuộc Xit: biến độc lập
Oi (11.. .11): hệ số chặn cho từng đơn vị nghiên cứu. β: hệ số góc đối với nhân tố X.
Eit: phần dư.
Mô hình tác động ngẫu nhiên - REM
Xét mô hình: Yit = Oi + βXit + μit
Thay vì trong mô hình trên Oi là cố định (không thay đổi theo thời gian) thì phương pháp REM giả định rằng nó là một biến ngẫu nhiên với Oi = O + εi (i= 1, 2, .., n), thay vào trong mô hình ban đầu ta có: Yit = O + βXit + εi + μll.
Trong đó εi là thành phần sai số theo đơn vị chéo và μit là thành phần sai số chéo và chuỗi thời gian kết hợp. Như vậy, với phương pháp REM, thay vì coi mỗi đặc điểm riêng của các đơn vị có tương quan tới biến độc lập và tách tác động đó ra như trong FEM thì phương pháp REM coi các đặc điểm riêng đó là ngẫu nhiên và không tương quan tới các biến độc lập mà giống như một biến giải thích mới tác động tới biến phụ thuộc.
38
So với phương pháp FEM, phương pháp REM có thể khắc phục được những nhược điểm của FEM nhưng REM coi mỗi đặc điểm riêng của các đơn vị εi không tương quan với các biến độc lập do đó nếu điều này vi phạm thì REM sẽ ước lượng không còn chính xác.
Qua nội dung của ba phương phương pháp ước lượng trên tác giả nhận thấy rằng mô hình REM và FEM có nhiều ưu điểm hơn so với mô hình Pooled OLS. Tuy nhiên để có được một mô hình tối ưu nhất, tác giả sẽ đi theo trình tự như sau: đầu tiên tiến hành ước lượng Pooed OLS, sau đó ước lượng mô hình Fixed Effect. Để biết giữa mô hình Pooled OLS và nhóm mô hình FEM và REM mô hình nào phù hợp hơn bằng cách sử dụng công cụ Redundant Fixed Effects trên Eviews 8 để kiểm định xem hệ số chặn của hàm hồi quy của từng ngân hàng có khác nhau không. Nếu không có sự khác nhau, ta có thể chọn Pooled OLS làm mô hình ước lượng cho bài nghiên cứu và nếu trường hợp ngược lại nhóm mô hình FEM và REM phù hợp thì ta phải tiến hành kiểm định Hausman nhằm lựa chọn một trong hai mô hình Fixed effect và Random effect, xem mô hình nào là mô hình phù hợp nhất cho bài nghiên cứu này.
Bước 3: Phương pháp kiểm định các hệ số hồi quy và sự phù hợp của mô hình.
Đầu tiên tác giả sẽ thực hiện kiểm định thừa biến để loại bỏ những biến không cần thiết ra khỏi mô hình. Các biến được sử dụng là các biến không có ý nghĩa thống kê từ kết quả ước lượng của các mô hình Pooled OLS, FEM và REM. Để thực hiện tác giả sử dụng kiểm định Wald để kiểm tra sự cần thiết của các biến không có ý nghĩa thống kê đối với mô hình. Sau khi loại bỏ biến thừa (nếu có), tác giả sẽ chạy lại mô hình phù hợp được lựa chọn với biến độc lập còn lại, rồi tiến hành kiểm định các hệ số hồi quy. Tác giả quyết định sử dụng kiểm định t (t-test) để kiểm tra sự phù hợp của các hệ số hồi quy. Theo kinh nghiệm, một hệ số hồi quy được xem là phù hợp khi có mức ý nghĩa thống kê là 1% hoặc 5% hoặc 10%, tương ứng với độ tin cậy là 99%, 95% và 90%.
39
Kiểm định hiện tượng đa cộng tuyến: Tác giả sẽ tiến hành kiểm định đa cộng tuyến bằng hai cách. Cách một là thông qua phân tích hệ số tương quan nhằm kiểm định đa cộng tuyến của từng cặp biến độc lập. Hệ số tương quan (Pearson) được tính bằng cách chia hiệp phương sai của biến với tích độ lệch chuẩn của chúng. Nếu hệ số tương quan giữa các biến độc lập lớn hơn 0.8 (còn được gọi là hệ số tương quan cao), ta có hiện tượng đa cộng tuyến cao. Cách hai là kiểm định đa cộng tuyến giữa một biến độc lập so với các biến độc lập còn lại thông qua sử dụng thừa phóng đại phương sai VIF. Nếu hiện tượng đa cộng tuyến xảy ra, tác giả sẽ khắc phục bằng cách bỏ đi biến độc lập có đa cộng tuyến, đây là cách làm đơn giản nhất vì sau khi bỏ biến độc lập có đa cộng tuyến, các hệ số hồi quy của các biến còn lại từ chỗ khác 0 và không có ý nghĩa thống kê có thể trở thành khác 0 có ý nghĩa thống kê.
Kiểm định hiện tượng tự tương quan: tác giả sẽ tiến hành kiểm định dựa trên quy tắc kiểm định Durbin - Watson theo kinh nghiệm. Nếu có hiện tượng tự tương quan xảy ra, tác giả quyết định chọn biến pháp khắc phục là ước lượng ρ dựa trên thống kê d - Durbin - Watson.
Kiểm định hiện tượng phương sai thay đổi: tác giả sẽ tiến hành kiểm định Breusch - Pagan cho mô hình Pooled OLS hoặc FEM. Nếu mô hình có phương sai thay đổi sẽ được khắc phục mô hình nghiên cứu bằng cách ước lượng lại mô hình được chọn bằng phương pháp GLS. Nếu trong trường hợp mô hình REM được chọn thì đề tài chỉ tiến hành kiểm định đa cộng tuyến và tự tương quan do mô hình Random Effect chưa có cách thức kiểm định phương sai thay đổi.
Trung bình Lớn nhất Nhỏ nhất Độ lệchchuẩn Số quansát ROA 2.8017 6.10217 -1.16115 0.71010 1023 SDA 55.0715 0 83.85191 1.19200 2.08431 1023 LDA 12.28611 79.45270 0.00000 1.66676 1023 LQ 1.54871 1.48211 0.10311 2.04661 1023 SGROWTH 23.1403 0 40.74890 -0.954691 1.50155 1023 SIZE 6.26227 10.36367 0.43178 1.38629 1023 INF 8.33640 19.89000 0.63000 0.05496 1023 40 KẾT LUẬN CHƯƠNG 3
Trong chương này, tác giả đã giới thiệu về mô hình nghiên cứu, giải thích ý nghĩa của các biến trong mô hình và kì vọng dấu về các biến. Ở phần giới thiệu mô hình, tác giả đã thiết kế mô hình cho đề tài dựa trên cơ sở lí thuyết đã trình bày ở Chương 2. Đồng thời, tác giả cũng xác định các biến độc lập cùng biến phụ thuộc và làm rõ mô hình thông qua việc trình bày công thức, ý nghĩa và bảng kì vọng dấu của các biến trên. Từ đó làm cơ sở cho việc thực hiện mô hình và kết luận đề tài cho chương sau.
41
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
Chương này sẽ đi vào cụ thể cách thức thực hiện mô hình nghiên cứu dựa theo số liệu đã thu thập bao gồm thống kê mô tả và chạy mô hình. Từ kết quả nghiên cứu thu được, chương cũng sẽ đưa ra các phân tích liên quan.