5. Mức độ phù hợp về mặt hình thức của khóa luận:
3.3. Phƣơng pháp nghiên cứu
Để đạt đƣợc mục tiêu nghiên cứu đƣợc đề ra, tác giả sử dụng phƣơng pháp nghiên cứu là hồi quy dữ liệu bảng (panel data). Chi tiết quy trình thực hiện đƣợc mô tả ở sơ đồ nhƣ sau:
Sơ đồ 3.1. Quy trình thực hiện ước lượng hồi quy
Nguồn: Tổng hợp của tác giả Để thực hiện quy trình nhƣ trên, tác giả sử dụng phần mềm hỗ trợ là Stata 14.0 để thực hiện ƣớc lƣợng mô hình và kiểm định mô hình. Chi tiết từng bƣớc đƣợc mô tả nhƣ sau:
Bƣớc 1: Thống kê mô tả dữ liệu
Thống kê mô tả đƣợc sử dụng nhằm mô tả những đặc tính cơ bản của dữ liệu thu thập đƣợc từ nghiên cứu qua các cách thức khác nhau. Qua thống kê mô tả này trình bày đƣợc giá trị trung bình của các biến thông qua tiêu chí giá trị trung bình, giá trị nhỏ nhất và giá trị lớn nhất, giá trị trung vị và sai số chuẩn giữa các giá trị. Thông qua các tiêu chí đƣợc thống kê đó, ta có thể hiểu đƣợc các hiện tƣợng và đƣa quyết định đúng đắn về chuỗi dữ liệu nghiên cứu.
Bƣớc 2: Kiểm định mô hình Pooled OLS, FEM và REM
Hồi quy dữ liệu bảng sử dụng ba phƣơng pháp chính, đó là phƣơng pháp Pooled OLS, phƣơng pháp tác động cố định (FEM) và phƣơng pháp tác động ngẫu nhiên (FEM).
Phương pháp Pooled OLS thực chất là việc sử dụng dữ liệu bảng để phân tích bằng hình thức sử dụng tất cả dữ liệu theo cách xếp chồng và không phân biệt từng đơn vị chéo riêng. Đây là phƣơng pháp thông thƣờng và đơn giản nhất, tƣơng tự nhƣ việc phân tích OLS bình thƣờng, không kể đến kích thƣớc không gian và thời gian của dữ liệu. Mô hình Pooled OLS đƣợc cụ thể nhƣ sau:
𝐿iiiiiiiiiiiiiii=�1+ 𝐿1𝐿1iiiiiiiiiiiiii i + 𝐿2𝐿2iiiiiiiiiiiiii i+. . +++++++++++++++ 𝐿𝐿iiiiiiiiiiiiiii + +++++++++++++++ iiiiiiiiiiiiiii
Trong đó 𝐿iiiiiiiiiiiiiii là biến phụ thuộc của quan sát i trong thời kỳ t, 𝐿iiiiiiiiiiiiiii là biến độc lập của quan sát k trong thời kỳ k.
Mô hình này có một số nhƣợc điểm, đó là nhận diện sai thể hiện ở Durbin – Watson (DW) và ràng buộc quá chặt về các đơn vị chéo, điều này khó xảy ra so với thực tế. Vì thế, để khắc phục các nhƣợc điểm trên, mô hình FEM và REM đƣợc sử dụng.
Để thể hiện tác động đặc trƣng của mỗi đơn vị chéo đến biến phụ thuộc nhằm cho tung độ gốc thay đổi đối với mỗi đơn vị nhƣng hệ số độ dốc không thay đổi. Phƣơng pháp đó đƣợc gọi là phƣơng pháp hồi quy theo mô hình tác động cố định (FEM), nghĩa là tung độ gốc có thể khác nhau giữa các đơn vị chéo nhƣng không thay đổi theo thời gian.
Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hƣởng đến các biến giải thích, FEM phân tích mối tƣơng quan này giữa phần dƣ của mỗi đơn vị với các biến giải thích qua đó kiểm soát và tách ảnh hƣởng của các đặc điểm riêng biệt
(không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ƣớc lƣợng những
ảnh hƣởng thực (net effects) của biến giải thích lên biến phụ thuộc. Mô hình FEM có dạng nhƣ sau:
𝐿iiiiiiiiiiiiiii = 𝐿i + 𝐿𝐿iiiiiiiiiiiiiii + +++++++++++++++iiiiiiiiiiiiiii
Trong đó 𝐿iiiiiiiiiiiiiii là biến phụ thuộc của quan sát i trong thời gian t, 𝐿iiiiiiiiiiiiiii là biến độc lập của quan sát i trong thời gian t, 𝐿i là hệ số chặn cho từng đơn vị nghiên cứu, 𝐿 là hệ số góc đối với nhân tố x và 𝐿iiiiiiiiiiiiiiilà phần dƣ.
Điểm khác biệt giữa mô hình ảnh hƣởng ngẫu nhiên và mô hình ảnh hƣởng cố định đƣợc thể hiện ở sự biến động giữa các đơn vị. Nếu sự biến động giữa các đơn vị có tƣơng quan đến biến độc lập – biến giải thích trong mô hình ảnh hƣởng cố định thì trong mô hình ảnh hƣởng ngẫu nhiên sự biến động giữa các đơn vị đƣợc giả sử là ngẫu nhiên và không tƣơng quan đến các biến giải thích.
Chính vì vậy, nếu sự khác biệt giữa các đơn vị có ảnh hƣởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dƣ của mỗi thực thể (không tƣơng quan với biến giải thích) đƣợc xem là một biến giải thích mới.
Ý tƣởng của mô hình REM cũng bắt đầu từ mô hình nhƣ sau:
𝐿iiiiiiiiiiiiiii = 𝐿i + 𝐿𝐿iiiiiiiiiiiiiii + +++++++++++++++iiiiiiiiiiiiiii
Thay vì trong mô hình trên, 𝐿i là cố định thì trong REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là C1 và giá trị hệ số chặn đƣợc mô tả nhƣ sau
𝐿i = 𝐿 + si (i = 1, … , 𝐿)
Trong đó si là sai số ngẫu nhiên có trung bình bằng 0 và phƣơng sai là 2. Thay vào mô hình tác giả đƣợc:
𝐿iiiiiiiiiiiiiii = 𝐿 + 𝐿𝐿iiiiiiiiiiiiiii + siiiiiiiiiiiiiii + 𝐿iiiiiiiiiiiiiii hay 𝐿iiiiiiiiiiiiiii = 𝐿 + 𝐿𝐿iiiiiiiiiiiiiii + 𝐿iiiiiiiiiiiiiii và 𝐿iiiiiiiiiiiiiii= siiiiiiiiiiiiiii + 𝐿iiiiiiiiiiiiiii
Trong đó siiiiiiiiiiiiiii là sai số thành phần của các đối tƣợng khác nhau (đặc điểm khác nhau của từng doanh nghiệp) và 𝐿iiiiiiiiiiiiiii là sai số thành phần kết hợp khác của cả đặc điểm riêng theo từng đối tƣợng và theo thời gian.
So với phƣơng pháp FEM, phƣơng pháp REM có thể khắc phục toàn bộ nhƣợc điểm của phƣơng pháp FEM nhƣng REM coi mỗi đặc điểm riêng của các đơn vị si không tƣơng
quan với các biến độc lập. Do đó nếu xảy ra hiện tƣợng này thì REM ƣớc lƣợng không còn chính xác.
Bƣớc 3: Kiểm định các hệ số hồi quy phù hợp với mô hình
Đầu tiên tác giả sẽ thực hiện kiểm định thừa biến để loại bỏ những biến không cần thiết ra khỏi mô hình. Các biến đƣợc sử dụng là các biến không có ý nghĩa thống kê từ kết quả ƣớc lƣợng của các mô hình Pooled OLS, FEM và REM. Để thực hiện, tác giả sử dụng kiểm định Wald để kiểm tra sự cần thiết của các biến không có ý nghĩa thống kê đối với mô hình.
Sau khi loại bỏ biến thừa (nếu có), tác giả sẽ chạy lại mô hình phù hợp đƣợc lƣa chọn với biến độc lập còn lại, rồi tiến hành kiểm định các hệ số hồi quy. Tác giả quyết định sử dụng kiểm định t (t-test) để kiểm tra sự phù hợp của các hệ số hồi quy. Theo kinh nghiệm, một hệ số hồi quy đƣợc xem là phù hợp khi có mức ý nghĩa thống kê là 1% hoặc 5% hoặc 10%, tƣơng ứng với độ tin cậy là 99%, 95% và 90%.
Bƣớc 4: Kiểm định khuyết tật mô hình
Kiểm định hiện tƣợng đa cộng tuyến: Nhóm tác giả sẽ tiến hành kiểm định đa cộng tuyến bằng hai cách. Cách một là thông qua phân tích hệ số tƣơng quan nhằm kiểm định đa cộng tuyến của từng cặp biến độc lập. Hệ số tƣơng quan (Pearson) đƣợc tính bằng cách chia hiệp phƣơng sai của biến với tích độ lệch chuẩn của chúng. Nếu hệ số tƣơng quan giữa các biến độc lập lớn hơn 0.8 (còn đƣợc gọi là hệ số tƣơng quan cao), ta có hiện tƣợng đa cộng tuyến cao. Cách hai là kiểm định đa cộng tuyến giữa một biến độc lập so với các biến độc lập còn lại thông qua sử dụng thừa phóng đại phƣơng sai VIF. Nếu hiện tƣợng đa cộng tuyến xảy ra, nhóm tác giả sẽ khắc phục bằng cách bỏ đi biến độc lập có đa cộng tuyến, đây là cách làm đơn giản nhất vì sau khi bỏ biến độc lập có đa cộng tuyến, các hệ số hồi quy của các biến còn lại từ chỗ khác 0 và không có ý nghĩa thống kê có thể trở thành khác 0 có ý nghĩa thống kê.
Kiểm định hiện tƣợng tự tƣơng quan: Nhóm tác giả sẽ tiến hành kiểm định dƣạ trên quy tắc kiểm định Durbin – Watson theo kinh nghiệm. Nếu có hiện tƣợng tự tƣơng quan xảy ra, nhóm tác giả quyết định chọn biến pháp khắc phục là ƣớc lƣợng ρ dựa trên thống kê Durbin – Watson.
Kiểm định hiện tƣợng phƣơng sai thay đổi: Nhóm tác giả sẽ tiến hành kiểm định Breusch – Pagan cho mô hình Pooled OLS hoặc FEM. Nếu mô hình có phƣơng sai thay đổi sẽ đƣợc khắc phục mô hình nghiên cứu bằng cách ƣớc lƣợng lại mô hình đƣợc chọn bằng phƣơng pháp GLS. Nếu trong trƣờng hợp mô hình Random effect đƣợc chọn thì đề tài chỉ tiến hành kiểm định đa cộng tuyến và tự tƣơng quan do mô hình Random Effect chƣa có cách thức kiểm định phƣơng sai thay đổi.
KẾT LUẬN CHƢƠNG 3
Trong chƣơng này, tác giả đã giới thiệu về mô hình nghiên cứu, giải thích ý nghĩa của các biến trong mô hình và kì vọng dấu về các biến. Ở phần giới thiệu mô hình, tác giả đã thiết kế mô hình cho đề tài dựa trên cơ sở lí thuyết đã trình bày ở chƣơng 2. Đồng thời, tác giả cũng xác định các biến độc lập cùng biến phụ thuộc và làm rõ mô hình thông qua việc trình bày công thức, ý nghĩa và bảng kì vọng dấu của các biến trên. Từ đó làm cơ sở cho việc thực hiện mô hình và kết luận đề tài cho chƣơng sau.
CHƢƠNG 4. KẾT QUẢ NGHIÊN CỨU
Ở chƣơng 4, tác giả sẽ đi vào cụ thể kết quả ƣớc lƣợng mô hình nghiên cứu dựa trên số liệu thu thập đƣợc bao gồm thống kê mô tả và chạy mô hình hồi quy. Dựa trên kết quả này, tác giả sẽ phân tích và đối chiếu với các nghiên cứu thực nghiệm trƣớc đây. Từ đó, đƣa ra các khuyến nghị phù hợp với tình hình thực tế cho các NHTM Việt Nam.