3.5.1. Giới thiệu về dữ liệu bảng
Trong phân tích thực nghiệm, các loại dữ liệu thường dùng bao gồm: dữ liệu chuỗi thời gian, dữ liệu chéo và dữ liệu bảng. Nếu dữ liệu chuỗi thời gian giúp ta
quan sát các giá trị của một hoặc nhiều biến theo thời gian, dữ liệu chéo cho ta các giá trị của một hoặc nhiều biến theo không gian (thu thập cho nhiều đơn vị mẫu hoặc nhiều đại diện mẫu tại cùng một thời điểm) thì dữ liệu bảng là sự kết hợp giữa không gian và thời gian. Nói cách khác dữ liệu bảng là sự mở rộng dữ liệu chéo theo thời gian hay dữ liệu chéo theo chuỗi thời gian.
Như đã trình bày ở trên, dữ liệu được sử dụng trong mẫu nghiên cứu bao gồm 16 NHTM trong thời gian 9 năm (2007-2015) tạo thành bảng dữ liệu cân bằng với 144 quan sát.
Theo Guragati (2010), việc sử dụng dữ liệu bảng trong nghiên cứu có những
lợi thế sau: dữ liệu bảng chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả hơn. Cũng vì khả năng sinh lời của các ngân hàng sẽ liên tục thay đổi qua các năm và bị ảnh hưởng bởi rất nhiều nhân tố tác động nên việc sử dụng dữ liệu bảng tỏ ra thích hợp hơn cho nghiên cứu bởi nó cho phép nghiên cứu các dữ liệu chéo một cách lặp đi lặp lại, phát hiện, đo lường tốt hơn các tác động không thể quan sát được và có thể giúp chúng ta nghiên cứu các mô hình hành vi phức tạp hơn so với dữ liệu chuỗi thời gian hay dữ liệu chéo thuần tuý.
3.5.2. Mộtsố phương pháp ước lượng cơ bảntrong hồi quy dữ liệu bảng
Trong hồi quy dữ liệu bảng, người ta thường dùng ba phương pháp cơ bản sau: phương pháp bình phương tối thiểu dạng gộp (Pooled OLS), phương pháp hiệu ứng cố định (Fixed Effects Model – FEM) và phương pháp hiệu ứng ngẫu nhiên
(Random Effects Model – FEM).
3.5.2.1. Phương pháp bình phương tối thiểu dạng gộp (Pooled OLS)
Phương pháp Pooled OLS là phương pháp đơn giản nhất để ước lượng mô
hình hồi quy bình phương nhỏ nhất thông thường (OLS) và không kể đến các kích
thước không gian và thời gian của dữ liệu bảng. Điều này có nghĩa là phương pháp Pooled OLS ước lượng mô hình với giả định tung độ gốc, hệ số độ dốc giống nhau
giữa các ngân hàng và qua thời gian (phần dư thể hiện những khác biệt giữa các ngân hàng và qua thời gian). Với phương pháp này, chúng ta giả định ảnh hưởng của các nhân tố lên khả năng sinh lời là giống nhau giữa tất cả các ngân hàng và không đổi theo thời gian.
Ta có thể thấy, phương pháp này rất đơn giản và dễ thực hiện nhưng rõ ràng những giả định trên rất hạn chế và khó xảy ra trong thực tế vì mỗi ngân hàng đều có những khác biệt và tác động của các đặc điểm riêng biệt này đến khả năng sinh lời ở mỗi ngân hàng là khác nhau và thay đổi qua các năm. Vì thế, kết quả ước lượng thu được có thể không hiệu quả.
3.5.2.2. Phương pháp hiệu ứng cố định (Fixed Effects Model –FEM) FEM)
Phương pháp FEM được sử dụng trong ước lượng với giả định mỗi ngân hàng có những đặc điểm riêng biệt và những đặc điểm riêng này có thể ảnh hưởng đến các biến độc lập trong mô hình hay nói cách khác có sự tương quan giữa các biến độc lập với thành phần sai số của mỗi thực thể (chứa các đặc điểm riêng của ngân hàng). Các đặc điểm riêng biệt (không đổi theo thời gian) này là duy nhất đối với một ngân hàng và không tương quan với đặc điểm của các ngân hàng khác.
Vì vậy, FEM có thể kiểm soát, tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến độc lập và mô hình có thể ước lượng tác động thực của các yếu tố trong mô hình lên khả năng sinh lờị Tuy nhiên, FEM có hạn chế là không đo lường được tác nhân không đổi theo thời gian và làm tăng khả năng đa cộng tuyến của mô hìnhgây khó khăn cho việc ước lượng chính xác.
3.5.2.3. Phương pháp hiệu ứng ngẫu nhiên (Random Effects Model – REM) – REM)
Phương pháp REM được sử dụng trong ước lượng với giả định đặc điểm riêng giữa các ngân hàng là ngẫu nhiên và không tương quan với các biến độc lập
trong mô hình. REM xem thành phần sai số của mỗi ngân hàng (không tương quan
Điều này có nghĩa là, trong FEM mỗi ngân hàng có giá trị tung độ gốc cố định riêng và 16 ngân hàng sẽ có 16 tung độ gốc khác nhau; ngược lại, trong REM, chỉ có 1 giá trị tung độ gốc là giá trị trung bình của 16 tung độ gốc của các ngân hàng, thành phần sai số thể hiện chênh lệch (ngẫu nhiên) của từng tung độ gốc với giá trị trung bình.
Thành phần sai số là biến không thể quan sát được thể hiện những yếu tố tác động không thể quan sát một cách trực tiếp.
3.5.3. Lựa chọn mô hình hồi quy
Vậy đâu là phương pháp phù hợp nhất cho mô hình nghiên cứủ Như đã phân tích ở trên, mỗi phương pháp được sử dụng với những giả định riêng của nó. Ta có thể dễ dàng nhận thấy Pooled OLS dường như không hiệu quả bởi những giả định của nó hầu như rất khó xảy ra trong thực tế vì mỗi ngân hàng đều có đặc trưng riêng biệt. Việc lựa chọn giữa FEM và REM phụ thuộc vào giả định về sự tương quan giữa thành phần sai số (chứa các đặc điểm riêng của các ngân hàng) và các biến độc lập trong mô hình: nếu có sự tương quan thì sử dụng FEM và không tương quan thì REM là thích hợp.
Ngoài ra, chúng ta có thể sử dụng các kiểm định cần thiết nhằm tìm ra mô hình thích hợp nhất trong ba mô hình Pooled OLS, mô hình FEM và mô hình REM được thực hiện theo lý thuyết kiểm định được trình bày trong Bảng 3.3.