Phương pháp phân tích mô hình hồi quy với dữ liệu dạng bảng

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu các yếu tố ảnh hưởng đến thu nhập ngoài lãi của các ngân hàng thương mại việt nam (Trang 80 - 86)

CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU

3.2 Dữ liệu nghiên cứu

3.3.1 Phương pháp phân tích mô hình hồi quy với dữ liệu dạng bảng

Theo Baltagi (2001)phương pháp hồi quy thông dụng với dữ liệu dạng bảng là mô hình hồi quy Pool OLS, mô hình hồi quy tác động cố định (FEM) và mô hình hồi quy tác động ngẫu nhiên (REM).

Mô hình hồi quy Pool OLS: Đối với mô hình này, giả định về sự tự tương quan, phương sai sai sô thay đổi, những sự khác biệt về không gian và thời gian của từng biến quan sát đều không tác động đến. Vì vậy, tung độ gốc và độ dốc của các hệ số được giả định là không thay đổi theo thời gian và cả theo từng biến. Đây là trường hợp đơn giản nhất, chúng ta bỏ qua mảng thời gian và không gian của dữ liệu bảng, mà chỉ ước lượng mô hình hồi quy bình phương bé nhất (OLS) thông thường. Mô hình hồi quy được biễu diễn như sau:

Yit = β1 + β2 X2it + β3X3it + … + μ it (1)

Tuy nhiên, đối với loại mô hình này, khả năng xảy ra hiện tượng tự tương quan trong số liệu khá cao. Ngoài ra, việc giả định hệ số chặn trong mô hình là giống nhau cho các đối tượng quan sát, và giả định về hệ số ước lượng của các biến quan sát là giống nhau cho các đối tượng quan sát là các giả định hết sức nghiêm khắc mà các dữ liệu khó đáp ứng được. Vì vậy, dù đây là trường hợp đơn giản, nhưng mô hình hồi quy này – với tất cả dữ liệu kết hợp như thế này có thể sẽ làm mất đi hình ảnh thật về mối quan hệ giữa các biến của các đối tượng quan sát.

Mô hình tác động cố định (FEM) hay hồi quy biến giả bình phương nhỏ nhất (LSDV). Việc ước lượng mô hình 1 phụ thuộc vào các giả định chúng ta đưa ra về tung độ gốc, các hệ số độ dốc, và số hạng sai số uit. Có nhiều khả năng xảy ra:

1. Giả định rằng tung độ gốc và các hệ số độ dốc không đổi theo thời gian và không gian và số hạng sai số thể hiện những khác biệt theo thời gian và các ngân hàng 2. Các hệ số độ dốc không đổi nhưng tung độ gốc thay đổi theo các ngân hàng

3. Các hệ số độ dốc không đổi nhưng tung độ gốc thay đổi theo các ngân hàng và thời gian.

4. Tất cả các hệ số (tung độ gốc cũng như các hệ số độ dốc) thay đổi theo các ngân hàng

5. Tung độ gốc cũng như các hệ số độ dốc thay đổi theo các cá nhân và thời gian. Trong mỗi trường hợp này thể hiện mức độ phức tạp tăng dần (và có lẽ thực tế hơn) trong việc ước lượng các mô hình hồi quy dữ liệu bảng, như mô hình 1. Dĩ nhiên, mức độ phức tạp sẽ gia tăng nếu chúng ta thêm nhiều biến hồi quy độc lập hơn vào mô hình này, do khả năng xảy ra hiện tượng đa cộng tuyến giữa các biến độc lập.

Mô hình FEM không bỏ qua các ảnh hưởng theo chuỗi thời gian và các đơn vị chéo, hay nói cách khác, tung độ gốc của mỗi đơn vị chéo là thay đổi nhưng vẫn giả định độ dốc là cố định cho từng biến. Một cách để tính đến “tính đặc trưng” của mỗi ngân hàng hay mỗi đơn vị chéo là để cho tung độ gốc thay đổi đối với mỗi ngân hàng nhưng vẫn giả định các hệ số độ dốc không đổi giữa các ngân hàng. Để thấy được điều này, mô hình 1 được viết như sau: Yit = βit + β2X2it + β3X3it + …. + μ it (2)

Mô hình (2) có thể tách thành hai mô hình:

Yit = β1t + β2X2it + β3X3it + …. + μ it (2.1) Yit = β1i + β2X2it + β3X3it + ….+ μ it (2.2)

Mô hình 2.1 giả định tung độ góc thay đổi theo thời gian nhưng giống nhau giữa các đơn vị chéo trong cùng năm quan sát, được biết đến như hồi quy tác động cố định thời gian. Khi đó, tác động thời gian cố định kiểm soát những biến không quan sát giống nhau giữa các đơn vị chéo nhưng khác nhau khi thời gian thay đổi. Những tác động theo thời gian này có thể là do tình hình kinh tế, hay chính sách của nhà nước đối với các ngân hàng.

Mô hình 2.2 giả định tung độ gốc chung của mô hình thay đổi nhưng độ dốc của các đơn vị chéo không đổi. Ý nghĩa của tác động chéo cố định là dù tung độ gốc khác nhau giữa các đơn vị chéo nhưng nó lại không thay đổi theo thời gian. Những ảnh hưởng làm thay đổi tung độ gốc có thể là do sự khác biệt về đặc thù, hay phong cách quản lý của mỗi ngân hàng.

Mô hình các tác động ngẫu nhiên (Random Effects Model – REM)

Trong mô hình hồi quy tác động cố định, những yếu tố không quan sát được xem như là tham số và được ước lượng, còn ở mô hình tác động ngẫu nhiên, chúng được xem như là kết quả của những biến ngẫu nhiên.

Từ mô hình 2.2, ta có thể viết lại:

Yit = β1i + β2X2it + β3X3it + …. + μit (3)

Thay vì cố định β1i, ta giả định nó như biến ngẫu nhiên có giá trị β1 và giá trị tung độ gốc của đơn vị chéo được biểu diễn như sau:

β1i = β1 + Ɛi (4) Với i = 1, 2,…N

Ɛi là sai số ngẫu nhiên có giá trị trung bình là 0 và phương sai ϭ 2 Thay (4) vào (3) chúng ta có:

Yit = β1 + β2X2it + β3X3it +…+ + Ɛi + uit

= β1 + β2X2it + β3X3it + wit (5) Trong đó: wit = Ɛi + μit

Số hạng sai số tổng hợp wit gồm có hai thành phần, đó là Ɛi là thành phần sai số chéo hay theo cá nhân, và μit, thành phần sai số chéo và chuỗi thời gian kết hợp. Thuật ngữ mô hình các thành phần sai số trở thành tên của mô hình này bởi vì số hạng sai số tổng hợp wit gồm có hai (hay nhiều hơn) thành phần sai số. ECM đưa ra các giả định thông thường sau đây:

uit~ N (0, 2 ε )

E(εiuit) = 0 ; E(εiεj) = 0 (i≠j)

E(uituis) = E(uitujt) = E(uitujs) = 0 (i≠j; t≠s)

nghĩa là các thành phần sai số đơn lẻ không tương quan với nhau và không tự tương quan giữa các đơn vị chéo lẫn chuỗi thời gian. Mô hình này kèm theo những giả định của tác động cố định cộng thêm yêu cầu bổ sung là các tác động không quan sát được không tương quan với tất cả các biến giải thích. Giả thuyết này được kiểm định bằng kiểm định Hausman. Ngoài ra, mô hình này giúp cho việc kiểm soát những tác động không quan sát được của các đơn vị chéo khác nhau nhưng không thay đổi theo thời gian. Những tác động không quan sát được như đặc thù, chính sách, nguồn nhân lực,…của công ty. Tuy nhiên, nếu không giữ giả định tác động cố định không tương quan với các biến giải thích, thì mô hình FEM lại thích hợp hơn.

Phương pháp FGLS

Ý tưởng của phương pháp FGLS bắt đầu từ phương pháp GLS là đã biết dạng thay đổi của phương sai sai số, khi đó dùng các phép biến đổi tương đương để đưa về một mô hình mới mà sai số ngẫu nhiên trong mô hình này có phương sai sai số không đổi, sau đó sử dụng phương pháp OLS để ước lượng mô hình mới này.

Phương pháp GLS được minh họa khi mô hình có hiện tượng phương sai sai số thay đổi, chúng ta xét mô hình: Y = 0 + 1X1+...+ k X k u (6)

Giả sử mô hình (6) thỏa mãn các giả thiết của mô hình OLS ngoại trừ giả thiết phương sai sai số không đổi. Và giả sử rằng phương sai sai số là thay đổi theo dạng:

2

i= 2X2

2i (7)

Khi đó ta thực hiện như sau: Chia hai vế của (6) cho X2i và thu được: Yi = 1 + 2 + X3i +....+k Xki + ui (8) X2i X2i X2i X2i X2i Hay : Y* = 1 + 2 X* 2i +...+ 2 X* ki u* i (9) Trong đó: Yi* = Yi , X*2i = 1 , X*ki = X*ki , u* i = ui X2i X2i X2i X2i

Với mô hình (8) có thể thấy có sai số ngẫu nhiên mới trong mô hình, u*, có phương sai là không đổi và bằng 2. Do đó có thể áp dụng OLS để thu được các ước lượng tốt nhất cho các hệ số j (j=1,k), và từ đó suy ra ước lượng cho các hệ số j. Việc biến đổi một mô hình có khuyết tật thành mô hình không có khuyết tật và sử dụng OLS cho mô

hình đã biến đổi như trên được gọi là phương pháp bình phương bé nhất tổng quát (GLS). Tuy nhiên, trong trường hợp không biết rõ dạng hàm của phương sai sai số thay đổi thì ước lượng GLS sẽ không thực hiện được. Khi đó cần thiết phải sử dụng một phương pháp tổng quát khả thi khác gọi là FGLS (ước lượng bình phương tối thiểu tổng quát khả thi). Phương pháp FGLS sẽ ước tính mô hình theo phương pháp OLS (ngay cả trong trường hợp có sự tồn tại của hiện tượng tự tương quan và phương sai sai số thay đổi). Các sai số được rút ra từ mô hình sẽ được dùng để ước tính ma trận phương sai - hiệp phương sai của sai số. Cuối cùng, sử dụng ma trận này để chuyển đổi các biến ban đầu và ước tính giá trị các tham số cần tìm trong trong mô hình. Khi đó, quy trình thực hiện ước lượng FGLS được thực hiện như sau: (i) Ước lượng OLS cho mô hình Y = 0 +

1X1+...+ k X k  u ; (ii) Lưu lại phần dư và tạo biến mới là logû ; (iii) Hồi quy logû

theo các biến giải thích Xk trong mô hình; (iv) Lưu lại giá trị dự báo ĝ, và tạo biến mới ĥ

= exp (ĝ ); Thực hiện ước lượng FGLS với trọng số là 1/ ĥ.

Mặt khác, một trong những hạn chế của phương pháp ước lượng mô hình ngưỡng của B. E. Hansen (1999) là các hệ số được ước lượng dựa trên phương pháp OLS. Điều này dẫn đến các hệ số ước lượng có thể không hiệu quả do hiện tượng tương quan chuỗi (Bertrand, Duflo và Mullainathan 2004). Chính vì lí do đó, nghiên cứu thực hiện phương pháp ước lượng FGLS nhằm so sánh, củng cố kết quả kiểm định trong trường hợp này. Phương pháp này được xem là hiệu quả hơn phương pháp OLS trong trường hợp dữ liệu có hiện tượng tương quan chuỗi (C. B. Hansen 2007).

Trong nghiên cứu này tiến hành hồi quy bình phương tối thiểu tổng quát khả thi FGLS bằng lệnh xtgls với sự kết hợp cả 2 tùy chọn panels (heteroskedastic) và corr (ar1) nhằm khắc phục hiện tượng phương sai sai số thay đổi và tự tương quan trong mô hình.

Phương pháp GMM

Các phương pháp ước lượng (OLS, FEM, REM, FGLS) chỉ đúng nếu như biến độc lập trong mô hình không chứa độ trễ của biến phụ thuộc, có nghĩa là không chứa Yt-h

(h là độ trễ của Y). Lúc này Yt-h là biến nội sinh (endogeous), có nghĩa là Yt-h sẽ tương quan với sai số (Arellano và Bond, 1991; Mileva, 2007). Ngoài ra, sự hiện diện của biến số này sẽ làm tăng sự tự tương quan của sai số (Arellano và Bond, 1991; Mileva, 2007). Để xử lý các vấn đề này, Arellano và Bond đề xuất mô hình chung cho vấn đề trên gọi là Dynamic model (mô hình dữ liệu bảng động) với nhiều phương pháp ước lượng khác

nhau nhưng phương pháp ước lượng hiệu quả tính tới thời điểm này được gọi là Arellano – Bond difference GMM estimator.

Việc sử dụng GMM (general moment model) được dùng để xử lý biến số bị nội sinh bằng cách sử dụng các biến công cụ (instrument) phù hợp và kết hợp với phân tích khác biệt (diffence) được dùng để xử lý hiện tượng tự tương quan. Phương pháp GMM được sử dụng để kiểm soát tính không đồng nhất, không quan sát được và ngăn ngừa vấn đề nội sinh tiềm tàng do có thể có những cú sốc hay các yếu tố không quan sát được tác động đến đa dạng hóa nhưng cũng tác động đến các biến hồi quy khác. Ước lượng GMM được xem là ước lượng vững, phân phối chuẩn và phù hợp nhất cho dữ liệu bảng.

Phương pháp Lasso

Việc xác định các yếu tố quyết định ảnh hưởng đáng kể đến đối tượng nghiên cứu không phải là một nhiệm vụ dễ dàng đối với các nhà nghiên cứu. Khi liệt kê các biến cho các mô hình tuyến tính, thông thường các nghiên cứu thường nhìn vào giá trị P-value để đưa ra quyết định. Điều này có thể gây hiểu nhầm trong trường hợp có thể bỏ qua các biến quan trọng có tương quan cao nhưng cũng có giá trị P-value cao. Mặt khác, các biến không liên quan có thể được đưa vào mô hình, tạo ra sự phức tạp không cần thiết trong việc xử lý mô hình. Ngoài ra, vấn đề quá mức có thể xuất hiện nếu số lượng quan sát nhỏ hơn số lượng biến trong mô hình.

LASSO được đề xuất bởi Tibshirani (1996), là một phần mở rộng của hồi quy OLS, thực hiện cả lựa chọn biến và chính quy hóa thông qua hệ số ràng buộc. Nó có khả năng nâng cao độ chính xác và khả năng diễn giải so với các phương pháp hồi quy cổ điển (Tibshirani 1996). Cụ thể, LASSO cung cấp giải pháp giảm thiểu theo vấn đề ràng buộc:

với . Hình dạng của LASSO giải thích tại sao LASSO thực hiện lựa chọn đồng biến trong khi thực hiện ước tính. Đầu tiên, hàm mục tiêu (OLS) có dạng như sau:

Q . Như vậy, mỗi Lc có :

có hình dạng là các ellipsoid (ranh giới này và bên trong của nó tạo thành một lồi được đặt trong , tức là giải pháp OLS. Khi c càng lớn tương ứng các cấp độ tương ứng (ellipsoids) cũng lớn dần, và c càng lớn hơn và lớn hơn. Lần đầu tiên Lc chạm vào ràng buộc    2 

2

0, k:

1 1

k j j

    giải pháp giảm thiểu ràng buộc là điểm nhấn  B(0, t). Không giống như

"hình cầu" trong , sử dụng khoảng cách Euclide/L2 -norm,  2 

2 : k t R   với 2 2 1 k j j     

tức là, với hình cầu (ranh giới của ràng buộc) không phải là hình cầu (hình học) mà là hình thoi có "góc". Như vậy, có thể một bộ Lc có thể chạm vào một góc đầu tiên, tức là, giải pháp LASSO có thể có một số thành phần (ước tính các thành phần của tham số mô hình ) chính xác bằng 0. Khi đó, thuật toán LASSO tạo ra các ước tính bằng không này, giả sử, đối với j, các biến số tương ứng Xj sẽ bị bỏ qua, vì không có đóng góp cho Y.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu các yếu tố ảnh hưởng đến thu nhập ngoài lãi của các ngân hàng thương mại việt nam (Trang 80 - 86)

Tải bản đầy đủ (PDF)

(142 trang)