Phương pháp hồi quy theo dữ liệu bảng

Một phần của tài liệu Tác Động Của Đòn Bẩy Tài Chính Đến Quyết Định Đầu Tư Của Các Công Ty Niêm Yết Tại Việt Nam (Trang 20 - 27)

CHƯƠNG 3 DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

3.1 Phương pháp nghiên cứu

3.1.2 Phương pháp hồi quy theo dữ liệu bảng

Tổng quan về dữ liệu bảng

Dữ liệu bảng còn được gọi bằng các tên khác như là dữ liệu gộp chung (gộp chung các quan sát chéo và chuỗi thời gian), dữ liệu bảng vi mô (micro panel data), dữ liệu dọc (đó là một nghiên cứu nào đó theo thời gian về một biến hay một nhóm đối tượng)… Mặc dù có những sự thay đổi tinh tế, nhưng tất cả các tên gọi này thực chất muốn nói đến sự thay đổi theo thời gian của các đơn vị chéo. Và để thống nhất, chúng ta gọi các mô hình hồi quy dựa trên dữ liệu như thế là các mô hình hồi quy theo dữ liệu bảng.

Vậy lý do vì sao tác giả Aivazian, Ying Ge, Jiang Qiu trong bài nghiên cứu này lại sử dụng dữ liệu bảng? dữ liệu bảng có ưu điểm gì so với dữ liệu chéo hay dữ liệu chuỗi thời gian?

Ưu điểm của dữ liệu bảng như sau:

Bởi vì dữ liệu bảng liên hệ đến các cá nhân, doanh nghiệp, các quốc gia..

theo thời gian, nên chắc chắn có tính không đồng nhất trong đơn vị này. Các kỹ thuật ước lượng dựa trên dữ liệu bảng có thể tính đến tính không đồng nhất đó một cách rõ ràng bằng cách bao gồm các biến chuyên biệt “cá nhân”.

Thuật ngữ “cá nhân” ở đây theo nghĩa chung nhất bao gồm các đơn vị vi mô như cá nhân, doanh nghiệp, thành phố, quốc gia…

Bằng cách kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta dữ liệu chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn.

Bằng cách nghiên cứu quan sát lặp đi lặp lại của các đơn vị chéo, dữ liệu bảng phù hợp hơn cho việc nghiên cứu sự thay đổi theo thời gian của các đơn vị chéo. Những tác động của thất nghiệp, tốc độ quay vòng việc làm,

tính dịch chuyển của lao động được nghiên cứu tốt hơn khi sử dụng dữ liệu bảng.

Cho phép kiểm soát sự khác biệt không quan sát được giữa các thực thể chẳng hạn như khác biệt văn hóa giữa các quốc gia, sự khác biệt về triết lý kinh doanh giữa các công ty.

Bằng cách cung cấp dữ liệu đối với vài nghìn đơn vị, dữ liệu bảng có thể giảm đến mức thấp nhất hiện tượng chệch có thể xảy ra nếu chúng ta gộp các cá nhân hay các doanh nghiệp theo những biến số có mức tổng hợp cao.

Nói tóm lại, dữ liệu bảng có thể làm cho phân tích thực nghiệm phong phú hơn so với khi chúng ta sử dụng dữ liệu chéo hay dữ liệu chuỗi thời gian.

Các dạng hồi quy dữ liệu bảng:

3.1.2.1 Mô hình hồi quy pool (Giả định rằng các hệ số độ dốc và tung độ gốc là hằng số theo thời gian và không gian)

Mô hình này là đơn giản nhất khi không kể đến các kích thước không gian và thời gian của dữ liệu kết hợp, và chỉ ước lượng hồi quy theo phương pháp bình phương nhỏ nhất thông thường.

Mô hình tổng quát : Yi,t = 1 + 2X2it + 3X3it + 4X4it +…..+Ui,t (1)

Với tung độ gốc B1 là hằng số, hệ số góc B2, B3, B4..là hằng số, Ui,t là số hạng sai số thể hiện sự khác nhau theo thời gian và theo cá nhân.

Vì 1, 2, 3… được mặc định là giống nhau cho các biến quan sát (cá nhân i,

công ty i, nước i.. vào năm t). Do đó mô hình không có sự phân biệt giữa các nước, các công ty này. Hơn thế nữa, giá trị thống kê của ước lượng khá thấp, có thể xảy ra

hiện tượng tự tương quan giữa biến Xi,t với phần dư Ui,t nên kết quả mô hình không còn chính xác nữa.

3.1.2.2 Mô hình hồi quy hiệu ứng cố định ((fixed effect)

Mô hình tác động cố định không bỏ qua các ảnh hưởng theo chuỗi thời gian và các đơn vị chéo. Hay nói cách khác, tung độ gốc của mỗi đơn vị chéo là thay đổi, nhưng hệ số góc là cố định cho từng biến.

Mô hình tổng quát như sau: Yi,t = it + 2X2it + 3X3it + 4X4it +…..+Ui,t (2) Với tung độ gốc Bit thay đổi giữa các cá nhân, còn hệ số góc B2, B3…là hằng số (không đổi).

Thuật ngữ “cố định” được biết đến dưới tên gọi là mô hình hồi quy tác động cố định (FEM ) được sử dụng do thực tế tung độ gốc có thể khác nhau giữa các cá nhân nhưng mỗi tung độ gốc của cá nhân không thay đổi theo thời gian ( 2, 3,

4….giống nhau- bất biến theo thời gian).

Mô hình (2) này cũng có thể được tách thành hai mô hình như sau:

Yi,t = 1t + 2X2it + 3X3it + 4X4it +…..+Ui,t (2a) Yi,t = 1i + 2X2it + 3X3it + 4X4it +…..+Ui,t (2b) Trong đó:

Yi,t: biến phụ thuộc với i: doanh nghiệp, t: thời gian.

Xi,t là biến độc lập.

1i, 1t là tung độ gốc thay đổi theo những đặc điểm riêng biệt, hay do chính sách

quản lý, hoạt động của từng cá nhân.

Ui,t là phần dư, sai số ngẫu nhiên.

Cụ thể mô hình (2a): giả định tung độ gốc thay đổi theo thời gian, nhưng giống nhau giữa các đơn vị chéo trong cùng năm quan sát (được biết đến như hồi quy tác động cố định thời gian). Những tác động theo thời gian này có thể do tình hình kinh tế hay chính sách của nhà nước đối với công ty.

Mô hình (2b): giả định tung độ gốc chung của mô hình thay đổi nhưng độ dốc của đơn vị chéo không đổi. Ý nghĩa của tác động chéo cố định là dù tung độ gốc khác nhau giữa các đơn vị chéo nhưng nó lại không thay đổi theo thời gian.

Những ảnh hưởng làm thay đổi tung độ gốc có thể là do sự khác biệt về đặc thù hay phong cách quản lý của mỗi công ty.

Ý tưởng của mô hình FEM: Với giả định mỗi cá nhân đều có những đặc điểm riêng biệt có thể ảnh hưởng đến biến giải thích (biến độc lập), FEM phân tích mối tương quan này giữa phần dư của mỗi thực thể với các biến giải thích, qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích, để chúng có thể ước lượng những ảnh hưởng thực của biến giải thích lên biến phụ thuộc.

3.1.2.3 Mô hình ảnh hưởng ngẫu nhiên (random effect hay REM)

Điểm khác biệt giữa mô hình ảnh hưởng ngẫu nhiên và mô hình ảnh hưởng cố định được thể hiện ở sự biến động giữa các đơn vị chéo. Nếu sự biến động giữa các cá nhân có tương quan đến biến giải thích (biến độc lập) trong mô hình FEM thì trong mô hình REM sự biến động giữa các cá nhân được giả sử là ngẫu nhiên, và không tương quan đến biến giải thích. Chính vì vậy, nếu sự khác biệt giữa các thực thể có ảnh hưởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dư của mỗi thực thể (không tương quan với biến giải thích) được xem là một biến giải thích mới.

Ý tưởng cơ bản của mô hình ảnh hưởng ngẫu nhiên cũng bắt đầu từ mô hình (2b): Yi,t = 1i + 2X2it + 3X3it + 4X4it +…..+Ui,t

. Nhưng thay vì trong mô hình trên, B1i là cố định thì trong mô hình REM có B1i = B1+ i (i=1,2…n), I là sai số ngẫu nhiên có trung bình bằng 0,và phương sai là 2 . Thay vào mô hình ta có : YI,t = 1+ 2X2it + 3X3it + 4X4it +…..+ I +Ui,t

I là sai số thành phần của các đối tượng khác nhau (đặc điểm riêng khác nhau của từng doanh nghiệp)

Ui,t là sai số thành phần kết hợp khác của đặc điểm riêng theo từng đối tượng và theo thời gian.

Mô hình này kèm theo những giả định của tác động cố định cộng thêm yêu cầu bổ sung là các tác động không quan sát được không tương quan với tất cả các biến giải thích. Giả định này được kiểm tra bằng kiểm định Hausman. Theo Wooldridge (2003), nếu giả thuyết tác động ngẫu nhiên đúng, ước lượng tác động ngẫu nhiên hiệu quả hơn mô hình pool theo phương pháp bình phương tối thiểu hay hiệu quả hơn cả mô hình tác động cố định. Ngoài ra, mô hình giúp cho việc kiểm soát những tác động không quan sát được của các đơn vị chéo khác nhau nhưng không thay đổi theo thời gian. Những tác động không quan sát được như đặc thù, chính sách, nguồn nhân lực…của công ty. Tuy nhiên nếu không giữ giả định tác động cố định không tương quan với các biến giải thích, thì mô hình hồi quy tác động cố định lại thích hợp hơn.

3.1.2.4 Các bước để chọn lựa phương pháp hồi quy thích hợp trong 3 phương pháp hồi quy pool, mô hình hiệu ứng cố định (fixed effect) và mô hình hiệu ứng ngẫu nhiên (random effect):

Đầu tiên để tìm hiểu xem hồi quy theo phương pháp pooling (phương pháp hồi quy thông thường) có thích hợp không, sử dụng kiểm định LM test của mô hình ngẫu nhiên. Kiểm định LM test với giả thiết

Ho: hồi quy theo phương pháp pooling là thích hợp

H1: hồi quy theo phương pháp pooling là không thích hợp.

Nếu hệ số Chi2 của LM test đủ lớn để bác bỏ giả thiết Ho, thì mô hình hồi quy theo phương pháp hiệu ứng ngẫu nhiên (random effect - REM) thích hợp hơn so với pooling.

Bước tiếp theo, để xem xét mô hình nào là phù hợp hơn giữa phương pháp hiệu ứng ngẫu nhiên (random effect) và hiệu ứng cố định (fixed effect)? Câu trả lời sẽ còn tùy thuộc vào việc chúng ta giả định thế nào về sự tương quan giữa sai số thành phần Ui và các biến số. Nếu nhu cầu giả định rằng Ui và các biến số không có tương quan với nhau thì FEM sẽ phù hợp hơn, còn nếu ngược lại thì REM sẽ phù hợp hơn.

Do có sự khác nhau cơ bản trong hai mô hình này nên việc lựa chon REM hay FEM được các nhà kinh tế lượng đề xuất dựa trên số lượng quan sát chúng ta có được như sau:

Nếu T (dãy số quan sát thời gian) nhiều và n (là đối tượng nghiên cứu) nhỏ, thì giá trị của các tham số ước lượng trong hai mô hình FEM và REM không chệch nhau nhiều. Do đó, việc lựa chọn mô hình nào sẽ tùy thuộc vào tiện ích trong việc xử lý.

Nếu n lớn và T nhỏ, kết quả ước lượng của hai mô hình này rất lệch nhau.

Nếu các đối tượng nghiên cứu không được chọn ra một cách ngẫu nhiên từ một tổng thể lớn hơn nhiều thì FEM sẽ phù hợp hơn. Tuy nhiên, nếu các đối tượng nghiên cứu của mẫu được rút ra một cách ngẫu nhiên từ một tổng thể lớn hơn thì REM sẽ phù hợp hơn, vì trong trường hợp này B1i là thật sự ngẫu nhiên nên việc suy luận thống kê hay giải thích mô hình sẽ dễ dàng và không có điều kiện ràng buộc.

Nếu sai số thành phần Ui của từng đối tượng nghiên cứu và một hoặc nhiều biến giải thích có tương quan thì kết quả ước lượng REM là chệch, trong khi đó kết quả này là không chệch đối với FEM.

Nếu n lớn, T nhỏ và nếu giả định của REM được bảo đảm thì kết quả ước lượng của REM sẽ chính xác hơn FEM.

Để có cơ sở lựa chọn FEM hay REM, Wooldridge (1993) đã dùng kiểm định Hausman (1978) có phân phối tiệm cận của Chi2 và dùng để kiểm định giả thiết :

Ho: hồi quy theo phương pháp hiệu ứng ngẫu nhiên phù hợp hơn.

H1: hồi quy theo phương pháp hiệu ứng ngẫu nhiên là không phù hợp

Nếu Chi2 của Hausman đủ lớn để bác bỏ Ho, thì mô hình hồi quy theo hiệu ứng cố định (fixed effect) là phù hợp hơn.

Thực chất kiểm định Hausman để xem xét có tồn tại tự tương quan giữa Uit và it hay không. Kiểm định Hausman với giả thiết

Ho: Ui và biến độc lập không tươnng quan với nhau H1: Ui và biến độc lập tương quan với nhau

Khi giá trị (Prob> Chi2) < 0.05 thì ta bác bỏ giả thiết Ho, khi đó Ui và biến độc lập tương quan với nhau. Khi đó, mô hình hiệu ứng cố định là thích hợp và ngược lại.

Một phần của tài liệu Tác Động Của Đòn Bẩy Tài Chính Đến Quyết Định Đầu Tư Của Các Công Ty Niêm Yết Tại Việt Nam (Trang 20 - 27)

Tải bản đầy đủ (PDF)

(62 trang)