Dữ liệu bảng, đôi khi còn được gọi là dữ liệu dài, là sự kết hợp của dữ liệu chéo và dữ liệu thời gian. Như vậy có thể thấy rằng, dữ liệu bảng là dữ liệu có hai chiều: chiều không gian và chiều thời gian. Việc kết hợp giữa không gian và thời gian như vậy
cho phép dữ liệu bảng mang nhiều ưu điểm, nhờ vậy được sử dụng phổ biến trong các công trình nghiên cứu trong khoảng thời gian dài trở lại đây. Thứ nhất, dữ liệu bảng cung cấp nhiều thông tin hơn, biến thiên ít hơn, ít có sự đa cộng tuyến giữa các biến số, bậc tự do cao hơn và hiệu quả hơn. Thứ hai, bằng việc nghiên cứu dữ liệu chéo một cách lặp đi lặp lại theo chuỗi thời gian, dữ liệu bảng thực hiện tốt hơn các nghiên cứu về những thay đổi xảy ra liên tục như tỷ lệ thất nghiệp, di chuyển lao động… Thứ ba, dữ liệu bảng cho phép kiểm soát được sự khác biệt không quan sát được giữa các thực thể, ví dụ như khác biệt văn hóa giữa các quốc gia hay sự khác biệt về triết lý kinh doanh giữa các công ty. Bên cạnh đó, dữ liệu bảng còn cho phép kiểm soát các biến không quan sát được nhưng thay đổi theo thời gian như các chính sách quốc gia, thỏa thuận quốc tế… Cuối cùng, dữ liệu bảng cho phép thực hiện nghiên cứu với những mô hình phức tạp chẳng hạn như tính kinh tế theo quy mô hay thay đổi công nghệ… Với những ưu điểm vừa nêu so với những dạng dữ liệu cổ điển, tác giả lựa chọn sử dụng dữ liệu bảng cùng với mô hình được trình bày ở những phần tiếp sau để tìm hiểu mối quan hệ giữa tự do hóa tài khoản vốn và bất bình đẳng thu nhập.
Mô hình bảng tĩnh.
Các mô hình tiêu chuẩn sử dụng khi nghiên cứu với dữ liệu bảng tĩnh, chẳng hạn như phương pháp gộp bình phương nhỏ nhất Pooled OLS, phương pháp ảnh hưởng cố định Fixed effects và ảnh hưởng ngẫu nhiên Random effects có một số thiếu sót nghiêm trọng. Pooled OLS là một phương pháp rất hạn chế vì nó áp đặt một hệ số chặn và hệ số độ dốc chung cho tất cả dữ liệu chéo và do đó đã bỏ qua sự không đồng nhất của những cá thể riêng lẻ trong bộ dữ liệu. Vì vậy, với bộ dữ liệu gồm nhiều quốc gia việc sử dụng phương pháp này là không phù hợp. Ở khía cạnh khác, phương pháp ảnh hưởng cố định Fixed effects lại giả định rằng những ước lượng sử dụng hệ số phương sai và hệ số độ dốc chung cho bộ dữ liệu tuy nhiên hệ số chặn là riêng biệt với từng cá thể trong mẫu. Cả hai sự tác động của dữ liệu chéo và dữ liệu chuỗi thời
gian đều có thể được quan sát thông qua các biến giả đặc biệt là trong mô hình ảnh hưởng cố định hai chiều. Tuy nhiên, khi sử dụng phương pháp này, sẽ phải đối mặt với vấn đề nghiêm trọng đó là sự bỏ sót các bậc tự do. Hơn nữa, các tham số ước lượng được thiết kế trong mô hình ảnh hưởng cố định sẽ bị chệch khi các biến hồi qui xuất hiện hiện tượng nội sinh hoặc tương quan với sai số. Ngược lại với mô hình ảnh hưởng cố định, mô hình ảnh hưởng ngẫu nhiên gặp phải ít vấn đề về bậc tự do hơn bằng cách giải định hệ số chặn chung cho bộ dữ liệu. Tuy nhiên, hạn chế của mô hình này là chỉ xem xét với các khoảng thời gian bất biến. Điều này có nghĩa là những thay đổi xảy ra ở bất kì giai đoạn nào cũng sẽ không tương quan với quá khứ, hiện tại và kể cả tương lai. Trong thực tế, đặt ra giả định này là không hợp lí, khi mà những biến số kinh tế phần lớn đều chịu ảnh hưởng từ những sự kiện xảy ra trong quá khứ. Ngoài ra, các ước lượng bảng tĩnh không tận dụng được lợi ích của kích thước dữ liệu bảng bằng cách phân biệt giữa mối quan hệ ngắn hạn và mối quan hệ dài hạn. Điều này là một hạn chế lớn trong việc xem xét các biến số kinh tế có sự ảnh hưởng khác biệt giữa ngắn hạn và dài hạn.
Tóm lại, các phương pháp tiếp cận bảng tĩnh là không phù hợp để nắm bắt bản chất
động của dữ liệu, đây cũng chính là vấn đề cơ bản trong việc phát triển các lý thuyết thực nghiệm. Ngoài ra, những ước lượng trên là không phù hợp với tính chất không đồng nhất trong bộ dữ liệu của bài nghiên cứu, vì thế tác giả sử dụng mô hình bảng động để tìm hiểu ảnh hưởng của các biến nghiên cứu.
Mô hình bảng động
Với bộ dữ liệu bao gồm số lượng lớn các quốc gia N, đi kèm với khoảng thời gian T như trong bài nghiên cứu, các ước lượng GMM sai phân (DGMM) được đề xuất bởi
Arellano, Bond (1991) làm việc tốt. Đây là loại ước lượng thường được sử dụng để phân tích vi mô dữ liệu dạng bảng. Trong mô hình DGMM, có các biến được công cụ (instrumented) và biến công cụ (instrument). Nếu các biến được dự đoán là nội sinh (tương đương với ngoại sinh không nghiêm ngặt) thì sắp xếp vào nhóm biến
được công cụ tiếp cận gmm, và khi đó chỉ có giá trị trễ của các biến này mới là công cụ thích hợp. Còn nếu như biến giải thích được xác định là ngoại sinh nghiêm ngặt cũng như các biến công cụ được thêm vào (nếu có) thì xếp vào nhóm biến công cụ. Các biến được cho là ngoại sinh nghiêm ngặt thì giá trị hiện tại và trễ của chúng đều là các công cụ thích hợp. Ngoài ra để kiểm định Sargan không bị yếu thì số lượng biến công cụ được lựa chọn về nguyên tắc phải nhỏ hơn hoặc bằng số lượng nhóm. Phương pháp DGMM sử dụng sai phân bậc nhất khi thực hiện hồi quy vì vậy tác động cố định sẽ được loại trừ bởi vì nó có đặc tính không đổi theo thời gian. Tóm lại, phương pháp DGMM sử dụng các độ trễ thích hợp của các biến được công cụ để tạo nên các biến công cụ. Ngoài ra, DGMM còn khai thác dữ liệu gộp của bảng và ràng buộc độ dài chuỗi dữ liệu thời gian của các đơn vị bảng trong bảng dữ liệu. Từ đó, cho phép sử dụng một cấu trúc trễ thích hợp để khai thác đặc tính năng động của dữ liệu.
3.2.2.2 Mô hình nghiên cứu
Dựa trên những phân tích lý thuyết của Silke Bumann, Robert Lensink (2015) và mục tiêu nghiên cứu, phương trình ước lượng tổng quát được trình bày như sau:
𝑖𝑛𝑒𝑞𝑢𝑎𝑙𝑖𝑡𝑦𝑖 ,𝑡 = 𝑐𝑜𝑛𝑠𝑡𝑎𝑛𝑡 + 𝜌𝑖𝑛𝑒𝑞𝑢𝑎𝑙𝑖𝑡𝑦𝑖 ,𝑡−1+ 𝜆𝑘𝑎𝑜𝑝𝑒𝑛𝑖,𝑡+
𝛽𝑓𝑖𝑛𝑑𝑒𝑝𝑡ℎ𝑖 ,𝑡−1+ 𝛿(𝑘𝑎𝑜𝑝𝑒𝑛𝑖,𝑡 × 𝑓𝑖𝑛𝑑𝑒𝑝𝑡ℎ𝑖,𝑡−1) + 𝒙𝒊𝒕′ 𝛾 + 𝜂𝑖+ 𝜇𝑡 + 𝜀𝑖,𝑡.
Trong đó:
t (t=1…T): đại diện cho chỉ số thời gian từ năm 1990 - 2012
i (i=1…N): đại diện cho chỉ số 35 quốc gia có thu nhập trung bình thấp trong mẫu nghiên cứu.
𝑖𝑛𝑒𝑞𝑢𝑎𝑙𝑖𝑡𝑦𝑖 ,𝑡: biến phụ thuộc đo lường bất bình đẳng thu nhập, được đại diện bằng chỉ số Gini.
𝑖𝑛𝑒𝑞𝑢𝑎𝑙𝑖𝑡𝑦𝑖 ,𝑡−1: biến phụ thuộc trễ
𝑘𝑎𝑜𝑝𝑒𝑛𝑖,𝑡: biến độc lập, đo lường tự do hóa tài khoản vốn - KAOPEN
𝑓𝑖𝑛𝑑𝑒𝑝𝑡ℎ𝑖,𝑡−1: biến độc lập trễ, đo lường độ sâu tài chính. Sử dụng biến trễ của biến độc lập này phù hợp với mô hình lý thuyết đã được xây dựng13
𝑥 𝑖,𝑡: là các biến kiểm soát bao gồm tăng trưởng kinh tế, đầu tư trực tiếp nước ngoài, mở cửa thương mại, lạm phát, tỷ lệ phụ thuộc, trình độ giáo dục và tốc độ tăng dân số.
ηi vàμt: tương ứng đại diện cho tác động cố định với các quốc gia và thời gian.
𝜀𝑖,𝑡: nhiễu trắng
Một số vấn đề kinh tế lượng có thể phát sinh trong phương trình ước lượng như sau: - Mô hình sử dụng dữ liệu dạng bảng của nhiều quốc gia trong thời gian dài (từ 1990 – 2012) và các hiệu ứng của chu kỳ kinh tế có thể lan truyền nhiều hơn 1 năm do đó có thể dẫn đến có sự tự tương quan mạnh trong sai số.
- Sự hiện diện của độ trễ của biến phụ thuộc đóng vai trò như một biến độc lập trong phương trình có thể gây ra sự tự tương quan.
- Việc sử dụng biến tương tác giữa tự do hóa tài khoản vốn và độ sâu tài chính có thể gây ra vấn đề nội sinh.
13 Khi thực hiện xây dựng phương trình lý thuyết thể hiện sự tác động của tự do hóa tài khoản vốn và bất bình đẳng thu nhập, Silk e Bumann, Robert Lensink (2015) đặt tham số v đại diện cho độ sâu tài chính. v là mức cho vay tối đa của một ngân hàng đối với một nhà đầu tư dựa vào tiền lương của họ do vấn đề bất cân xứng thông tin. Với cách đặt giả định này, tự do hóa tài khoản vốn không làm thay đổi độ sâu tài chính, hay nói cách khác độ sâu tài chính là cố định trong năm t, và tác động của nó đến bất bình đẳng thu nhập sẽ trễ hơn 1 thời kỳ so với các biến còn lại.
- Các đặc điểm của quốc gia không thay đổi theo thời gian có thể tương quan với biến giải thích
Căn cứ vào đặc điểm của chuỗi dữ liệu cũng như mục tiêu nghiên cứu, tác giả đề xuất sử dụng phương pháp DGMM để thực hiện hồi quy phương trình. Cụ thể, tác giả sử dụng ước lượng DGMM hai bước để kiểm soát các vấn đề nội sinh và sử dụng kiểm định Arellano-Bond (AR2) để kiểm tra hiện tượng tự tương quan trong phương sai phần dư. Theo hướng dẫn của Blundell và Bond (1998), tác giả sử dụng Hansen test để đánh giá tính phù hợp của các biến công cụ. Với 2 kiểm định trên, giá trị P-value càng lớn thì kết quả hồi quy càng vững. Cuối cùng, tác giả áp dụng những sửa chữa của Windmeijer để làm tăng tính vững của kết quả hồi quy.
CHƯƠNG 4 KẾT QUẢ NGHIÊN CỨU THỰC NGHIỆM