3 .DỮ LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
3.1 Nguồn dữ liệu và định nghĩa các biến
3.1.1 Nguồn dữ liệu
Bài nghiên cứu sử dụng số liệu từ bảng cân đối kế toán, báo cáo kết quả kinh doanh, báo cáo lƣu chuyển tiền tệ, thuyết minh báo cáo tài chính, báo cáo thƣờng niên của các cơng ty phi tài chính niêm yết trên sàn HOSE và HNX từ năm 2007- 2014.
Hệ thống dữ liệu bảng cho bài nghiên cứu đƣợc thiết lập nhƣ sau: Thứ nhất, những cơng ty tài chính đƣợc loại trừ khỏi mẫu nghiên cứu bởi họ đóng vai trị là nhà tạo lập thị trƣờng và cụ thể hơn là tỷ lệ nắm giữ tiền mặt của các loại hình cơng ty này phải tuân thủ một số quy định giám sát (Opler và cộng sự, 1999) từ ngân
hàng trung ƣơng. Thứ hai, các báo cáo tài chính từ năm 2007 đến 2014 hàng năm phải cung cấp đầy đủ dữ liệu cho tất cả các biến nghiên cứu nhằm đảm bảo dữ liệu bảng thu đƣợc là cân đối.Thứ ba, tiến hành loại bỏ những cơng ty có vốn chủ sở hữu âm. Cuối cùng, bài nghiên cứu đã thu thập đƣợc 163 công ty thỏa mãn các yêu cầu với tổng số 1304 quan sát (163 công ty x 8 năm).
Bài nghiên cứu sử dụng dữ liệu bảng để ƣớc tính mối liên hệ giữa tỷ lệ nắm giữ tiền mặt với các biến giải thích ở trên. Dữ liệu bảng là dữ liệu kết hợp các quan sát theo chuỗi thời gian và theo không gian. Baltagi (2008) liệt kê các ƣu điểm của dữ liệu bảng so với dữ liệu theo chuỗi thời gian và không gian nhƣ sau: Thứ nhất, vì dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, tiểu bang, đất nƣớc, v.v… theo thời gian, nên nhất định phải có tính dị biệt (khơng đồng nhất) trong các đơn vị này. Kỹ thuật ƣớc lƣợng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng cá nhân hoặc doanh nghiệp. Thứ hai, thông qua kết hợp các chuỗi theo thời gian của các quan sát theo không gian, dữ liệu bảng cung cấp những dữ liệu có nhiều thơng tin hơn, đa dạng hơn, ít cộng tuyến hơngiữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn. Thứ ba,
thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi. Thứ tƣ, dữ liệu bảng có thể phát hiện và đo lƣờng tốt hơn những ảnh hƣởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy. Thứ năm, dữ liệu bảng giúp ta nghiên cứu những mơ hình hành vi phức tạp hơn. Cuối cùng, số lƣợng quan sát thu thập đƣợc khá nhiều nên dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra. Tóm lại, dữ liệu bảng có thể làm phong phú các phân tích thực nghiệm theo những cách thứcmà không thể đạt đƣợc nếu ta chỉ sử dụng các dữ liệu theo chuỗi thời gian hay không gian thuần túy.