Dữ liệu mà luận văn sử dụng trong bài nghiên cứu là giá cổ phiếu của các công ty niêm yết, chỉ số thị trường VN-Index được thu thập với tần suất ngày từ 01/01/2006 đến 31/12/2015 trên Sở giao dịch chứng khoán Tp.HCM (HOSE). Giá thu thập là giá đóng cửa và đã điều chỉnh phần cổ tức vào giá. Với những ngày lễ hoặc các ngày thứ bảy, chủ nhật thì giá cổ phiếu sẽ được lấy ngày gần nhất (ngày t-j, với j là số ngày không giao dịch). Dữ liệu không bao gồm các công ty bị hủy niêm yết, các công ty chuyển đổi sàn niêm yết, các công ty niêm yết nhưng bị gián đoạn trong thời gian dài hoặc các công ty có dữ liệu không đủ độ dài theo yêu cầu. Cấu trúc dữ liệu nghiên cứu là kiểu dữ liệu bảng không cân bằng (unbalance panel data).
Bảng 3.1: Thống kế số lượng cổ phiếu mẫu từ 2006 – 2015
Năm 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
Số lượng
cổ phiếu 21 70 98 121 166 231 259 259 259 259
Nguồn: Dữ liệu tổng hợp từ HOSE
Qua thu thập, số lượng cổ phiếu năm 2006 là 21 cổ phiếu và gia tăng theo từng năm, đến 2015 số lượng mã cổ phiếu đáp ứng theo điều kiện nghiên cứu là 259 cổ phiếu. Tuy nhiên, để ước lượng được hiệu quả với kiểu dữ liệu nghiên cứu là bảng không cân bằng thì mỗi quan sát của từng công ty chứng khoán phải liên tục trong 4 năm, nếu một quan sát hiện diện trong bộ dữ liệu chỉ 3 năm liên tục hoặc thấp hơn thì công ty này sẽ bị loại bỏ ra khỏi bộ dữ liệu nghiên cứu. Do đó, 21 công ty được thu thập tại năm 2006 sẽ có độ dài hoạt động ít nhất là đến năm 2009 và tương tự cho những công ty khác.