Dữ liệu nghiên cứu là dữ liệu sơ cấp được tác giả lấy từ nguồn báo cáo tài chính, bản cáo bạch, báo cáo thường niên trên các trang web công bố của doanh nghiệp và các trang web thông tin tài chính (cafef, vietstock). Các doanh nghiệp được lựa chọn là các doanh nghiệp hoạt động trong lĩnh vực dệt may, được niêm yết trên thị trường chứng khoán trong giai đoạn từ năm 2010 đến năm 2018:
Lựa chọn mẫu nghiên cứu: Mẫu nghiên cứu bao gồm 30 doanh nghiệp hoạt động trong các lĩnh vực dệt may, trong giai đoạn từ năm 2010 đến năm 2018. Các doanh nghiệp này được niêm yết tại các sàn Hose, Hnx và Upcom. Trong số các doanh nghiệp dệt may niêm yết, tác giả loại bỏ dữ liệu của doanh nghiệp là Công ty cổ phần Dệt may Minh Khai (MKT) hủy niêm yết trong thời gian nghiên cứu. Tổng cộng nghiên cứu bao gồm 225 quan sát, và được thu thập theo dữ liệu bảng không cân nghĩa là có công ty tham gia TTCK sớm hơn, có công ty tham gia TTCK chậm hơn.
Dữ liệu trong nghiên cứu là dữ liệu bảng đây là dữ liệu kết hợp giữa dự liệu chéo và dữ liệu thời gian. Có thể coi dữ liệu bảng là dữ liệu chuỗi thời gian theo từng đơn vị chéo khác nhau mà nghiên cứu quan tâm (TS. Phạm Thị Tuyết Trinh –
tế lượng ứng dụng trong kinh tế và tài chính, 2016). Bằng cách kết hợp chuỗi thời gian của các quan sát chéo, dữ liệu bảng cho chúng ta “dữ liệu chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, ít hiện tượng đa cộng tuyến giữa các biến hơn, nhiều bậc tự do hơn và hiệu quả cao hơn” (Chương trình Giảng dạy Kinh tế Fulbright – Chương 16: Các mô hình hồi quy dữ liệu bảng, 2012). Bên cạnh đó dữ liệu bảng còn cung cấp khả năng tạo ra các dự đoán chính xác hơn cho từng quan sát riêng lẻ. Nếu các biến riêng được xem xét trong môi trường tương tự với một số biến nhất định, việc sử dụng dữ liệu bảng sẽ cung cấp làm rõ sự biến động của quan sát đó bằng cách cung cấp các biến thiên của quan sát khác. Nếu các hành vi riêng lẻ có điều kiện tương tự đối với một số biến nhất định, dữ liệu bảng điều khiển cung cấp khả năng tìm hiểu hành vi cá nhân bằng cách quan sát hành vi của người khác. Do đó, có thể thu được mô tả chính xác hơn về hành vi cá nhân bằng cách gộp dữ liệu. (Cheng Hsiao – Analysis of Panel Data, 2003)