Nghiên cứu sử dụng dữ liệu thứ cấp, định lượng được trích ra từ báo cáo tài chính được cơng bố của các doanh nghiệp chế biến thực phẩm niêm yết trên hai sàn giao dịch của thị trường chứng khốn Việt Nam là HNX và HoSE giai đoạn 2007-2019. Do phạm vi nghiên cứu Các dữ liệu này được sử dụng để tính tốn ra giá trị của các chỉ tiêu phản ánh khả năng sinh lời và các chỉ tiêu đại diện cho những nhân tố nội tại tác động tới khả năng sinh lời kỳ sau của các doanh nghiệp trên, đĩng vai trị là số liệu đầu vào của nghiên cứu. Bên cạnh đĩ, nghiên cứu cịn thu thập một số dữ liệu định tính và định lượng về tình hình chung của tồn ngành chế biến thực phẩm Việt Nam trong giai đoạn trên, phục vụ cho mục tiêu đánh giá tổng thể tình hình kinh doanh và khả năng sinh lời tồn ngành. Với nội dung phân tích thực trạng khả năng sinh lời của các doanh nghiệp chế biến thực phẩm tại Việt Nam, các dữ liệu hàng năm của các doanh nghiệp cũng như của tồn ngành được sử dụng để tính tốn các chỉ tiêu tổng hợp phản ánh khả năng sinh lời như lợi nhuận biên, ROA, ROE, …
Tiếp đĩ, với nội dung nghiên cứu kiểm định tác động ngắn hạn của các nhân tố nội tại tới khả năng sinh lời của các doanh nghiệp chế biến thực phẩm niêm yết tại Việt Nam, các dữ liệu tài chính – kế tốn cần thiết hàng quý được thu thập và sàng lọc. Đối với nội dung kiểm định tác động dài hạn của các nhân tố trên, các dữ liệu hàng năm được thu thập và sàng lọc.
Với sự biến động của ngành chế biến thực phẩm và thị trường chứng khốn, số lượng các doanh nghiệp chế biến thực phẩm niêm yết cĩ thể thay đổi hàng năm do các doanh nghiệp mới niêm yết hoặc hủy niêm yết. Hệ quả là một số doanh nghiệp cĩ đầy đủ số liệu trong các năm được nghiên cứu, một số khác thì khơng. Do đĩ, dữ liệu bảng được thu thập cĩ thể khơng cân (unbalanced). Để đảm bảo dữ liệu phản ánh chân thực thực trạng ngành nghề, tác giả khơng loại bỏ những doanh nghiệp cĩ số năm xuất hiện ít hơn các doanh nghiệp khác bởi điều này cĩ thể khiến kết quả phân tích bị thiên lệch về các doanh nghiệp vững mạnh hơn (hiện tượng “survival bias”). Đây là hiện tượng xảy ra khi mẫu chỉ bao gồm những doanh nghiệp tồn tại suốt từ đầu đến cuối thời gian nghiên cứu, bỏ sĩt những doanh nghiệp gia nhập muộn hơn hoặc bị phá sản/hủy niêm yết giữa chừng – vì những doanh nghiệp tồn tại lâu dài và xuyên suốt như vậy thường là những doanh nghiệp vững mạnh nhất nên mẫu phân tích khi đĩ khơng mang tính đại diện cho tồn ngành, kết quả phân tích theo đĩ chỉ phản ánh tính chất của các doanh nghiệp mạnh này mà thơi. Trường hợp dữ liệu mảng khơng cân cĩ thể dẫn tới một số
khiếm khuyết của kết quả ước lượng, các khiếm khuyết này được khắc phục bằng biện pháp phù hợp trình bày ở phần tiếp theo.