Dữ liệu sử dụng trong bài này là dữ liệu thứ cấp, được lấy từ báo cáo tài chính (được kiểm toán) và các báo cáo khác của 80 công ty dược phẩm ở Việt Nam từ 2011–2014. Các công ty lấy mẫu là có đầy đủ dữ liệu trong giai đoạn nghiên cứu. Dữ liệu dùng cho nghiên cứu là loại dữ liệu bảng: Dữ liệu bảng là sự kết hợp của dữ liệu chéo và chuỗi thời gian. Dữ liệu bảng có lợi ích cụ thể là nó giả định rằng các công ty khác nhau là không đồng nhất trong tự nhiên tức là có những yếu tố khác nhau, nó cũng xem xét sự thay đổi trong dữ liệu, do đó nó cung cấp hiệu quả hơn phương pháp dữ liệu chéo (Baltagi, 2001). Dữ liệu bảng cũng cung cấp một giải pháp cho tính không đồng nhất trong quan sát đó là một vấn đề phổ biến trong dữ liệu chéo và dữ liệu bảng có thể dễ dàng xử lý số lượng lớn các quan sát (Dougherty, 2011). Vì vậy, phương pháp dữ liệu bảng được sử dụng trong nghiên cứu này.
Nghiên cứu sử dụng phương pháp dữ liệu bảng với 3 mô hình khác nhau: Mô hình đánh giá tác động ngẫu nhiên - random effects (REM), mô hình đánh giá tác động cố định - fixed effects (FEM) và mô hình Pooled OLS để đánh giá tác động.
Để đảm bảo sự phù hợp của mô hình, nghiên cứu đã thực hiện một số kiểm định Breusch-Pagan Lagrangian (để lựa chọn giữa Pooled OLS và REM), kiểm định Hausman (để lựa chọn giữa REM và FEM), kiểm định Wald (phát hiện phương sai sai số thay đổi) và kiểm định Wooldridge (phát hiện tự tương quan). Bên cạnh đó, phương pháp FGLS cũng được sử dụng bởi nó có thể kiểm soát được hiện tượng phương sai số thay đổi và tự tương quan (Judge, Hill et al, 1988).
Điều kiện lọc dữ liệu:
- Các công ty phải kinh doanh liên tục trong suốt thời gian nghiên cứu - Không có sáp nhập công ty
- Các công ty phải có thời gian hoạt động lớn hơn thời gian nghiên cứu.
- Các công ty nghiên cứu là các công ty niêm yết trên thị trường chứng khoán Việt Nam.