6. Kết cấu khóa luận
3.1.3. Dữ liệu nghiên cứu
Nghiên cứu sử dụng dữ liệu thứ cấp, mẫu nghiên cứu bao gồm dữ liệu thu thập được của 12 doanh nghiệp thuộc ngành Thép được niêm yết trên thị trường chứng khoán Việt Nam giai đoạn 20011- 2020. Trong giai đoạn 10 năm này, tổng số lượng mẫu nghiên cứu trong một năm là 12 doanh nghiệp tương ứng với 120 mẫu chính thức được sử dụng trong bài nghiên cứu. Tất cả dữ liệu được sử dụng này đều là dữ liệu thứ cấp được lấy từ website của Sở giao dịch chứng khoán Hà Nội, sở giao dịch chứng khoán TPHCM và báo cáo tài chính của các tổ chức phát hành.
Bài viết lựa chọn được biến độc lập là giá Quặng sắt 62% Fe tính trung bình theo từng năm. Đồng thời, có 3 yếu tố chính được lựa chọn làm biến phụ thuộc đại diện cho lợi nhuận của các doanh nghiệp ngành Thép là: Lợi nhuận sau thuế, Tỷ suất sinh lời trên tổng tài sản ROA và Tỷ suất sinh lời trên vốn chủ sở hữu ROE. Ngoài ra, các biến kiểm soát được cho là có ảnh hưởng đến lợi nhuận của các doanh nghiệp này gồm: tổng nợ, tổng tài sản, các khoản tiền và tương đương tiền, cổ tức tiền mặt, tổng sản phẩm quốc nội GDP và chỉ số giá tiêu dùng phản ánh lạm phát CPI.
Thứ nhất, các biến phụ thuộc là ROA, ROE biến động rất nhiều qua các năm đối với các doanh nghiệp ngành Thép thuộc đối tượng nghiên cứu. Bởi vậy khi đưa dữ liệu vào mô hình hồi quy sẽ dễ dẫn đến những kết quả không chính xác vì những con số này qua hằng năm gần như có sự thay đổi tương đối lớn. Do đó, nghiên cứu đã quyết định chuyển sang dạng logarit đối với những biến này, viết tắt là Ln(ROA) và Ln(ROE) để những số liệu trong bài ít
Thứ hai, lợi nhuận sau thuế (LNST) được tính bằng doanh thu trừ đi các khoản chi phí và thuế thu nhập doanh nghiệp. Lợi nhuận sau thuế qua các năm của doanh nghiệp biến động lớn, lợi nhuận có thể âm có thể dương nên số liệu nghiên cứu có thể không đồng nhất. Vì vậy, nghiên cứu đã lấy logarit cơ số e của lợi nhuận sau thuế để đồng bộ dữ liệu nghiên cứu cho mô hình hồi quy.
Thứ ba, biến độc lập là giá Quặng sắt 62% Fe là giá quặng sắt trung bình theo từng năm với đơn vị là USD/tấn. Các giá trị này cũng được cho là biến động lớn qua các năm. Bởi vậy biến này đều được thống nhất để dưới định dạng logarit cơ số e số để kết quả mô hình đưa ra sẽ có tính chính xác cao hơn.
Thứ tư, các biến kiểm soát là tổng tài sản (TONGTSAN), tổng nợ (TONGNO), cổ tức tiền mặt (COTUC), tiền và tương đương tiền (TIENMAT) cũng là những dữ liệu có sự thay đổi lớn qua các năm nên tiếp tục sử dụng logarit cơ số e đối với những biến này để mô hình có ý nghĩa.
Thứ năm, tăng trưởng tổng sản phẩm quốc nội (GDP) và chỉ số tiêu dùng (CPI) là phần trăm tăng trưởng của các chỉ số này qua các năm nên được ghi nhận với đơn vị phần trăm.