7. Kết cấu luận văn
2.1.2. Mô hình nghiên cứu
Đề tài sử dụng dữ liệu bảng - số liệu theo quý của 16 doanh nghiệp ngành khoáng sản niêm yết trên thị trường chứng khoán Việt Nam trong vòng 5 năm từ năm 2009- 2013 để phân tích các nhân tố ảnh hưởng đến hiệu quả hoạt động. Đề tài sử dụng số liệu bảng được lựa chọn trong nghiên cứu bởi vì những ưu điểm của dữ liệu bảng như:
-Loại dữ liệu này liên quan đến nhiều thông tin của cùng một đối tượng nghiên cứu trong một giai đoạn thời gian nên bao hàm những đặc điểm riêng khác nhau cho các đối tượng nghiên cứu khác nhau. Chính vì vậy mà với những kỹ thuật ước lượng đối với loại dữ liệu này có thể cho phép chúng ta xem xét sự khác biệt của những đặc điểm riêng không quan sát được của các đối tượng khác nhau (ví dụ như khác biệt văn hoá giữa các quốc gia hay sự khác biệt về triết lý kinh doanh giữa các doanh nghiệp, khác biệt về đặc điểm doanh nghiệp và môi trường kinh doanh…) một cách rõ ràng bằng việc đưa thêm vào bên trong mô hình những biến số chỉ định riêng cho từng đối tượng hoặc nhóm đối tượng nghiên cứu.
- Việc kết hợp các giá trị quan sát theo thời gian khác nhau cho nhiều đối tượng khác nhau làm cho loại dữ liệu này chứa đựng nhiều thông tin có giá trị hơn, biến đổi hơn, giảm hiện tượng tự tương quan trong các biến của mô hình, bậc tự do cao hơn và sẽ hiệu quả hơn trong việc xử lý các mô hình.
- Dữ liệu bảng có thể phát hiện và đo lường tốt hơn các tác động mà người ta không thể quan sát được trong dữ liệu chuỗi thời gian hay dữ liệu chuỗi thuần túy.
Hầu hết các nghiên cứu ở Việt Nam nêu trên đều áp dụng phương pháp phân tích hồi qui bội dữ liệu chéo dựa trên nguyên tắc bình phương nhỏ nhất nhằm tìm ra mối quan hệ giữa biến phụ thuộc và các biến độc lập. Đây được xem là phương pháp đáng tin cậy trong việc ước lượng mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập.
Tuy nhiên mô hình OLS dữ liệu chéo lại ràng buộc quá chặt về không gian và thời gian – các hệ số hồi quy không đổi theo cả không gian và thời gian – có thể làm mất đi ảnh hưởng thật của biến độc lập lên biến phụ thuộc dẫn đến kết quả mô hình không phù hợp trong điều kiện thực tế. Chính vì vậy nghiên cứu áp dụng hai mô hình: mô hình ảnh hưởng ngẫu nhiên (RE) và mô
hình ảnh hưởng cố định (FE) nhằm xem xét đến sự khác biệt giữa các đối tượng chéo (doanh nghiệp) để phân tích tác động của các nhân tố lựa chọn (quy mô, cơ cấu tài sản, cấu trúc tài chính…) đến hiệu quả hoạt động của các doanh nghiệp ngành khoáng sản.
a. Mô hình ảnh hưởng cốđịnh – FEM
Việc ước lượng mô hình nghiên cứu phụ thuộc vào những giả định được đặt ra về tung độ gốc, hệ số độ dốc, và số hạng sai số uit. Một số khả năng có thể xảy ra:
- Giả định rằng các hệ số độ dốc và tung độ gốc là hằng số theo thời gian và không gian, và số hạng sai số thể hiện sự khác nhau theo thời gian và theo các cá nhân.
- Các hệ số độ dốc là hằng số nhưng tung độ gốc thay đổi theo các cá nhân.
- Các hệ số độ dốc là hằng số nhưng tung độ gốc thay đổi theo các cá nhân và thời gian.
- Tất cả các hệ số (tung độ gốc cũng như các hệ số độ dốc) đều thay đổi theo các cá nhân.
- Tung độ gốc cũng như các hệ số độ dốc đều thay đổi theo các cá nhân và theo thời gian
Mô hình ước lượng được sử dụng:
Yit = Ci + β1X1it + β2X2it + …+ βkXkit + uit
Trong đó: Yit : Biến phụ thuộc, với i là doanh nghiệp và t là thời gian (quý)
Xit : Biến độc lập
βi : Hệ số góc đối với nhân tố Xi uit : Phần dư
b. Mô hình ảnh hưởng ngẫu nhiên – REM
Ý tưởng cơ bản bắt đầu:
Yit =C+ β1X1it + β2X2it +… + βn Xnit + uit
Thay vì xem β1i là cố định, ta giả định đó là một biến ngẫu nhiên với một giá trị trung bình là β1 . Và giá trị tung độ gốc cho một cá nhân riêng lẽ có thể được biểu thị là:
C= C + εi i= 1, 2,…, N
Trong đó: εi : là số hạng ngẫu nhiên với một giá trị trung bình bằng 0 và phương sai bằng σ2ε .
Thay vào công thức trên ta có:
Yit = C + β1 X1it +… + βn Xnit + εi + uit
εi : Sai số thành phần của các đối tượng khác nhau
uit : Sai số thành phần theo không gian và chuỗi thời gian kết hợp Giả định thông thường mà mô hình đưa ra là:
εit ~ N (0, σ2ε)
uit ~ N (0, σ2u )
E(εit, uit) = 0 E(εi, εj) = 0 (i ≠ j)
Nghĩa là các thành phần sai số riêng biệt (εit) không có tương quan với nhau và không tự tương quan giữa các đơn vị theo không gian và chuỗi thời gian.
Nhìn chung, mô hình FEM hay REM tốt hơn cho nghiên cứu phụ thuộc vào giả định có hay không sự tương quan giữa εi và các biến giải thích X. Nếu giả định rằng không có tương quan, thì REM phù hợp hơn, và ngược lại.
Ngoài ra, nếu căn cứ vào N (số dữ liệu chéo) và T (độ dài thời gian nghiên cứu) thì theo Judge:
- Trường hợp T lớn và N nhỏ: Trong trường hợp này không có sự khác biệt lớn về giá trị của các tham số ước lượng trong mô hình FEM và REM. Vì
vậy việc lựa chọn mô hình nào phụ thuộc vào tiện ích trong xử lý. Thông thường trong trường hợp này mô hình ảnh hưởng cố định (FEM) được lựa chọn
Trường hợp T nhỏ và N lớn: Trong trường hợp này, kết quả ước lượng khác biệt nhau rất lớn. Nếu các đối tượng nghiên cứu không được chọn ra một cách ngẫu nhiên từ một tổng thể lớn hơn nhiều thì FEM sẽ phù hợp hơn. Ngược lại, nếu các đối tượng nghiên cứu được lựa chọn một cách ngẫu nhiên từ một tổng thể lớn hơn thì REM sẽ thích hợp hơn bởi vì trong trường hợp này hệ số chặn β1i là thật sự ngẫu nhiên nên việc suy luận thống kê hay giải thích mô hình sẽ dễ dàng và không có điều kiện ràng buộc. Do đó, nếu các điều kiện của REM được đảm bảo thì kết quả ước lượng của REM sẽ chính xác hơn sơ với FEM.
Bên cạnh đó, Hausman test cũng là một phương án trong việc chọn phương pháp tốt nhất giữa FEM và REM. Kiểm định Hausman nhằm lựa chọn mô hình FEM hay REM phù hợp cho hồi quy dữ liệu mẫu trên giả định:
H0: Ước lượng FEM và REM không khác nhau đáng kể H1: Ước lượng FEM và REM là khác nhau
Nếu p-value <0,05, bác bỏ H0. Khi đó REM là không hợp lý, nên lựa chọn FEM.
c. Lựa chọn mô hình
Mô hình ảnh hưởng cố định FEM
Mô hình ảnh hưởng ngẫu nhiên REM
Hệ số chặn Có riêng từng hệ số chặn cho từng đơn vị chéo (DN)
Chỉ có duy nhất một hệ số chặn cho tất cả các đơn vị chéo (DN) Giá trị này là giá trị trung bình của
tất cả các đơn vị chéo Hệ số góc Không biến đổi Không biến đổi
Mô hình ảnh hưởng cố định FEM
Mô hình ảnh hưởng ngẫu nhiên REM
Phần dư
(Sai số) Không biến đổi
Sự khác biệt của các đơn vị chéo nằm trong thành phần ngẫu nhiên, phần dư của mỗi thực thể
Thay đổi theo từng đơn vị chéo và/hoặc theo thời gian
Nhìn chung, mô hình FEM hay REM tốt hơn cho nghiên cứu phụ thuộc vào giả định có hay không sự tương quan giữa εi và các biến giải thích X. Nếu giả định không tương quan, thì REM phù hợp hơn, và ngược lại. Ngoài ra, nếu căn cứ vào N (số dữ liệu chéo) và T (độ dài thời gian nghiên cứu) thì theo Judge, FEM và REM không phân biệt khi T lớn và N nhỏ, khá khác biệt khi N lớn và T nhỏ. Bên cạnh đó, kiểm định Hausman cũng là một trong những phương pháp để lựa chọn giữa FEM và REM.