Khai thác dữ liệu bảng và sử dụng mơ hình hồi quy bảng.
Sử dụng cơng cụ Stata 11 để phân tích thống kê.
Kiểm định giá trị trung bình, ví dụ kiểm định giá trị trung bình của VA (giá trị gia tăng) trong trường hợp D = 0 (không đào tạo) và D = 1 (có đào tạo)
Giả thuyết H0: giá trị trung bình các nhóm khơng khác nhau
Kiểm định T; Sig. t < 0,05: giá trị trung bình có chênh lệch
Kiểm định biến có phân phối chuẩn
Kiểm định Skewness/Kurtosis; các thông số Pr(Skewness), Pr(Kurtosis), Pr(χ2); Sig. χ2 < 0,05: khơng có phân phối chuẩn
So sánh chọn mơ hình hồi quy tác động xác định (FEM - Fixed Effects Model) hay hồi quy tác động ngẫu nhiên (REM - Random Effects Model) dựa theo kiểm định Hausman.
Giả thuyết H0: các hệ số fixed effect và random effect không khác nhau
Kiểm định χ2; Sig. χ2 < 0,05: sử dụng fixed effect (Torres-Reyna, 2011)
Chấp nhận H0 Bác bỏ H0
B (random effect ) Phù hợp & Hiệu quả Không phù hợp b (fixed effect) Phù hợp & Không hiệu quả Phù hợp
Lệnh xtreg, fe của stata cho R2 không đúng; dùng areg để có R2 đúng hơn (Park, 2005); có 3 lệnh hồi quy (regress + dummy, xtreg fe, areg) đều cho cùng kết quả hệ số hồi quy, nhưng sử dụng R2 của regress hoặc areg để báo cáo (Torres-Reyna, 2011).
F-test được cung cấp khi chạy lệnh xtreg fe; nếu Sig. F < 0,05 thì mơ hình phù hợp dữ liệu thực nghiệm, tất cả hệ số biến độc lập không đồng thời bằng 0 (Torres-Reyna, 2011).
Kiểm định xem mơ hình fixed effect có cần fixed thời gian hay không, sử dụng kiểm F-test:
Giả thuyết H0: tất cả biến giả thời gian đều = 0
Kiểm định F; Sig. F < 0,05: bác bỏ H0, có nghĩa là giá trị có thay đổi đáng kể theo thời gian (trong đa số trường hợp thì giá trị ít thay đổi theo thời gian), cần fixed thời gian (tạo thêm các biến giả thời gian là cần thiết)
Kiểm định phương sai không thay đổi (homoskedasticity)
Giả thuyết H0: σi2 = σ2, với mọi i
Kiểm định χ2; Sig. χ2 < 0,05: có tình trạng phương sai không đồng nhất (heteroskedasticity)
Nếu gặp hiện tượng phương sai thay đổi: khắc phục bằng sử dụng tùy chọn "robust" (Torres-Reyna, 2011)
Kiểm định tương quan chuỗi thời gian (serial correlation)
Giả thuyết H0: khơng có tương quan
Kiểm định Wooldridge-test; Sig. F < 0,05: có tương quan
chỉ kiểm định với dữ liệu bảng chuỗi thời gian dài (20-30 năm), không cần kiểm định với chuỗi thời gian ngắn chỉ vài ba năm (Torres-Reyna, 2011).
Kiểm định đa cộng tuyến (multicollinearity)
Kiểm định Tolerance, hệ số phóng đại phương sai VIF (Variance Inflation Factor); VIF < 10 thể hiện khơng có đa cộng tuyến
3.4.1 Tác động của đào tạo đến giá trị gia tăng theo mơ hình truyền thống
Xem lại phương trình hồi quy (1):
(1) lnVAi = a1 + δ1Di + κ1lnKi + λ1lnLi + ε1i
Do dữ liệu khảo sát ở dạng bảng cân đối, balanced panel, với số đối tượng i = 1.454, sóng thời gian t = 4; cho nên khi phân tích thống kê, có thể khai thác dữ liệu theo kiểu chéo (cross data), chuỗi thời gian (time series data), pool (kết hợp chéo và chuỗi), bảng (panel data); cụ thể:
Mơ hình pool, hồi quy OLS:
(1.1) lnVAit = a + δDit + κlnKit + λlnLit + uit
Một kết quả dùng chung cho tất cả đối tượng (hệ số a giống nhau), đặc trưng khác nhau ở mỗi đối tượng nằm trong phần sai số, uit, cho nên yêu cầu phần dư uit phải không tương quan với các biến
Mơ hình panel, hồi quy "random effect model":
(1.2) lnVAit = ai + δDit + κlnKit + λlnLit + εit
khác OLS ở chỗ ai thay đổi theo đặc điểm đối tượng; với giả định đặc trưng của đối tượng có phân phối ngẫu nhiên với trung bình = 0 và phương sai khơng đổi
Mơ hình panel, hồi quy "fixed effect model":
(1.3) lnVAit = δDit + κlnKit + λlnLit + ai + εit
tương đương OLS + các biến giả dummy để thể hiện khác nhau giữa các đối tượng
Mơ hình panel, hồi quy "fixed effect model" + biến giả thời gian:
(1.4) lnVAit = δDit + κlnKit + λlnLit + j.nam + ai + εit
tương đương fixed đối tượng + fixed thời gian (thêm các biến giả j.nam), phù hợp dữ liệu bảng với số lượng sóng thời gian t thấp
So với pooled OLS (1.1) thì fixed effect panel (1.3) ưu điểm hơn ở chỗ cho phép phân biệt các đối tượng khác nhau với các đặc trưng khác nhau. (1.3) khác với (1.1) ở chỗ có thêm các biến dummy biểu thị sự khác nhau của đối tượng i. Nên chọn (1.1) hay (1.3) có thể dựa vào kiểm định giả thuyết H0: tất cả biến dummy = 0: = =
⋯= = 0, sử dụng thống kê F.
Mơ hình đầy đủ (Robust model) là fixed effect, mơ hình hiệu quả (Efficient model) là pooled OLS.
( ′ − ′ )/( −1)
( ′ )/( − − )
=( − )/( −1)
(1− )/( − − ) ~ ( −1, − − )
Nếu giả thuyết H0 bị bác bỏ (Prob > F < 0,05) kết luận: fixed group effect model tốt hơn pooled OLS model.
So với random effect (1.2) thì fixed effect (1.3) có ưu điểm hơn ở chỗ cho phép đặc trưng các đối tượng tương quan với biến độc lập bởi vì đặc trưng đối tượng (1.3) nằm trong hệ số tung độ gốc (intercept), trong khi (1.2) thì nằm trong phần dư. Cho nên, nếu bảo đảm điều kiện đặc trưng đối tượng khơng tương quan với biến độc lập thì (1.2) phù hợp và hiệu quả hơn (1.3), còn (1.3) phù hợp nhưng không hiệu quả bằng (1.2). Nếu có tương quan thì (1.2) khơng phù hợp, chỉ còn (1.3) phù hợp, lúc này
khơng cần xét tính hiệu quả. Cơng cụ để chọn (1.2) hay (1.3) là kiểm định Hausman, đã đề cập ở mục 3.4 Cơng cụ phân tích.
So với fixed effect (1.3) thì fixed effect + dummy thời gian (1.4) có ưu điểm hơn ở chỗ cho phép có tác động khác nhau theo thời gian. Thơng thường thì tác động này nhỏ, có thể bỏ qua, cho nên (1.3) không khác (1.4). Tuy nhiên, nếu tác động lớn, thường trong trường hợp số lượng sóng thời gian thấpít (chỉ có vài năm khảo sát) thì (1.4) cho kết quả ít chệch hơn so với (1.3). Có thể kiểm định tác động theo thời gian có khác nhau hay khơng bằng kiểm định F-test.
(Các nội dung trong 3.4.1 được tham khảo kết hợp từ nhiều nguồn, Gujarati, 2004; Park, 2005; Torres-Reyna, 2011; Lennox, 2013; Cameron, 2007).
3.4.2 Tác động của đào tạo đến tăng trưởng giá trị gia tăng theo mơ hình truyền thống
Xem lại phương trình hồi quy (2):
(2) lnTTVAi = δDi + κlnTTKi + λlnTTLi + εi
Do dữ liệu khảo sát ở dạng bảng cân đối, balanced panel, với số đối tượng i = 1.454, sóng thời gian t = 4; cho nên khi phân tích thống kê, có thể sử dụng kỹ thuật mơ hình tự hồi quy AR(1) (autoregressive), đưa thêm biến giá trị gia tăng ban đầu dạng logarit tự nhiên, lnVA0, vào mơ hình với vai trị là một biến giải thích như trong một số nghiên cứu (Pellegrini & Gerlagh, 2004; Pincus, 2011; CIEM, 2012); về mặt ý nghĩa thì mức độ tăng trưởng được cho là có chịu ảnh hưởng bởi giá trị ban đầu theo như lý thuyết tăng trưởng hội tụ của Solow (Pincus, 2011), hệ số của lnVA0 kỳ vọng có ý nghĩa và có giá trị âm.
Do đánh giá mức độ tăng trưởng cho nên cần dữ liệu 2 thời kỳ; biến đào tạo được mở rộng là tổ hợp của đào tạo trong cả hai kỳ; cho nên sẽ thực hiện hồi quy hai trường hợp để đánh giá gồm, đào tạo kỳ trước (D0), đào tạo kỳ này (D).
Phương trình hồi quy phân tích:
(2.2) lnTTVAi = α2lnVA0 + δ2D + κ2lnTTKi + λ2lnTTLi + ε2i
3.4.3 Tác động của đào tạo đến giá trị gia tăng và tăng trưởng giá trị gia tăng theo mơ hình tác động trung gian mơ hình tác động trung gian
Chọn một trong 4 kỹ thuật hồi quy đã nêu trong 3.4.1 (pooled OLS, random effect, fixed effect, fixed effect + dummy thời gian) tùy vào các kiểm định xem cái nào là phù hợp nhất (kết quả sau này cho thấy chọn fixed effect + dummy thời gian).
Các bước thực hiện như đã nêu trong 3.3.5 và 3.3.6.