Vấn đề nội sinh và đa cộng tuyến

Một phần của tài liệu Luận văn thạc sĩ Tác động của đào tạo ngắn hạn lao động đang làm việc đến kết quả hoạt động doanh nghiệp nhỏ và vừa Việt Nam giai đoạn 2005-2011 (Trang 48)

Nếu mục tiêu phân tích là thiết lập phương trình hồi quy để dùng cho dự báo thì mức độ giải thích và ý nghĩa của mô hình là quan trọng (R2 và F-test). Với mục tiêu phân tích tác động của nhân tố, như mục tiêu của bài viết này, thì giá trị và ý nghĩa của hệ số nhân tố là quan trọng (b và se).

Đào tạo tiềm ẩn nội sinh. Các doanh nghiệp có nhiều lựa chọn hơn khi lao động có thể đào tạo. Một phần của điều này được kiểm soát bằng cách đo các doanh nghiệp giống nahu theo thời gian. Nhưng cú sốc đột biến cũng có thể có tác động đến quyết định đào tạo và không có một nghiên cứu nào kiểm soát chính xách điều này. Nói riêng, có nhiều bằng chứng rằng các chương trình đào tạo được giới thiệu khi doanh nghiệp đối diện với cú sốc thiếu hụt nhu cầu. Do sản xuất bị hạn chế có sự khuyến khích tái bố trí lao động bằng hoạt động đào tạo (Dearden và cộng sự, 2000). Kết quả hồi quy có thể bị chệch nếu như có hiện tượng nội sinh; với biểu hiện biến đào tạo có tương quan với phần dư (chính xác là với biến giải thích có ý nghĩa còn thiếu, nằm trong phần dư) đồng thời phần dư có tương quan với biến được giải thích. Kết quả hồi quy sẽ không chệch khi biến đào tạo ngoại sinh, tức là không có tương quan phần dư; nếu như biến đào tạo nội sinh thì thực hiện giải pháp xử lý.

Kiểm tra tình trạng nội sinh của biến:

Yit = a + δDit + β1Xit + uit (3.6) Dit = d + β2Xit + θZit + vit (3.7)

 Có tình trạng nội sinh và ước lượng δ trong (3.6) bị chệch nếu có tương quan giữa vit và uit.

 Thực hiện hồi quy (3.6) bổ sung biến vit là phần dư của hồi quy (3.7) Yit = a + δDit + β1Xit + uit + ζvit (3.8)

Nếu hệ số ζ có ý nghĩa thống kê thì có nội sinh của biến D Xử lý nếu có tình trạng nội sinh:

 Sử dụng hồi quy biến công cụ (IV, instrumental variables regression).

 Thay Dit trong (3.6) bằng Dit từ (3.7),

Yit = a + δ(d + β2Xit + θZit + vit) + β1Xit + uit (3.9)

 Loại bỏ vit ra khỏi (3.9) bằng cách sử dụng giá trị Dit ước lượng ( it) thay cho giá tị thực của Dit,

Yit = a + δ( + 2Xit + Zit) + β1Xit + uit (3.10)

 Ước lượng δ trong (3.9) bị chệch, nhưng δ trong (4.15) sẽ không chệch. Điều kiện áp dụng

 Biến Zit phải là biến ngoại sinh và không được có mặt trong (3.6)

 Biến Xit cũng là biến ngoại sinh và có mặt trong cả hai (3.6), (3.7)

 Biến nội sinh là biến liên tục.

Trong trường hợp biến nội sinh là biến dummy (cụ thể là biến đào tạo trong nghiên cứu này) thì phương pháp cũng tương tự, nhưng các bước thực hiện kiểm tra và xử lý có khác (Lennox, 2013).

Xem lại phương trình hồi quy chính: Y = a + δD + β1X + u (3.11)

Nếu u và v tương quan thì E(u|D) ≠ 0, có nội sinh, kết quả δ bị chệch. Mô hình chọn lọc Heckman dùng để ước tính và kiểm soát E(u|D).

D* = d + β2X + θZ + v (3.12) trong đó D* ≥ 0 nếu D = 1 (D* < 0 nếu D = 0)

Chọn các biến Z ngoại sinh có tác động đến D nhưng không tác động đến Y. Ước lượng E(u|D) và đưa vào (3.6) như là một biến kiểm soát.

= E(u|D) =φ θZ + βX

Ф θZ + βX nếu D = 1 =−φ θZ + βX

[1− Ф θZ + βX ] nếu D = 0

Y = αD + βX + ρσMILLS + ε (3.13)

Ước lượng tác động của D đến Y giờ đây sẽ không chệch bởi vì E(u|D) = 0. Mô hình D và Y được ước lượng theo hai bước hay ước lượng theo ML, maximum likelihood.

Trong các nghiên cứu trước đây, cũng có một ít nghiên cứu xem đào tạo như biến ngoại sinh, cho nên không kiểm tra hay xử lý nội sinh (Aragon-Sanchez, 2003; Schonewille, 2001). Số khác thì dùng mô hình hiệu số bậc một (first different) để loại trừ nội sinh trong phân tích mức độ tăng trưởng (Dearden và cộng sự, 2000; Conti, 2005; Thang và cộng sự, 2009). Một số đánh giá tác động trễ của đào tạo cho nên vấn đề nội sinh cũng không đặt ra (Aragon-Sanchez, 2003), hay sử dụng một số biến với độ trễ làm biến công cụ. Đa số nghiên cứu còn lại có quan tâm vấn đề nội sinh cũng như cách xử lý bằng mô hình GMM (Dearden và cộng sự, 2000; Conti, 2005; Ballot, 2001; Zwick, 2004).

Các biến có thể giải thích doanh nghiệp quyết định thực hiện đào tạo hay không được một số nghiên cứu đề xuất như dư thừa lao động dự kiến, lao động có thể bỏ việc, nhu cầu chuyên môn cao, đào tạo nghề là giải pháp số một giải quyết thiếu hụt lao động kỹ năng, đào tạo nâng cao là giải pháp ưu tiên giải quyết thiếu hụt lao động kỹ năng, số lượng lao động, chia sẻ lao động chất lượng cao, máy móc thiết bị công nghệ cao, đầu tư vào công nghệ thông tin, hợp đồng tiền lương tập thể, đào tạo nghề nghiệp với mức ý nghĩa tác động cao (Zwick, 2002); hay là số lượng lao động, vốn trên lao động, doanh nghiệp có nước ngoài sở hữu, doanh nghiệp có nhà nước sở hữu, có thay đổi công nghệ, tỷ lệ hàng hóa xuất khẩu, tỷ lệ lao động tạm thời/lao động

tuyển mới, tỷ lệ lao động thời vụ ký hợp đồng, tỷ lệ lao động ký hợp đồng nghề, tỷ lệ quản lý cấp cao, tỷ lệ quản lý cấp trung và thấp, tỷ lệ nhân viên văn phòng, tỷ lệ lao động được chia sẻ lợi nhuận (Alba-Raminez, 1991).

Từ kết quả tham khảo và bộ dữ liệu sử dụng, các biến có thể giải thích việc doanh nghiệp quyết định thực hiện đào tạo hay không được đề xuất gồm: doanh nghiệp có khó khăn trong tuyển dụng lao động có tay nghề (hireless, khó tuyển dụng nên phải đào tạo, mức độ khó khăn tăng theo giá trị 1, 2, 3); doanh nghiệp có tổ chức công đoàn hay không (union, có công đoàn giá trị = 1, thường yêu cầu đào tạo); một trong những trở ngại chính đối với doanh nghiệp là thiếu lao động có tay nghề (skillgap, mức độ trở ngại tăng theo giá trị 1, 2, 3); trình độ chuyên môn nghiệp vụ cao nhất của chủ doanh nghiệp (spec, chuyên môn cao muốn đào tạo cho lao động, giá trị từ 1 đến 5); doanh nghiệp có xuất khẩu (Ex = 1 có xuất khẩu, yêu cầu sản phẩm cao dẫn đến tăng đào tạo); có sản phẩm mới (Pnew), có cải tiến (Inn) hay có quy trình mới (Tnew) là các biến dummy = 1 nếu có, dễ dẫn đến thực hiện đào tạo; tỷ lệ máy móc mới (Mnew, %) và tỷ lệ máy móc dưới 3 năm (Ma3, %), giá trị càng cao càng có nhu cầu đào tạo.

Với các biến giải thích như trên và biến được giải thích là xác suất doanh nghiệp thực hiện đào tạo; mô hình logit (hoặc probit) được dùng để xử lý,

logit(D) = ln[P(D=1)/P(D=0)] = d + κlnK + λlnL + ζ1hireless + ζ2union + ζ3skillgap + ζ4spec + ζ5Ex + ζ6Pnew + ζ7Inn + ζ8Tnew + ζ9Mnew + ζ10Ma3 + ν (3.14)

 kết quả F-test và R2 cho thấy mô hình có ý nghĩa với mức độ giải thích 19%, các biến có ý nghĩa tác động gồm hireless (khó khăn trong tuyển dụng lao động có tay nghề), union (có công đoàn), spec (trình độ chuyên môn chủ doanh nghiệp), Tnew (có quy trình mới) (Phụ lục PL.07.1).

Các biến hireless, Tnew, union, được đưa vào phương trình hồi quy chính để kiểm tra có tương quan với biến phụ thuộc hay không,

lnVA = a + δD + κlnK + λlnL + ζ1hireless + ζ2union + ζ4spec + ζ8Tnew + ε (3.15)

 kết quả chỉ có biến Tnew là thỏa điều kiện làm biến công cụ để xử lý nội sinh nếu có (ζ8 không có ý nghĩa thống kê, Phụ lục PL.07.2).

Phương trình chọn lọc Heckman,

logit(D) = d + κlnK + λlnL + ζTnew + ν (3.16)

Xác định phần dư (Phụ lục PL.07.3). Kiểm tra nội sinh biến D được thực hiện bằng cách đưa phần dư ν trong (3.16) vào hồi quy phương trình chính,

lnVA = a + δD + κlnK + λlnL + ξν + ε (3.17)

 kết quả hệ số phần dư ξ không có ý nghĩa thống kê (P > |t| = 0,576, Phụ lục PL.07.4), chứng tỏ các phần dư không có tương quan, hay không có hiện tượng nội sinh của biến D.

Nếu có nội sinh thì sẽ xử lý theo mô hình hai bước hay ML, maximum likelihood, không được trình bày trong phạm vi nghiên cứu.

Thực ra, vấn đề kết quả chệch do nội sinh biến trong nghiên cứu này cũng không quá nghiêm trọng bởi vì việc sử dụng dữ liệu bảng (panel data) với mô hình fixed effect (Yit = a + δDit + βXit + ui + eit) là một ưu điểm, đã giúp kiểm soát phần dư đặc trưng đối tượng không quan sát được (ui) vừa tác động đến Y vừa tương quan với D (Dearden và cộng sự, 2000); chỉ còn phần dư (eit) nếu không tương quan với D thì D ngoại sinh, kết quả δ sẽ không chệch.

Nếu như nội sinh làm chệch giá trị thì đa cộng tuyến làm sai lệch mức ý nghĩa thống kê của hệ số biến mục tiêu. Có một số dấu hiệu nhận biết đa cộng tuyến cao: R2 cao trong khi quá ít biến có tỷ số t có ý nghĩa, có tương quan cao giữa các cặp biến giải thích, hồi quy phụ giữa các biến thích có ý nghĩa cao với R2 lớn, hệ số phóng đại phương sai cao, VIF - variance inflating factor = 1/(1 - r2), hệ số Tolerance = 1/VIF = (1 - r2) quá thấp,... Đa cộng tuyến không nhất thiết phải xử lý, nếu cần khắc phục thì có một số quy tắc, dựa vào lý thuyết hay tài liệu để có mối quan hệ giữa các hệ số, bỏ bớt biến giải thích và chấp nhận ước lượng chệch (đôi khi sự chệch biến lại có hữu dụng như trong trường hợp cần phân tích tác động trực tiếp và tác động gián tiếp), chuyển dạng biến như dùng hiệu số các biến hay tỷ số các biến hay biến có độ trễ, thêm dữ liệu mới, dùng biến bậc cao, phân tích nhân tố để chọn biến phù hợp, ...

Trong hồi quy (1) đánh giá tác động của đào tạo đến giá trị gia tăng, cũng như trong hồi quy (2.1) và (2.2) đánh giá tác động trễ và tác động cùng thời kỳ của đào tạo đến tăng trưởng giá trị gia tăng, hệ số đào tạo δ1, δ2.1 và δ2.2 đều không có ý nghĩa thống kê. Trong khi đó, các hồi quy (3.1), (3.2) (2.2e) cho thấy có mối tương quan giữa đào tạo với vốn và lao động. Cho nên, có thể có hiện tượng đa cộng tuyến dẫn đến phương sai của hệ số đào tạo var(δ) tăng lên, sai số chuẩn se(δ) tăng lên, thống kê t = δ/se(δ) giảm xuống, dẫn đến sai lệch khi đánh giá ý nghĩa thống kê hệ số δ.

Việc kiểm tra đa cộng tuyến được thực hiện qua các dấu hiệu đã nêu ở trên. Chỉ số R2 trong hồi quy (1), (2.1), (2.2) lần lượt là 88%, 64%, 64% tương đối cao ở hồi quy (1), trong khi hệ số đào tạo lại không có ý nghĩa thống kê, đây là một dấu hiệu ghi nhận có thể có đa cộng tuyến. Đánh giá qua hệ số tương quan cặp biến đào tạo - vốn, đào tạo - lao động thì mối tương quan không quá chặt với hệ số tương quan rD-lnK và rD- lnL lần lượt là 0,18 và 0,24, khó có đa cộng tuyến cao. Đánh giá qua hồi quy phụ, đối với hồi quy (1) có R2 = 88%, trong khi R2 của hồi quy phụ lnK - D và lnL - D lần lượt là 76% và 85% thấp hơn so với 88%, khó có đa cộng tuyến cao. Đánh giá qua chỉ số VIF cũng cho thấy khó có đa cộng tuyến cao, với VIF = 1 / (1- r2) = 1,58 đối với (1), 1,16 đối với (2.1) và (2.2).

Mặc dù không có dấu hiệu của đa cộng tuyến cao, nhưng với việc sử dụng mô hình tác động trung gian thì đa cộng tuyến nếu có cũng đã được xử lý qua việc tách tương quan giữa đào tạo và biến trung gian đưa vào biến đào tạo, biến trung gian lúc này chỉ còn tương quan với những yếu tố không phải đào tạo, đa cộng tuyến do tương quan giữa đào tạo và biến trung gian bị khử đi. Cụ thể hệ số tác động của đào tạo, δ1 trong hồi quy (1), đến giá trị gia tăng theo mô hình truyền thống không có ý nghĩa thống kê, nhưng qua mô hình tác động trung gian thì hệ số đào tạo, δ4 = δ1 + κ1δ3.1 + λ1δ3.2 trong hồi quy (4) đã có ý nghĩa thống kê mức 1%. Còn δ2.2 trong hồi quy (2.2) không có ý nghĩa thống kê, nhưng δ2.2f trong hồi quy (2.2f) có ý nghĩa thống kê dù chỉ ở mức 10%.

Chương 4 – Kết quả phân tích thực nghiệm 4.1 Thống kê mô tả

4.1.1 Các biến trong bảng dữ liệu

Bảng 4.1 trình bày thống kê mô tả các biến có trong bộ dữ liệu khảo sát. Số doanh nghiệp quan sát trong dữ liệu bảng cân đối (balanced panel) là 1.454; gồm 4 sóng tương ứng 4 đợt khảo sát 2005, 2007, 2009, 2011; tổng số quan sát là 1.454*4 = 5.816. Khi phân tích mức độ tăng trưởng thì chỉ còn 3 sóng tương ứng tổng số quan sát là 1.454*3 = 4.362 (các biến TTVA, TTK, TTL, đo bằng chỉ số, là tỷ số giữa giá trị kỳ này so với kỳ trước, đã có đề cập trong mục 3.2). Biến đào tạo D cho thấy trung bình chỉ có 5% doanh nghiệp thực hiện đào tạo.

Một phần của tài liệu Luận văn thạc sĩ Tác động của đào tạo ngắn hạn lao động đang làm việc đến kết quả hoạt động doanh nghiệp nhỏ và vừa Việt Nam giai đoạn 2005-2011 (Trang 48)

Tải bản đầy đủ (PDF)

(121 trang)