Tất cả quan sát Loại trừ dum_rd Loại trừ dum_lnrd Loại trừ cả hai lnE p-value lnE p-value lnE p-value lnE p-value lnRD -0,3572 0,0032 -0,5057 0,0051 -0,4955 0,000 -0,2982 0,1233 Ln2RD 0,3973 0,001 0,4631 0,0114 0,4965 0,000 0,3119 0,1061
Nguồn: tác giả tính tốn từ bộ dữ liệu điều tra SME (2007, 2009, 2011)
Hình 4.9 cho thấy có hai nhóm rõ rệt: có hoặc khơng có đầu tư nghiên cứu phát triển. Trong nhóm có đầu tư R&D, mối quan hệ giữa gia nhập ngành và đầu tư R&D có vẻ như là mối quan hệ tuyến tính. Nghiên cứu tạo biến giả dum_rd để kiểm định sự tác động của việc có hoặc không đầu tư R&D đối với gia nhập ngành. Biến dum_rd có giá trị bằng 1 với các quan sát có giá trị lnRD bằng 0. Ngồi ra, nghiên
cứu đặt biến giả dum_lnrd có giá trị bằng 1 với một quan sát dị biệt lnE bằng 013.
Bảng 4.11 cho thấy mối tương quan giữa lnRD, ln2RD và lnE đều ý nghĩa thống kê trong ba trường hợp bao gồm tất cả quan sát, loại trừ dum_rd hoặc loại trừ dum_lnrd. Còn trong trường hợp loại trừ cả hai biến giả thì gia nhập ngành khơng tương quan với chi phí R&D. Trong trường hợp loại trừ một trong hai biến giả, bất kể là dum_rd hay dum_lnrd, thì hệ số tương quan giữa lnE và lnRD đều lớn hơn trường hợp không loại trừ biến giả. Điều này nghĩa là có ít nhất một trong hai biến giả ảnh hưởng đến mối quan hệ giữa gia nhập ngành và R&D. Hệ số tương quan mang dấu âm cho thấy R&D có thể có tác động hạn chế gia nhập ngành.
Để kiểm định lại sự tác động của biến giả đến mối quan hệ của gia nhập ngành và chi phí nghiên cứu phát triển, nghiên cứu tiến hành chạy mơ hình hồi quy giữa lnE, lnRD và hai biến giả dum_rd và dum_lnrd. Kết quả là biến dum_lnrd có ý nghĩa thống kê cịn dum_rd thì khơng (p-value=0,858). Như vậy, các quan sát có giá trị R&D bằng 0 khơng thể tách rời ra trong biến R&D. Cịn biến dum_lnrd sẽ được đưa vào trong mơ hình hồi quy tổng thể.
Gia nhập ngành và độ tuổi doanh nghiệp
Số liệu cho thấy ngành có doanh nghiệp hoạt động lâu đời nhất là ngành Sản xuất sản phẩm từ khoáng phi kim loại khác (mã ngành 23, trung bình 3 giai đoạn là 19,3 năm), sau đó là ngành Sản xuất xe có động cơ (mã ngành 29, trung bình 3 giai đoạn là 17,7 năm). Cịn ngành có độ tuổi trung bình của các doanh nghiệp nhỏ nhất là ngành In sao chép bản ghi các loại (mã ngành 18, trung bình 3 giai đoạn là 5 năm) và ngành Sản xuất da và các sản phẩm có liên quan (mã ngành 15, trung bình 3 giai đoạn là 6,7 năm).
Hình 4.10. Biểu đồ phân tán gia nhập ngành và độ tuổi doanh nghiệp
Trước khi loại hai quan sát dị biệt Sau khi loại hai quan sát dị biệt
Nguồn: tác giả tự vẽ từ bộ dữ liệu điều tra SME (2007, 2009, 2011) Bảng 4.12. Hệ số tương quan giữa gia nhập ngành và độ tuổi doanh nghiệp
tất cả quan sát Loại trừ
dum_outlier Loại trừ dum_age Loại trừ hai biến
lnE p-value lnE p-value lnE p-value lnE p-value lnAGE -0,0989 0,4295 -0,1913 0,1301 0,0226 0,8595 -0,01 0,9386 ln2AGE -0,0831 0,5069 -0,1963 0,1201 0,0311 0,8075 -0,0269 0,8355
Nguồn: tác giả tính tốn từ bộ dữ liệu điều tra SME (2007, 2009, 2011)
Hình 4.10 cho thấy đường trung bình của lnE và lnAGE gần như nằm ngang, nghĩa là khơng có tương quan với nhau. Nghiên cứu nhận thấy có nhiều quan sát dị biệt và những quan sát này có thể ảnh hưởng đến mối quan hệ giữa hai biến này. Nghiên cứu đặt biến giả dum_age gồm các quan sát dị biệt có giá trị lnE=3,85 và lnE=7,4 (tức hai điểm cao nhất và nằm thấp nhất nằm ngồi rìa – trừ hai quan sát dị biệt
0 2 4 6 8 0 1 2 3 4 lnage
lne Fitted values
Fitted values 4 5 6 7 8 0 1 2 3 4 lnage
lne Fitted values
dum_outlier). Vì mối quan hệ giữa lnE và lnAGE cũng có thể là đường cong thay vì đường thẳng. Nghiên cứu đặt thêm biến ln2AGE bằng bình phương của lnAGE. Nghiên cứu tiến hành kiểm định lại sự tương quan sau khi thực hiện các bước trên. Bảng kiểm định hệ số tương quan 4.12 cho thấy khơng có mối tương quan có ý nghĩa nào giữa gia nhập ngành và độ tuổi doanh nghiệp trong tất cả các trường hợp. Nghiên cứu tiến hành chạy mơ hình để kiểm định ý nghĩa của biến giả dum_outlier đối với lnAGE. Kết quả là dum_outlier có tác động đến mối quan hệ giữa lnAGE và lnE (p-value=0,000) còn biến giả dum_age khơng có ý nghĩa thống kê (p- value=0,673). Như vậy chỉ có biến dum_outlier được đưa vào mơ hình hồi quy tổng thế và tạm thời có thể kết luận rằng độ tuổi doanh nghiệp khơng có tương quan với gia nhập ngành.
Biến giả theo năm
Năm 2007, tổng số doanh nghiệp mới gia nhập trong các ngành cấp 2 là 5.174 doanh nghiệp. Đến năm 2009, số doanh nghiệp mới gia nhập tăng 57,1%. Tuy nhiên, đến năm 2011 tổng số doanh nghiệp mới gia nhập lại giảm 4,2%. Có thể tình hình kinh tế thuận lợi trong năm 2007 đã kích thích các doanh nghiệp tiềm năng gia nhập nhiều hơn vào giai đoạn sau năm 2007, trong đó bao gồm cả năm 2009.
Để kiểm định sự khác biệt của gia nhập ngành qua các năm, nghiên cứu đặt biến giả dum_year và tiến hành kiểm định mối tương quan giữa biến giả và biến phụ thuộc. Nghiên cứu sử dụng kiểm định tương quan Spearman vì biến dum_year khơng có phân phối bình thường. Kiểm định tương quan Spearman được sử dụng giữa biến giả khơng có phân phối bình thường và biến phụ thuộc là biến liên tục.
Kết quả phân tích tương quan từ bảng 4.13 cho thấy gia nhập ngành có tương quan nghịch với mơi trường kinh doanh trong cả hai trường hợp. Với trường hợp loại bỏ hai quan sát dị biệt, giá trị tuyệt đối của hệ số tương quan lớn hơn (-0,3117 so với - 0,2582). Điều này hàm ý rằng hai giá trị quan sát dị biệt cũng có thể ảnh hưởng đến
mối quan hệ giữa gia nhập ngành và biến giả theo năm. Tương tự với những trường hợp ở trên, nghiên cứu chạy mơ hình hồi quy gồm biến phụ thuộc là lnE và hai biến giả dum_year và dum_outlier để kiểm định trường hợp đặc biệt dum_outlier. Kết quả là biến dum_outlier có ý nghĩa thống kê và biến này sẽ được đưa vào mơ hình hồi quy với tổng thể tất cả các biến.
Bảng 4.13. Hệ số tương quan giữa gia nhập ngành và biến giả theo năm
Tất cả quan sát Loại trừ dum_outlier
lnE p-value lnE p-value
dum_year -0,2582 0,0364 -0,3117 0,0122
Nguồn: tác giả tính tốn từ bộ dữ liệu điều tra SME (2007, 2009, 2011)
Tóm lƣợc phần thống kê mơ tả
Nghiên cứu tiến hành phân tích phi tham số và phân tích hồi quy giữa biến phụ thuộc với từng biến độc lập riêng lẻ để tìm ra mối quan hệ tương quan giữa gia nhập ngành và các yếu tố ảnh hưởng đến gia nhập.
Bằng cách chuyển trục tọa độ và phân tích tham số trong phần thống kê mô tả, nghiên cứu nhận thấy các rào cản gia nhập ngành như mức độ tập trung ngành, vốn trang bị trên lao động, quy mơ tài sản, chi phí nghiên cứu và phát triển, biến giả theo năm có tương quan âm có ý nghĩa với gia nhập ngành. Các yếu tố khuyến khích gia nhập là chi phí sở hữu giấy chứng nhận quyền sử dụng đất, xuất khẩu có tương quan dương có ý nghĩa với gia nhập ngành. Biến tăng trưởng lợi nhuận có mối tương quan âm với gia nhập ngành nhưng chưa rõ ràng. Còn lại hai biến tỉ lệ quảng cáo và độ tuổi doanh nghiệp không tương quan với gia nhập ngành.
Kết quả phân tích cịn cho thấy có rất nhiều quan sát dị biệt trong mơ hình, trong đó hai quan sát có giá trị gia nhập ngành nhỏ nhất ảnh hưởng đến các mối quan hệ giữa biến phụ thuộc và hầu hết các biến độc lập khác. Ngoài ra, mỗi biến độc lập cịn có những quan sát dị biệt khác nhau. Những quan sát dị biệt này đều được kiểm định lại sự ảnh hưởng đến mối quan hệ của gia nhập ngành và rào cản gia nhập bằng mơ
hình hồi quy. Nếu biến giả quan sát dị biệt có ý nghĩa thống kê, có thể kết luận đây là quan sát dị biệt và quan sát này sẽ được đối xử như một biến độc lập. Còn nếu ngược lại, quan sát này là quan sát bình thường và được bỏ qua.
Bảng 4.14. Bảng tóm tắt kết quả tương quan giữa gia nhập ngành và các nhân tố ảnh hưởng
Kiểm định hệ số tương quan Pearson Kiểm định Spearman
Trường hợp Tất cả quan sát Loại trừ dum_outlier Loại trừ dum_ad Loại trừ dum_outlier và dum_ic Loại trừ dum_lnrd Tất cả quan sát Loại trừ dum_outlier lnCON -0,5122*** -0,6262*** lnKL -0,2371* ln2KL -0,2434** lnASSET -0,2777** ln2ASSET -0,2846** lnGRW -0,245* ln2GRW 0,1387 lnIC 0,3585*** ln2IC -0,365*** lnAD -0,2873** lnLAND 0,3388*** 0,3501*** LnEX 0,3171*** lnRD -0,3572*** -0,5175*** -0,4955*** lnAGE -0,0989 dum_year -0,2582** -0,3117***
Ghi chú: *, **, *** có ý nghĩa thống kê lần lượt ở mức ý nghĩa 10%, 5% và 1% Nguồn: tác giả tính tốn từ bộ dữ liệu điều tra SME (2007, 2009, 2011)
4.2. Kết quả phân tích hồi quy
Nội dung phần này trình bày kết quả phân tích của mơ hình hồi quy đầy đủ với biến phụ thuộc và các biến độc lập, cũng như các quan sát dị biệt như phân tích ở phần trên. Bảng 4.15 cho thấy các biến lnCON, ln2KL, lnKL, ln2ASSET, lnASSET, ln2IC, lnIC, ln2GRW, lnGRW, và các biến giả dum_ic, dum_year, dum_outlier có ý nghĩa thống kê với mức ý nghĩa 5%. Nghiên cứu loại các biến khơng có ý nghĩa thống kê và tiếp tục hồi quy với mơ hình chỉ bao gồm các biến có ý nghĩa thống kê. Kết quả nhận được là những biến này đều có ý nghĩa thống kê trong mơ hình mới. Sử dụng kiểm định F-test để kiểm định giả thiết tất cả hệ số hồi quy bằng 0 cho kết quả mơ hình có khả năng sử dụng được (p-value=0,0000). Mơ hình này giải thích được 85,42% sự biến thiên của số lượng gia nhập ngành theo các biến độc lập. Tiếp theo, nghiên cứu kiểm định sự phù hợp của mơ hình tác động ngẫu nhiên bằng kiểm định Hausman. Mục tiêu của kiểm định này là khẳng định lại sự lựa chọn mơ hình tác động ngẫu nhiên (random effect) là phù hợp hơn so với mơ hình tác động cố định (fixed effect). Kiểm định Hausman đưa ra giả thuyết Ho là sự khác biệt giữa các hệ số hồi quy giữa hai mơ hình là khơng có hệ thống. Kết quả kiểm định cho thấy chúng ta không bác bỏ giả thuyết Ho (p-value=0,7737). Điều này nghĩa là sự khác biệt giữa hai hệ số hồi quy là có hệ thống và mơ hình tác động ngẫu nhiên là phù hợp. Tiếp theo, để kiểm định việc sử dụng mơ hình tác động ngẫu nhiên này hay sử dụng mơ hình hồi quy theo phương pháp OLS là phù hợp, nghiên cứu sử dụng kiểm định Breusch - Pagan Lagrangian để kiểm tra giả thiết Ho là khơng có sự khác biệt giữa phương sai ở các ngành khác nhau, nghĩa là khơng có tác động của mơ hình theo dữ liệu bảng. Kết quả kiểm định cho thấy chúng ta bác bỏ giả thiết Ho (p-value=0,0307). Như vậy chúng ta không thể sử dụng OLS vì vi phạm giả định phương sai đồng nhất của phương pháp ước lượng này. Do đó, việc sử dụng mơ hình tác động ngẫu nhiên là phù hợp.
Bảng 4.15. Kết quả hồi quy
Số quan sát: 66 Số nhóm: 22 Số năm: 3 Biến phụ thuộc: lnE
Phương pháp ước lượng GLS Mơ hình tác động ngẫu nhiên
Mơ hình hồi quy đầy đủ Mơ hình hồi quy lần hai với các biến có ý nghĩa Hệ số P-value Khoảng tin cậy 95% Hệ số P-value Khoảng tin cậy 95%
lnCON -0,79*** 0,000 -1,07 -0,51 -0,73*** 0,000 -1,02 -0,45 ln2GRW 15.78*** 0,001 6,59 24.97 16,56*** 0,000 9,56 23,56 lnGRW 3,57*** 0,014 0,71 6,43 4,03*** 0,002 1,46 6,59 lnIC -0,60*** 0,000 -0,88 -0,31 -0,66*** 0,000 -0,89 -0,43 ln2IC -0,05*** 0,000 -0,07 -0,03 -0,05*** 0,000 -0,07 -0,04 dum_ic 1,56*** 0,001 0,61 2,52 2,10*** 0,000 1,18 3,02 ln2ASSET -0,28*** 0,007 -0,47 -0,08 -0,35*** 0,000 -0,53 -0,17 lnASSET 8,03*** 0,009 2,00 14,06 10,31*** 0,000 4,87 15.76 dum_year -0,40*** 0,001 -0,64 -0,16 -0,35*** 0,002 -0,57 -0,13 dum_outlier -8,30*** 0,007 -14,30 -2,30 -4,62*** 0,000 -5,55 -3,69 ln2KL 0,32** 0,033 0,03 0,62 0,52*** 0,005 0,16 0,89 lnKL -7,80** 0,039 -15,20 -0,40 -12,57*** 0,007 -21,68 -3,47 lnAD 1,34 0,110 -0,30 2.99 ln2AD 0,09 0,125 -0,02 0,20 dum_lnad -4,48 0,131 -10,28 1,33 lnLAND 0,04 0,341 -0,04 0,11 lnEX 0,00 0,730 -0,02 0,03 lnRD -0,02 0,393 -0,06 0,02 dum_lnrd 3,28 0,295 -2,86 9,42 lnAGE -0,06 0,571 -0,27 0,15 _cons -3,29 0,880 -46,00 39,42 3,34 0,905 -51,24 57.91 R-sq: overall = 0,8981 R-sq: overall = 0,8542
Ghi chú: *, **, *** có ý nghĩa thống kê lần lượt ở mức ý nghĩa 10%, 5% và 1%
Nguồn: tác giả tính tốn từ bộ dữ liệu điều tra SME (2007, 2009, 2011)
Bảng kết quả hồi quy 4.15 cho thấy trong các biến theo dõi, chỉ có mức độ tập trung ngành là có mối quan hệ tuyến tính với gia nhập ngành. Mối quan hệ này là đúng với kì vọng. Cịn những biến khác như quy mơ tài sản, vốn trang bị trên một lao động, chi phí giao dịch khơng chính thức và tỉ lệ lợi nhuận gộp trên doanh thu là có mối quan hệ phi tuyến với gia nhập ngành. Điều này nghĩa là các nhân tố này vừa
có hiệu ứng hạn chế gia nhập, nhưng cũng có thể mang hiệu ứng khuyến khích gia nhập ngành.
Có ba biến giả có ảnh hưởng đến gia nhập ngành. Thứ nhất là biến giả dum_year có tác động ngược chiều hàm ý rằng trong năm 2007, các doanh nghiệp tiềm năng gia nhập nhiều hơn. Còn năm 2009 và năm 2011 thì khơng cịn tác động khuyến khích gia nhập ngành. Và điều này có thể là do mơi trường kinh doanh biến động khi năm 2007 nền kinh tế tăng trưởng nóng và ngược lại, trong năm 2009 và 2011 nền kinh tế suy thoái. Biến giả thứ hai dum_outlier là hai quan sát dị biệt đặc biệt có giá trị gia nhập ngành thấp nhất. Cụ thể hơn, đây là hai quan sát trong ngành Sản xuất phương tiện vận tải khác (mã ngành 30) trong năm 2011 và ngành Công nghiệp chế biến chế tạo khác (mã ngành 32) cũng trong năm 2011. Hệ số hồi quy của biến giả dum_outlier mang dấu âm nghĩa là các quan sát dị biệt có tác động hạn chế sự gia nhập ngành. Biến giả thứ ba là dum_ic đại diện cho ngành Công nghiệp chế biến chế tạo khác (mã ngành 32) vào năm 2009 và ngành sửa chữa bảo dưỡng và lắp đặt máy móc thiết bị (mã ngành 33) vào năm 2007 và năm 2009. Hệ số của biến giả dum_ic có dấu dương hàm ý rằng các quan sát dị biệt này có tác động khuyến khích gia nhập ngành. Phần thảo luận kết quả bên dưới sẽ đi tìm hiểu sâu hơn về mối quan hệ và cơ chế tác động giữa các biến này.
4.3. Thảo luận kết quả
Nghiên cứu này nhằm mục đích kiểm tra lại mơ hình lý thuyết về các đặc điểm của ngành là rào cản hạn chế hay là nhân tố khuyến khích gia nhập ngành. Rào cản gia nhập ngành được xác định là mức độ tập trung ngành. Ngồi ra, các biến cịn lại như quy mô tài sản, vốn trang bị trên một lao động, chi phí giao dịch khơng chính thức và tăng trưởng tỉ lệ lợi nhuận gộp trên doanh thu vừa có tác động khuyến khích vừa có tác động hạn chế gia nhập ngành. Sở dĩ như vậy vì mối quan hệ giữa các biến này với gia nhập ngành là đường cong thay vì đường thẳng. Mơi trường kinh doanh cũng có ảnh hưởng đến gia nhập ngành. Các trường hợp quan sát dị biệt cũng