Trước khi loại hai quan sát dị biệt Sau khi loại hai quan sát dị biệt
Nguồn: Tác giả tự vẽ từ bộ dữ liệu tổng hợp
Bảng 4.3. Hệ số tương quan giữa gia nhập ngành và mức độ tập trung ngành
Tất cả quan sát Loại trừ dum_outlier
lnE p-value lnE p-value
lnCON -0,5122 0,0000 -0,6262 0,0000
Nguồn: Tác giả tính tốn từ bộ dữ liệu điều tra SMEs (2007, 2009, 2011).
Hình 4.1 cho thấy gia nhập ngành và mức độ tập trung ngành có mối quan hệ tuyến tính nghịch biến rõ ràng. Thống kê trong bảng 4.3 cho thấy mối tương quan giữa hai
0 2 4 6 8 -2 -1.5 -1 -.5 0 lncon lne3 Fitted values
4 5 6 7 8 -2 -1.5 -1 -.5 0 lncon lne3 Fitted values
biến này ở mức khá (hệ số tương quan là -0,54) và có ý nghĩa thống kê (p- value=0,0004). Như vậy có thể tạm thời kết luận các doanh nghiệp gia nhập tiềm năng có xu hướng tham gia vào những ngành có mức độ tập trung ngành thấp. Tuy nhiên, có hai giá trị dị biệt có thể có ảnh hưởng đến mối quan hệ giữa gia nhập ngành và mức độ tập trung ngành. Các quan sát dị biệt này có giá trị lnE=0 và lnE=2,34, tức hai giá trị nhỏ nhất trong biến gia nhập ngành. Tiến hành kiểm định hệ số tương quan Pearson đối với hai biến lnE và lnCON, kết quả là mối tương quan sau khi bỏ hai quan sát dị biệt mạnh hơn so với lúc có đầy đủ quan sát.
Để kiểm định lại sự tương tác của hai quan sát dị biệt này đến mối quan hệ giữa lnE và lnCON, nghiên cứu đặt biến giả dum_outlier với giá trị bằng 1 tại hai quan sát này và bằng 0 với những giá trị cịn lại. Sau đó tiến hành hồi quy theo mơ hình bao
gồm biến phụ thuộc là lnE và biến độc lập là lnCON cùng biến giả dum_outlier8.
Mục đích của việc hồi quy này là kiểm định lại biến giả dum_outlier có ý nghĩa thống kê hay khơng. Nếu dum_outlier có ý nghĩa thống kê, nghĩa là các quan sát dị biệt này có tác động riêng đến sự gia nhập ngành, và do đó chúng sẽ được đối xử như các biến độc lập khác. Trong trường hợp dum_outlier khơng có ý nghĩa thống kê, xem như các quan sát dị biệt này không tách rời với các quan sát còn lại trong biến độc lập đó. Vì vậy chúng ta có thể giữ ngun biến độc lập như bình thường. Kết quả hồi quy cho thấy dum_outlier có ý nghĩa thống kê (p-value=0,000). Như vậy biến giả dum_outlier này sẽ được đưa vào mơ hình hồi quy tổng thể với tất cả các biến. Có thể tạm thời kết luận rằng biến lnCON có tương quan âm với lnE.
Gia nhập ngành và vốn trang bị trên một lao động
Các ngành có giá trị vốn trang bị trên lao động cao nhất là Sửa chữa bảo dưỡng và lắp đặt máy móc thiết bị (mã ngành 33), ngành Sản xuất phương tiện vận tải khác (mã ngành 30) và Sản xuất thuốc, hóa dược và dược liệu (mã ngành 21). Những
8 Hồi quy theo mơ hình mặc định là mơ hình các yếu tố tác động ngẫu nhiên (random effect) dựa trên dữ liệu bảng. Mục đích chỉ là để kiểm định các biến giả có tác động đến mối quan hệ giữa các biến chính hay khơng. Phương pháp này được sử dụng tương tự với những biến được phân tích ở phần sau.
ngành này cũng là những ngành có ít doanh nghiệp đang hoạt động. Ngược lại, nhóm ngành gồm ngành Sản xuất sản phẩm từ khoáng phi kim loại khác (mã ngành 23), Chế biến thực phẩm (mã ngành 10) lại là những ngành có mức vốn trang bị trên lao động thấp nhất. Từ năm 2007 đến 2011, có nhiều ngành gia tăng mức vốn trang bị trên một lao động. Trong đó ngành In sao chép bản ghi các loại (mã ngành 18) là ngành có mức tăng mạnh nhất (242%), tiếp theo là ngành Sản xuất phương tiện vận tải khác (mã ngành 30, 227%), ngành Sản xuất sản phẩm từ khoáng phi kim loại khác (mã ngành 23, 193%), ngành Chế biến gỗ và sản phẩm từ gỗ tre nứa (mã ngành 16, 184%). Ngành Sản xuất đồ uống (mã ngành 11) là có mức tăng trưởng thấp nhất (2,19% trong giai đoạn 2006 – 2011. Riêng ngành Sản xuất sản phẩm điện tử, máy vi tính và sản phẩm quang học (mã ngành 26) lại có mức vốn trang bị trên một lao động giảm (22%). Nhìn chung, tổng mức vốn trang bị trên một lao động trong tất cả các ngành tăng lên gấp đôi trong giai đoạn 2006 – 2011. Điều này hàm ý rằng các doanh nghiệp đang đầu tư vốn ngày càng nhiều hơn. Và có thể đó là một rào cản đối với gia nhập ngành.
Kết quả kiểm định mối tương quan trong bảng 4.4 giữa lnE và lnKL cho thấy mối tương quan khơng có ý nghĩa thống kê. Cịn hình 4.2 cho thấy có hai quan sát dị biệt có thể có ảnh hưởng đến mối quan hệ giữa hai biến. Hai quan sát này cũng chính là biến dum_outlier. Tiếp tục kiểm định mối tương quan giữa hai biến trong trường hợp loại trừ hai quan sát dị biệt này cũng cho thấy kết quả tương tự. Ngoài ra, đồ thị phân tán gợi ý cho nghiên cứu về mối quan hệ giữa hai biến có thể là đường cong thay vì đường thẳng. Như vậy, nghiên cứu tạo thêm biến ln2KL bằng cách lấy bình phương biến lnKL và kiểm định mối quan hệ giữa biến này và biến lnE. Kết quả là lnE có tương quan âm có ý nghĩa thống kê với ln2KL (p-value=0,0489). Nghiên cứu tiếp tục kiểm định tương quan giữa biến ln2KL và biến lnE trong trường hợp loại trừ hai quan sát dị biệt, nhưng kết quả là mối tương quan khơng có ý nghĩa thống kê.