biệt
Biến phụ thuộc trong mô hình nghiên cứu là số di cƣ nam và nữ bình quân trong 3 năm (2005-2007) ở từng địa phƣơng, tên biến là MigrantMMean và
MigrantFMean.
Dữ liệu thƣờng đƣợc chú ý nhất trong các đề tài di cƣ là các biến số liên quan đến thu nhập. Trong bảng 9 mô tả các hệ số tƣơng quan của các biến phụ thuộc của mẫu dữ liệu ban đầu (có 64 tỉnh thành), biến đại diện cho thu nhập bình quân của ngƣời dân tại một địa phƣơng (GDPPerMean) không có sự tƣơng quan chặt với số di cƣ nam và chỉ thể hiện tƣơng quan rất thấp với số di cƣ nữ. Căn cứ vào điều này, có thể dẫn tới giả thuyết : ảnh hƣởng của thu nhập có tác động không rõ ràng hoặc không đáng kể trong mô hình này, trong khi mối ảnh hƣởng này đã đƣợc khẳng định trong các mô hình của Harris Todaro, Harvey B. King và các nghiên cứu khác.
Tuy nhiên, có một điều cần chú ý là biến số GDP bình quân đầu ngƣời có thể không phản ảnh đầy đủ thu nhập bình quân của ngƣời dân. Một số tỉnh thành có nguồn thu lớn bất thƣờng do có ƣu thế hơn hẳn về tài nguyên thiên nhiên hoặc có những dự án, nhà máy tạo ra giá trị sản xuất lớn thƣờng đƣợc tính vào GDP cả nƣớc.. Vì vậy, khi đƣa vào tính toán, GDP bình quân có thể tạo ra những dị biệt không phản ánh đúng thực chất thu nhập bình quân của địa
phƣơng đó. Để kiểm tra giả thuyết này, trƣớc hết cần bắt đầu từ nguồn số liệu dùng để tính toán biến số này.
Biểu đồ phân tán (Hình 7) mô tả mối quan hệ giữa số di cƣ nam và GDP bình quân đầu ngƣời. Trong biểu đồ này, ta thấy rõ có một biến dị biệt là Bà Rịa – Vũng Tàu có GDP bình quân đầu ngƣời rất cao. Nguyên nhân là nguồn thu nhập từ khai thác dầu khí đƣợc tính vào GDP của Bà Rịa Vũng Tàu, trong khi địa phƣơng này có dân số thấp.
Hình 7 – Đồ thị phân tán số di cƣ nam (có Bà Rịa – Vũng Tàu)
Bà Rịa - Vũng Tàu -20,000 -10,000 0 10,000 20,000 30,000 40,000 50,000 60,000 70,000 0 50,000 100,000 150,000 GDPPerMean M igr ant M M ean
(Nguồn : Tính toán từ nguồn số liệu khảo sát)
Bảng 7 – So sánh GDP giữa Bà Rịa – Vũng Tàu và TP. Hồ Chí Minh
Bình quân Bà Rịa - Vũng Tàu TP. Hồ Chí Minh
Dân số (ngƣời) 920,489 6,034,353
GDP (tỷ VND) 123,841 133,016
GDP bình quân (1000
VND/ngƣời) 134,537 22,043
Bảng 7 cho thấy Dân số bình quân của TP. Hồ Chí Minh gấp 6.5 lần Bà Rịa Vũng Tàu, nhƣng GDP của TPHCM – địa phƣơng cao nhất cả nƣớc – chỉ cao hơn GDP của Bà Rịa Vũng Tàu khoảng 10 nghìn tỷ. Vì vậy, nếu xét theo tỉ lệ GDP bình quân đầu ngƣời, Bà Rịa Vũng Tàu cao hơn TP Hồ Chí Minh gấp 6 lần. Nếu dựa vào tỉ lệ này cho rằng, thu nhập ngƣời dân ở Bà Rịa Vũng Tàu cao hơn TP HCM là hoàn toàn không chính xác.
Về mặt số liệu, một số phần tử có đặc tính đặc biệt là điều bình thƣờng trong mẫu. Những phần tử nhƣ vậy có thể xuất hiện một cách ngẫu nhiên trong bất cứ một mẫu dữ liệu nào. Tuy nhiên, sự khác biệt quá lớn của biến GDP bình quân của tỉnh Bà Rịa – Vũng Tàu có thể tạo nên sự phân cực lớn và làm ảnh hƣởng đến đặc tính chung của mẫu dữ liệu. Hình 7 cho thấy, GDP bình quân của Bà Rịa – Vũng Tàu cao nhất và cách rất xa GDP bình quân cao thứ hai của mẫu (TPHCM).
Các phân tích thống kê mô mô tả tổng quát sự phân bố của mẫu dữ liệu GDP bình quân của 64 tỉnh thành và mẫu dữ liệu GDP bình quân của 63 tỉnh thành (không tính Bà Rịa – Vũng Tàu) tại Bảng 8 cho thấy khi có Bà Rịa – Vũng Tàu, các hệ số Kurtosis và Skewness bị thay đổi rõ rệt, đặc biệt là Kurtosis19
.
Bảng 8 – So sánh mô tả thống kê di cƣ khi có và không tính Bà Rịa – Vũng Tàu GDPPerMean Có BR-VT Không có BR-VT Mean 10,219.42 8,255.68 Standard Error 2,048.09 591.02 Standard Deviation 16,384.69 4,691.05 19
Hệ số Kurtosis đại diện cho sự phân bố tập trung của các biến quanh giá trị trung bình của mẫu. Kurtosis càng lớn thì sự tập trung quanh giá trị trung bình càng nhiều. Hệ số Skewness cho biết độ lệch xung quanh dữ liệu trung bình, Skewness càng âm thì phân bố càng lệch phải, Skewness càng dƣơng thì phân bố càng lệch trái.
Kurtosis 53.66 8.86 Skewness 7.08 2.68 Range 130578 26224 Minimum 3357 3357 Maximum 133935 29581 Count 64 63
(Nguồn : Tính toán từ nguồn số liệu khảo sát)
Đây là sự dị biệt trong số liệu cần chú ý khi so sánh thu nhập giữa các địa phƣơng với nhau thông qua biến số GDP bình quân. Quảng Ngãi, nơi nhà máy lọc dầu Dung Quất chuẩn bị đi vào hoạt động cũng sẽ có hiện tƣợng tƣơng tự trong tƣơng lai, vì giá trị sản xuất công nghiệp của nhà máy này không hoàn toàn thuộc về toàn bộ ngƣời dân ở Quảng Ngãi mà phần lớn sẽ đƣợc tính vào GDP quốc gia. Những dị biệt có ảnh hƣởng quá lớn này có thể làm méo dạng kết quả phân tích trong mô hình hồi quy. Do đó, để khắc phục hiện tƣợng này, biến số Bà Rịa – Vũng Tàu sẽ đƣợc loại khỏi mẫu quan sát. Việc phân tích hồi quy trong phần kế tiếp sẽ chỉ thực hiện với mẫu còn lại 63 tỉnh thành.
Bảng 10 mô tả hệ số tƣơng quan của các biến số sau khi đã điều chỉnh mẫu quan sát (bỏ đi Bà Rịa – Vũng Tàu). Các hệ số không thay đổi nhiều so với trƣớc khi điều chỉnh (Bảng 9), ngoại trừ thay đổi rõ rệt trong sự tƣơng quan giữa GDP bình quân và các biến phụ thuộc. Trong mẫu sau khi điều chỉnh, sự tƣơng quan này thể hiện mạnh nhất so với các hệ số còn lại. Cả hai hệ số tƣơng quan của biến này với số di cƣ nam và nữ đều ở mức cao và đạt mức ý nghĩa <1%. Điều này phản ánh thu nhập có liên quan chặt chẽ với số lƣợng ngƣời di cƣ ở từng địa phƣơng.
Cả hai biến MigrantMMean và MigrantFMean đều tƣơng quan nghịch biến với diện tích đất nông nghiệp bình quân FoodSPerMean, sự tƣơng quan có ý nghĩa ở mức 0.05. Điều này cho thấy diện tích đất nông nghiệp ở các địa
phƣơng giảm có khả năng gia tăng số di cƣ đến. Điều này có thể hiểu : diện tích đất nông nghiệp giảm sẽ làm tăng số ngƣời di cƣ đến và giảm số ngƣời di cƣ đi. Sự tƣơng quan tƣơng tự cũng xảy ra giữa hai biến phụ thuộc của mô hình nghiên cứu với Giá trị sản xuất nông nghiệp bình quân AgriVPerMean. Căn cứ vào sự tƣơng quan này, có thể đặt ra giả thuyết là đối với các địa phƣơng có tình hình sản xuất nông nghiệp giảm (tƣ liệu sản xuất giảm, năng suất giảm) thì số ngƣời di cƣ đến sẽ tăng và số ngƣời di cƣ đi sẽ giảm. Giả thuyết này sẽ tiếp tục đƣợc kiểm tra trong mô hình phân tích hồi quy.
Ngƣợc lại với các biến số liên quan đến sản xuất nông nghiệp, các biến Giá trị sản xuất công nghiệp trong và ngoài nhà nƣớc bình quân,
IndustrialSPerMean và IndustrialOoSPerMean lại tƣơng quan cùng chiều với hai biến phụ thuộc của mô hình nghiên cứu. Các hệ số tƣơng quan này đều ở mức ý nghĩa rất cao (<0.01). Điều này cho thấy, số di cƣ đến tại một địa phƣơng sẽ tỉ lệ thuận với tình hình sản xuất công nghiệp tại địa phƣơng đó. Một biến số khác liên quan đến khả năng tạo ra việc làm là Giá trị bán lẻ hàng hóa dịch vụ bình quân GoodSerVPerMean cũng có tƣơng quan đồng biến (với hệ số tƣơng quan khá cao so với các hệ số tƣơng quan khác và có ý nghĩa ở mức <1%) với hai biến phụ thuộc. Sự tƣơng quan mạnh này đặt ra giả thuyết : ở các địa phƣơng có tình hình bán lẻ hàng hóa, cung cấp dịch vụ phát triển thì số di cƣ đến sẽ tăng.
Đối với các biến số liên quan đến chất lƣợng cuộc sống, chỉ có biến Số giảng viên, sinh viên đại học, trung cấp học nghề EducatedNPerMean là có tƣơng quan dƣơng có ý nghĩa (<1%) với Số di cƣ đến. Các biến số về y tế cũng có tƣơng quan dƣơng nhƣng kiểm định thống kê không cho thấy ý nghĩa bác bỏ ở mức thấp.