4.5.1. Nguồn dữ liệu thu thập
Số liệu thứ cấp: Các Nghị quyết của Đảng bộ huyện Lai Vung, Niên giám Thống kê tỉnh Đồng Tháp, Kết quả điều tra Nông nghiệp, nông thôn và thủy sản năm 2011 tỉnh Đồng Tháp và huyện Lai Vung, Báo cáo kinh tế xã hội của UBND huyện lai Vung giai đoạn 2011-2015, Báo cáo kết quả điều tra giảm nghèo của UBND tỉnh Đồng Tháp,…
Số liệu sơ cấp: Tiến hành phỏng vấn trực tiếp 270 hộ gia đình bằng bảng câu hỏi (phụ lục 3), chọn mẫu theo phương pháp chọn mẫu ngẫu nhiên trong 11xã.
4.5.2. Phương pháp chọn mẫu và xác định kích thước mẫu
Nghiên cứu thực hiện bằng hình thức phỏng vấn trực tiếp các Hộ gia đình tại địa bàn huyện Lai Vung với kích thước mẫu là 270. Tổng số hộ của 11 xã trên địa bàn huyện Lai Vung là 37.766 hộ.
Theo Green (1991, trích dẫn theo Nguyễn Đình Thọ, 2011) giới thiệu một cơng thức kinh nghiệm thường dùng để tính kích thước mẫu cho hồi quy tuyến tính đa biến (hồi quy bội) như sau: n = 50 + 8p. Trong đó, n là kích thước mẫu tối thiểu cần thiết và p là số lượng biến độc lập trong mơ hình. Trong nghiên cứu này, sử dụng phương pháp hồi quy tuyến tính đa biến với 09 biến độc lập, do đó kích thước mẫu tối thiểu của nghiên cứu là n = 50 +8*9 =122 mẫu. Số lượng trong nghiên cứu này là 270 mẫu lớn hơn 122 mẫu vì vậy đáp ứng được u cầu về kích thước mẫu.
4.5.3. Mẫu nghiên cứu
Bảng câu hỏi sau khi thiết kế hoàn chỉnh được phát ra 270 mẫu cho các cộng tác viên cùng tác giả đi khảo sát theo phương pháp chọn mẫu hệ thống. Cụ thể, trong mỗi xã có nhiều ấp tác giả sẽ chọn ngẫu nhiêu mỗi xã từ 2 đến 3 ấp để tiến hành khảo sát, tùy theo tỷ lệ dân số và số lượng ấp của mỗi xã nhiều hay ít mẫu khảo sát. Số lượng mẫu khảo sát mỗi ấp sẽ dao động từ 8-15 mẫu. Tổng số ấp được khảo sát lấy mẫu là 22/60 ấp của 11 xã. Do phỏng vấn trực tiếp các hộ gia đình nên tổng số thu về đầy đủ với 270 mẫu như ban đầu, khơng xảy ra tình trạng thất thốt trong q trình khảo sát. Tuy nhiên, đến khi sàng lọc sơ bộ trước khi đưa vào nhập liệu thì cịn có 263 mẫu là có thể sử dụng được (7 mẫu chưa trả lời đầy đủ thông tin hoặc do người phỏng vấn ghi sót thơng tin). Trong q trình nhập liệu tiếp tục loại bỏ 6 mẫu khơng phù hợp vì thơng tin cung cấp có phần mâu thuẫn. Như vậy, mẫu nghiên cứu cuối cùng đạt yêu cầu là 257 mẫu, đạt tỷ lệ 95,2% so với mẫu ban đầu. Trong 257 mẫu phù hợp, được khảo sát tại 11 xã trên địa bàn huyện Lai Vung (Bảng 4.2)
Bảng 4.2. Bảng thể hiện số liệu mẫu khảo sát tại 11 xã của huyện Lai Vung
Tên xã Số lượng mẫu Tỷ lệ % Lũy kế %
Hòa Long 23 8,9 8,9 Hòa Thành 27 10,5 19,4 Tân Phước 34 13,2 32,6 Phong Hòa 24 9,3 41,9 Long Thắng 20 7,8 49,7 Tân Thành 14 5,4 55,1 Vĩnh Thới 20 7,8 62,9 Định Hòa 18 7,0 69,9 Tân Dương 21 8,2 78,1 Long Hậu 37 14,4 92,5 Tân Hòa 19 7,5 100 Tổng cộng 257 100.0 100.0
(Nguồn: Số liệu điều tra thực tế tại 11 xã trên địa bàn huyện Lai Vung) Bảng 4.3: Bảng số liệu thể hiện mẫu khảo sát phân bổ theo ấp
(có 22/60 ấp) được khảo sát
Tên ấp Số mẫu Tỷ lệ % Lũy kế %
Long Thành 13 5.1 5.1 Long Hòa 13 5.1 10.1 Long Khánh 11 4.3 14.4 Tân Thuận 11 4.3 18.7 Tân Phú 12 4.7 23.3 Tân Khánh 15 5.8 29.2 Thới Mỹ 1 10 3.9 33.1 Thới Mỹ 2 10 3.9 37.0 Hịa Bình 14 5.4 42.4 Hòa Tân 9 3.5 45.9 Định Tân 12 4.7 50.6 Định Phong 14 5.4 56.0 Tân An 13 5.1 61.1 Tân Phong 11 4.3 65.4 Hịa Ninh 11 4.3 69.6
Hoa Bình 8 3.1 72.8 Long Bửu 11 4.3 77.0 Long Bình 12 4.7 81.7 Tân Thuận A 8 3.1 84.8 Tân Thuận B 13 5.1 89.9 Tân Thành 13 5.1 94.9 Tân Bình 13 5.1 100.0 Total 257 100
(Nguồn: Số liệu điều tra thực tế tại 11 xã trên địa bàn huyện Lai Vung)
4.5.4. Quy trình xử lý số liệu:
Bước 1: Sàng lọc thủ công, loại bỏ những bảng câu hỏi không hợp lệ như thiếu thơng tin, thơng tin khơng chính xác.
Bước 2: Mã hóa và nhập liệu trên phần mềm SPSS 18, trong quá trình nhập tiếp tục loại bỏ những bảng câu hỏi phỏng vấn không phù hợp.
Bước 3: Xử lí sơ bộ kiểm tra mức độ chính xác của q trình nhập dữ liệu. Bước 4: Xử lí dữ liệu bằng phần mềm SPSS 18.
4.5.5. Phân tích dữ liệu
4.5.5.1.Phân tích thống kê mơ tả dữ liệu nghiên cứu
Đề tài sử dụng các kỹ thuật thống kê mơ tả như: tần suất, trung bình cộng, giá trị lớn nhất, giá trị nhỏ nhất, các thông tin này cung cấp dữ liệu một cách tổng quan về các biến nghiên cứu trong đề tài.
4.5.5.2.Các kiểm định trong mơ hình nghiên cứu
Để mơ hình hồi quy đảm bảo khả năng tin cậy và hiệu quả, ta cần thực hiện các kiểm định sau:
(1) Kiểm định hệ số hồi quy:
Mục tiêu kiểm định này nhằm xem xét các biến độc lập tương quan có ý nghĩa với biến phụ thuộc hay khơng (xét riêng từng biến độc lập). Khi mức ý nghĩa (Sig) của hệ số hồi quy từng phần có độ tin cậy ít nhất 90% (Sig<0,1), kết luận tương quan có ý nghĩa thống kê giữa các biến độc lập và phụ thuộc.
Kiểm định này nhằm xem xét mối quan hệ tuyến tính giữa các biến độc lập với biến phụ thuộc. Mơ hình được xem là khơng phù hợp khi tất cả các hệ số hội quy bằng khơng và mơ hình được xem là phù hợp khi có ít nhất một hệ số hội quy khác không.
Đặt giả thuyết:
H0: các hệ số hồi quy đều bằng khơng.
H1: Có ít nhất một hệ số hồi quy khác khơng.
Phân tích phương sai (Analysis of variance, ANOVA) được sử dụng để kiểm định. Nếu mức ý nghĩa đảm bảo có độ tin cậy ít nhất 99% (Sig <0,1), ta chấp nhận giả thiết H1 và mô hình được xem là phù hợp.
(3) Kiểm định hiện tượng đa cộng tuyến:
Hiện tượng đa cộng tuyến (Multicollinearity) là hiện tượng các biến độc lập có quan hệ gần như tuyến tính. Việc bỏ qua hiện tượng đa cộng tuyến sẽ làm các sai số chuẩn thường cao hơn, giá trị thống kê thấp hơn và có thể khơng có ý nghĩa. Và để kiểm tra hiện tượng này, chúng ta sử dụng ma trận tương quan giữa các biến độc lập. Nếu hệ số tương quan của các biến độc lập với nhau nhỏ hơn 0,5 có thể chấp nhận khơng có hiện tượng đa cộng tuyến. Ngồi ra, có thể sử dụng thước đo phóng đại phương sai (Variance Inflation Factor, VIF) để kiểm tra hiện tượng tương quan giữa các biến độc lập. Điều kiện VIF <10 để khơng có hiện tượng đa cộng tuyến.
(4) Kiểm định tự tương quan của phần dư:
Khi có hiện tượng tự tương quan (autocorrelation) thì các phần dư số chuẩn ước lượng sẽ khác các phần dư thực và do đó ước lượng sẽ khơng chính xác. Điều này làm cho các giá trị thống kê t và F được ước lượng khơng đúng. Vì vậy kiểm định t và F khơng cịn tin cậy nửa. Các ước lượng OLS vẫn là các ước lượng tuyến tính khơng chệch, nhưng ước lượng lúc này đã khơng cịn hiệu quả.
Trong thống kê học, trị số thống kê Durbin-Watson (Durbin và Watson, 1951, trích bởi Đinh Phi Hổ) là một kiểm định được sử dụng để kiểm tra xem có hiện tượng tự tương quan hay khơng trong phần dư (residuals) của một phân tích hồi quy.
Trị số thống kê Durbin-Watson (d) được xác định như sau:
n 2 et et 1 t 2 n 2 t t 1 d e
Tự tương
quan dương Không kếtluận Khơng có tựtương quan Khơng kếtluận Tự tươngquan âm
Căn cứ vào số quan sát, số tham số (k-1) của mơ hình hồi quy, mức ý nghĩa 95% (0,05) trong Bảng số thống kê thống kê Durbin-Watson để xác định dU trị số thống kê trên) và dL (trị số thống kê dưới).
0 dL dU 4-dU 4-dL
Khi d lớn hơn dU nhỏ hơn ( 4-dL), kết luận: khơng có hiện tượng tự tương quan trong phần dư của mơ hình hồi quy tuyến tính.
(5) Kiểm định phương sai phần dư khơng đổi:
Phương sai phần của phần dư thay đổi (heteroskedasticity) là hiện tượng các giá trị phần dư có phân phối khơng giống nhau và giá trị phương sai không như nhau. Bỏ qua hiện tượng phương sai của phần dư thay đổi làm cho các ước lượng OLS của các hệ số hồi quy không hiệu qua. Để kiểm tra hiện tượng này ta sử dụng kiểm định White (White, 1980, trích bởi Đinh Phi Hổ), do số quan sát trong nghiên cứu lớn hơn 100.
Kiểm định White:
Kết quả của mơ hình hồi quy:
I=b0 + b1X1 + b2X2 + b3X3 + b4X4 + b5X5 + b6X6 + b7X7 + b8X8 + b9X9 + u. Xây dựng mơ hình hồi quy phụ:
u2 = a0 + a1X1 + a2X2 + a3X3 + a4X4 + a5X5 + a6X6 + a7X7 + a8X8 + a9X9 + a10(X1)2 + a11 (X2)2 + a12 (X3)2 + a13 (X4)2 + a14 (X5)2 + a15 (X6)2 + a16 (X7)2 + a17 (X8)2
+ a18 (X9)2 + a19 (X1*X2*X3*X4*X5*X6*X7*X8*X9) + v
Xác định hệ số White: nR2: trong đó n là số quan sát của nghiên cứu, R2 : kết quả có được từ mơ hình hồi quy phụ
Căn cứ vào tham số (k-1) của mơ hình hồi quy phụ, mức ý nghĩa 0,05% trong bảng phân phối Chi bình phương để xác định giá trị Chi bình phương.
Khi nR2 < giá trị Chi bình phương tra bảng, kết luận phương sai của phần dư khơng đổi.