1 TFP là viết tắt của total factor productivity.
3.2 PHƯƠNG PHÁP NGHIÊN CỨU 1 Phương pháp thu thập số liệu
3.2.1 Phương pháp thu thập số liệu
Để đạt được mục tiêu đề ra, luận án sử dụng cả số liệu sơ cấp và số liệu thứ cấp. Đối với số liệu thứ cấp, luận án sử dụng số liệu từ các cơ quan hữu quan như Tổng cục Thống kê, Ủy ban nhân dân, cục thống kê, ngân hàng Nhà nước các tỉnh Đồng bằng Sông Cửu Long và các nghiên cứu có liên quan trong và ngoài nước.
Số liệu sơ cấp sử dụng trong luận án được thu thập thông qua phỏng vấn trực tiếp chủ hộ của 1.017 nông hộ trồng lúa vào năm 2015 và 1.065 vào năm 2018 được chọn ngẫu nhiên ở các tỉnh (thành phố) thuộc ĐBSCL, sử dụng bảng câu hỏi soạn sẵn và được hiệu chỉnh sau các lần khảo sát thử. Mẫu khảo sát được phân phối ở các địa phương thuộc ĐBSCL như trong Bảng 3.1. Cỡ mẫu lớn và đại diện gần như tốt nhất có thể cho các nông hộ được trồng lúa ở ĐBSCL ở hai thời điểm cách nhau đủ dài (năm 2015 và năm 2018) có thể minh chứng cho độ tin cậy của số liệu. Ưu điểm này cho phép tác giả thực hiện phương pháp ước lượng phù hợp nhất để rút ra kết luận và đề xuất các giải pháp chính sách cho các vấn đề có liên quan được phân tích trong luận án.
Ở mỗi tỉnh (thành phố) thuộc ĐBSCL, tác giả chọn xã có diện tích lúa lớn nhất thuộc huyện có diện tích sản xuất lúa lớn nhất. Ở mỗi xã, tác giả căn cứ vào tỷ lệ diện tích sản xuất lúa của tỉnh trên tổng diện tích sản xuất lúa ở ĐBSCL để phân bổ số quan sát và chọn ngẫu nhiên với kỳ vọng tối đa là 200 nông hộ sản xuất lúa để tiến hành phỏng vấn. Bảng câu hỏi – như vừa đề cập – được sử dụng để thu thập thông tin trực tiếp từ các chủ hộ. Tuy nhiên, do các khó khăn trong kinh phí, thời gian, việc tìm gặp chủ hộ, bị từ chối trả lời và thông tin được cung cấp thiếu đầy đủ, tác giả chỉ xây dựng được cơ sở dữ liệu như trình bày trong Bảng 3.1.
HẠN CHẾ TÍN DỤNG CHO ĐẦU VÀO SẢN XUẤT LƯỢNG VỐN PHÂN BỔ LÚA (Giống, phân bón, thuốc BVTV,
và lao động thuê)
NĂNG SUẤT LÚA Các yếu tố (diện tích đất, thu nhập,
thời gian sống ở địa phương, tuổi chủ hộ, học vấn, giới tính chủ hộ, khoảng cách đến TCTD, địa vị xã hội, và kinh nghiệm sản xuất.
41
Bảng 3.1 Cơ cấu mẫu khảo sát theo địa phương
Địa phương 2015 2018 Số nông hộ Tỷ trọng (%) Số nông hộ Tỷ trọng (%) An Giang 99 09,73 200 18,78 Bạc Liêu 76 07,47 117 10,99 Cà Mau 85 08,36 100 09,39 Cần Thơ 110 10,82 126 11,83 Hậu Giang 100 09,83 118 11,08 Kiên Giang 91 08,95 145 13,62 Sóc Trăng 188 18,49 92 08,64 Trà Vinh 100 09,83 70 06,57 Vĩnh Long 168 16,52 97 09,11 Tổng cộng 1.017 100,00 1.065 100,00
Ở nông thôn ĐBSCL, chủ hộ là chủ gia đình, chủ sở hữu tài sản và có thẩm quyền cao nhất trong các quyết định về sản xuất, tiêu dùng và sử dụng nguồn lực của nông hộ. Ngoài ra, chủ hộ còn là người chịu trách nhiệm chính trong việc đảm bảo cuộc sống gia đình nên rất sâu sát mọi khía cạnh và diễn biến trong gia đình cũng như môi trường kinh tế – xã hội xung quanh. Do đó, các thông tin và số liệu được chính chủ hộ cung cấp sẽ phản ánh xác thực các vấn đề có liên quan mà luận án quan tâm tìm hiểu và được thể hiện trong bảng câu hỏi, đặc biệt là quy mô đất canh tác, thu nhập, thực trạng tiếp cận tín dụng, thực trạng sử dụng vốn, quyết định mua yếu tố đầu vào, quyết định bán lúa, rủi ro trong sản xuất và năng suất lúa. Ngoài ra, các thông tin về nhân khẩu học (tuổi, giới tính của chủ hộ và học vấn) và về đặc điểm của hộ (số nhân khẩu, số lao động, khoảng cách đến TCTD gần nhất, khoảng cách đến chợ và kinh nghiệm sản xuất lúa) cũng được thu thập để sử dụng vào các phân tích trong luận án.
Để số liệu sử dụng phân tích phản ánh chính xác bản chất vấn đề mà luận án quan tâm, với số liệu thu thập được vào năm 2015 và 2018, tác giả đã lưu ý một số vấn đề:
Thứ nhất, khi tính toán lượng vốn phân bổ cho các yếu tố đầu vào, tác giả loại trừ tín dụng phi chính thức bởi theo khảo sát, cũng như theo kết quả của các nghiên cứu trước đây (tiêu biểu là Khandker và Faruquee, 2003; Ali và cộng sự, 2014), tín dụng phi chính thức chủ yếu được nông hộ sử dụng cho tiêu dùng. Bảng câu hỏi được thiết kế cho phép sàng lọc mục tiêu sử dụng vốn vay của nông hộ nên việc loại trừ tín dụng phi chính thức khỏi lượng tiền vay của nông hộ có thể thực hiện một cách thuận lợi.
Thứ hai, lượng vốn vay từ các tổ chức tín dụng có thể được nông hộ sử dụng cho cả sản xuất lẫn tiêu dùng. Do đó, nếu không tách bạch hai mục tiêu sử dụng này kết quả ước lượng sẽ bị chệch nên tác giả chỉ sử dụng số liệu của các nông hộ sử dụng vốn vay cho sản xuất (một lần nữa, Bảng câu hỏi (câu số 15) được thiết kế để tách bạch hai mục tiêu sử dụng vốn này của nông hộ). Tuy nhiên, do việc nông hộ có thực sự sử dụng vốn vay cho sản xuất (như ghi trong hợp đồng tín dụng) hay không rất khó hay không ai có
42
thể kiểm chứng nên tác giả giả định là nông hộ trung thực trong cung cấp số liệu để có thể tiến hành nghiên cứu.
Thứ ba, khi tính toán lượng vốn phân bổ cho yếu tố đầu vào, tác giả cũng loại trừ tín dụng thương mại (mua chịu vật tư) để kết quả nghiên cứu không chịu ảnh hưởng (nên có thể bị chệch) của yếu tố này. Hơn nữa, luận án không nghiên cứu ảnh hưởng của lượng tín dụng mà nghiên cứu ảnh hưởng của mức độ hạn chế tín dụng và của sự thay đổi trong mức độ hạn chế tín dụng đến lượng vốn phân bổ cho yếu tố đầu vào và năng suất lúa của nông hộ. Do đó, kết quả nghiên cứu không lệ thuộc vào việc nông hộ sử dụng nhiều nguồn tín dụng để tài trợ cho hoạt động sản xuất lúa, bởi các nguồn tài trợ này đều đầu tư vào việc mua yếu tố đầu vào cần thiết. Ngoài ra, mua chịu vật tư được thực hiện bằng tín nhiệm giữa nông hộ và đại lý nên không xảy ra hiện tượng hạn chế tín dụng do các đại lý có thông tin khá đầy đủ về nông hộ và có biện pháp kiểm soát và cưỡng chế phù hợp. Vì vậy, hạn chế tín dụng chỉ xuất phát từ tín dụng chính thức do sự hiện diện của thông tin bất đối xứng và chi phí giao dịch.
3.2.2 Sai số đo lường
Với mục tiêu cung cấp kết quả nghiên cứu ở mức độ tin cậy cao nhất có thể, tác giả rất quan tâm đến độ chính xác của số liệu sơ cấp được thu thập. Nếu số liệu thu thập thiếu chính xác bởi sự hiện diện của sai số đo lường do nông hộ cung cấp số liệu khác với thực tế, kết quả ước lượng sẽ bị chệch và các kết luận đúc kết từ đó sẽ thiếu chính xác nên không hữu ích cho việc hoạch định chính sách. Thật vậy, giả sử đại lượng thực (chính xác) Xi* được đo lường với sai số như sau:
i i i X
X * hay Xi Xi*i
với Xi là trị số thu thập được qua khảo sát và i là sai số đo lường.
Khi đó, mối quan hệ đúng để ước lượng ảnh hưởng của biến độc lập Xi* đến biến phụ thuộc Yi là:
i i
i X e
Y 01 *
Song, do có sai số đo lường nên với số liệu thu thập được, thực tế chỉ có thể ước lượng mối quan hệ:
i i i i i i X u X u Y 01 01( * ) hay Yi 01Xi*(ui1i).
Như vậy, ei ui 1i. Trong trường hợp này, các ước lượng bằng phương pháp bình phương bé nhất (OLS) đối với các sẽ bị chệch do Xi* có mối quan hệ với ei thông qua sai số ngẫu nhiên i. Do đó, như đã đề cập ở trên, số liệu thu thập cần đảm bảo độ chính xác đến chừng mực cao nhất có thể (bởi chính xác tuyệt đối là điều không thể trong các cuộc khảo sát để thu thập số liệu sơ cấp).
Số liệu quan trọng mà luận án sử dụng là chi phí cho các loại yếu tố đầu vào được sử dụng trong sản xuất của nông hộ và năng suất lúa của nông hộ. Đối với chi phí cho các loại yếu tố đầu vào, hiện nay phần lớn nông hộ đều có hóa đơn khi mua hàng và lưu
43
lại nên khi khảo sát, các phỏng vấn viên nhờ các đáp viên cho xem các hóa đơn này để ghi nhận lại số liệu. Trong một số trường hợp, đáp viên không có hay thất lạc hóa đơn mua hàng, phỏng vấn viên ghi nhận số liệu cung cấp và kiểm tra chéo với các thông tin khác trong bảng câu hỏi (bảng câu hỏi được thiết kế để kiểm tra chéo các thông tin và số liệu có liên quan).
Trong luận án, năng suất lúa của nông hộ được định nghĩa là tỷ số giữa sản lượng thu hoạch và diện tích đất canh tác. Theo một số nhà nghiên cứu, số liệu về sản lượng nông sản nói chung và sản lượng lúa nói riêng có thể không chính xác bởi nông sản có khối lượng lớn, kích cỡ không đồng đều và được thu hoạch trên diện rộng. Tuy nhiên, phần lớn nông hộ trồng lúa ở ĐBSCL bán lúa tại ruộng sau khi thu hoạch cho thương lái hay cò lúa nên sản lượng thu hoạch của từng nông hộ được cân đo khá chính xác bởi người mua nhằm tránh thiệt hại trong kinh doanh. Nhờ đó, số liệu về sản lượng thu thập được khá chính xác bởi tránh được sai số đo lường ở chừng mực nhất định. Đối với diện tích đất canh tác, chúng tôi sử dụng số liệu ghi trên sổ sách mà địa phương cấp cho nông hộ nên tránh được sai sót về số liệu. Trong trường hợp nghi vấn số liệu có sai sót lớn ở vài quan sát, tác giả không sử dụng số liệu đó vào phân tích. Hơn nữa, do cỡ mẫu lớn nên sai số đo lường (nếu có) có thể được bù trừ giữa các quan sát nên kết quả ước lượng có thể có độ tin cậy chấp nhận được.
3.2.3 Phương pháp phân tích số liệu
Việc ước lượng ảnh hưởng của hạn chế tín dụng đến lượng vốn phân bổ cho yếu tố đầu vào và năng suất lúa của nông hộ gặp khó khăn trong việc lựa chọn nông hộ cho mẫu khảo sát. Nông hộ tham gia và không tham gia thị trường tín dụng phụ thuộc vào đặc điểm riêng của từng hộ nên việc lựa chọn nông hộ để nghiên cứu có thể không ngẫu nhiên và sai lệch. Vì vậy, phương pháp ước lượng Propensity score matching (PSM) – điểm xu hướng – được lựa chọn thực hiện để hạn chế khiếm khuyết nói trên. Phương pháp PSM được sử dụng rất phổ biến trong các nghiên cứu thực nghiệm, chẳng hạn như Bento và cộng sự (2007), Roberts và Key (2008), Beiggenman và cộng sự (2009), Pufahl và Weiss (2009) và Katchova (2010). Ưu điểm của phương pháp ước lượng PSM là kiểm soát được sai lệch khi chọn mẫu. Theo đó, các mục tiêu trình bày trong luận án được sử dụng các phương pháp phân tích như sau: Trước tiên, phương pháp thống kê mô tả được thực hiện để mô tả các đặc điểm của nông hộ về hạn chế tín dụng, phân bổ yếu tố đầu vào và năng suất lúa. Thứ hai, luận án sử dụng phương pháp điểm su hướng (PSM) để ước lượng ảnh hưởng của hạn chế tín dụng đến lượng vốn phân bổ cho yếu tố đầu vào và năng suất lúa của nông hộ. Cuối cùng, phương pháp suy luận, diễn dịch được thực hiện nhằm đề xuất kiến nghị và giải pháp đối với các bên có liên quan.
3.2.3.1 Tổng quan về phương pháp ước lượng PSM
Phương pháp PSM được phát triển bởi Rosenbaum và Rubin (1983) nhằm ước lượng tác động của một hiện tượng, một chương trình hay một chính sách đến đối tượng chịu tác động. Bản chất của PSM là xây dựng nhóm chịu tác động bằng phương pháp
44
thống kê. Phương pháp này dựa vào các đặc điểm quan sát được của nhóm chịu tác động (hay nhóm can thiệp – treatment group) và nhóm không chịu tác động (hay nhóm đối chứng – control group) để xây dựng một chỉ số gọi là điểm xu hướng (propensity score) – đó là, xác suất một quan sát được chọn vào nhóm can thiệp (chịu tác động) hay nhóm đối chứng (không chịu tác động). Các quan sát không chịu tác động có cùng điểm xu hướng với các quan sát chịu tác động được sử dụng để làm đối chứng. Như vừa đề cập, điểm xu hướng được xây dựng hoàn toàn dựa trên các đặc điểm quan sát được, do đó phương pháp PSM được sử dụng cho các mẫu khảo sát được lựa chọn dựa vào các đặc tính có thể quan sát được của đối tượng được khảo sát nên các đặc tính không quan sát được không ảnh hưởng đến quá trình hình thành nhóm đối chứng hay nhóm can thiệp.
Phương pháp ước lượng PSM được thực hiện với giải pháp phi tham số thay thế cho hồi quy tuyến tính nên có ưu điểm trong việc ước lượng ảnh hưởng của hạn chế tín dụng đến việc phân bổ vốn cho yếu tố đầu vào và đến năng suất sản xuất của nông hộ. Đầu tiên, phương pháp này không áp đặt bất kỳ giả định nào về phương thức ảnh hưởng của tiếp cận tín dụng đến hành vi của nông hộ. Nói cách khác, PSM cho phép sự không đồng nhất và phi tuyến đối với ảnh hưởng của hạn chế tín dụng miễn là chúng có liên quan đến đặc điểm quan sát được của nông hộ. Thứ hai, PSM có thể xử lý được sự không đồng nhất không quan sát được bởi chỉ phân tích dựa trên sự so sánh giữa các nông hộ tương tự về các đặc điểm quan sát được, do đó tránh được sai lệch từ việc so sánh các nông hộ quá khác biệt (Blundell và Dias, 2009; Ciaian và cộng sự, 2012). Thứ ba, PSM khắc phục được sai lệch bắt nguồn từ việc tự chọn lọc do các đặc điểm quan sát được. Điểm xu hướng giảm sai lệch này bằng cách so sánh các nhóm dựa trên nhiều đặc điểm đã biết và cung cấp phương pháp thích hợp để ước lượng hiệu ứng tác động khi đối tượng chịu tác không phải ngẫu nhiên (Ciaian và cộng sự, 2011; Ciaian và cộng sự, 2012).
Với các ký hiệu như ở phần cơ sở lý thuyết, Ci 1 được sử dụng để chỉ nông hộ bị hạn chế tín dụng và Ci0 để chỉ nông hộ không bị hạn chế tín dụng. Gọi Q1i là kết quả nhận được của nông hộ i bị hạn chế tín dụng (đó là, nhóm can thiệp) và Q0i là kết quả nhận được của nông hộ i không bị hạn chế tín dụng (đó là, nhóm đối chứng). Gọi Z là véc-tơ các biến số đo lường các đặc điểm quan sát được (từ khảo sát) của nông hộ. Khi đó, ảnh hưởng kỳ vọng của hạn chế tín dụng đến kết quả mà nông hộ i nhận được (đó là, lượng vốn phân bổ cho các yếu tố đầu vào và năng suất sản xuất) sẽ là
Q1i Q0iZi,Ci 1.
E Đây là tác động trung bình của nông hộ bị hạn chế tín dụng đến nông hộ không bị hạn chế tín dụng (ATT) – đại lượng đo lường ảnh hưởng của hạn chế tín dụng đến lượng vốn phân bổ vốn cho yếu tố đầu vào và năng suất lúa của nông hộ bị hạn chế tín dụng so với nông hộ không bị hạn chế tín dụng.
45
Nguồn: Rosenbaum và Rubin (1983) Hình 3.3. Vùng hỗ trợ chung
Với thực tế là ta không thể quan sát được điều gì có thể xảy ra nếu giả sử nông hộ bị hạn chế tín dụng không bị hạn chế tín dụng và ngược lại, ta cần ước lượng giả định trái thực tế (không thực) là EQ0iZi,Ci 1. Theo Rosenbaum và Rubin (1983), việc so sánh nông hộ có xác suất bị hạn chế tín dụng tương tự nhau trên cơ sở các đặc điểm quan sát được giống như so sánh các nông hộ với các giá trị Z gần giống nhau. Vì vậy, phương pháp ước lượng Probit có thể giúp ước lượng xác suất bị hạn chế tín dụng (hay điểm xu hướng). Sau đó, dựa trên điểm xu hướng vừa ước lượng, đối với mỗi nông hộ thuộc nhóm can thiệp (bị hạn chế tín dụng) một nông hộ được giả định trái thực tế (nông