Dữ liệu sử dụng trong nghiên cứu bao gồm: số liệu điều tra mức sống hộ gia
đình 2008 và số liệu khí tượng Việt Nam tháng 11, 12 năm 2007, tháng 1 đến
tháng 10 năm 2008. Cách thức chọn lọc và xử lý dữ liệu như sau:
3.1.1 Dữ liệu trích từ điều tra mức sống hộ gia đình (VHLSS) 2008
Nghiên cứu sử dụng dữ liệu VHLSS 2008 do Tổng Cục Thống Kê Việt Nam thực hiện năm 2008 để trích các thơng tin về sản xuất nông nghiệp của nông hộ trên phạm vi cả nước. Bộ dữ liệu có tổng cộng có 9.189 hộ được điều tra trên 3063 xã/phường thuộc 64 tỉnh thành, trong đó nơng hộ là 5.839 hộ. Cuộc Khảo sát thu thập thông tin theo 2 kỳ trong năm 2008 bằng phương pháp điều tra viên phỏng vấn trực tiếp chủ hộ và cán bộ chủ chốt của xã có địa bàn khảo sát (TCTK, 2009). Tiêu chí lựa chọn nông hộ nghiên cứu trong đề tài như sau: (i) Nông hộ trồng trọt chỉ trồng các loại cây hàng năm và/hoặc lâu năm; (ii) Nông hộ chỉ sở hữu đất trồng trọt với duy nhất một trong hai loại hình thức tưới tiêu chủ động hoặc tưới tiêu khơng chủ động.
27
Kết quả trích được 3.788 nông hộ trên cả nước trong bộ dữ liệu. Các thông tin thu thập trên cơ sở các biến trong mơ hình nghiên cứu như sau:
- Thu nhập rịng của nơng hộ (NI): trích từ mục 4B1TN, mà được tính bằng hiệu số của tổng thu nhập từ trồng trọt (mục 4B1T) và tổng chi phí cho trồng trọt (mục 4B1C), đơn vị tính là ngàn đồng.
- Đặc điểm kinh tế xã hội của hộ gia đình: Chọn chủ hộ là người được đánh số 1 (chủ hộ) trong mục 1A câu 3. Các thông tin liên quan đến chủ hộ bao gồm: Tuổi chủ hộ (Age) trích từ mục 1A câu 5 - tuổi được tính theo số năm sinh sống hiện tại của chủ hộ; Giới tính chủ hộ (Sex) trích từ mục 1A câu 2 – có hai lựa chọn là nam hoặc nữ; Trình độ giáo dục (Edu) trích từ mục 2A câu 1 kết hợp mục 2A câu 3 như sau: trình độ học vấn từ 0-12 tại mục 2A câu 12. Nếu chủ hộ có học vấn cao hơn 12, dùng thông tin mục 2A câu 3 và chuyển sang số năm đi học sau PTTH. Ví dụ: tốt nghiệp cao đẳng là 12+3=15 năm học; đại học (12+4 =16 năm học), thạc sĩ (12+6=18 năm học) và tiến sĩ (12+9=21 năm học). Như vậy số năm đi học sẽ từ 0 -21 năm.
- Tổng diện tích đất canh tác (Area) trích từ mục 4B0 câu 3a và b (số thửa và diện tích thửa): Nếu một hộ có nhiều thửa đất (câu3a) thì tổng diện tích đất sẽ bằng tất cả diện tích các thửa cộng lại.
- Quy mơ trang trại (Gồm ba nhóm nhỏ, vừa và lớn - Sland, Mland và Lland): trích từ tổng diện tích đất canh tác (Area), sử dụng biến giả phân loại thành ba nhóm theo Pháp lệnh thuế đất nông nghiệp Việt Nam (1993) được các tỉnh thành áp dụng. Nhóm nơng hộ có diện tích canh tác trồng trọt lớn (Lland) có diện tích lớn hơn 2,5 ha/hộ. Nhóm hộ có diện tích đất canh tác trung bình (Mland) có diện tích từ 1ha/hộ đến 2,5ha/hộ. Và nhóm quy mơ nhỏ (Sland) có diện tích bình qn nhỏ hơn 1ha/hộ.
28
- Loại hình canh tác trích từ mục 4B16 câu C2a đến C2e: Các hộ có thu nhập từ hai loại cây trồng trở lên được chọn là hộ đa canh (Mcrop =1) cịn lại hộ chỉ có thu nhập duy nhất từ một loại cây trồng chọn làm hộ độc canh (Scrop = 0). Sử dụng biến giả cho yếu tố này.
- Hình thức tưới tiêu trích từ mục 4B0 câu 4: có năm chọn lựa là tưới tự chảy, sử dụng máy bơm, dùng sức người và khơng được tưới tiêu. Năm nhóm
được phân lại thành hai nhóm: nhóm tưới tiêu chủ động (Irri = 1) gồm ba lựa
chọn đầu, và không tưới tiêu chủ động (Irri = 0) tức là nguồn nước cung cấp cho sản xuất phụ thuộc hoàn toàn vào lượng mưa hàng năm.
3.1.2 Dữ liệu về khí tượng Việt Nam
Số liệu khí hậu các năm 2007 và 2008 được thu thập từ trang thông tin điện tử của Bộ NN&PTNT3. Số liệu khí hậu này là số liệu chính thức của các địa phương trên cả nước, trạm khí tượng đặt tại địa phương nào sẽ ghi nhận thơng tin khí hậu tại địa phương đó và thơng tin này được dùng để dự báo khí tượng thủy văn trong nơng nghiệp cũng như các ngành khác cho từng địa phương.
Số liệu về nhiệt độ bình quân và lượng mưa 12 tháng, bao gồm tháng 11, 12 năm 2007 và tháng 1 đến tháng 10 năm 2008, phù hợp với phân tích theo hai mùa, mùa khô từ tháng 11 năm trước đến tháng 4 năm sau, và mùa mưa từ tháng 5 đến tháng 10. Riêng các tỉnh miền Nam Trung Bộ do đặc thù của khí hậu nên mùa mưa thường kéo dài đến tháng 12 (Số liệu của các vùng này đã được điều
chỉnh cho phù hợp). Số trạm khí tượng là 120 trạm phân bổ trên 64 tỉnh thành
được thu thập số liệu như sau:
- Thu thập số liệu khí hậu hàng tháng của 120 trạm khí tượng, chọn cột Ttb (Nhiệt độ trung bình) và R (Lượng mưa) của 12 bảng số liệu tháng. Từ tháng 11/2007 đến 10/2008.
3 http://fsiu.mard.gov.vn/data/khituong.htm
29
- Tính tốn nhiệt độ trung bình và lượng mưa của 6 tháng mùa khô từ
tháng 11/2007 đến 4/2008, và mùa mưa từ tháng 5/2008 đến 10/2008. Số liệu các tỉnh Nam Trung Bộ từ Nha Trang đến Thừa Thiên Huế được điều chỉnh lệch sau một tháng (Từ tháng 6 đến tháng 11) do mùa mưa vùng này kéo dài đến tháng 11 (IMHEN, 2007; 2008).
3.1.3 Xử lý số liệu:
Tổng hợp số liệu VHLSS và số liệu khí tượng: Đơn vị hành chánh cuối
cùng trong VHLSS 2008 là xã/phường do đó số liệu khí tượng cũng sẽ áp dụng cho các hộ trong xã/phường chọn lựa. Trạm khí tượng đặt tại xã/phường nào thì dùng số liệu khí tượng cho các hộ gia đình trong xã/phường đó và các xã/
phường, vùng lân cận với bán kính khoảng 50km, và theo địa hình (địa hình gần giống vùng đặt trạm) có thể khơng cùng nằm trong địa bàn một tỉnh. Ví dụ trạm Tân Sơn Nhất (Tp.HCM) có số liệu áp dụng cho cả Biên Hòa (Đồng Nai) hay Thủ Dầu Một, Thuận An (Bình Dương), nhằm tránh sai lệch số liệu khí tượng do
địa hình khác biệt nhau khi hai xã nằm cạnh nhau (Xem phụ lục 2-bản đồ vị trí
vùng mẫu chọn).
Số liệu được tổng hợp tiếp tục xử lý loại bỏ các vùng có lượng mưa quá cao hoặc quá thấp ngoài phạm vi khoảng 2 lần độ lệch chuẩn của số liệu lượng mưa (Trung bình lượng mưa hàng năm là 2068mm, độ lệch chuẩn 640mm)4 bao gồm vùng Phan rang – Ninh Thuận (lượng mưa năm 695mm); vùng Phú quý - Bình Thuận (1298mm); vùng Nam Đông – Huế (4123mm); Huế (4179mm), Trà My – Quảng Nam (5239). Như vậy số liệu khí hậu sẽ còn lại là 115 trạm trên cả nước
để phân tích. Tiếp tục xử lý và loại bỏ các nơng hộ có số liệu thu nhập rịng nằm
ngoài phạm vi 2 lần độ lệch chuẩn của chúng.
Tập số liệu sau cùng có 3.616 nơng hộ đáp ứng đầy đủ các tiêu chí đưa ra, trong đó nhóm nơng hộ có tưới tiêu chủ động là 3100 hộ và không chủ động là
30
516 hộ. Đây là số quan sát dùng để phân tích cho ba mơ hình tương ứng trong
nghiên cứu (n=3.616).