Để phân tích các nhân tố tác động đến sản lƣợng cá mú nuôi thƣơng phẩm của các hộ nuôi tại Khánh Hòa, bài luận văn sử dụng phƣơng pháp phân tích tƣơng quan và hồi qui tuyến tính giữa các biến trong mô hình nhƣ đã đƣợc nêu ở chƣơng 1. Để xác định mối quan hệ nhân quả giữa các biến trong mô hình, bƣớc đầu tiên ta cần phân tích tƣơng quan giữa các biến xem thử có mối liên hệ tuyến tính giữa biến độc lập và biến phụ thuộc hay không. Kết quả của phần phân tích này dù không xác định đƣợc mối quan hệ nhân quả giữa biến phụ thuộc và biến độc lập nhƣng nó đóng vai trò làm cơ sở cho phân tích hồi qui. Các biến biến phụ thuộc và biến độc lập có tƣơng quan cao với nhau báo hiệu sự tồn tại của mối quan hệ tiềm ẩn giữa hai biến. Đồng thời, việc phân tích tƣơng quan còn làm cơ sở để dò tìm sự vi phạm giả định của phân tích hồi qui tuyến tính: các biến độc lập có tƣơng quan cao với nhau hay hiện tƣợng đa cộng tuyến. Nhƣ đã trình bày trong trong chƣơng 1 ở phần mô hình nghiên cứu, các biến số nghiên cứu đƣợc xác định trong mô hình hồi qui 9 biến (Hình 1.1).Tuy nhiên trong thực tế điều tra và phỏng vấn nhóm, ngƣời nghiên cứu loại các biến: qui mô vốn đầu tƣ, loại
thức ăn, vùng nuôi ra khỏi mô hình nghiên cứu ban đầu bởi lý do sau:
Biến “qui mô vốn đầu tƣ”: Trong quá trình điều tra thì đa phần các hộ nuôi đầu tƣ vốn nhƣ nhau tùy theo diện tích nuôi. Vì thế yếu tố này sẽ đƣợc cân nhắc bởi biến diện tích nuôi.
Biến “loại thức ăn”: các hộ nuôi ở cả bốn vùng nuôi đều cho thức ăn là cá tạp với lƣợng thức ăn cho ăn là giống nhau ở các hộ nuôi nên biến này sẽ không ảnh hƣởng nhiều đến sản lƣợng cá mú nuôi thƣơng phẩm.
Biến “vùng nuôi”: Đa phần các hộ nuôi ở cả bốn vùng nuôi đều không có dao động lớn đến sản lƣợng thu hoạch cá mú thƣơng phẩm.
Ngoài ra, sau khi nghiên cứu thực tế tác giả nhận thấy rằng kinh nghiệm nuôi và trình độ kỹ thuật nuôi của các hộ nuôi có những điểm tƣơng đồng, trình độ kỹ thuật nuôi của chủ hộ thƣờng đƣợc học tập qua nhiều cách thức khác nhau và đặc biệt tự học từ bản thân tích lũy qua các vụ nuôi cũng nhƣ học hỏi lẫn nhau giữa các hộ nuôi và thƣờng đƣợc tích lũy theo thời gian. Và tác giả kỳ vọng rằng số lao động có kinh nghiệm và có trình độ kỹ thuật mà hộ nuôi sử dụng càng nhiều thì sản lƣợng cá mú nuôi thƣơng phẩm thu hoạch sẽ càng cao, nên sẽ có quan hệ (+). Thêm vào đó nuôi lồng bè và nuôi trong ao đất sẽ ảnh hƣởng đến sản lƣợng nuôi cá mú thƣơng phẩm. Theo kinh nghiệm nuôi cá mú thƣơng phẩm thì sản lƣợng thu hoạch cao khi nuôi trong ao đất hơn là nuôi trong lồng bè.
Nhƣ vậy, sau khi loại đi những biến không có ý nghĩa, mô hình nghiên cứu điều chỉnh đƣợc vẽ lại nhƣ sau:
Hình 3. 1: Mô hình nghiên cứu điều chỉnh.
SẢN LƢỢNG THU HOẠCH TỪ NUÔI CÁ MÚ THƢƠNG PHẨM Kích cỡ con giống Diện tích thả nuôi
Hình thức nuôi Số năm kinh nghiệm Mật độ nuôi
Thuốc
Bảng 3. 21: Tên biến và dấu kỳ vọng của các hệ số hồi qui mô hình của nghiên cứu sau khi điều chỉnh
STT Biến Tên biến Đơn vị
tính Thang đo Dấu kỳ vọng 1 Sản lƣợng thu hoạch SL Kg/m2 Tỷ lệ 2 Kích cỡ con giống KCG cm Tỷ lệ +/- 3 Mật độ nuôi MDN con/m2 Tỷ lệ +/- 4 Diện tích thả nuôi DT m2 Tỷ lệ +
5 Hình thức nuôi HT Danh nghĩa +
6 Số năm kinh nghiệm SN_KN năm Tỷ lệ +
7 Thời gian nuôi TG_nuoi tháng Tỷ lệ +
8 Thuốc Thuoc Đồng Tỷ lệ +
(Nguồn: Nghiên cứu của tác giả)
3.3.1 Phân tích tương quan
Trƣớc khi phân tích tƣơng quan, ta cần xem xét phân phối của các biến cần phân tích thông qua hệ số Skewness và Kurtosis. Đối với biến đo lƣờng trên thang đo Likert, giá trị của hai hệ số này nằm trong khoảng [-1; + 1], có nghĩa là các biến có phân phối chuẩn [Muthen & Kaplan, 1985]. Lúc này, ta sẽ sử dụng hệ số tƣơng quan Person. Ma trận tƣơng quan giữa các biến số (các biến độc lập và biến phụ thuộc). Ma trận tƣơng quan giữa các biến số (các biến độc lập và biến phụ thuộc) thể hiện nhƣ sau:
Bảng 3. 22: Ma trận tƣơng quan SL MDN SN_KN DT1 DT2 TG_nuoi thuoc HT1 HT2 KCG SL Pearson Correlation 1 -.560** .409** .889** -.734** .241 -.140 .843** -.836** .469** Sig. (2-tailed) .000 .001 .000 .000 .063 .286 .000 .000 .000 N 60 60 60 60 60 60 60 60 60 60 MDN Pearson Correlation -.560** 1 -.123 -.509** .350** -.075 -.136 -.668** .646** -.370** Sig. (2-tailed) .000 .348 .000 .006 .568 .301 .000 .000 .004 N 60 60 60 60 60 60 60 60 60 60 SN_K N Pearson Correlation .409** -.123 1 .563** -.303* .079 .161 .352** -.383** .097 Sig. (2-tailed) .001 .348 .000 .019 .546 .218 .006 .002 .463 N 60 60 60 60 60 60 60 60 60 60 DT1 Pearson Correlation .889** -.509** .563** 1 -.660** .303* .134 .752** -.761** .445** Sig. (2-tailed) .000 .000 .000 .000 .018 .309 .000 .000 .000 N 60 60 60 60 60 60 60 60 60 60 DT2 Pearson Correlation -.734** .350** -.303* -.660** 1 -.340** .028 -.877** .846** -.565** Sig. (2-tailed) .000 .006 .019 .000 .008 .830 .000 .000 .000 N 60 60 60 60 60 60 60 60 60 60 TG_n uoi Pearson Correlation .241 -.075 .079 .303* -.340** 1 .349** .220 -.179 .251 Sig. (2-tailed) .063 .568 .546 .018 .008 .006 .090 .171 .054 N 60 60 60 60 60 60 60 60 60 60 thuoc Pearson Correlation -.140 -.136 .161 .134 .028 .349** 1 -.073 .036 .111 Sig. (2-tailed) .286 .301 .218 .309 .830 .006 .580 .783 .399 N 60 60 60 60 60 60 60 60 60 60 HT1 Pearson Correlation .843** -.668** .352** .752** -.877** .220 -.073 1 -.964** .605** Sig. (2-tailed) .000 .000 .006 .000 .000 .090 .580 .000 .000 N 60 60 60 60 60 60 60 60 60 60 HT2 Pearson Correlation -.836** .646** -.383** -.761** .846** -.179 .036 -.964** 1 -.545** Sig. (2-tailed) .000 .000 .002 .000 .000 .171 .783 .000 .000 N 60 60 60 60 60 60 60 60 60 60 KCG Pearson Correlation .469** -.370** .097 .445** -.565** .251 .111 .605** -.545** 1 Sig. (2-tailed) .000 .004 .463 .000 .000 .054 .399 .000 .000 N 60 60 60 60 60 60 60 60 60 60
Ghi chú: SL: sản lượng thu hoạch, MDN: mật độ nuôi, SN_KN: số năm kinh nghiệm,DT1: diện tích nuôi ao, DT2: diện tích nuôi lồng, TG_nuôi: Thời gian nuôi, HT1: hình thức nuôi ao, HT2: hình thức nuôi lồng, KCG: kích cỡ giống, thuoc: Thuốc. **. Correlation is significant at the 0,01 level (2-tailed) (Mức ý nghĩa 1%)
*. Correlation is significant at the 0,05 level (2-tailed) (Mức ý nghĩa 5%).
Qua bảng trên ta thấy: Ma trận này cho biết tƣơng quan giữa biến phụ thuộc (sản lƣợng thu hoạch) với từng biến độc lập trong mô hình hồi qui, cũng nhƣ tƣơng quan giữa các biến độc lập với nhau. Hệ số tƣơng quan giữa biến sản lƣợng thu hoạch và các biến độc lập còn lại tƣơng đối cao. Sơ bộ ta có thể kết luận các biến độc lập này có thể đƣa vào mô hình để giải thích cho biến sản lƣợng cá mú thu hoạch.
3.3.2. Phân tích hồi qui
Để phân tích các nhân tố tác động đến sản lƣợng cá mú nuôi thƣơng phẩm của các hộ nuôi tại Khánh Hòa, tác giả đã sử dụng phƣơng pháp phân tích hồi qui tuyến tính giữa các biến trong mô hình nhƣ đã nêu ở chƣơng 1. Kết quả phân tích hồi qui thể hiện ở các bảng sau.
Bảng 3. 23: Thủ tục chọn biến trong phân tích hồi qui OLS
Mô hình Các biến đƣa vào Các biến loại bỏ Phƣơng pháp
1 KCG, SN_KN, thuoc , MDN, TG_nuoi, DT2, DT1, HT2, HT1a . Đƣa một lƣợt các biến vào một lúc. 2 . KCG Loại trừ dần từng biến ra khỏi mô hình (Tiêu chuẩn: Xác suất của F để
loại >= 0.100).
3 . HT1
Loại trừ dần từng biến ra khỏi mô hình (Tiêu chuẩn: Xác suất của F để
loại >= 0.100).
4 . SN_KN
Loại trừ dần từng biến ra khỏi mô hình (Tiêu chuẩn: Xác suất của F để
loại >= 0.100).
5 . HT2
Loại trừ dần từng biến ra khỏi mô hình (Tiêu chuẩn: Xác suất của F để
loại >= 0.100).
6 . TG_nuoi
Loại trừ dần từng biến ra khỏi mô hình (Tiêu chuẩn: Xác suất của F để
loại >= 0.100).
a. Tất cả các biến được yêu cầu đưa vào. b. Biến phụ thuộc: Sản lượng thu hoạch (kg)
SLi=β0 + β1*SN_KNi+β2*KCGi+β3*MDNi+β4*TG_nuoii+β5* DT1i + β6* DT2i +β7*QM_voni + β8*thuoci + β9*Z1 + β10*Z2+ β11*HT1 + β12*HT2 +ei
Trong đó:
SL : Sản lƣợng cá mú chấm đen nuôi thƣơng phẩm (kg) SN_KN : Số năm kinh nghiệm (năm)
MDN : Mật độ thả giống(con/m2) TG_nuoi : Thời gian nuôi/vụ (tháng) DT1 : Quy mô diện tích nuôi ao (m2) DT2 : Quy mô diện tích nuôi lồng (m2) KCG : Kích cỡ giống (cm)
Thuoc : Số tiền mua kháng sinh, thuốc men trong quá trình nuôi (đồng) HTj : Biến giả của hình thức nuôi (j=1,2)
Số liệu trên bảng 3.23: Thủ tục chọn biến trong phân tích hồi qui OLS cho thấy có 03 biến hình thức nuôi (HT1, HT2), số năm kinh nghiệm (SN_KN), kích cỡ giống (KCG), thời gian nuôi (TG_nuoi) bị loại khỏi mô hình do không thỏa mãn điều kiện (F>= 0.1). Các nhân tố còn lại trong mô hình sẽ là: mật độ nuôi (MDN), diện tích (DT1, DT2) và Thuốc (thuoc).
Bảng 3. 24: Mô hình tổng quát trong phân tích hồi qui Mô hình Hệ số tƣơng quan bội R R2 R2 đã hiệu chỉnh
Sai số tiêu chuẩn của ƣớc lƣợng Kiểm định Durbin- Watson 1 .953a .909 .892 1272.4852 2 .953b .909 .894 1259.9779 3 .953c .909 .896 1247.9045 4 .952d .907 .897 1246.3025 5 .951e .905 .896 1248.2563 6 .951f .904 .897 1246.4672 2.431
a. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), kích cỡ giống (KCG), hình thức nuôi (HT1, HT2), số năm kinh nghiệm (SN_KN), thuốc (thuoc), diện tích nuôi (DT1, DT2).
b. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), hình thức nuôi (HT1, HT2), số năm kinh nghiệm (SN_KN), thuốc (thuoc), diện tích nuôi (DT1, DT2).
c. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), hình thức nuôi (HT2), số năm kinh nghiệm (SN_KN), thuốc (thuoc), diện tích nuôi (DT1, DT2).
d. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), hình thức nuôi (HT2), thuốc (thuoc), diện tích nuôi (DT1, DT2).
e. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), thuốc (thuoc), diện tích nuôi (DT1, DT2).
f. Dự đoán: mật độ nuôi (MDN), thuốc (thuoc), diện tích nuôi (DT1, DT2). g. Biến phụ thuộc: sản lượng thu hoach (kg).
Các thông tin ở bảng trên cho thấy các tham số thống kê của mô hình khi tất cả các biến đƣợc đƣa vào và dần loại bỏ các biến ít có quan hệ. Kết quả cho thấy mối quan hệ giữa biến phụ thuộc với các biến độc lập trong cả 04 mô hình đều có hệ số tƣơng quan khá cao, với R2
nhận các giá trị 0,935; 0,935 và 0,934 và mức giảm rất bé khi các biến độc lập đƣợc đƣa ra khỏi mô hình. Điều này có nghĩa là các biến bị loại bỏ là những biến ít có mối quan hệ với biến phụ thuộc.
Với hệ số xác định hiệu chỉnh R2 (1) = 0,909, R2 (2) = 0,909, R2 (3) = 0,909, R2 (4) = 0,907, R2 (5) = 0,905, R2 (6) = 0,904 nghĩa là mô hình hồi qui tuyến tính bội trên đã xây dựng phù hợp với tập dữ liệu đến 90,4 % hay sự thay đổi của sản lƣợng thu
hoạch cá mú nuôi thƣơng phẩm có thể đƣợc giải thích bởi sự phụ thuộc tuyến tính vào các yếu tố: mật độ nuôi (MDN), thuốc (thuoc), diện tích nuôi (DT1, DT2), số 9,6% còn lại phụ thuộc vào các yếu tố khác.
3.3.3 Kiểm định độ phù hợp của mô hình
Bảng 3. 25: Phân tích ANOVA của mô hình Mô hình Tổng bình phƣơng Bậc tự do (df) Bình phƣơng trung bình Kiểm định (F) Mức ý nghĩa (Sig.) 1
Hồi qui 8.055E8 9 8.950E7 55.273 .000a
Phần dƣ 8.096E7 50 1619218.633 Tổng số 8.864E8 59
2
Hồi qui 8.055E8 8 1.007E8 63.422 .000b
Phần dƣ 8.096E7 51 1587544.188 Tổng số 8.864E8 59
3
Hồi qui 8.055E8 7 1.151E8 73.891 .000c
Phần dƣ 8.098E7 52 1557265.534 Tổng số 8.864E8 59
4
Hồi qui 8.041E8 6 1.340E8 86.283 .000d
Phần dƣ 8.232E7 53 1553269.835 Tổng số 8.864E8 59
5
Hồi qui 8.023E8 5 1.605E8 102.983 .000e
Phần dƣ 8.414E7 54 1558143.714 Tổng số 8.864E8 59
6
Hồi qui 8.010E8 4 2.002E8 128.887 .000f
Phần dƣ 8.545E7 55 1553680.442 Tổng số 8.864E8 59
a. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), kích cỡ giống (KCG), hình thức nuôi (HT1, HT2), số năm kinh nghiệm (SN_KN), thuốc (thuoc), diện tích nuôi (DT1, DT2).
b. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), hình thức nuôi (HT1, HT2), số năm kinh nghiệm (SN_KN), thuốc (thuoc), diện tích nuôi (DT1, DT2).
c. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), hình thức nuôi (HT2), số năm kinh nghiệm (SN_KN), thuốc (thuoc), diện tích nuôi (DT1, DT2).
d. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), hình thức nuôi (HT2), thuốc (thuoc), diện tích nuôi (DT1, DT2).
e. Dự đoán: mật độ nuôi (MDN), thời gian nuôi (TG_nuoi), thuốc (thuoc), diện tích nuôi (DT1, DT2).
f. Dự đoán: mật độ nuôi (MDN), thuốc (thuoc), diện tích nuôi (DT1, DT2). g. Biến phụ thuộc: sản lượng thu hoach (kg).
Tác giả sử dụng kiểm định F trong bảng phân tích phƣơng sai để kiểm định giả thuyết về độ phù hợp của mô hình hồi qui tuyến tính.
Giả thuyết H0 là: 1 = 2= 3= 4= 5=6= 7=8=β9=β10=β11=β12= 0. Phân tích ANOVA ở bảng 3.25 cho thấy, trị số (F) đƣợc tính từ giá trị R square của mô hình đầy
đủ (mô hình 06 – mô hình đƣợc chọn trong cả 06 mô hình) và có mức ý nghĩa (Sig) rất nhỏ (0,000); tổng bình phƣơng (Sum of Squares) giảm không đáng kể khi loại bớt biến ở mô hình 06. Điều này khẳng định việc loại bớt biến là chính xác. Vì đối với mô hình hồi qui, nếu việc đƣa thêm biến vào không làm tăng R2 thì việc đƣa vào biến mới là không thành công. Nhƣ vậy, chúng ta sẽ an toàn khi bác bỏ giả thuyết H0 cho rằng tất cả các hệ số hồi qui bằng 0 (ngoại trừ hằng số); mô hình hồi qui tuyến tính bội phù hợp với tập dữ liệu. Điều này cho phép kết luận có tồn tại mối liên hệ tuyến tính giữa sản lƣợng cá mú thu hoạch với các biến số hoặc với tất cả các biến số độc lập đã liệt kê.
3.3.4 Dò tìm các vi phạm giả định cần thiết
3.3.4.1 Giả định liên hệ tuyến tính
Tác giả dùng phƣơng pháp vẽ đồ thị phân tán giữa các phần dƣ và giá trị dự đoán (tất cả đều đƣợc chuẩn hóa) là kết quả kết xuất từ mô hình hồi qui tuyến tính lôgarít cho ra. Nếu giả định có sự liên hệ tuyến tính giữa hai giá trị này và phƣơng sai bằng nhau không vi phạm, thì sẽ không thấy có mối liên hệ gì giữa các giá trị dự đoán và phần dƣ chúng sẽ phân tán rất ngẫu nhiên. Kết quả nhƣ sau:
Hình 3. 2: Đồ thị phân tán giữa các phần dƣ và giá trị dự doán chuẩn hóa
Về giả định liên hệ tuyến tính và phƣơng sai bằng nhau: Từ kết quả đồ thị phân tán giữa các phần dƣ chuẩn hóa và giá trị dự đoán chuẩn hóa, không thấy có liên hệ gì giữa các giá trị dự đoán và phần dƣ, chúng phân tán ngẫu nhiên trong vùng xung
Gi á tr ị d ự đ oán c h u ẩn h óa
Biến phụ thuộc: sản lƣợng thu hoạch
quanh đƣờng đi qua có giá trị tung độ bằng 0, không tạo thành một hình dạng nào cả. Nhƣ vậy giả định tuyến tính và phƣơng sai bằng nhau đƣợc thỏa mãn. Điều này chứng tỏ giả định có quan hệ tuyến tính không bị vi phạm.
3.3.4.2 Giả định phương sai của sai số không đổi
Hình 3. 3: Biểu đồ Histogram (tần số) của phần dƣ chuẩn hóa
Về giả định phân phối chuẩn của phần dƣ: Trong các giá trị của đồ thị, có thể nói phân phối phần dƣ xấp xỉ chuẩn (trung bình Mean = -1.03E-15 và độ lệch chuẩn Std.Dev. = 0,966 tức là gần bằng 1). Do đó có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm.
Hoặc xem biểu đồ P-P plot so sánh giữa phân phối tích lũy của phần dƣ quan sát trên trục hoành và phân phối tích lũy kỳ vọng trên trục tung ta thấy các điểm phân bố nằm trên hoặc rất gần đƣờng chéo nên ta có thể kết luận rằng phân phối phần dƣ coi nhƣ gần chuẩn.
Biến phụ thuộc: sản lƣợng thu hoạch
Phần dƣ chuẩn hóa Ph ần tră m Trung bình = -1.03E-15 Độ lệch chuẩn = 0,966 Cỡ mẫu = 149
Hình 3. 4: Biểu đồ phân phối tích lũy của phần dƣ
3.3.4.3 Giả định về tính độc lập của sai số (Không có tự tương quan giữa các phần dư)
Căn cứ vào kết quả của bảng 3.24 (mô hình tổng quát trong phân tích hồi qui) hệ số kiểm định Dubin – Waston = 2,431 (1<2,431<3) vì vậy mô hình đƣợc đề xuất xem nhƣ không có tự tƣơng quan (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008). Nhƣ vậy giả định về tính độc lập của sai số đƣợc chấp nhận (không có tự tƣơng quan giữa các phần dƣ).
3.3.4.2 Giả định không có mối tương quan giữa các biến độc lập (Đo lường đa cộng tuyến)
Căn cứ vào kết quả của bảng 3.26 (Các hệ số) cho thấy độ chấp nhận của biến