Phương pháp phân tích hồi quy tuyến tính nhiều biến

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu mối quan hệ giữa cấu trúc hải dương với năng suất khai thác một số loài cá kinh tế ở vùng biển đông nam bộ (Trang 51 - 53)

Với các bộ dữ liệu đồng bộ cá-môi trường nêu trên, sử dụng phương pháp phân tích hồi quy tuyến tính đa biến giữa một biến phụ thuộc (ở đây là CPUE) với các biến độc lập (các yếu tố mơi trường) sẽ tìm được phương trình hồi quy tuyến tính phản ánh mối quan hệ cá-mơi trường, có dạng tổng qt sau [26, 46]:

y = a0 + a1x1 + a2x2 + ... + amxm

trong đó y – biến phụ thuộc, là năng suất khai thác (CPUE) cá Ngừ Vằn hoặc cá Ngừ Chấm của nghề lưới rê, hoặc cá Chỉ Vàng của nghề lưới kéo; xj (j=1..m) – các

các hệ số hồi quy, được xác định bằng phương pháp bình phương nhỏ nhất trên cơ sở các tập dữ liệu đồng bộ cá và mơi trường có m cột và n hàng như đã nêu trên.

Hệ số tương quan bội R được tính theo cơng thức (n là độ dài chuỗi số liệu, m là số biến):

Giá trị tuyệt đối của R nằm trong khoảng 0-1, trong đó nếu |R|< 0,1 thì tương quan rất yếu; 0,2-0,3 – yếu; 0,4-0,5 – trung bình; 0,6-0,7 – cao; và |R|> 0,8 – tương quan rất cao [46].

Như vậy, phép phân tích tương quan và hồi quy tuyến tính đa biến đã sử dụng nhiều biến độc lập. Trong một số trường hợp một vài “biến độc lập” lại có thể có quan hệ chặt chẽ với nhau, nghĩa là chúng “không độc lập”, và do vậy chỉ cần chọn 1 biến đại diện cho các biến này. Việc loại bớt các “biến không độc lập” một mặt đảm bảo các biến cịn lại có ý nghĩa và vai trị quan trọng nhất tác động đến năng suất khai thác, do đó giải thích được bản chất sự biến đổi nguồn lợi phụ thuộc chủ yếu vào yếu tố môi trường nào, mặt khác làm giảm thời gian tính tốn trong mơ hình dự báo mà vẫn đảm bảo độ tin cậy cần thiết.

Để loại bớt biến không cần thiết, luân án đã sử dụng tiêu chuẩn thông tin AIC (Akaike information Criterion) sau đây [46]:

với

trong đó RSS là tổng bình phương phần dư, y là giá trị quan trắc (số liệu) và yt là giá trị tính theo phương trình hồi quy, k là số biến độc lập và n là độ dài chuỗi giá trị quan trắc.

Quy luật chung trong phân tích hồi quy tuyến tính đa biến là mơ hình với k biến độc lập sẽ có RSS thấp hơn mơ hình với k-1 biến, nghĩa là mơ hình càng có nhiều biến độc lập sẽ giải thích biến phụ thuộc tốt hơn. Nhưng vì một vài biến “độc

lập” có thể có mối quan hệ với nhau, nên nhiều khi thêm biến khơng có nghĩa là RSS sẽ giảm đi một cách có ý nghĩa. Một “phép tính” để dung hồ RSS và số biến độc lập trong một mơ hình hồi quy đa biến cần xem xét đến giá trị của AIC. Mơ hình nào có chỉ số AIC thấp nhất là mơ hình được lựa chon và số biến trong mơ hình đó là tối ưu [46].

Phân tích tương quan cá-mơi trường (cũng như xây dựng bộ chỉ số các yếu tố mơi trường thích ứng, sẽ được nói tới ở mục 2.3) đối với cá Ngừ Vằn được thực hiện cho từng tháng và cho cả hai vụ cá trong năm. Tuy nhiên, do số liệu khai thác cá Ngừ Vằn các tháng 1-2 và 11-12 ở VBĐNB không nhiều, nên luận án đã kết hợp số liệu tháng 1 với tháng 2, tháng 11 với tháng 12 để đảm bảo độ dài chuỗi số liệu có đủ ý nghĩa thống kê cho phân tích tính tốn. Đối với cá Ngừ Chấm và cá Chỉ Vàng, do lượng số liệu không nhiều nên chỉ thực hiện phân tích tương quan theo vụ cá.

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu mối quan hệ giữa cấu trúc hải dương với năng suất khai thác một số loài cá kinh tế ở vùng biển đông nam bộ (Trang 51 - 53)

Tải bản đầy đủ (PDF)

(138 trang)